論大數(shù)據(jù)分析的正確方法 應理智對待
據(jù)統(tǒng)計,從人類文明開始到2003年,人類共創(chuàng)造了5TB(兆億字節(jié))的信息?,F(xiàn)在,同樣的數(shù)據(jù)量僅需兩天就能夠被創(chuàng)造出來,且速度仍在加快。如此龐大的數(shù)據(jù)量使數(shù)據(jù)分析復雜化,而大數(shù)據(jù)中的非結構化數(shù)據(jù)將加深這種復雜度。
這種情況下,我們需要清楚:什么樣的數(shù)據(jù)應被保存。如果從整體性出發(fā),數(shù)據(jù)采集和存貯算不上大數(shù)據(jù),對海量數(shù)據(jù)進行分析計算之后的結果才有實際價值。這亦是大數(shù)據(jù)的價值所在。
關于大數(shù)據(jù)數(shù)量,業(yè)內一種較為激進的觀點認為,“大數(shù)據(jù)”的叫法存在問題,因為數(shù)據(jù)只有“大”是沒有用處的。雖然數(shù)據(jù)無處不在,但唯有復用性強和可轉化成有用抽象信息的數(shù)據(jù)才更有價值。
即使我們的數(shù)據(jù)搜集、處理能力逐漸增強,仍然要堅持“不是任何數(shù)據(jù)都重要”這一準則。對企業(yè)來講,具體需遵循兩點,一是堅持數(shù)據(jù)廣泛性,對內掌握企業(yè)內部分析數(shù)據(jù),對外摸準用戶喜好和習慣;二是堅持數(shù)據(jù)關鍵性,從最重要處著手,把握數(shù)據(jù)復用性,達到最大價值又使成本最優(yōu)化。
《哈佛商業(yè)評論》近期發(fā)表了一篇題為“更大的數(shù)據(jù)會導致更好的決策嗎?”的文章,這篇文章提出警告,把重點放在量的方面將導致大錯誤。如今很多企業(yè)試圖通過龐大的數(shù)據(jù)量獲得利益,但只有少數(shù)企業(yè)真正取得成功,這是過分注重數(shù)據(jù)“量”帶來的弊端。
大數(shù)據(jù)分析之數(shù)據(jù)質量與數(shù)據(jù)分享
我們知道,要保證分析結果的準確性,必須確保被分析數(shù)據(jù)真實有效,至少絕大部分數(shù)據(jù)樣本要有質量保證。但在大量數(shù)據(jù)從數(shù)據(jù)源匯聚而來的過程中,難免有以次充好的數(shù)據(jù)混入。
在淘寶網(wǎng)購時,賣家信用等級是買家購買與否的重要參考。為了提高產品銷售量,刷信用等級成了業(yè)內公開的秘密,伴隨著部分賣家弄虛作假、違規(guī)提高信用等級的過程,將產生大量失真數(shù)據(jù),在欺騙消費者的同時,也會直接影響后期數(shù)據(jù)分析結果。
其次,中國互聯(lián)網(wǎng)產業(yè)中,“數(shù)據(jù)割據(jù)”現(xiàn)象較嚴重,即掌握大量核心數(shù)據(jù)的幾大互聯(lián)網(wǎng)巨頭各自為戰(zhàn),不愿分享。如掌握搜索數(shù)據(jù)的百度,掌握社交數(shù)據(jù)的騰訊,掌握消費數(shù)據(jù)的阿里巴巴,他們都意識到數(shù)據(jù)對于未來企業(yè)競爭力的重要性,因此不會將自己手中的數(shù)據(jù)籌碼輕易示人。
仍舊以百度、騰訊、阿里巴巴為例,按照目前他們在中國互聯(lián)網(wǎng)的流行程度,我們可以大體估計同時使用這三種應用的用戶個體占互聯(lián)網(wǎng)總用戶數(shù)的比率,保守估計,達到50%不成問題。因此,這三方數(shù)據(jù)一旦實現(xiàn)共享,將能拼湊出一幅完整的網(wǎng)絡信息圖譜。反之,“數(shù)據(jù)割據(jù)”造成大數(shù)據(jù)斷層和片面性,使其利用價值大打折扣。
CMIC認為,在大數(shù)據(jù)洪流洶涌襲來的當下,信息的流動才是重中之重,互聯(lián)網(wǎng)巨頭們的數(shù)據(jù)割據(jù)思維嚴重阻礙著整個產業(yè)的發(fā)展。尤其對于那些擁有大數(shù)據(jù)分析技術卻無大數(shù)據(jù)源的中下游企業(yè)來說,面臨“巧婦難為無米之炊”的窘境。

責任編輯:小沈
-
權威發(fā)布 | 新能源汽車產業(yè)頂層設計落地:鼓勵“光儲充放”,有序推進氫燃料供給體系建設
2020-11-03新能源,汽車,產業(yè),設計 -
中國自主研制的“人造太陽”重力支撐設備正式啟運
2020-09-14核聚變,ITER,核電 -
探索 | 既耗能又可供能的數(shù)據(jù)中心 打造融合型綜合能源系統(tǒng)
2020-06-16綜合能源服務,新能源消納,能源互聯(lián)網(wǎng)
-
新基建助推 數(shù)據(jù)中心建設將迎爆發(fā)期
2020-06-16數(shù)據(jù)中心,能源互聯(lián)網(wǎng),電力新基建 -
泛在電力物聯(lián)網(wǎng)建設下看電網(wǎng)企業(yè)數(shù)據(jù)變現(xiàn)之路
2019-11-12泛在電力物聯(lián)網(wǎng) -
泛在電力物聯(lián)網(wǎng)建設典型實踐案例
2019-10-15泛在電力物聯(lián)網(wǎng)案例
-
新基建之充電樁“火”了 想進這個行業(yè)要“心里有底”
2020-06-16充電樁,充電基礎設施,電力新基建 -
燃料電池汽車駛入尋常百姓家還要多久?
-
備戰(zhàn)全面電動化 多部委及央企“定調”充電樁配套節(jié)奏
-
權威發(fā)布 | 新能源汽車產業(yè)頂層設計落地:鼓勵“光儲充放”,有序推進氫燃料供給體系建設
2020-11-03新能源,汽車,產業(yè),設計 -
中國自主研制的“人造太陽”重力支撐設備正式啟運
2020-09-14核聚變,ITER,核電 -
能源革命和電改政策紅利將長期助力儲能行業(yè)發(fā)展
-
探索 | 既耗能又可供能的數(shù)據(jù)中心 打造融合型綜合能源系統(tǒng)
2020-06-16綜合能源服務,新能源消納,能源互聯(lián)網(wǎng) -
5G新基建助力智能電網(wǎng)發(fā)展
2020-06-125G,智能電網(wǎng),配電網(wǎng) -
從智能電網(wǎng)到智能城市