分享到: | 更多 |
大數據究竟能給我們帶來什么?僅僅是要我們不斷增加存儲,不斷提高帶寬,不斷進行數據的處理嗎?當然不是,我們真正要從大數據得到的,是大數據中那些有用的知識。
大致上講,目前的大數據來源有兩塊:交易數據和關聯交互數據,前者指業(yè)務系統或交易系統產生的數據庫,小體量卻高價值;后者則是社交網絡產生的數據,大體量卻低價值。對于這兩大數據來源,人們基于大數據理論提出一些解決方案,如把社交網站的數據和電商平臺的交易數據關聯,進行精準廣告投放,產生更大的價值。然而問題是,為何交易系統要共享這些數據?擁有電子商務網站、微博或即時通訊工具的那些互聯網巨頭,很難說愿意把自己的這些核心數據在沒有重大利好前提下與人分享。同時,需要進一步思考的是,即使這些數據能夠共享,該用哪一種技術才能實現較高的關聯性,來挖掘出潛在的巨大價值?
那么,作為從傳統數據挖掘概念延伸而來的“大數據”,現在為何這么熱?很大一部分原因,是源自管理學界和商業(yè)媒體對于大數據的推崇備至,他們認為大數據是信息技術改變商業(yè)世界的殺手級應用。有不少人沉醉于大數據的大容量、快速和多樣性,卻忽視了大數據真正能給用戶帶來的價值。我們不難發(fā)現,現在關于大數據成功案例的報道并不多見,尤其缺少那種系統性大項目的成功經驗。谷歌預測系統和亞馬遜精準廣告投放系統,和最近斯諾登爆出的美國棱鏡計劃,這些可被視為大數據解決方案的“成功”案例。然而,棱鏡的“成功”不是由于其技術或方法的先進,而是在于美國政府有著強大的能力來整合谷歌、臉譜網、雅虎等各大互聯網服務商的信息,通過數據挖掘實現自己的應用。除此之外,很難覓得其他具有實際意義的案例。
現在,學術界對于大數據的態(tài)度相較以前已經冷靜很多,不再是一窩蜂地為其叫好。更多的人開始反思大數據的局限性,如曾利用大數據準確預測出美國總統大選結果的納特·西爾弗,著書討論大數據帶來的究竟是信號還是噪音;也有曾力推大數據的學者認為,大數據不僅僅是海量數據的集合,更重要的是要挖掘出其背后真正的價值。近來,人們也開始反思大數據的真正含義,冷靜思考大數據背后的真正價值,嘗試構建各種大數據解決方案并應用于各行各業(yè)。尤其是在智慧城市建設中,更是不斷探索如何盤活已有數據存量,用好大數據增量,來提升城市公共服務能力和管理決策水平。
因此,我們需要意識到,IT技術經過這些年來的發(fā)展,已經從數據產品時代步入數據應用時代,而大數據的核心不在于其體量、速度和類型,而是如何發(fā)揮數據的價值。如果現有的數據富礦我們都不去很好的整合、分析加工和利用,何談還有必要去挖掘新礦?
。ㄗ髡邽樯裰輸荡a大數據專家)