人類已經等了五千年DT 真的有那么神奇嗎
2014年3月的第一個周末,馬云在北京的一場大數據產業推介會上提出:“人類正從IT時代走向DT(Data Technology)時代”。阿里巴巴的創始人認為,“未來的制造業要的不是石油,它最大的能源是數據。”
那么,數據真的有那么神奇嗎?
對于這個問題,歷史學家的回答是:
5000多年前人類最早的文字就是為數據量身打造的; 人類能夠從原始的食物采集者進入穩定的農業文明,從原始部落走向城市、王國和帝國,數據也功不可沒。
數據是人類最早的文字信息
公元前3500年-公元前3000年,在與北京直線距離6000多公里的兩河流域,艷陽高照在這片肥沃的平原上。定居在這里的蘇美爾人發展出發達的農業和繁榮的城鎮。
不像靠采集和打獵為生的幾百人原始部落,進入農業社會的蘇美爾人口越來越多,地盤也越來越大。于是,蘇美爾人遇到了一個棘手的問題——這么多人口,該怎么管理呢?該種多少麥子?該收多少稅?
人類的“好記性”已經應付不了這些,只能借助外部工具了。于是蘇美爾人率先發明了一套專門處理大量數字和數據的系統——“文字”。
人類最早的文字信息既不是詩歌也不是故事,而是財經數據:“29086單位大麥 37個月”
尤瓦爾·赫拉利在《人類簡史》一書中評價說:
如果要管理一個大國家,數字可以說是一大關鍵。 人腦的限制大大局限了人類合作的規模和程度。 (可以用文字記錄數據的)蘇美爾人的社會秩序不再受限于人腦的處理能力,可以走向城市、王國和帝國。
大數據是能準確解釋原因、預測趨勢的數據
美索不達米亞南部的蘇美爾人開啟了人類的數據時代。那么,今天我們正在探索的大數據時代與五千年前有何不同?大數據又到底“大”在哪?對于普通人來說,這些問題可能還是傻傻分不清。
根據DT財經和“問卷網”聯合進行的關于對大數據認知和態度的調查問卷,在“什么是大數據”的多選題里,選擇“全國人口普查”的人次最多,“政府財政數據”和“商業抽樣數據”居后,而認為“淘寶‘剁手’指數”是大數據的人次竟然只有“全國人口普查”的1/4不到。
對于大數據的定義不盡相同,但它與普通數據最大的區別在于樣本從部分變成了整體。按照《大數據時代》一書中的觀點:
大數據指不用隨機分析法(抽樣調查)這樣的捷徑,而采用所有數據進行分析處理。
根據這個觀點,“商業抽樣數據”肯定不是大數據的范疇,而“人口普查數據”則是。
有一種較為狹義的大數據論,認為大數據是基于用戶痕跡,可以快速反饋的數據。這種觀點明顯是基于互聯網時代,尤其是移動終端特征的。如果根據這個說法,上圖四個選項中,只有淘寶數據可以被稱為大數據。
還有一種讓“小數據”變“大”的觀點。數據專家涂子沛認為“小數據”在縱向時間上的積累,或者空間上的記錄,再整合其他數據也能產生價值,成為“多源”的全息大數據。
那么到底什么是大數據?其實我們不用糾結于定義,而應把重心放在應用。正所謂“不看廣告,看療效”,大數據應該是能準確解釋原因、預測趨勢的數據。
大數據遍地開花,應用仍需謹慎
大數據的收集與應用已經無處不在:購物網站的每一次消費和查看、搜索引擎的每一次輸入、資訊平臺點開的每一個標題……我們這些被記錄下來的行為,都是大數據時代的基本粒子。
生活中讓我們感受最深的大數據應用之一,就是交通大數據。比如2016年1月高德地圖發布的《2016年春節出行預測報告》,預測了春節期間哪一時間段在哪個高速路段可能有怎樣程度的擁擠,并給出繞行方案。
這種長時間的預測,必須要用到往年的數據,而更多情況下的交通預測是基于當下交通流量大數據的及時反饋。比如可以看出某一路段車輛的實時位置,然后系統會預測未來幾分鐘、幾小時的車流。
精準的預測可以獲取利益,也可以規避損失,其價值不言而喻。高德公司估算:使用高德地圖躲避擁堵功能,平均每月為全部用戶節省時間達700年,節油高達1840萬升、價值1.3億元。
除了交通,大數據還將在哪些領域開花結果?根據“中投顧問”的《大數據產業報告》,教育、交通、消費、電力、能源、大健康和金融是全球大數據應用的七大領域,總價值預估在32200-53900億美元。
但是這數萬億的市場大部分還在腦海中。盡管大數據這個詞已經鋪天蓋地,但人類還并沒進入大數據時代。有專家認為:
目前大數據給出的結果可靠性太低,如果急于應用到實際中,就好比是土木工程還沒學好就開始造橋,結果可想而知。
政府數據資源應合理適度向社會開放
蘇美爾人發明的數據記錄系統,讓他們有能力管理日益復雜的社會,可以知道有多少人口,每年產多少糧食、收多少稅……自古以來,數據就是一個城邦、一個王國甚至一個帝國重要的治國依據。
在現代社會,公安部門有人口數據庫,工商部門有企業數據庫……每個政府部門、每級政府單位都有各自的數據庫。雖然按照“用戶反饋”這一特征,政府數據不一定能被稱為大數據,但政府部門積累的海量數據,卻是建造大數據“跨海大橋”的橋墩。
比如高德地圖,就與交通部門有合作,拿到了交通部門的數據。不過,更多的情況是抱怨政府掌控的公共數據存在重重壁壘,公共數據不夠開放。
政府公共數據是否該公開,又該怎樣公開,民眾也有自己的看法:
數據專家涂子沛認為,只要不危及國家安全、不侵犯公民隱私,政府公共數據就應該開放。原因很簡單,政府收集數據用的是納稅人的錢,收集的也是納稅人的數據,自然要向納稅人開放。
但是數據開放不是簡單的政府信息公開,涂子沛認為“公開”和“開放”是兩個不一樣的詞:
公開是信息層面的,是一條一條的;開放是數據庫層面的,是一片片的。
他認為,大數據時代,不同系統之間的數據要進行整合,要有統一的元數據定義。
好消息是,2015年9月國務院印發《促進大數據發展行動綱要》稱,國家政府數據統一開放平臺將在2018年底前建成,率先在氣象、環境、信用、交通、醫療、衛生等20余項重要領域,實現公共數據資源合理適度向社會開放。
企業間商業數據共享仍未可期
作為戰略資源,石油曾多次引發爭奪戰。如馬云所述,數據將是比石油更重要的資源,它又會引發怎樣的爭斗?
互聯網大佬都在覬覦政府的大數據,都想獲得這個龐大的資源。政府也越來越需要這些互聯網大佬的技術,愿意與這些企業點對點合作。
但BAT企業自身也擁有著海量的數據資源,這些源于用戶反饋的數據是否也該適當地向社會公開,甚至是與其他企業共享?
對此,民眾是這樣看的:
或許,想讓企業開放數據資源是天真的。對于把數據看成比石油還重要的資源的企業,數據保密是頭等大事。
國內的BAT三家互聯網巨頭,通過不斷收購都形成了龐大的派系。那么,這些派系內部各個公司的數據共享是否通暢呢?
恐怕也是堵塞的。《財經》雜志的文章評價說:
國內大數據領域的一些學者和業界人士抱怨,政府所掌握的公共大數據存在重重壁壘,難以共享,從源頭上有礙于創新。這一觀點有其合理之處,但并不全面。因為它難以解釋,為何已經手握海量數據的國內互聯網巨頭,也尚未用大數據技術挖掘出扛鼎之作。
大數據讓個人隱私無處安放
在原始部落社會,人類沒有個人空間,甚至衣不蔽體、袒胸露乳,沒有隱私的概念。即使是在中世紀的城堡里,那些還沒有個人主義觀念的貴族,也不懂什么叫隱私。他們甚至沒有自己的房間,就睡在敞亮的大廳里,活在眾目睽睽之下。
如今卻不一樣,還不識字的兒童也會有自己的房間,藏著自己的秘密。但就是在人類格外注重隱私的今天,我們卻暴露在互聯網之下。人類越來越多的行為被第三方記錄:中午吃了什么、晚上去了哪里、今天走了多少路、跟誰聊天、甚至得了什么病。
對于這些被記錄的個人行為,民眾是怎么看的?
斯諾登事件后,保護隱私就是民心所向,而得民心者得市場。美國FBI要求蘋果公司協助解開一部嫌犯使用的iPhone5c,但蘋果CEO庫克拒絕了,甚至寫公開信指責FBI破壞美國民主自由的立國根基(盡管最終FBI請第三方解鎖了那部手機)。
隱私不僅涉及秘密,更涉及安全。如果說一般的數據是常規裝備,大數據就是核裝備。大數據可以像核能造福人類,也可能像核武器帶來巨大傷害,尤其是多個源頭的大數據泄露后被組合在一起,破壞力將大大增加。
其實對于政府來說,開放公共數據也面臨著泄密的風險,即使是與科技公司點對點合作,個人隱私也是最容易觸及的紅線。
“靠譜”是大數據的生命
在DT時代,大數據將引領日常生活、指導企業生產、輔助政府治國理政。所以,“靠譜”是大數據的立身之本,不靠譜的大數據則可能把社會帶上歪路。
大數據靠不靠譜,數據來源很重要。而另一方面,則需要有專業的數據挖掘和分析人員。LinkedIn去年公布了2014年最受雇主喜歡、最炙手可熱的25項技能,其中統計分析和數據挖掘技能位列榜首。
大數據人才的炙手可熱既反映了行業的向好,也反映了目前大數據挖掘分析的短板,而這種專業人員和專業技能的缺少,也極有可能導致目前大數據產品的失真。
可以想見,在五千年前蘇美爾人的社會,會記錄數據的人才一定是國之棟梁。而后來兒童也可以書寫識數,有了數學家,物理學家……人類現在漸漸進入大數據時代,大數據的技能也勢必越來越普及。
從原始部落進入農業社會,數據記錄系統的誕生使得不斷增長的人類社會得到有效管理。
如今,全球化的世界面臨著更加復雜的問題——人口的進一步增長、資源的不堪重負、環境的持續惡化、生物種群的不斷減少……
原始的數據形式已然難以應對今天和明天的問題,大數據也許是解決之道。

2、本網其他來源作品,均轉載自其他媒體,目的在于傳遞更多信息,不表明證實其描述或贊同其觀點。文章內容僅供參考。
3、若因版權等問題需要與本網聯絡,請在30日內聯系我們,電話:0755-32905944,或者聯系電子郵件: 434489116@qq.com ,我們會在第一時間刪除。
4、在本網發表評論者責任自負。
網友評論僅供其表達個人看法,并不表明本網同意其觀點或證實其描述,發言請遵守相關規定。