11月12日,美國(guó)政府公布新版大數(shù)據(jù)研究計(jì)劃,白宮科技政策辦公室主任霍爾德倫致辭說,他去年曾預(yù)測(cè)大數(shù)據(jù)將是件“大事”,現(xiàn)在來看保守了;因?yàn)椤按髷?shù)據(jù)現(xiàn)在已經(jīng)成為天大的事”。
時(shí)間倒回到6月,斯諾登的41張幻燈片,讓美國(guó)大數(shù)據(jù)監(jiān)控項(xiàng)目“棱鏡”浮出水面,令人不寒而栗。
對(duì)大數(shù)據(jù)時(shí)代的樂觀和憂慮,在這一年充分展示。
1
大變革
“除了上帝,每個(gè)人都必須用數(shù)據(jù)說話。”不僅是人,整個(gè)世界都越來越數(shù)據(jù)化。信息革命深入發(fā)展,如潮的數(shù)據(jù)澎湃而至,數(shù)量之巨,種類之雜,來勢(shì)之快,前所未有。
IDC(國(guó)際數(shù)據(jù)公司)估計(jì),全球2012年產(chǎn)生數(shù)據(jù)總量約2.8澤字節(jié)。有人計(jì)算,這相當(dāng)于3000多億部時(shí)長(zhǎng)2小時(shí)的高清電影,連著看7000多萬年也看不完。
而這還只是序曲。更大的浪潮在后頭。
IDC預(yù)測(cè),未來幾年,全球數(shù)據(jù)量每隔兩年翻一番,2020年達(dá)到40澤字節(jié)。
大數(shù)據(jù)不單單是“數(shù)據(jù)的工業(yè)革命”,而是一場(chǎng)更深刻的科技和產(chǎn)業(yè)大變革的組成部分,是對(duì)未來大趨勢(shì)、時(shí)代新特征的一種描述。大數(shù)據(jù)是推動(dòng)這場(chǎng)大變革的重要?jiǎng)恿?,將成為促進(jìn)經(jīng)濟(jì)社會(huì)轉(zhuǎn)型新的關(guān)鍵資源。搜集、分析和運(yùn)用指數(shù)級(jí)增長(zhǎng)的龐大數(shù)據(jù),將催生創(chuàng)新,為各行各業(yè)提供新的發(fā)展機(jī)遇,給人們?nèi)粘I顜砀淖儭?/p>
星巴克有意推出的“大數(shù)據(jù)咖啡杯”就是個(gè)小小的例子。美國(guó)媒體報(bào)道,這家咖啡連鎖巨頭打算試驗(yàn)在一些咖啡杯中裝上傳感器,收集??秃瓤Х人俣鹊葦?shù)據(jù),從而為喝咖啡較慢顧客提供保溫效果好的杯子,提高其滿意度和忠誠(chéng)度。
業(yè)內(nèi)人士認(rèn)為,大數(shù)據(jù)的本質(zhì)還不在于“大”,而是以嶄新的思維和技術(shù)去分析海量數(shù)據(jù),揭示其中隱藏的人類行為等模式,由此創(chuàng)造新產(chǎn)品和服務(wù),或是預(yù)測(cè)未來趨勢(shì)。
暢銷書《大數(shù)據(jù)時(shí)代》的作者、英國(guó)牛津大學(xué)數(shù)據(jù)科學(xué)家舍恩伯格認(rèn)為,大數(shù)據(jù)是一種新的價(jià)值觀和方法論,人們面對(duì)的不再是隨機(jī)樣本而是全體數(shù)據(jù),不是精確性而是混雜性,不是因果關(guān)系而是相關(guān)關(guān)系。
“現(xiàn)有的認(rèn)知和體系是建立在稀缺數(shù)據(jù)上的成果,人們思維和工作方式必須發(fā)生變革以適應(yīng)大數(shù)據(jù)時(shí)代的到來?!鄙岫鞑裨谄鋾袑懙馈?/p>
2
大競(jìng)爭(zhēng)
大數(shù)據(jù)被視為創(chuàng)新和生產(chǎn)力提升的下一個(gè)前沿,正成為國(guó)家競(jìng)爭(zhēng)力的要素之一,在世界范圍內(nèi)日益受到重視。多國(guó)政府加大了對(duì)大數(shù)據(jù)發(fā)展的扶持力度,甚至上升到國(guó)家戰(zhàn)略的高度。2013年,圍繞大數(shù)據(jù)的國(guó)際競(jìng)爭(zhēng)繼續(xù)加碼。
咨詢公司益百利集團(tuán)的研究顯示,全球?qū)Υ髷?shù)據(jù)項(xiàng)目投資總額去年已達(dá)45億歐元(約60億美元),預(yù)計(jì)今明兩年均會(huì)保持約40%的增長(zhǎng)速度。
在美國(guó),大數(shù)據(jù)已由熱點(diǎn)詞匯變成重點(diǎn)項(xiàng)目。去年3月,美國(guó)政府已公布2億美元的《大數(shù)據(jù)研究發(fā)展計(jì)劃》,今年11月再度公布涉及各級(jí)政府、私企、科研機(jī)構(gòu)的多個(gè)大數(shù)據(jù)研究項(xiàng)目。美國(guó)國(guó)家衛(wèi)生研究院、國(guó)家科學(xué)基金會(huì)等都參與其中,有評(píng)論稱之為美國(guó)大數(shù)據(jù)戰(zhàn)略2.0版。
在英國(guó),雖然經(jīng)濟(jì)不景氣、財(cái)政緊縮,但政府依然為大數(shù)據(jù)一擲千金。2013年初,英國(guó)商業(yè)、創(chuàng)新和技能部宣布將注資8億英鎊發(fā)展8類高新技術(shù),其中1.89億英鎊(約3億美元)用于大數(shù)據(jù)項(xiàng)目。
大數(shù)據(jù)在中國(guó)也已啟動(dòng)駛?cè)搿翱燔嚨馈?,政府、企業(yè)和科研院所正多方位布局。工信部的物聯(lián)網(wǎng)“十二五”發(fā)展規(guī)劃,將信息處理技術(shù)作為四項(xiàng)關(guān)鍵創(chuàng)新技術(shù)工程之一,其中包括海量數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)挖掘等。隨著4G牌照在2013年末的發(fā)放,更高速的網(wǎng)絡(luò)將帶來更大的數(shù)據(jù)流,為政府和企業(yè)帶來戰(zhàn)略性資源。
3
大挑戰(zhàn)
“棱鏡”今年曝光,讓人看到大數(shù)據(jù)時(shí)代維護(hù)國(guó)家信息安全、保護(hù)個(gè)人隱私所面臨的嚴(yán)峻挑戰(zhàn)。
“棱鏡門”讓各國(guó)政府意識(shí)到“數(shù)據(jù)主權(quán)”的重要性,以及在網(wǎng)絡(luò)和電信核心技術(shù)上依賴個(gè)別國(guó)家的惡果。必須加快自主創(chuàng)新以保護(hù)“數(shù)據(jù)主權(quán)”,已成為一些國(guó)家的共識(shí)。
英國(guó)《自然》雜志3月刊登的研究發(fā)現(xiàn),只要有4個(gè)時(shí)間點(diǎn)和位置的數(shù)據(jù)就能確定一個(gè)人身份,準(zhǔn)確率高達(dá)95%。這表明,大數(shù)據(jù)足以將一個(gè)人“描畫”清晰,現(xiàn)有法律手段和核心技術(shù)對(duì)個(gè)人隱私的保護(hù)正在逐漸失效。
如何在大數(shù)據(jù)來襲中保持清醒和理性、有所創(chuàng)新和創(chuàng)造,對(duì)國(guó)家和個(gè)人來說同樣是考驗(yàn)。
專家指出,大數(shù)據(jù)可望為中國(guó)經(jīng)濟(jì)轉(zhuǎn)型升級(jí)發(fā)揮重要貢獻(xiàn),巨大的人口基數(shù)、經(jīng)濟(jì)體量和需求,意味著中國(guó)發(fā)展大數(shù)據(jù)擁有得天獨(dú)厚的優(yōu)勢(shì)。但也應(yīng)該看到,大數(shù)據(jù)具有價(jià)值密度低的特性,挖掘、分析等技術(shù)要求高。中國(guó)不能僅滿足于做“世界數(shù)據(jù)中心”,應(yīng)防止概念炒作,加強(qiáng)自主創(chuàng)新,進(jìn)行前瞻性的制度設(shè)計(jì)等布局,順勢(shì)而為,將“中國(guó)創(chuàng)造”由機(jī)遇化為現(xiàn)實(shí)。
還應(yīng)該警惕“迷信”大數(shù)據(jù)等傾向,認(rèn)識(shí)到大數(shù)據(jù)分析可能存在的缺陷和不足。心理學(xué)家認(rèn)為,大數(shù)據(jù)創(chuàng)造的模型會(huì)將人束縛在算法提供的選項(xiàng)中,過度依賴大數(shù)據(jù)分析也可能束縛創(chuàng)新。美國(guó)互聯(lián)網(wǎng)活動(dòng)家帕里澤稱之為“互聯(lián)網(wǎng)濾泡”:互聯(lián)網(wǎng)個(gè)性化雖然帶來方便,卻將人們局限在自己過往行為模式的“氣泡”中,無法觸及海量信息帶來的無盡可能。
大數(shù)據(jù)專家喜歡用莎士比亞“凡是過去,皆為序曲”來形容大數(shù)據(jù)分析的必然,但大數(shù)據(jù)提供的也只是參考答案而非最終答案。無論在小數(shù)據(jù)時(shí)代還是大數(shù)據(jù)時(shí)代,探索和創(chuàng)新精神都不應(yīng)放棄,正如林肯所言,“預(yù)測(cè)未來最好的方法就是去創(chuàng)造未來”。
4
大事件
美國(guó)防務(wù)承包商前雇員愛德華·斯諾登的爆料,讓美國(guó)國(guó)家安全局的“棱鏡”監(jiān)視項(xiàng)目為大眾窺知。如果單從技術(shù)角度看,“棱鏡”可能是迄今最成功的大數(shù)據(jù)應(yīng)用項(xiàng)目之一。
“棱鏡”最大特點(diǎn)在于利用美國(guó)的全球通信中樞地位截取數(shù)據(jù)。斯諾登提供的一張幻燈片,如果從巴基斯坦發(fā)一封電子郵件到英國(guó),從美國(guó)“繞道”更快捷經(jīng)濟(jì)。而當(dāng)全球海量數(shù)據(jù)都如此“繞道”,美國(guó)情報(bào)機(jī)構(gòu)只要在電信運(yùn)營(yíng)商的主干光纖上做手腳,就可以截取。
除了對(duì)互聯(lián)網(wǎng)數(shù)據(jù)通路的操控,美國(guó)國(guó)家安全局在“9·11”之后還開始收集通話元數(shù)據(jù),即不包含通話內(nèi)容的美國(guó)境內(nèi)及國(guó)際通話的雙方電話號(hào)碼、通話時(shí)長(zhǎng)、電話的位置信息等。另據(jù)媒體披露,對(duì)于電子郵件、社交網(wǎng)絡(luò)等加密內(nèi)容,在一些互聯(lián)網(wǎng)公司的合作下,國(guó)家安全局可以從這些公司的服務(wù)器將數(shù)據(jù)直接同步到自己的服務(wù)器上,運(yùn)作過程同云端硬盤備份類似。
為了處理這些數(shù)據(jù),國(guó)家安全局專門開發(fā)了一個(gè)數(shù)據(jù)庫,可以儲(chǔ)存處理多格式數(shù)據(jù),在發(fā)現(xiàn)數(shù)據(jù)的規(guī)律模式后實(shí)時(shí)報(bào)告,并能將姓名、電話號(hào)碼等元數(shù)據(jù)作為節(jié)點(diǎn),把相關(guān)的姓名、號(hào)碼、搜索詞等聯(lián)系起來,自動(dòng)生成關(guān)聯(lián)圖。
“棱鏡”還有一套名為“無限線人”的大數(shù)據(jù)分析工具,按國(guó)家和具體項(xiàng)目進(jìn)行監(jiān)視。使用者可以選擇一個(gè)國(guó)家向系統(tǒng)提問“我們對(duì)X國(guó)掌握的最新數(shù)據(jù)是什么”,系統(tǒng)會(huì)顯示掌握的元數(shù)據(jù)量,再根據(jù)具體項(xiàng)目顯示細(xì)節(jié)數(shù)據(jù)。資料顯示,2013年3月,“無限線人”在全球計(jì)算機(jī)網(wǎng)絡(luò)收集信息基礎(chǔ)上產(chǎn)生的報(bào)告達(dá)970億條。
大變革
一種新的價(jià)值觀和方法論,人們思維和工作方式必須轉(zhuǎn)變以適應(yīng)大數(shù)據(jù)時(shí)代
大競(jìng)爭(zhēng)
大數(shù)據(jù)被視為創(chuàng)新和生產(chǎn)力提升的下一個(gè)前沿,成為國(guó)家競(jìng)爭(zhēng)力的要素之一
大挑戰(zhàn)
只要有4個(gè)時(shí)間點(diǎn)和位置的數(shù)據(jù)就能確定一個(gè)人身份,其準(zhǔn)確率高達(dá)95%
新聞熱詞
大數(shù)據(jù)
據(jù)新華社電 按照業(yè)界比較普遍的看法,大數(shù)據(jù)具有海量、多種類、需要大規(guī)模處理和快速響應(yīng)等特點(diǎn)。
根據(jù)IDC(國(guó)際數(shù)據(jù)公司)的跟蹤分析,全球產(chǎn)生的數(shù)據(jù)總量2010年首次突破1澤(10的21次方)字節(jié),2012年達(dá)到約2.8澤字節(jié),2020年有望達(dá)到40澤字節(jié)。2012年,全球產(chǎn)生的數(shù)據(jù)中僅有約0.5%得到分析。到2020年,全球數(shù)據(jù)總量中有22%將來自中國(guó)。
從內(nèi)容來看,這些海量數(shù)據(jù)可分為結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)。問卷調(diào)查、產(chǎn)品評(píng)論、信用卡記錄和實(shí)驗(yàn)結(jié)果等屬于結(jié)構(gòu)化數(shù)據(jù),僅占數(shù)據(jù)總量的5%左右;大數(shù)據(jù)時(shí)代的數(shù)據(jù)量爆炸多來自非結(jié)構(gòu)化數(shù)據(jù),例如在社交網(wǎng)站上發(fā)布的照片和視頻,在搜索引擎中輸入的搜索詞,手機(jī)產(chǎn)生的即時(shí)位置信息等,約占數(shù)據(jù)量的95%。
比如,世界上第一部“先拍照后對(duì)焦”光場(chǎng)相機(jī)Lytro,就運(yùn)用了大數(shù)據(jù)處理分析理念。與傳統(tǒng)相機(jī)只記錄一束光不同,Lytro可以記錄整個(gè)光場(chǎng)里所有的光,也就是用總體數(shù)據(jù)取代了隨機(jī)樣本。用戶沒必要一開始就對(duì)焦,想要什么樣的照片可以在拍攝之后再?zèng)Q定。
數(shù)據(jù)量大幅增加對(duì)人們注重精確性的習(xí)慣等提出了挑戰(zhàn),大數(shù)據(jù)需要技術(shù)和思維上的變革才能利用。人工智能專家說,相關(guān)翻譯在語料庫使用龐雜的網(wǎng)絡(luò)內(nèi)容后取得了飛躍發(fā)展,不完整的句子、拼寫錯(cuò)誤、語法錯(cuò)誤等各種錯(cuò)誤;讓翻譯可以正確地推算出英文詞匯搭配在一起的可能性,混雜性和謬誤反而讓翻譯的表現(xiàn)以及產(chǎn)品更為突出。
聯(lián)系客服