国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
知識(shí)圖譜:讓搜索通往答案本身

知識(shí)圖譜:讓搜索通往答案本身

果殼包果核 2013-01-25 16:18

現(xiàn)在,谷歌似乎成為了知識(shí)的代名詞。它雖不能回答你的問題,但卻可以幫你找到答案。隨著“知識(shí)圖譜”(Knowledge Graph)的出現(xiàn),谷歌的定位也在改變——它提供的不僅是通向答案的鏈接,還有答案本身。

谷歌從未停止自己對(duì)于搜索的探索。這間公司已經(jīng)近乎達(dá)成“世間萬(wàn)物的所有信息都匯聚于此”,“知識(shí)圖譜”(Knowledge Graph)要做的,就是梳理清楚這些信息間的關(guān)系。

這十幾年來,隨著以谷歌為代表的互聯(lián)網(wǎng)搜索巨頭的出現(xiàn),“搜索”這個(gè)概念已經(jīng)發(fā)生了翻天覆地的變化,被改變的不僅僅是困惑時(shí)尋找答案的方式,連“迷路”等狀況也漸漸地淡出了人們的生活。思考的方式在變,與朋友聯(lián)系的方式在變,獲取信息的方式在變,甚至于搜索的方式也在改變——用語(yǔ)言向計(jì)算機(jī)提問,不再需要輸入框。
 
搜索的未來會(huì)是怎樣?身價(jià)億萬(wàn)的谷歌創(chuàng)始人拉里·佩奇(Larry Page)和謝爾蓋·布林(Sergey Brin)2004年曾預(yù)言,“搜索會(huì)成為人們大腦的一種活動(dòng),當(dāng)你在想到一件不怎么清楚的事,它便會(huì)自動(dòng)出現(xiàn)在你的腦海里”;“谷歌的目的是用全世界的信息擴(kuò)張人類的腦容量。目前,你需要在搜索框內(nèi)輸入字眼,但未來事情肯定會(huì)更簡(jiǎn)單。你可以和設(shè)備對(duì)話,計(jì)算機(jī)會(huì)自動(dòng)收集周圍的信息……”;佩奇更是堅(jiān)信,“最終,計(jì)算機(jī)會(huì)被植入你的大腦,只要想到,答案就會(huì)出現(xiàn)”。
 
9年之后,布林規(guī)劃的“未來”已經(jīng)逐步實(shí)現(xiàn),蘋果和谷歌都推出了語(yǔ)音搜索服務(wù),而Google Now可以在你發(fā)問之前告訴你目的地的天氣如何、喜歡的球隊(duì)?wèi)?zhàn)況怎樣,諸如此類的信息。而佩奇的大腦植入計(jì)劃還仍舊遙遠(yuǎn),不過谷歌正在研發(fā)的“谷歌眼鏡”可以在使用者眼睛近前方外側(cè)投射一個(gè)恒定的屏幕影像,操控也是通過語(yǔ)音進(jìn)行。搜索,已經(jīng)越來越接近于思考。(※此處已修改)
 
搜索的概念日新月異,但其本質(zhì)卻始終如一——滿足你對(duì)信息的需求。在這一切的背后,是寫代碼的程序員孜孜不倦的努力。提起程序員,就不得不提到阿米特·辛格爾(Amit Singhal)。44歲的辛格爾是Google搜索部門的帶頭人,十幾年來他肩負(fù)著編寫及維護(hù)谷歌搜索算法的大任,正是他負(fù)責(zé)的200多個(gè)獨(dú)立的編碼方程式,讓我們?cè)诿曰髸r(shí)能從Google得到答案。
 

谷歌搜索的掌門人

阿米特·辛格出生于印度北部的一個(gè)小村莊,在8歲后他的家里才添置了第一塊顯示屏,那是一臺(tái)黑白電視機(jī)。“當(dāng)時(shí)的電視只有兩個(gè)頻道,一個(gè)是針對(duì)于本地農(nóng)民播放的農(nóng)業(yè)頻道,另一個(gè)不斷地播放美國(guó)電視劇,比如星際迷航(Star Trek)。”“我看了非常多遍星際迷航,每一集我都爛記于心”,回憶這段歲月時(shí)辛格爾發(fā)出了爽朗的笑聲,“我認(rèn)為是這部電視劇改變了我的世界觀。在星球間穿行、能回答任何問題的電腦,這些概念深深地植入我的心底。唯一沒想到的是,這些東西竟然會(huì)在我的有生之年出現(xiàn)。”
 
辛格爾認(rèn)為自己是個(gè)幸運(yùn)的人,總是在正確的時(shí)間被引領(lǐng)向正確的事情。1991年他在美國(guó)本科畢業(yè),轉(zhuǎn)入學(xué)習(xí)計(jì)算機(jī)搜索,這一年起萬(wàn)維網(wǎng)(World Wide Web)開始連接世界。在拿到博士學(xué)位后,辛格爾加入AT&T的貝爾實(shí)驗(yàn)室(Bell laboratories)。2000年起,他加入谷歌。這一切,仿佛冥冥之中有一雙手在指引他前進(jìn)的方向。
 
接受采訪時(shí),辛格爾從口袋中掏出自己的安卓手機(jī),對(duì)著手機(jī)問道:“倫敦有多少人口?”手機(jī)答:“2011年的數(shù)據(jù)顯示,倫敦人口為817.4萬(wàn)。”他接著問:“賈斯汀·比伯(Justin Bieber)身高幾何?”手機(jī)答:“賈斯汀·比伯身高5英尺7英寸。”聲音落下,辛格爾露出了孩子般的笑容:“如果我二十年前睡著了今天才起床,看到這一切后,我肯定會(huì)激動(dòng)地問:‘快告訴我,去哪里搭乘星際航班?’”
 
辛格爾進(jìn)而表示,他們現(xiàn)在取得的成果都還在初級(jí)階段,但搜索已經(jīng)站在了奇幻未來的大門口。在經(jīng)過了十幾年的發(fā)展后,這些冷冰冰的計(jì)算機(jī)開始獲得人性化的能力,“開始學(xué)習(xí)如何理解真實(shí)社會(huì)中的人和事”。
 
在一些看似簡(jiǎn)單的場(chǎng)景背后,蘊(yùn)含著極其豐富的信息,就比如說手機(jī)回答了賈斯汀·比伯的身高。手機(jī)得明白,賈斯汀·比伯是一個(gè)人,還得明白身高一詞代表著怎樣的含義?!?wbr>計(jì)算機(jī)已經(jīng)能夠跨越語(yǔ)義學(xué)上的障礙,但這遠(yuǎn)遠(yuǎn)不夠。在簡(jiǎn)單的語(yǔ)句背后是一大堆無(wú)結(jié)構(gòu)的文本信息,只有明白了究竟問得是什么問題,才能給出適合的答案。”
 
現(xiàn)在,谷歌似乎成為了知識(shí)的代名詞。它雖然不能回答你的問題,但它可以幫助你找到問題的答案。從某些方面看,隨著“知識(shí)圖譜”(Knowledge Graph)的出現(xiàn),谷歌的定位也在改變——它提供的不僅是通向答案的鏈接,還有答案本身。
 

知識(shí)圖譜:梳理人與信息的聯(lián)系

知識(shí)圖譜是一個(gè)收集了5億余個(gè)最常被搜索的人、地、事的數(shù)據(jù)庫(kù)。對(duì)于每一個(gè)詞條,谷歌都提供了大量而全面的信息——不是簡(jiǎn)單的詞串或單薄的數(shù)據(jù)片段。假設(shè)你通過知識(shí)圖譜查詢唐寧街10號(hào)(10 Downing Street),谷歌給出的答案并不是“這是一個(gè)地名”,他會(huì)像一個(gè)普通人一樣,把相關(guān)的信息對(duì)你娓娓道來,這些相關(guān)信息都是其他用戶經(jīng)常查詢的。

5 年前,當(dāng)科技類雜志《連線》(Wired)創(chuàng)始人約翰·巴特利(John Battelle)創(chuàng)作著作《搜》(The Search:How Google and Its Rivals Rewrote the Rules of Business andTransformed Our Culture)時(shí),他引用了艾薩克·阿西莫夫(Isaac Asimov)在科幻小說中描述的場(chǎng)景:“所有被收集的信息都來到一個(gè)終點(diǎn),世間萬(wàn)物的所有信息都匯聚于此。但是,這些信息之間的關(guān)系還沒有被完全梳理清楚,這項(xiàng)工程要耗費(fèi)無(wú)窮無(wú)盡的時(shí)間?!?/p>

信息的廣度和精度

在某種角度上,谷歌對(duì)知識(shí)圖譜的嘗試便是這一無(wú)窮無(wú)盡的工程的開端。對(duì)于這間公司,它已經(jīng)近乎達(dá)成“世間萬(wàn)物的所有信息都匯聚于此”,它管理的信息不僅是互聯(lián)網(wǎng)上一切網(wǎng)頁(yè)上書寫著的內(nèi)容,更有每一條街、每一道路上的照片,有數(shù)不盡的實(shí)體書內(nèi)容,有你我觀看的每一個(gè)網(wǎng)絡(luò)視頻(最大的視頻分享網(wǎng)站Youtube為谷歌所有)。近年來,谷歌又在做新的嘗試,它想記錄下世間各色各樣的人音,為了收集世間一切的語(yǔ)言或方言,以打造出新一代的翻譯/人聲閱讀功能。同時(shí),谷歌還在人臉識(shí)別領(lǐng)域進(jìn)行探索。最關(guān)鍵的是,憑借搜索記錄等常被大肆批評(píng)討論是否侵犯隱私的個(gè)人信息搜集,谷歌足夠了解每個(gè)用戶的私人生活。

一切被收集的信息不僅可用于精準(zhǔn)契合用戶需求提供信息支持,更能幫助谷歌去思考如何給機(jī)器培養(yǎng)思維。這十幾年來,辛格爾和他的團(tuán)隊(duì)一直在探索,如何通過文本和超鏈接為搜索用戶提供更為準(zhǔn)確的信息。同時(shí),他們也慢慢掌握了方法,“觀察這個(gè)世界是如何與信息產(chǎn)生互動(dòng),并開始做一些其他的東西,比如讓計(jì)算機(jī)明白人們輸入的問題是什么意思”。

谷歌是如何向用戶學(xué)習(xí)的呢?其實(shí)很簡(jiǎn)單,分析用戶在搜索頁(yè)面上停留的時(shí)間。如果時(shí)間長(zhǎng),說明用戶找到了滿意的答案,他們不需要點(diǎn)開其他鏈接,或是更改搜索詞條。如果時(shí)間短,這就說明搜索頁(yè)面沒有做到盡善盡美,得算是一個(gè)小的失敗。每個(gè)人都認(rèn)為,我們向谷歌學(xué)習(xí)了很多。但事實(shí)上,受益于源源不斷的上十億次分析,谷歌從你我身上學(xué)到了更多東西。

理解用戶的需求

早在2002年,辛格爾就基于路德維?!ぞS特根斯坦(Ludwig Wittgenstein)的理論,引進(jìn)了一套關(guān)于上下文如何影響單詞詞義的升級(jí)理論。當(dāng)詞義模糊的單詞被搜索時(shí),谷歌跨越單詞本身去查詢相關(guān)的詞匯。比如熱狗,谷歌會(huì)通過相關(guān)詞“芥末”或“球賽”明白它是一種快餐類食物,而不是一只很熱的狗。辛格爾解釋說,“正是熱狗與很熱的狗之間的細(xì)微差別,定義了人工智能。”

既然如此,是不是人們用谷歌用得越多,谷歌就越能提供精準(zhǔn)的回答呢?對(duì)于這個(gè)假設(shè),辛格爾發(fā)出一聲嘆息:“事實(shí)不是如此。當(dāng)搜索引擎給出的信息越精準(zhǔn),用戶的提問就越粗糙,搜索引擎的進(jìn)步就受到了阻礙?!?wbr>面對(duì)著大量的語(yǔ)法錯(cuò)誤或是拼寫錯(cuò)誤,工程師要耗費(fèi)大量的精力去調(diào)試系統(tǒng),目的只有一個(gè),做出《星際迷航》中那樣的計(jì)算機(jī),即便你不知如何表述自己的問題,答案仍會(huì)出現(xiàn)在你的腦海中?!?wbr>最終我們希望搜索成為大腦思考進(jìn)程中自然的一環(huán),我們竭盡全力消除問題與答案之間的阻礙?!边@一切,恰是對(duì)于“植入大腦的計(jì)算機(jī)”概念的響應(yīng)。

知識(shí)圖譜是一個(gè)強(qiáng)有力的嘗試,它的出現(xiàn)是隨著谷歌收購(gòu) Metaweb 公司開始的。辛格爾回憶道,“我們發(fā)現(xiàn)了這家叫做Metaweb 的公司,他們擁有讓計(jì)算機(jī)與人類和諧交互的辦法,他們正嘗試著把真實(shí)世界的人與物投射到計(jì)算機(jī)內(nèi)存之中。他們的技術(shù)看起來很靠譜,所以我們收購(gòu)了Metaweb?!?/p>

在那時(shí),Metaweb 存儲(chǔ)了1200萬(wàn)個(gè)參照點(diǎn)(reference points)。在兩年后,有了谷歌的推動(dòng),這個(gè)規(guī)模被擴(kuò)張至5.7億,并在這些參照點(diǎn)之間建立了180億個(gè)連接。這是一個(gè)怎樣的概念呢?“百科全書”維基百科內(nèi)僅收錄了約400萬(wàn)個(gè)詞條。

艾米麗·莫克斯利(Emily Moxley)是谷歌知識(shí)圖譜的負(fù)責(zé)人,她在接受記者采訪時(shí)表示,他們花了極大的功夫,才讓這個(gè)搜索引擎能夠區(qū)分英式足球和美式足球(即橄欖球)?!氨热缯f在日本,我們的分析結(jié)果顯示,用戶對(duì)于影星的血型很感興趣,于是我們?cè)谥R(shí)圖譜內(nèi)便添加了這部分內(nèi)容?!?wbr>谷歌針對(duì)日本市場(chǎng)還花費(fèi)了另一些功夫。他們發(fā)現(xiàn)日本用戶在搜索相撲時(shí)難以得到滿意的答案,“我認(rèn)為我們至少得能夠回答一些較有深度的相關(guān)問題”,艾米麗如是說。怎樣才是“較有深度”呢?艾米麗的答案是,“至少要能回答最常見的那幾千萬(wàn)個(gè)問題?!?/p>知識(shí)的精度與廣度并不是谷歌唯一的追求,辛格爾希望搜索的結(jié)果能夠與用戶的需求相一致?!?wbr>當(dāng)你搜索馬丁·路德·金(Martin Luther King)那篇著名的演講《我有一個(gè)夢(mèng)想》時(shí),”辛格爾說:“你可能想找演講文本,可能想找相關(guān)圖片,但我們猜,你真正想要到的是當(dāng)時(shí)現(xiàn)場(chǎng)的視頻,所以這段視頻出現(xiàn)在知識(shí)圖譜的最上方?!边@就是知識(shí)圖譜,谷歌希望它不僅能提供信息,還要能理解人的需求。

 

不少人質(zhì)疑,谷歌每年的營(yíng)收超過 9 成來自于廣告收入,而廣告收入的基礎(chǔ)恰恰是他們所掌握的信息。不過,如果你向任何一位谷歌員工提起這個(gè)話題,他們都會(huì)自然地給出類似回應(yīng):“你為什么不相信我們呢?”谷歌也時(shí)時(shí)因?yàn)樽约旱慕巧萑敕杉m紛中,比如歐盟起訴谷歌在搜索結(jié)果中偏袒自己的產(chǎn)品服務(wù),違反了反壟斷的相關(guān)法規(guī)。

對(duì)于這些問題,辛格爾的回應(yīng)是——我們是搞搜索的人,我就是想建立一個(gè)強(qiáng)大的搜索引擎,實(shí)現(xiàn)自己的價(jià)值,僅此而已。辛格爾進(jìn)一步說:“所有的信息都是經(jīng)過授權(quán)的。”對(duì)于谷歌擁有的信息的意義,他舉了自己最喜歡的例子以作說明——每年,辛格爾都要回到自己出生的那個(gè)印度小村莊,看看信息化如何影響了這里的人們,而辛格爾的父親幾乎每年都會(huì)到訪加利福尼亞,“我的父親是一位退休公務(wù)員,他以前每次來這都很擔(dān)心,因?yàn)樗麕Щ丶业亩Y品得經(jīng)過海關(guān)的復(fù)雜檢驗(yàn)。印度海關(guān)對(duì)于這一塊的規(guī)定糾結(jié)且善變,要搞懂最新的規(guī)定十分非常讓人頭疼?!?/p>

“我仍記得在10年前,我教父親使用谷歌搜索‘印度海關(guān)通關(guān)條例’,黑紙白字的搜索結(jié)果,全是最新版的。父親會(huì)將其打印出來塞進(jìn)胸前口袋,鼓囊囊的一坨。當(dāng)父親回家時(shí)他會(huì)打電話向我描述,自己在通關(guān)時(shí)是怎樣拿出那張紙,向海關(guān)工作人員說明,自己給孩孫帶的禮物都符合了的規(guī)定。海關(guān)工作人員之后對(duì)他說,‘歡迎回家,辛格爾先生!’”

正如辛格爾父親的經(jīng)歷,便捷的搜索簡(jiǎn)化了我們的生活,辛格爾還在繼續(xù)努力讓這種便捷繼續(xù)前進(jìn)。如今知識(shí)圖譜會(huì)顯示出它認(rèn)為你最需要的信息,但未來它可能可以模擬我們的思維過程。辛格爾如今醉心于對(duì)行為心理學(xué)的研究,他成為了心理學(xué)家丹尼爾·卡尼曼(Daniel Kahneman)的擁躉。“我喜歡他對(duì)于人類面對(duì)選擇和決定時(shí)心態(tài)的細(xì)致研究。比如當(dāng)有人拿出32條巧克力要你選擇時(shí),你為什么想逃;為什么當(dāng)那人拿出只一只巧克力讓你無(wú)從選擇時(shí),你會(huì)感到心滿意足。”

辛格爾與谷歌從未停止自己對(duì)于搜索的探索。這樣發(fā)展下去,信息與搜索的未來會(huì)是何種模樣? 對(duì)于這個(gè)問題,辛格爾爽朗地答道:“具體我還不確定……”讓你毫不懷疑他、還有谷歌這家公司一貫所奉行的,很快就會(huì)知曉。

 

更正說明:文章發(fā)布之初,第三自然段中對(duì)于谷歌眼鏡(Google Glass)的功能表述有誤,而且沒有準(zhǔn)確傳達(dá)作者對(duì)佩奇將計(jì)算機(jī)植入大腦這一預(yù)測(cè)的看法。經(jīng)讀者_Taget_指出后修改,特此說明。(2013-1-26)

 

編譯自:《衛(wèi)報(bào)》,Google and the future of search: Amit Singhal and the Knowledge Graph
文章圖片:來自網(wǎng)絡(luò)

本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
谷歌終成霸主 多虧這三件法寶
Google 的偉大征程之二:知識(shí)圖譜
剛剛卸任的谷歌搜索及AI負(fù)責(zé)人,被蘋果挖走了
前員工揭內(nèi)幕:10年了,為何谷歌還搞不定知識(shí)圖譜?
Google是如何做移動(dòng)搜索的(上) | 36氪
健康知識(shí)圖譜
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服