使用人工智能去改善機(jī)器搜索結(jié)果無疑是下一代搜索引擎發(fā)展的方向,ChaCha搜索[目前僅僅支持英文]用了一個(gè)比較原始但保證有效的方法:"搜索引擎+人工搜索助理",ChaCha收編了大量的搜索向?qū)?,并以廣告收入的部分作為工作報(bào)酬,去協(xié)助大量的用戶完成一些他們并不熟悉的搜索經(jīng)歷,依靠資深的具備豐富專業(yè)知識(shí)的向?qū)斯ずY選搜索結(jié)果,并將機(jī)器搜索與人工篩選后的精確結(jié)果提交給用戶。
雖然這是一個(gè)對(duì)提高搜索結(jié)果精確度十分行之有效的方法,但有效果并不代表有效率,這種利用人工智能參與的搜索方法最低效的地方在于沒有把人工搜索的經(jīng)驗(yàn)與行為過程用機(jī)器方式保存下來,從而導(dǎo)致下次基于同一搜索任務(wù)的時(shí)候依然要人工勞動(dòng)參與其中。
微軟的搜索Macros、Google的Co-op等等都是利用人工智能的經(jīng)驗(yàn)參與到搜索結(jié)果的篩選當(dāng)中,但效果依然未能理想。他們確實(shí)利用了計(jì)算機(jī)的程序去記錄下人工智能搜索的部分經(jīng)驗(yàn)(搜索范圍、主要關(guān)鍵字),卻無法模擬出人工智能中對(duì)結(jié)果相關(guān)程度的判斷,也沒有象人工智能那樣對(duì)搜索關(guān)鍵字進(jìn)行聯(lián)想或推理?,F(xiàn)時(shí)的搜索引擎僅僅依賴于服務(wù)器端對(duì)互聯(lián)網(wǎng)頁面內(nèi)容和鏈接的文字分析,并沒有將最終用戶的使用結(jié)果的反饋和經(jīng)驗(yàn)(人工智能)納入其中。
用煩瑣大量的人工智能腦力勞動(dòng)去解決搜索的問題固然有效,但使用計(jì)算機(jī)程序來模擬人工的智能達(dá)到同樣的效果才是根本解決之道。
[以下內(nèi)容引用于<<China Internet Weekly>>第40期]
那么,ChaCha的向?qū)兡茉诙啻蟪潭壬蠌浹a(bǔ)傳統(tǒng)搜索引擎的缺陷呢?例如,一位對(duì)游戲一無所知的父親想為自己的兒子買一款游戲時(shí),他在ChaCha首頁中輸入“游戲”這個(gè)關(guān)鍵詞,系統(tǒng)根據(jù)關(guān)鍵詞分類為其尋找到一位精通游戲的向?qū)?,他?huì)告訴這位父親當(dāng)下最流行的游戲是什么及在哪里購買,還附上了相關(guān)網(wǎng)址。這就是使用ChaCha的典型體驗(yàn)。
簡(jiǎn)單來說,ChaCha的搜索結(jié)果來自于向?qū)兊慕?jīng)驗(yàn)。而向?qū)儎t是根據(jù)職業(yè)、愛好、特長(zhǎng)及經(jīng)歷等要素被分類,并依照相匹配的關(guān)鍵詞指定給有需要的用戶。一般來說,ChaCha的向?qū)儗⒂脩籼岢龅膯栴}分類,然后在20秒內(nèi)將他們需要的頁面答復(fù)給他們。因?yàn)镃haCha為所有被提問的問題以及向?qū)冇盟阉饕嫠训降拇鸢负唾Y源,包括用戶訪問的頁面都加了標(biāo)簽,所以用戶使用ChaCha的次數(shù)越多,搜索速度將會(huì)越快,結(jié)果也會(huì)越準(zhǔn)確。
而在推出ChaCha時(shí),斯科特·瓊斯就為其向?qū)冊(cè)O(shè)立了一個(gè)線上社區(qū)ChaCha Underground,以互相評(píng)估彼此的工作,共同分享經(jīng)驗(yàn)和知識(shí)。在他看來,這個(gè)社區(qū)是MySpace.com和 Wikipedia.org的交叉體。而與此相應(yīng)的,ChaCha這個(gè)搜索引擎實(shí)際上就是人機(jī)智能的結(jié)合體。與此相似的還有Yahoo! Answers、Answer Bag以及Google的付費(fèi)問答服務(wù)Google Answers,國內(nèi)的百度知道和新浪愛問也屬于此類。但不同的是,ChaCha的向?qū)峁┑姆?wù)是實(shí)時(shí)的交流,更加方便快捷。
當(dāng)然,優(yōu)質(zhì)的服務(wù)必定是需要付出代價(jià)的,但這個(gè)代價(jià)不需要用戶付出,而是由ChaCha來買單。根據(jù)用戶對(duì)向?qū)峁┑膸椭臐M意度,他們被分為4個(gè)等級(jí),并依照等級(jí)獲得每小時(shí)5美元至10美元的報(bào)酬,而頂尖向?qū)У氖杖肷踔量梢赃_(dá)到每小時(shí)20美元。如果達(dá)到一定等級(jí),向?qū)н€可以邀請(qǐng)其他人加入圈子,而他自己則可以獲得他們收入的10%作為獎(jiǎng)金。這無疑會(huì)產(chǎn)生巨大的吸引力。憑借“坐在家里賺錢”口號(hào),ChaCha聚集了大批家庭主婦及在校大學(xué)生加入。但用戶還是需要付出代價(jià)的,那就是在等待結(jié)果的間隙收看一下與搜索關(guān)鍵詞相對(duì)應(yīng)的視頻廣告,ChaCha正是憑借這塊廣告才能得到生存和發(fā)展。
為了兌現(xiàn)對(duì)向?qū)冃剿某兄Z,ChaCha于10月23日發(fā)布了名為“Pay me now”的即時(shí)支付系統(tǒng)。通過這個(gè)系統(tǒng),薪水將會(huì)即時(shí)打進(jìn)向?qū)兊你y行賬戶,存在專門的ChaCha借記卡中,而這張卡和其他的借記卡及 信用卡之間可以實(shí)現(xiàn)相互轉(zhuǎn)帳,也可以正常消費(fèi)。
將搜索社會(huì)化
實(shí)際上,ChaCha反映出了“次世代搜索引擎”的核心特質(zhì):搜索的社會(huì)化。斯科特·瓊斯也不無感慨地表示:“我們意識(shí)到,社會(huì)化的互動(dòng)改變了這個(gè)游戲的規(guī)則。”
創(chuàng)新在搜索引擎領(lǐng)域內(nèi)似乎正顯現(xiàn)出舉步維艱的態(tài)勢(shì)。盡管今天,Google仍在以讓人眼花繚亂的頻率不斷推出新品,盡管它離“整合全球信息”的偉大理想日進(jìn)一步,然而在如何讓用戶更快地得到最有用的信息這個(gè)問題上,Google以及其他所有的搜索引擎都沒有給出明確的回答。
不難看出,在互聯(lián)網(wǎng)由Web1.0向Web 2.0進(jìn)化的過程中,搜索引擎也或多或少地受到了啟發(fā)。有人稱社會(huì)化搜索可能是搜索領(lǐng)域里一個(gè)里程碑式的轉(zhuǎn)變。如果說對(duì)海量網(wǎng)頁的分析與儲(chǔ)存的計(jì)算技術(shù)是以Google為代表的第一代搜索引擎的核心因素。那么以ChaCha 為代表的“次世代搜索引擎”則將人腦的智能置于了一個(gè)更高的地位,它們信賴人類的反應(yīng)和分析能力,也滿足了特定社群的成員之間分享經(jīng)驗(yàn)和信息的需求,將搜索功能的主導(dǎo)權(quán)真正交給了互聯(lián)網(wǎng)用戶。
而在這個(gè)趨勢(shì)中,我們也看到了傳統(tǒng)搜索引擎巨頭們轉(zhuǎn)身的努力。早在去年4月,雅虎就推出了My Web個(gè)性化搜索服務(wù),用戶可以保存搜索記錄、網(wǎng)頁訪問記錄及點(diǎn)評(píng),并可以通過郵件、內(nèi)容集成和網(wǎng)頁等方式共享搜索結(jié)果;隨后的6月,雅虎又推出了Yahoo!My Web2.0,用戶可選擇自己喜歡的網(wǎng)站建立標(biāo)簽,并歸入不同檔案添加評(píng)語,日久積累便會(huì)形成一個(gè)信息庫,這樣用戶的搜索結(jié)果就會(huì)只限于自己感興趣的范圍,不再是漫天撒網(wǎng),這被稱為MyRank搜索技術(shù)。
無獨(dú)有偶。微軟目前也正在研發(fā)一種問答式的社會(huì)化搜索工具,通過這種工具用戶直接將問題提交給某個(gè)相關(guān)的社群,獲得搜索結(jié)果。對(duì)微軟來說,它有一個(gè)巨大的優(yōu)勢(shì),就是其4億多的MSN和Hotmail的龐大用戶群。
雅虎和微軟的舉動(dòng)很明顯是在挑戰(zhàn)Google。相比之下Google在社區(qū)建設(shè)和社會(huì)化搜索方面投入的力量遠(yuǎn)遠(yuǎn)小于Yahoo!,但其已作出了些微的嘗試。今年5月,Google發(fā)布了測(cè)試版的社會(huì)化搜索工具“Co-op”和“Notebook”,其共同特點(diǎn)就是使用戶之間可以分享彼此的搜索標(biāo)簽。10月,Google又發(fā)布了其獨(dú)立的社會(huì)化搜索站點(diǎn)Searchmash。這個(gè)網(wǎng)頁具備了一些問答式的特征,可以根據(jù)用戶的搜索行為做出相應(yīng)的反應(yīng)及提示,但目前還不允許用戶對(duì)搜索結(jié)果進(jìn)行編輯和共享。
大家都在勾勒自己心目中的“次世代搜索引擎”,以期趕上搜索引擎的下一個(gè)機(jī)會(huì)。而跟這些歷史悠久的互聯(lián)網(wǎng)巨頭相比,年輕的ChaCha還要面臨一個(gè)巨大的挑戰(zhàn),那就是如何聚集更多的向?qū)Ш退阉饔脩簦驗(yàn)樯鐣?huì)化搜索的優(yōu)勢(shì)的實(shí)現(xiàn)有賴于社群的規(guī)模和用戶使用的頻率。對(duì)ChaCha甚或是巨頭們來說都需要一個(gè)積累的過程,畢竟這需要根據(jù)對(duì)用戶行為的長(zhǎng)期觀察才能形成一個(gè)可以反映其偏好的數(shù)據(jù)庫,從而不斷改善搜索精度。
當(dāng)然,ChaCha也有其獨(dú)特優(yōu)勢(shì):實(shí)時(shí)的交流可以最大限度地發(fā)揮人腦智能的力量。斯科特·瓊斯堅(jiān)信一點(diǎn),人腦永遠(yuǎn)比機(jī)器好使,能給用戶更有效的幫助。而對(duì)用戶來說,如果可以省事兒,那為什么還要費(fèi)事兒呢?