新聞來源:翻譯自altsearchengines.com 人們期待已久的自然語言搜索引擎 Powerset 終于亮相, Powerset 將改變?nèi)藗儚?wikipedia 搜索和發(fā)現(xiàn)資料的方式。基于 PARC 專利許可,以及專有的搜索技術(shù)的 Powerset 將是自然語言搜索技術(shù)的一種突破,它可以就任何主題或領(lǐng)域,從 wikipedia 的文章中抓取句子的含義。 這是 Powerset 改變?nèi)藗兿M(fèi)網(wǎng)絡(luò)內(nèi)容的第一步,與基于關(guān)鍵詞搜索的傳統(tǒng)搜索引擎不同,Powerset 嘗試?yán)斫饩渥拥暮x并進(jìn)行匹配,以下是關(guān)于 Powerset 的發(fā)展歷程。 2006年10月2日 Matt Marshall 在 venturebeat.com 撰寫了一份聲明來吸引風(fēng)險(xiǎn)資金。 一個(gè)不容忽視的高科技創(chuàng)業(yè)公司,Powerset,即將獲得 1000萬美元風(fēng)險(xiǎn)資金對(duì)抗 Google 我們耳聞一個(gè)叫做 Powerset 的高科技創(chuàng)業(yè)公司,聲稱其搜索技術(shù)優(yōu)于 Google。該公司由人工智能與自然語言技術(shù)專家 Barney Pell 創(chuàng)辦,他的業(yè)務(wù)創(chuàng)想已經(jīng)深入硅谷的風(fēng)險(xiǎn)投資者。 接著,Pell 在他的博客中談了他的看法: Powerset與自然語言搜索 兩天以后,VentureBeat 就以前的生命發(fā)表了一篇很長的更新,因?yàn)樘L,我們只節(jié)選其中一部分: 關(guān)于 Powerset 與自然語言搜索的更多細(xì)節(jié) Matt Marshall 2006年10月4號(hào) 我們說過會(huì)告訴你們更多 Powerset 的細(xì)節(jié),這個(gè)不為人知的公司準(zhǔn)備以一種新的搜索技術(shù)超越 Google。Powerset 的殺手锏是自然語言搜索,它會(huì)理解人們的自然語言。比如,如果你在 Google 中輸入“Books by Children”,Google 一般會(huì)忽略那個(gè) "by",并搜索所有與 "books" 和 "children" 有關(guān)的頁面,因?yàn)闆]有搜索引擎能理解句子中的語意,一些公司,如 Ask Jeeves,曾嘗試過,你可以以問句向 Ask Jeeves 提問,但如果你的問題太復(fù)雜,Ask Jeeves 就會(huì)無所適從,因?yàn)樗荒芑卮鹗孪葴?zhǔn)備好的特定問題。 雖然 Google 也知道自然語言的重要,卻沒有在這個(gè)領(lǐng)域獲得重大突破。這很好理解,正象 Powerset 的 Barney Pell 說的那樣,人們已經(jīng)接受使用那些專門的搜索語言,就是關(guān)鍵詞語言。很多搜索引擎能夠識(shí)別一些高級(jí)查詢語法,比如,搜索那些不含某個(gè)關(guān)鍵詞的頁 面,但人們并不容易記住這些搜索語法,而每個(gè)搜索引擎的語法各不相同。最終,Google 的核心引擎建立在這種關(guān)鍵詞語言上,而它們很難改變建立在這個(gè)基礎(chǔ)上的各個(gè)層面。 ![]() Pell 因此而來,Powerset 嘗試解決自然語言問題,將自然語言作為搜索的核心引擎,來理解時(shí)間,地點(diǎn),語氣等等,他們并沒有給出確切的發(fā)布日期。 就在第二天,10月5日,搜索專家 Danny Sullivan 正式向 Powerset 提出質(zhì)疑: ![]() “那是癡人說夢(mèng),10年前就有人這么癡了, 現(xiàn)在又輪到 Powerset。目前,那是一個(gè)你根本沒法使用的搜索引擎,但這些炒作無疑還會(huì)繼續(xù)。為了阻止這些行為,讓我來講講自然語言搜索的歷史?!苯又?Danny Sullivan 用了非常長的篇幅,回顧了1995年以來的自然語言搜索歷史,因?yàn)樘L,這里不再贅述。 現(xiàn)在,看看2008 年5月12日 Powerset 正式發(fā)布,這是 Powerset 改變?nèi)藗兿M(fèi)網(wǎng)絡(luò)內(nèi)容的第一步,與基于關(guān)鍵詞搜索的傳統(tǒng)搜索引擎不同,Powerset 嘗試?yán)斫饩渥拥暮x并進(jìn)行匹配。 Powerset 的首頁 ![]() Powerset 目前面向以下領(lǐng)先的自由內(nèi)容提供者進(jìn)行搜索: Powerset 對(duì) wikipedia 英文版的250萬篇文章進(jìn)行搜索 針對(duì)很多問題,Powerset 從開放的共享知識(shí)庫 Freebase 獲得答案。 Powerset 的搜索結(jié)果頁包含以下實(shí)用功能: Factz – 當(dāng)用戶輸入一個(gè)搜索主題,Powerset 會(huì)從 wikipedia 中總結(jié)出一些相關(guān)資料。 ![]() Dossiers – Powerset 會(huì)根據(jù) Freebase 和 Wikipedia 作一個(gè)總結(jié),以便用戶對(duì)某個(gè)主題的概況有一個(gè)快速的了解。 ![]() Answers – 對(duì)很多問題,Powerset 自動(dòng)根據(jù) wikipedia 和 freebase 中的資料,生成一個(gè)答案表。 ![]() Semantic Highlighting – 與用戶問題語意相關(guān)的搜索結(jié)果會(huì)加亮顯示。 ![]() Minibrowser – 搜索結(jié)果會(huì)以大綱形式顯示。 ![]() Article Outline – 一個(gè)導(dǎo)航工具條會(huì)隨時(shí)漂浮在旁邊幫助用戶快速進(jìn)入文章的某個(gè)章節(jié)。 ![]() Summary of Factz – 會(huì)自動(dòng)生成文章的內(nèi)容總結(jié)。 Explore Factz – 可以生成相關(guān)主題文章的鏈接。 Powerset 常見問題: 為什么 Powerset 的搜索只限于 Wikipedia? Wikipedia 是網(wǎng)絡(luò)上千千萬萬用戶查找高質(zhì)量信息的源泉,通過對(duì) Wikipedia 的搜索,Powerset 不僅提高了搜索質(zhì)量,還提供了一種對(duì)知識(shí)進(jìn)行總結(jié)歸納的新方法。當(dāng)然,Wikipedia 只是開始,接下來,Powerset 還會(huì)將觸角伸向更多資源。 什么是 Freebase? 一個(gè)由 Metaweb 提供的自由開發(fā)的世界知識(shí)庫,Powerset 的一些問題的答案來自 Freebase。 “Powerset”是什么意思? 太文字游戲了 - 譯者。 本文國際來源:http://altsearchengines.com/2008/05/11/powerset-launches-into-the-search-space/ |
聯(lián)系客服