国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
搜索引擎發(fā)展綜述_eric的空間

摘要:本文簡(jiǎn)述了搜索引擎的起源和發(fā)展,介紹了國(guó)內(nèi)外的研究現(xiàn)狀,對(duì)其分類、性能評(píng)測(cè)、關(guān)鍵技術(shù)等方面做了一定的討論,在此基礎(chǔ)上對(duì)其發(fā)展趨勢(shì)作了大膽的預(yù)測(cè)。
關(guān)鍵詞:搜索引擎;Web挖掘;信息檢索


Internet自誕生以來不斷成長(zhǎng),其內(nèi)容不斷豐富,整個(gè)網(wǎng)絡(luò)逐漸堆積成一個(gè)前所未有的超大型信息庫(kù)。Internet作為一個(gè)信息平臺(tái)在人們的日常生活和工作中發(fā)揮著越來越重要的作用,人們?cè)絹碓蕉嗟赝ㄟ^Internet獲取信息。在互聯(lián)網(wǎng)發(fā)展初期,網(wǎng)站相對(duì)較少,網(wǎng)頁(yè)數(shù)量亦較少,因而信息查找比較容易。然而伴隨互聯(lián)網(wǎng)爆炸性的發(fā)展,普通網(wǎng)絡(luò)用戶想找到所需的資料簡(jiǎn)直如同大海撈針,以至于迷失在信息的海洋中不知所措,出現(xiàn)了我們所說的"信息豐富,知識(shí)貧乏"的奇怪現(xiàn)象。搜索引擎正是為了解決這個(gè)"迷航"問題而出現(xiàn)的技術(shù)。
搜索引擎(Search Engine簡(jiǎn)稱SE)是一個(gè)信息處理系統(tǒng),它以一定的策略在互聯(lián)網(wǎng)中搜集、發(fā)現(xiàn)信息,對(duì)信息進(jìn)行理解、提取、組織和處理,并為用戶提供檢索服務(wù),從而起到信息導(dǎo)航的目的,一般包括信息搜集、信息整理和用戶查詢?nèi)糠?。從用戶的角度來看,它就是一個(gè)幫助人們進(jìn)行信息檢索的工具。


1. 發(fā)展回眸

現(xiàn)代意義上的搜索引擎的祖先,是1990年由美國(guó)蒙特利爾大學(xué)的學(xué)生 Alan Emtage等人發(fā)明的Archie。Archie是第一個(gè)自動(dòng)索引互聯(lián)網(wǎng)上匿名FTP網(wǎng)站文件的程序,但它還不是真正的搜索引擎。Archie是一個(gè)可搜索的FTP文件名列表,用戶必須輸入精確的文件名搜索,然后Archie會(huì)告訴用戶哪一個(gè)FTP地址可以下載該文件。
 由于專門用于檢索信息的Robot程序像蜘蛛(spider)一樣在網(wǎng)絡(luò)間爬來爬去,因此,搜索引擎的Robot程序被稱為spider(Spider FAQ)程序。世界上第一個(gè)Spider程序,是MIT Matthew Gray的World wide Web Wanderer,用于追蹤互聯(lián)網(wǎng)發(fā)展規(guī)模。剛開始它只用來統(tǒng)計(jì)互聯(lián)網(wǎng)上的服務(wù)器數(shù)量,后來則發(fā)展為也能夠捕獲網(wǎng)址(URL)。
真正意義上的搜索引擎出現(xiàn)于1994年7月。當(dāng)時(shí)Michael Mauldin將John Leavitt的蜘蛛程序接入到其索引程序中,創(chuàng)建了大家現(xiàn)在熟知的Lycos。同年4月,Stanford大學(xué)的兩名博士生,David Filo和美籍華人楊致遠(yuǎn)(Jerry Yang)共同創(chuàng)辦了超級(jí)目錄索引Yahoo,并成功地使搜索引擎的概念深入人心,Yahoo也被稱為第一代搜索引擎。從此搜索引擎的發(fā)展也進(jìn)入了黃金時(shí)代。1998年9月,同樣是Stanford大學(xué)兩位博士生Larry Page和Sergey Brin在風(fēng)險(xiǎn)投資公司的資助下,成功開發(fā)了新一代搜索引擎——Google。它具有比Yahoo先前使用的技術(shù)更快、更準(zhǔn)確搜索到所需信息的特點(diǎn),被視為第二代搜索引擎的代表。現(xiàn)在Internet 上已有數(shù)千個(gè)能提供檢索服務(wù)的站點(diǎn),這些站點(diǎn)的搜索引擎在收錄的范圍、內(nèi)容、檢索方法上都各有不同,采用的技術(shù)也各具特色。比較著名的有Google,Yahoo,AltaVista,Dogpile,百度等。 
目前,搜索引擎的研究、開發(fā)十分活躍,各大搜索引擎公司都在投巨資研制搜索引擎系統(tǒng),同時(shí)也不斷地涌現(xiàn)出新的具有鮮明特色的搜索引擎產(chǎn)品,搜索引擎已經(jīng)成為信息領(lǐng)域的產(chǎn)業(yè)之一。它要用到了信息檢索、人工智能、數(shù)據(jù)庫(kù)、數(shù)據(jù)挖掘、自然語(yǔ)言理解等領(lǐng)域的理論和技術(shù),具有綜合性和挑戰(zhàn)性。又由于搜索引擎有大量的用戶,由此衍射出許多商機(jī),具有很好的經(jīng)濟(jì)價(jià)值。根據(jù)iResearch艾瑞市場(chǎng)咨詢《2003年中國(guó)搜索引擎研究報(bào)告》的研究數(shù)據(jù)顯示,中國(guó)的搜索引擎市場(chǎng)2003年達(dá)到了5.2億元人民幣,比2002年的2.3億一年增長(zhǎng)了127%,顯示了搜索引擎市場(chǎng)的強(qiáng)勁增長(zhǎng);雅虎表示未來5年全球搜索市場(chǎng)將由今年的30億美元增長(zhǎng)至110億美元。搜索引擎作為連接互聯(lián)網(wǎng)的一座橋梁,越來越受到人們的重視,亦引起了世界各國(guó)計(jì)算機(jī)科學(xué)界、信息產(chǎn)業(yè)界和商界的高度關(guān)注,已投入了不少的人力、物力,也取得了不俗的成績(jī)。


2. 分類

搜索引擎依其所用技術(shù)原理,主要可以分為以下三類:
2.1. 目錄式搜索引擎:以人工方式或半自動(dòng)方式搜集信息,由編輯員查看信息之后,人工形成信息摘要,并將信息置于事先確定的分類框架中。信息大多面向網(wǎng)站,提供目錄瀏覽服務(wù)和直接檢索服務(wù)。該類搜索引擎因?yàn)榧尤肓巳说闹悄?,所以信息?zhǔn)確、導(dǎo)航質(zhì)量高,缺點(diǎn)是需要人工介入、維護(hù)量大、信息量少、信息更新不及時(shí)。典型代表是:Yahoo(現(xiàn)已采用Robot技術(shù))、LookSmart、Open Directory等。
2.2. 基于Robot搜索引擎:基于Robot 的搜索引擎多提供對(duì)全文的檢索,有時(shí)也叫做全文搜索引擎(Full Text)。通過Robot程序從互聯(lián)網(wǎng)上搜集信息而建立索引數(shù)據(jù)庫(kù),檢索與用戶查詢條件匹配的相關(guān)記錄,然后按一定的排列順序?qū)⒔Y(jié)果返回給用戶。這類搜索引擎的代表是:Google、Fast/AllTheWeb、AltaVista、Inktomi、Teoma、WiseNut等;國(guó)內(nèi)代表為:百度(Baidu),"天網(wǎng)"、OpenFind等。
2.3. 元搜索引擎:這類搜索引擎沒有自己的數(shù)據(jù)庫(kù),而是將用戶的查詢請(qǐng)求同時(shí)向多個(gè)搜索引擎遞交,將返回的結(jié)果進(jìn)行去重、排序等處理后,作為自己的結(jié)果返回給用戶。服務(wù)方式為面向網(wǎng)頁(yè)的全文檢索。這類搜索引擎的優(yōu)點(diǎn)是返回結(jié)果的信息量更大、更全,缺點(diǎn)是不能夠充分使用所使用搜索引擎的功能,用戶需要做更多的篩選。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等(元搜索引擎列表),中文元搜索引擎中具代表性的有搜星搜索引擎。
除上述三大類引擎外,還有以下幾種非主流形式:集合式搜索引擎、門戶搜索引擎:如AOL Search、MSN Search等、免費(fèi)鏈接列表(Free For All Links,簡(jiǎn)稱FFA)等。 


3. 性能指標(biāo)

搜索引擎是一種互聯(lián)網(wǎng)信息檢索工具,因此對(duì)其性能評(píng)價(jià)可以參考傳統(tǒng)型文獻(xiàn)檢索工具的質(zhì)量評(píng)價(jià)標(biāo)準(zhǔn),結(jié)合搜索引擎在信息組織加工及檢索服務(wù)提供方式等內(nèi)容進(jìn)行;又因?yàn)樗苯痈櫨W(wǎng)絡(luò)信息并面向網(wǎng)絡(luò)信息用戶,對(duì)它的評(píng)價(jià)因該立足于用戶的利益立場(chǎng)。通俗地講,能令大多數(shù)網(wǎng)絡(luò)用戶滿意的搜索引擎就是一個(gè)好的搜索引擎。
通常情況下,我們可以從以下幾個(gè)方面來衡量一個(gè)搜索引擎的性能:
3.1. 召回率(Recall):又稱查全率,指搜索引擎提供的檢索結(jié)果中相關(guān)信息文檔數(shù)與網(wǎng)絡(luò)信息中存在的相關(guān)信息文檔數(shù)之比, 因檢索結(jié)果是在對(duì)檢索需求與搜索引擎的索引數(shù)據(jù)庫(kù)中的文檔進(jìn)行匹配后的文檔集合, 這一指標(biāo)也是搜索引擎對(duì)網(wǎng)絡(luò)信息覆蓋率的真實(shí)反映。
3.2. 精度(Precision):又稱查準(zhǔn)率,是搜索引擎提供的檢索結(jié)果與用戶信息需求的匹配程度, 也是檢索結(jié)果中有效信息的文檔數(shù)與搜索引擎提供的全部文檔數(shù)之比。
3.3. 檢索速度:又稱響應(yīng)時(shí)間,檢索速度一般而言取決于兩個(gè)因素, 即與帶寬有關(guān)的網(wǎng)絡(luò)速度及搜索引擎本身的速度, 只有在二者均獲得可靠的技術(shù)支持的情況下, 才能保證理想的檢索速度。
  對(duì)于一個(gè)檢索系統(tǒng)來講,召回率和精度很難做到兩全其美:召回率高時(shí),精度低;精度高時(shí),召回率低。對(duì)于搜索引擎系統(tǒng)來講,因?yàn)闆]有一個(gè)搜索引擎系統(tǒng)能夠覆蓋所有的網(wǎng)絡(luò)資源,所以召回率很難計(jì)算。目前的搜索引擎系統(tǒng)都非常關(guān)心精度。對(duì)于上面的衡量方法,有其不足之處,還有其他方面的因素沒能考慮,在文獻(xiàn)[7]中以用戶為導(dǎo)向運(yùn)用層次分析法建立一個(gè)分析模型,文獻(xiàn)[8]中提出了一些較好的衡量方法。影響一個(gè)搜索引擎系統(tǒng)的性能有很多因素,最主要的是信息檢索模型,包括文檔和查詢的表示方法、評(píng)價(jià)文檔和用戶查詢相關(guān)性的匹配策略、查詢結(jié)果的排序方法和用戶進(jìn)行相關(guān)度反饋的機(jī)制。
另外,我們可以從對(duì)搜索引擎的功能要求角度對(duì)它進(jìn)行評(píng)價(jià)。在筆者看來,一個(gè)理想的搜索引擎系統(tǒng)應(yīng)該具備以下功能要求:
① 涵蓋較多的互聯(lián)網(wǎng)資源,資源更新周期不是很長(zhǎng),對(duì)于某些特殊信息可以實(shí)時(shí)更新,這些是查全率的保障之一。
② 具備盡可能多的可選擇功能,如資源類型(網(wǎng)站、網(wǎng)頁(yè)、新聞、軟件、FTP、MP3、Flash、圖像、影視等)選擇、等待時(shí)間控制、返回結(jié)果數(shù)量控制、結(jié)果時(shí)段選擇、過濾功能選擇、結(jié)果顯示方式選擇等。
③ 強(qiáng)大的檢索請(qǐng)求處理功能(如支持邏輯匹配檢索、短語(yǔ)檢索、自然語(yǔ)言檢索等)。
④ 詳盡全面的檢索結(jié)果信息描述(如網(wǎng)頁(yè)名稱、URL、文摘、結(jié)果與用戶檢索需求的相關(guān)度等)。
⑤ 支持多種語(yǔ)言檢索,比如提供中英文搜索等。
⑥ 可對(duì)結(jié)果進(jìn)行自動(dòng)分類,如按照域名、國(guó)別、資源類型、區(qū)域等進(jìn)行分類整理。
⑦ 可以針對(duì)不同用戶提供個(gè)性化服務(wù)。


4. 原理和關(guān)鍵技術(shù)

當(dāng)今搜索引擎的主流是基于Robot的網(wǎng)頁(yè)搜索系統(tǒng),本文主要敘述這方面的技術(shù)。搜索引擎的原理,可以看作三步:從互聯(lián)網(wǎng)上抓取網(wǎng)頁(yè) → 建立索引數(shù)據(jù)庫(kù) → 在索引數(shù)據(jù)庫(kù)中搜索排序。
① 從互聯(lián)網(wǎng)上發(fā)現(xiàn)、搜集有用網(wǎng)頁(yè)信息
利用高性能的Spider程序去自動(dòng)地在互聯(lián)網(wǎng)中搜索信息。一個(gè)典型的"網(wǎng)洛蜘蛛"工作的方式,是查看一個(gè)頁(yè)面,并從中找到相關(guān)信息,然后它再?gòu)脑擁?yè)面的所有URL中出發(fā),爬行到相關(guān)頁(yè)面,重復(fù)這過程,直到把爬過的所有網(wǎng)頁(yè)都收集回來。搜索引擎的Spider一般要定期重新訪問所有網(wǎng)頁(yè),更新網(wǎng)頁(yè)索引數(shù)據(jù)庫(kù),以反映出網(wǎng)頁(yè)文字的更新情況。
② 將收集到的信息進(jìn)行分類整理,建立索引數(shù)據(jù)庫(kù)
由分析索引系統(tǒng)程序?qū)κ占貋淼木W(wǎng)頁(yè)進(jìn)行分析,提取相關(guān)網(wǎng)頁(yè)信息(包括網(wǎng)頁(yè)所在URL、編碼類型、頁(yè)面內(nèi)容包含的所有關(guān)鍵詞、關(guān)鍵詞位置、生成時(shí)間、大小、與其它網(wǎng)頁(yè)的鏈接關(guān)系等),根據(jù)一定的相關(guān)度算法進(jìn)行大量復(fù)雜計(jì)算,得到每一個(gè)網(wǎng)頁(yè)針對(duì)頁(yè)面文字中及超鏈中每一個(gè)關(guān)鍵詞的相關(guān)度(或重要性),然后用這些相關(guān)信息建立網(wǎng)頁(yè)索引數(shù)據(jù)庫(kù)。
③ 用戶檢索過程
當(dāng)用戶輸入關(guān)鍵詞搜索后,由搜索系統(tǒng)程序從網(wǎng)頁(yè)索引數(shù)據(jù)庫(kù)中找到符合該關(guān)鍵詞的所有相關(guān)網(wǎng)頁(yè)。因?yàn)樗邢嚓P(guān)網(wǎng)頁(yè)針對(duì)該關(guān)鍵詞的相關(guān)度早已算好,所以只需按照現(xiàn)成的相關(guān)度數(shù)值排序,相關(guān)度越高,排名越靠前。最后,由頁(yè)面生成系統(tǒng)將搜索結(jié)果的鏈接地址和頁(yè)面內(nèi)容摘要等內(nèi)容組織起來返回給用戶。
上面簡(jiǎn)述了搜索引擎的工作原理,從這里不難看出搜索引擎的基本構(gòu)成:搜索器、索引器、檢索器和用戶接口等。下面介紹幾種與之相關(guān)的關(guān)鍵技術(shù):
① Robot技術(shù),網(wǎng)絡(luò)機(jī)器人Robot(通常也稱為網(wǎng)絡(luò)蜘蛛Spider、爬行者Crawler等)可以用在針對(duì)互聯(lián)網(wǎng)的數(shù)據(jù)統(tǒng)計(jì)、數(shù)據(jù)搜索、鏈接維護(hù)等方面。搜索引擎中的網(wǎng)絡(luò)機(jī)器人主要完成兩個(gè)功能,即分析、獲取互聯(lián)網(wǎng)的鏈接和讀取各鏈接所對(duì)應(yīng)的網(wǎng)頁(yè)內(nèi)容。Robot 從一個(gè)事先制定好的URLs列表出發(fā), 在訪問了一個(gè)網(wǎng)頁(yè)后,會(huì)對(duì)它進(jìn)行分析,提取出新的URLs ,將之加入到訪問列表中,如此遞歸地訪問Web。Robot 設(shè)計(jì)是否合理將直接影響它訪問Web 的效率,影響搜索數(shù)據(jù)庫(kù)的質(zhì)量。Robot的實(shí)現(xiàn)常用分布式、并行計(jì)算技術(shù),以提高信息發(fā)現(xiàn)和更新的速度。
② 索引技術(shù),Robot采集回來的文檔信息要被用來建立索引數(shù)據(jù)庫(kù)。索引的建立方法對(duì)搜索引擎來說具有很大的影響,好的索引能提高搜索引擎系統(tǒng)運(yùn)行的效率以及檢索結(jié)果的質(zhì)量??梢哉f索引技術(shù)是搜索引擎中的核心技術(shù), 是搜索技術(shù)高低的集中體現(xiàn)。其中很重要的是文本分析技術(shù),這是索引器的主要支撐技術(shù)。文本分析所研究的內(nèi)容包括提取索引項(xiàng)、自動(dòng)摘要、自動(dòng)分類器、文本聚類等。文本分析所依據(jù)的主要是文本中所包含的詞匯、超文本標(biāo)記和超鏈接。
 ③ 信息檢索和排序技術(shù),搜索的最終目的是獲取需要的信息,在大量的信息中進(jìn)行查找是很討厭的一件事情,很難做到令人滿意。即使是在現(xiàn)實(shí)生活中,面對(duì)一大堆自己辛辛苦苦找來的資料時(shí),你往往會(huì)發(fā)現(xiàn)并不是所有的資料都有用。目前搜索引擎所實(shí)現(xiàn)的只是通常意義上的相關(guān)信息搜索。常用的相關(guān)信息查找方法有相似性函數(shù)法、歸類(組)法等。在這一研究領(lǐng)域有兩種比較有影響的方法,就是Page Rank方法和Authority and Hub方法。這兩種方法都是利用頁(yè)面中的鏈接來對(duì)文檔的重要性進(jìn)行判斷。
④ 用戶接口設(shè)計(jì),用戶接口的作用是輸入用戶查詢、顯示查詢結(jié)果、提供用戶相關(guān)性反饋機(jī)制。主要的目的是方便用戶使用搜索引擎,高效率、多方式地從搜索引擎中得到有效、及時(shí)的信息。用戶接口的設(shè)計(jì)和實(shí)現(xiàn)使用人機(jī)交互的理論和方法,以充分適應(yīng)人類的思維習(xí)慣。一般搜索引擎都提供基本檢索和高級(jí)檢索兩個(gè)接口?;緳z索接口只提供用戶輸入關(guān)鍵字的文本框,有的可以在這里輸入一些復(fù)雜的查詢表達(dá)式,不過這個(gè)只適用于那些搜索專家;高級(jí)檢索接口可以讓用戶對(duì)查詢進(jìn)行限制,如邏輯運(yùn)算(與、或、非)、相近關(guān)系(相鄰、NEAR)、域名范圍(如.edu、.com)、出現(xiàn)位置(如標(biāo)題、內(nèi)容)、信息時(shí)間、長(zhǎng)度等等。


5. 發(fā)展趨勢(shì)

經(jīng)過了多年的發(fā)展之后,現(xiàn)在的搜索引擎功能越來越強(qiáng)大,提供的服務(wù)也越來越全面據(jù)。研究者統(tǒng)計(jì), 目前互聯(lián)網(wǎng)上的搜索引擎已達(dá)數(shù)千種, 僅中文搜索引擎就達(dá)上百種,可謂是百花爭(zhēng)艷。然而隨著WWW信息的急劇增加,目前的搜索引擎存在界面不夠友好、響應(yīng)時(shí)間長(zhǎng)、死鏈接過多、結(jié)果中重復(fù)信息及不相關(guān)信息過多等問題,難以滿足人們的各種信息需求,搜索引擎將向智能化、個(gè)性化、精確化、專業(yè)化、交叉語(yǔ)言檢索、多媒體檢索等適應(yīng)不同用戶需求的方向發(fā)展。
5.1. 智能化的搜索引擎:它是未來搜索引擎的發(fā)展方向,被稱作是"第三代搜索引擎",在這方面中國(guó)搜索走在了前面,已經(jīng)推出了此類搜索引擎供用戶試用。搜索引擎的智能化體現(xiàn)在兩方面:一是對(duì)搜索請(qǐng)求的理解,二是對(duì)網(wǎng)頁(yè)內(nèi)容的分析。它利用智能代理技術(shù)對(duì)用戶的查詢計(jì)劃、意圖、興趣方向進(jìn)行推理,自動(dòng)進(jìn)行信息搜集過濾,自動(dòng)地將用戶感興趣的、對(duì)用戶有用的信息提交給用戶。這其中也包含了對(duì)服務(wù)多項(xiàng)化、個(gè)性化,結(jié)果精確化,交叉語(yǔ)言檢索等方面的功能。
5.2. 重視查詢結(jié)果的精度,提高檢索的有效性:解決查詢結(jié)果過多的現(xiàn)象目前有以下幾種方法:a) 構(gòu)建基于內(nèi)容的搜索引擎?;趦?nèi)容的搜索不是根據(jù)字形,而是試圖理解用戶的請(qǐng)求,同時(shí)根據(jù)文檔的內(nèi)容選出符合用戶要求的文檔。即通過各種方法獲得用戶沒有在查詢語(yǔ)句中表達(dá)出來的真正用途,實(shí)現(xiàn)自然語(yǔ)言的智能查詢功能。當(dāng)前比較成熟的解決方案是依靠語(yǔ)義網(wǎng)絡(luò)、漢語(yǔ)分詞、句法分析、處理同義詞等中文信息處理技術(shù)最大程度地了解用戶需求。b) 將用戶提問轉(zhuǎn)化為系統(tǒng)已知的問題,然后對(duì)已知問題進(jìn)行解答,以求降低對(duì)自然語(yǔ)言理解技術(shù)的依賴性。c) 用正文分類技術(shù)將結(jié)果分類,使用可視化技術(shù)顯示分類結(jié)構(gòu),用戶可以只瀏覽自己感興趣的類別。d) 進(jìn)行站點(diǎn)類聚或內(nèi)容類聚,減少信息的總量。e)讓用戶對(duì)返回結(jié)果進(jìn)行選擇,進(jìn)行二次查詢是一種非常有效的手段。
5.3. 實(shí)現(xiàn)交叉語(yǔ)言的檢索:搜索引擎對(duì)多種語(yǔ)言的數(shù)據(jù)庫(kù)進(jìn)行交叉語(yǔ)言信息檢索,返回能夠回答用戶問題的所有語(yǔ)言的文檔。若配上機(jī)器翻譯,就可使返回結(jié)果以用戶熟悉的語(yǔ)言顯示。雖然該技術(shù)目前還處于初步研究階段,其難點(diǎn)在于語(yǔ)言之間在表達(dá)方式和語(yǔ)義對(duì)應(yīng)上的不確定性,但其確是發(fā)展方向。
5.4. 提供對(duì)自然語(yǔ)言檢索的支持:為了提高搜索引擎對(duì)用戶檢索提問的理解,就必須有一個(gè)好的檢索提問語(yǔ)言,為了克服關(guān)鍵詞檢索和目錄查詢的缺點(diǎn),現(xiàn)在已經(jīng)出現(xiàn)了自然語(yǔ)言智能答詢。如Google有專用于回答問題的Google Answer,微軟有AnswerBot等。用戶可以輸入簡(jiǎn)單的疑問句,比如"how can kill virus of computer?"。搜索引擎在對(duì)提問進(jìn)行結(jié)構(gòu)和內(nèi)容的分析之后,或直接給出提問的答案,或引導(dǎo)用戶從幾個(gè)可選擇的問題中進(jìn)行再選擇。自然語(yǔ)言的優(yōu)勢(shì)在于,一是使網(wǎng)絡(luò)交流更加人性化,二是使查詢變得更加方便、直接、有效。就以上面的例子來講,如果用關(guān)鍵詞查詢,多半人會(huì)用"virus"這個(gè)詞來檢索,結(jié)果中必然會(huì)包括各類病毒的介紹、病毒是怎樣產(chǎn)生的等等許多無(wú)效信息,而用"how can kill virus of computer?",搜索引擎會(huì)將怎樣殺病毒的信息提供給用戶,提高了檢索效率。
5.5. 多媒體搜索引擎:網(wǎng)絡(luò)資源豐富多彩,具有很多類型的信息,用戶需要的信息也不完全是網(wǎng)頁(yè)的形式,從用戶的角度來看,必然要求搜索引擎能夠覆蓋更多的網(wǎng)絡(luò)資源?,F(xiàn)在有很多搜索引擎已經(jīng)提供了網(wǎng)頁(yè)、新聞、圖片、音樂等資源搜索,當(dāng)然范圍還可以更廣,再如可以搜索新聞組、軟件、FTP、Flash、論文等等。
5.6. 專業(yè)化搜索引擎:是為了專門收錄某一行業(yè)、某一學(xué)科、某一主題和某一地區(qū)的信息而建立,非常實(shí)用,如有商務(wù)查詢、企業(yè)查詢、人名查詢、電子郵件地址查詢和招聘信息查詢等等。這種專業(yè)化的搜索引擎是將來的方向之一。
5.7. 桌面型搜索引擎:這類引擎實(shí)際上是一個(gè)軟件,下載安裝后放在電腦桌面上,用戶不用頻繁打開瀏覽器,而是直接通過只要通過它就能完全實(shí)現(xiàn)搜索過程,更甚者它可以同時(shí)搜索本地、局域網(wǎng)和互聯(lián)網(wǎng)上的信息。它完全越過傳統(tǒng)的搜索模式,越過瀏覽器,真正實(shí)現(xiàn)讓搜索無(wú)處不在。搜索引擎脫離瀏覽器是一個(gè)發(fā)展趨勢(shì),Google、Yahoo等都有計(jì)劃地推出屬于自己的桌面型搜索軟件,而微軟同樣打算把搜索設(shè)計(jì)到桌面上。國(guó)內(nèi)有中國(guó)搜索推出的"網(wǎng)絡(luò)豬"軟件可用。
 此外還有一些其它值得注意的技術(shù)發(fā)展,如元搜索引擎,移動(dòng)代理和XML技術(shù),語(yǔ)音檢索技術(shù)等。隨著技術(shù)的不斷發(fā)展進(jìn)步,搜索引擎將會(huì)成為一個(gè)人們網(wǎng)際遨游的好幫手。


6. 參考文獻(xiàn)

[1] 李曉明,劉建國(guó)  搜索引擎技術(shù)及趨勢(shì)
[2] 搜索引擎直通車  搜索引擎發(fā)展史 http://www.se-express.com/about/about.htm
[3] 博客中國(guó)  前生今世——搜索引擎發(fā)展史http://www.blogchina.com/new/source/130.html
[4] 莊毅,黎浩宏 引擎技術(shù)現(xiàn)狀及發(fā)展動(dòng)向 計(jì)算機(jī)時(shí)代 2002年第8期
[5] 王紅梅,朱洪秀,王凌 對(duì)中文搜索引擎未來發(fā)展的探討 東北電力學(xué)院學(xué)報(bào)2001年12月第21卷第4期
[6] 張曉剛,李明樹 智能搜索引擎技術(shù)的研究與發(fā)展 計(jì)算機(jī)工程與應(yīng)用 2001年第24期
[7] 馬彪,李恒 搜索引擎的性能評(píng)價(jià) 新世紀(jì)圖書館 2003年第6期
[8] 鳳元杰,劉正春,王堅(jiān)毅 搜索引擎主要性能評(píng)價(jià)指標(biāo)體系研究 情報(bào)學(xué)報(bào) 2004年2月第23卷第1期
[9] 凌美秀 關(guān)于搜索引擎當(dāng)前存在的主要問題及其發(fā)展趨勢(shì)的探討 高校圖書館工作 2001年第5期第21卷
[10] 蔡瑞平,鐘哲釋 搜索引擎的檢索功能特征及技巧  圖書與情報(bào)2003年4月
[11] 彭洪匯,林作銓 Internet上的搜索引擎和元搜索引擎 計(jì)算機(jī)科學(xué)2002 Vol. 29 No. 9
[12] 李遠(yuǎn)明 試析搜索引擎技術(shù)及其未來發(fā)展趨勢(shì) 情報(bào)檢索 2002 No.7
[13] 盧世光,丁方忠 搜索引擎使用技術(shù)回顧和發(fā)展趨勢(shì)探討 廣東通信技術(shù) 2002 Vol.19 No.5

本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
搜索引擎在網(wǎng)絡(luò)信息挖掘中的應(yīng)用 - 業(yè)界 - SOWANG 搜索愛好者論壇 - Power...
搜索引擎要涉及的專業(yè)知識(shí)要點(diǎn)分析
搜索引擎原理
搜索引擎技術(shù)及趨勢(shì)≡搜索引擎直通車
網(wǎng)絡(luò)搜索技巧
搜索引擎的工作機(jī)制[圖]
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服