国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
計算機信息檢索
    1. 計算機信息檢索

來自 維客

Jump to: navigation, search

計算機信息檢索

computer information retrieval

  利用計算機系統(tǒng)有效存儲和快速查找的能力發(fā)展起來的一種計算機應(yīng)用技術(shù)。它與信息的構(gòu)造、分析、組織、存儲和傳播有關(guān)。計算機信息檢索系統(tǒng)是信息檢索所用的硬件資源、系統(tǒng)軟件和檢索軟件的總合。它能存儲大量的信息,并對信息條目(有特定邏輯含義的基本信息單位)進行分類、編目或編制索引。它可以根據(jù)用戶要求從已存儲的信息集合中抽取出特定的信息,并提供插入、修改和刪除某些信息的能力。計算機信息檢索系統(tǒng)可分為:一次性信息檢索系統(tǒng)和二次性信息檢索系統(tǒng)。前者適合于單個條目,即信息量不大而需要經(jīng)常修改的情況,如航空公司訂票系統(tǒng)。后者適合于信息條目本身信息量較大而不常修改的情況,如圖書或文獻檢索系統(tǒng)。

  信息分析  目的是確定輸入系統(tǒng)的信息條目的格式和內(nèi)容,并為建立索引作準備。一次信息檢索系統(tǒng)用于確定邏輯記錄的格式和記錄關(guān)鍵字,或記錄之間的關(guān)系;二次信息檢索系統(tǒng)用于濃縮原始信息,又稱作標引。這相當(dāng)于編制題錄或文摘,即找出標識原始信息的一組關(guān)鍵詞(稱作主題詞或檢索詞),從而產(chǎn)生一部檢索詞典。在詞典中還可以規(guī)定同義詞、近義詞關(guān)系和各詞語之間的層次關(guān)系。標引工作的一部分可由計算機自動完成。例如,利用題內(nèi)關(guān)鍵詞索引或頻率統(tǒng)計法等技術(shù)從原始信息中抽取出關(guān)鍵詞。

  信息存儲  目的是建立信息庫,以備檢索。為便于查找,需要合理組織信息條目,可以按文件形式組織,也可以按數(shù)據(jù)庫形式組織。信息檢索系統(tǒng)常用的文件組織形式有:順序文件、索引順序文件、倒排文件和聚類文件,其中用得較多的是倒排文件和聚類文件。

  倒排文件對每個信息條目給出一個表示主要屬性的唯一的關(guān)鍵詞,稱主關(guān)鍵詞。所有主關(guān)鍵詞和相應(yīng)信息條目在文件中的地址構(gòu)成一個索引,稱為主索引。系統(tǒng)還給出允許用戶檢索的信息條目中的次要屬性,稱為次關(guān)鍵詞。次關(guān)鍵詞不是唯一的。通過在每個次關(guān)鍵詞后面列出出現(xiàn)該屬性的信息條目的主關(guān)鍵詞而構(gòu)成另一種形式的索引,稱為次索引。從主關(guān)鍵詞查主索引可以找到信息條目。從次關(guān)鍵詞查次索引可以找到若干主關(guān)鍵詞,系統(tǒng)從主索引可以找出若干有關(guān)的信息條目。在一次檢索提問中要查找的索引部分是很小的,所以倒排文件結(jié)構(gòu)的查找時間較短。

  聚類文件是通過分析信息條目之間的相似性來組織的。檢索時,系統(tǒng)查找出與提問關(guān)鍵詞有相似性的聚集類,聚類文件結(jié)構(gòu)特別適合于文獻檢索的情況。

  信息檢索  有脫機處理和聯(lián)機檢索兩種檢索方式。對于前者,用戶提交書面檢索要求,操作員按期打印出結(jié)果交付用戶。對于后者,用戶通過聯(lián)機終端打入檢索命令,系統(tǒng)當(dāng)時給出回答。通過計算機網(wǎng)絡(luò),用戶還可以進行遠程脫機處理或遠程聯(lián)機檢索。

  用戶與系統(tǒng)的接口是檢索語言,通過它提出檢索要求。檢索語言通常包括檢索命令和提問邏輯表達式兩個部分。命令傳達用戶對系統(tǒng)的請示,邏輯表達式則提供執(zhí)行該命令時的邏輯條件。邏輯表達式是邏輯運算符(與、或、非)、邏輯關(guān)系符和不同屬性的組合。系統(tǒng)提供一組程序來解釋和執(zhí)行檢索語言。

  系統(tǒng)維護  系統(tǒng)提供一組實用程序來進行裝入信息的格式轉(zhuǎn)換、信息文件的初始化和故障后系統(tǒng)的重新運行等一般性服務(wù)。二次信息檢索系統(tǒng)還提供檢索詞典維護程序,以便能增加、刪除、修改和打印出檢索詞。

  保密性和可靠性  計算機信息檢索系統(tǒng)的保密性是通過對信息條目的存取控制機構(gòu)來實現(xiàn)的。對于以文件系統(tǒng)為基礎(chǔ)的信息檢索系統(tǒng),存取控制一般只能在文件一級,即通過在打開文件時核對口令來控制非授權(quán)的用戶檢索信息。對于以數(shù)據(jù)庫技術(shù)為基礎(chǔ)的檢索系統(tǒng),存取控制可以在文件、記錄,甚至在信息條目中某信息項一級,既可以通過核對口令方式,也可以采取調(diào)用用戶編寫的編碼、譯碼子程序的方式阻止非授權(quán)的用戶調(diào)用保密的信息。

  計算機信息檢索系統(tǒng)的可靠性與計算機系統(tǒng)的可靠性密切相關(guān)。它依賴于計算機系統(tǒng)硬件的可靠性、操作系統(tǒng)的故障恢復(fù)機構(gòu)、數(shù)據(jù)庫管理系統(tǒng)的恢復(fù)機構(gòu)和應(yīng)用軟件采取的故障處理措施。任何計算機信息檢索系統(tǒng)都不能保證信息不受到破壞,但是它必須具有從破壞中得以恢復(fù)的能力。

  效能評價  計算機信息檢索系統(tǒng)的效能通常根據(jù)漏檢索、誤檢率、檢全率、檢準率和響應(yīng)時間(對聯(lián)機檢索)等來衡量。關(guān)鍵詞本身錯誤或使用的查找算法不對會引起漏檢。關(guān)鍵詞的二義性會造成誤檢。檢全率和檢準率主要針對二次信息檢索系統(tǒng)而言的。檢全率指檢出的相關(guān)信息條目數(shù)與信息庫中的相關(guān)條目數(shù)之比。檢準率指檢出的相關(guān)條目數(shù)與所有檢出的條目數(shù)之比。這二者是相互制約的。一般認為一個系統(tǒng)檢全率在60%~70%,檢準率在40%~50%即能滿足需要。響應(yīng)時間的快慢不僅與軟件設(shè)計的好壞有關(guān),而且與硬件的性能有關(guān)。

  應(yīng)用范圍  計算機信息檢索最初用于圖書、文獻檢索方面,后已用在軍事、工業(yè)、醫(yī)療、航空、政府機關(guān)等各個方面。有的只作信息檢索用,有的則是將信息檢索技術(shù)應(yīng)用在其他綜合的管理信息系統(tǒng)之中,如用于輔助決策的軍事情報檢索系統(tǒng);航空公司自動訂票系統(tǒng),醫(yī)療情報系統(tǒng)(包括病歷管理、預(yù)約登記、通知、病名檢索、病床管理等);旅館床位管理系統(tǒng);檢索型的輔助設(shè)計系統(tǒng)等。此外,政府部門或企業(yè)的檔案管理、科研或工程項目管理、基本建設(shè)投資管理等都可應(yīng)用信息檢索技術(shù)。

  參考書目

 張琪玉著:《情報檢索語言》,武漢大學(xué)出版社,武漢,1983。

 F.W.Lancaster,Information Retrieval Systems—Characteristics,Testing,John Wiley,New York,1968.

本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊舉報。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
淺析搜索引擎的工作原理及檢索技巧 搜索引擎 檢索 信息檢索 中國搜索研究中心 中國電子商務(wù)...
搜索引擎發(fā)展綜述_eric的空間
語義搜索引擎綜述
文獻信息檢索8
信息檢索初級篇
網(wǎng)絡(luò) 搜索引擎與智能代理技術(shù)
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服