在電腦未發(fā)明前,查資料不是一件容易的事,想要從一本書中找到某個關鍵詞要花不少時間,更別說從圖書館里找了。數(shù)字化時代的到來,讓資料查找上升了一個“維度”。
怎么形容這上升的一個維度呢?《三體Ⅲ》中做了精彩的比喻,說從四維看三維,三維完全暴露在四維之下,能看到無限的細節(jié),從四維干預三維,可以完全無傷地把一個人的腦子取出來。
信息的數(shù)字化也是如此。 實物檔案的數(shù)字化是一次劃時代的變革,它讓我們很輕易就能從海量信息中找到所需信息。不管是工作還是學習中,使用電子版的閱讀材料和筆記記錄,我們都能方便地進行知識管理和查找。
本文的主要內容正是為本地搜索引擎的建立提供一些思路。
01
文件搜索引擎
本地搜索引擎的建立可以參考谷歌、百度搜索引擎的做法,大致步驟是:
1、爬蟲收集信息(我們自己制作/下載的電子文檔)
2、建立索引數(shù)據(jù)庫(軟件自動生成)
3、用戶使用搜索引擎(我們使用搜索軟件)
文件搜索的使用頻率最高,通常只要做好“命名和分類”就能進行高效搜索,這一點在《文件管理》一文中已有介紹,適用于絕大多數(shù)情況。
使用的搜索軟件包括:Listary + Everything。
1、一般的文件:
按 Ctrl + Q 喚出 Listary 工具欄進行搜索
2、稍復雜的文件:
在 Listary 中設置關鍵字'e' 來調用 Everything 進行搜索。
3、當前目錄的文件:
在 Listary 中設置關鍵字'ee' 來調用 Everything 進行搜索。
注意:不是調出 Listary 工具條搜索,而是直接在當前目錄輸入'ee',然后輸入要搜索的內容。
02
圖片搜索引擎
圖片搜索和文件搜索的不同在于,很多時候搜索到的圖片文件需要查看才能知道是不是要找的文件,所以搜索軟件得要有預覽功能。在新版的 Everything 中就加入了圖片預覽功能。
1、通常的搜索方法:
在 Everyting 中使用通配符“pic:”就能進行圖片過濾。
2、快捷的搜索方法:
省去每次搜索都要輸入通配符“pic:”的煩惱,我們可以使用 Listary 來調用 Everything 搜索,同時加入搜索參數(shù)。
3、文檔搜索預覽:
Everything 也支持常見文檔格式的搜索預覽,包括 Word、PPT、Excel、PDF等。
03
全文搜索引擎
和圖片搜索一樣,我們也需要查看一些文檔里面的內容,而不僅僅是文檔名稱。特別是你只模糊記得一些詞語,而要找的文件名稱叫什么都不知道的時候,全文搜索就派上大用處了。
換句話說,我們可以借助全文搜索功能來打造個人的電子圖書館。
FileLocator Pro 正是一款為此而生的搜索軟件,也可能是目前 Windows 下最好用的全文搜索軟件。除了支持絕大多數(shù)文檔文件外,也支持壓縮文件的內容搜索,也支持通配符表達式。
1、普通的全文搜索:
在 Listary 中設置關鍵字'f' 來調用 FileLocator Pro 進行搜索。
這個方法主要是用于快速調用 FileLocator Pro,搜索范圍和內容都在需要稍后進行。
2、當前目錄的全文搜索:
在 Listary 中設置關鍵字'ff' 來調用 FileLocator Pro 進行搜索。
這是使用最多的情況,我們通常只需要對當前目錄進行全文搜索,如果全盤搜索的話,花費的時間實在太久了。
3、建立索引數(shù)據(jù)庫
FileLocator Pro 也支持文件的 Unicode 十六進制編碼內容搜索,但用得上的情況很少。我們甚至要排除掉這個功能,因為查看一個較大文件的 Unicode 十六進制編碼時,會因為讀取內容過多而導致軟件崩潰。
此外,我還可以手動創(chuàng)造常用文件夾的索引數(shù)據(jù)庫來加快全文搜索的速度。
結尾