內(nèi)容介紹:
本書詳細(xì)介紹了如何應(yīng)用Lucene進行搜索引擎開發(fā),通過學(xué)習(xí)本書,讀者可以完成構(gòu)建一個企業(yè)級的搜索引擎網(wǎng)站。全書共分為14章,內(nèi)容包括搜索引擎與信息檢索基礎(chǔ),Lucene入門實例,Lucene索引的建立,使用Lucene構(gòu)建搜索,Lucene的排序,Lucene的分析器,對Word、Excel和PDF格式文檔的解析,Compass搜索引擎框架,Lucene分布式和Google Search API,爬蟲Heritrix,綜合實例之準(zhǔn)備篇,綜合實例之HTMLParser篇,綜合實例之DWR篇,綜合實例之Web編。本書是國內(nèi)第一本使用Lucene和Heritr...