Lucene學(xué)習(xí)筆記(2)
不僅僅在
推廣和介紹方面,
車東在Lucene的漢化及
web應(yīng)用,也作出了極大的極大的貢獻(xiàn)。他將自己的漢化和web應(yīng)用兩方面的成果,放在
sourceforge上成了開源的項(xiàng)目。下面主要是對(duì)這個(gè)項(xiàng)目的學(xué)習(xí)筆記。
對(duì)Lucene的漢化,車東開發(fā)了兩個(gè)Analyzer,一個(gè)是二元切分,一個(gè)單字切分。利用這兩個(gè)中的任一個(gè)進(jìn)行分析,都可以進(jìn)行漢字的索引和檢索了。我把這兩個(gè)Analyzer編譯后一起打入到lucene-1.2.jar中了,如果不愿自己動(dòng)手進(jìn)行編譯這兩個(gè)Analyzer的朋友,可以從這兒下載。
有了新的Analyzer,我把IndexFiles、IndexHTML和SearchFiles中的Analyzer也用了新CJKAnalyzer做了替換,并重新編譯打了包lucene-demo-1.2.jar,可以從這兒
下載。包內(nèi)帶有修改后的三個(gè)java文件。
用上面兩個(gè)jar文件,分別替換同名的原來的文件,就可以索引和檢索漢語了。右面是我做的測(cè)試。
本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)
點(diǎn)擊舉報(bào)。