相逢縹緲,窗外又拂曉.長(zhǎng)憶清弦弄淺笑,只恨人間花少. *菊不待清尊,相思飄落無痕.風(fēng)雨重陽又過,登高多少黃昏.
這首《清平樂.*菊》的作者是一臺(tái)計(jì)算機(jī),比我寫的好,十分佩服。且平仄、押韻十分工整,沒有明顯的句法錯(cuò)誤,沒有讀著別扭的句子,風(fēng)格婉約,傷感悲秋。這還是一臺(tái)CPU 1.83GHz,內(nèi)存512M計(jì)算機(jī)么?看完《一種宋詞自動(dòng)生成的遺傳算法及其機(jī)器實(shí)現(xiàn)》這篇論文后,我對(duì)詩人、藝術(shù)家們十分同情,會(huì)有一天他們下崗的。
除了對(duì)人類未來的擔(dān)憂,我感興趣的是研究者們解決問題的思路。我們這樣分析:
3首由系統(tǒng)自動(dòng)生成的宋詞示例。圖/中科院軟件研究所
1. 基于統(tǒng)計(jì)學(xué)的詞庫。雖說漢語常用詞匯不過3千個(gè),可是這些詞放在不同的上下文中所能表達(dá)的意思確千差萬別。登山則情滿于山,觀海則意溢于海,人類的語言是 人類情感的抒發(fā)。我認(rèn)為要讓計(jì)算機(jī)寫詩,最基礎(chǔ)的工作就是建立一個(gè)包含情感類別、語義、音韻等要素的元數(shù)據(jù)庫。
2. 填詞的過程是搜索的過程?;叵敫咧袑W(xué)寫宋詞的時(shí)候,總是安裝詞牌的要求一個(gè)一個(gè)詞的填寫,這是從大腦中搜索的過程,對(duì)于計(jì)算機(jī)而言是一個(gè)類似的過程。我們 可以采用啟發(fā)式搜索,使得搜索總是沿著較優(yōu)的方向前進(jìn)??梢愿鶕?jù)詞法等相關(guān)概念,從詞庫挑選一系列備用詞,沿著計(jì)算出來的評(píng)價(jià)(打分)進(jìn)行搜索。
這篇論文和我前段時(shí)間讀的人工魚模擬的的論文類似,在解決搜索問題上都使用了遺傳算法。遺傳算法(Genetic Algorithm)是模擬達(dá)爾文生物進(jìn)化論的自然選擇和遺傳學(xué)機(jī)理的生物進(jìn)化過程的計(jì)算模型,是一種通過模擬自然進(jìn)化過程搜索最優(yōu)解的方法(引:百度百科)。
這是一篇很有意思的論文,所以我寫了些自己的想法。語義分析我不懂也不是很感興趣,但是,通過讀論文來開拓視野,長(zhǎng)長(zhǎng)見識(shí),推薦大家多逛逛相關(guān)網(wǎng)站:)
下載:《一種宋詞自動(dòng)生成的遺傳算法及其機(jī)器實(shí)現(xiàn)》
本論文由來自廈門大學(xué)和浙江大學(xué)的三位學(xué)者完成。
摘要: 主要針對(duì)宋詞這種特殊的漢語詩歌體裁,開展了有關(guān)自動(dòng)生成算法及其實(shí)現(xiàn)方法的探索性研究.研究工作主要根據(jù)宋詞特點(diǎn),設(shè)計(jì)了基于平仄的編碼方式、基于句法和語義加權(quán)值的適應(yīng)度函數(shù)、基于精英主義和輪盤賭算法的選擇策略,采用部分映射和啟發(fā)式交叉算子和啟發(fā)式變異算子,從而構(gòu)建了一種基于遺傳算法的宋詞生成計(jì)算模型并進(jìn)行了系統(tǒng)實(shí)現(xiàn).實(shí)驗(yàn)結(jié)果表明,所建立的計(jì)算模型及其軟件系統(tǒng),初步實(shí)現(xiàn)了機(jī)器自動(dòng)生成宋詞的目標(biāo),對(duì)于給定的主題詞和詞牌,基本上能夠自動(dòng)生成有一定欣賞價(jià)值的宋詞.論文的工作也填補(bǔ)了我國在漢語詩歌自動(dòng)生成研究方面的不足.
來源:Qizhi