這是jiangwei在我的webnote上的留言:
國內(nèi)并非沒有人研究tag技術(shù),以《Tags,無序,分類和家族相似》這篇文章為例,我用計(jì)算機(jī)自動(dòng)提煉的tag如下:信息分類 檢索語言 分類檢索 Tag 維特根施坦 標(biāo)簽△ 關(guān)鍵字△ 邏輯△ 家族△ 本質(zhì) 實(shí)證主義△ ,覺得計(jì)算機(jī)提煉得如何?特別指出的是:信息分類是原文中沒有的詞語,這個(gè)tag是計(jì)算機(jī)自動(dòng)抽象概括出來的主題。
這是我的回復(fù):
電腦提煉的只能算關(guān)鍵字或主題詞,不是tag。比如同樣是你提到的那篇文章,如果是人來給它設(shè)置tag,可能會(huì)是:tagsresearch, opinion, folksonomy, etc.
tag表現(xiàn)的是普通人的思維而不是機(jī)器的思維,它要求的不是精確,而是方便自己找到。
我之前也說過,“很多人習(xí)慣性地把tag理解成關(guān)鍵字,實(shí)際上tag不是關(guān)鍵字。”比如機(jī)器就沒有辦法提取一張照片的關(guān)鍵字,但人可以給它設(shè)定一個(gè)或多個(gè)tag。
zheng也談到過tag與關(guān)鍵字的問題:
標(biāo)簽和關(guān)鍵詞比起來,除了更近乎個(gè)人的知識體系之外,在功能上也強(qiáng)大的多。標(biāo)簽和目錄在功能上一致,而關(guān)鍵詞卻不同于目錄,因此也不同于標(biāo)簽。
但是在信息的索引找尋上,標(biāo)簽和關(guān)鍵詞卻有相通的地方。關(guān)鍵詞標(biāo)注內(nèi)容的主題,而標(biāo)簽則是在對內(nèi)容的個(gè)人理解上的私人標(biāo)注,未必針對的是主題,比如我可能關(guān)注的是時(shí)間,或者是內(nèi)容中某個(gè)和通篇主題無關(guān)的觀點(diǎn)。因此標(biāo)簽的設(shè)定要比關(guān)鍵詞自由的多,也要方便得多,就好像我把東西到處亂放,但我總能找到我需要的東西。因?yàn)槟鞘俏易约旱乇P的坐標(biāo)。標(biāo)簽就是自己關(guān)注/存儲(chǔ)內(nèi)容的坐標(biāo)。
比如中網(wǎng)的老板萬平國的辦公桌上總是亂七八糟,東西堆得像座山,但他總能找到他想找的東西,不管是一本書,還是一封信,因?yàn)樗呀?jīng)在腦子里為那個(gè)東西貼上了標(biāo)簽,他知道那東西在哪兒。但別人把他的桌子收拾干凈以后,他卻發(fā)現(xiàn),很多東西找不到了。
zheng還認(rèn)為,“就算是有著悠久歷史的分類法下的信息,它所能展現(xiàn)的,遠(yuǎn)遠(yuǎn)落后于信息本身所產(chǎn)生的,因?yàn)樗兄鴩?yán)重的時(shí)滯。”
人的思維常常是無序的,跳躍的,同時(shí)也是活躍的;但嚴(yán)格的分類法把這種無序的狀態(tài)進(jìn)行規(guī)整化以后,同時(shí)也損失了這種無序所承載的信息量。關(guān)鍵字技術(shù)當(dāng)然是有用的,基于文章的語義分析未來可能產(chǎn)生大量有價(jià)值的應(yīng)用。但,人并不總是需要精確。就像你愛上了一個(gè)姑娘,并不是因?yàn)樗耆夏闶孪却_定的那些規(guī)格,其中一定有很多不可言說的成分。
tag是人產(chǎn)生的,又是通過機(jī)器實(shí)現(xiàn)的,所以它天然地帶有人和機(jī)器的雙重性格。它無法替代關(guān)鍵字和主題詞,但同時(shí),機(jī)械的關(guān)鍵字和主題詞也無法替代tag。
Update 1: 剛剛又在MSN上跟jiangwei聊了幾句,他在政府部門從事語義挖掘方面的工作。像很多人一樣,他或許也認(rèn)為tag這種民間分類的價(jià)值被高估了。不過我的看法是,語言學(xué)和圖書館學(xué)關(guān)注的中心是物,是無生命的文本,而民間分類關(guān)注的中心是人,tag是一種人類活動(dòng),而不完全是一種分類方法。
Update 2: xuer對tag與關(guān)鍵字的評論,是我見過的最形象的評論:
Tag與關(guān)鍵字之別不僅僅是人機(jī)之別,說到底還是人與人的主客觀念之別,都是人的東西,機(jī)器只是一種反映,無非:Tag是以主觀之,關(guān)鍵字是以客觀之;Tag是我的,關(guān)鍵字是別人的;Tag用“心”,關(guān)鍵字用“聰明”;Tag是樂,關(guān)鍵字是音;Tag是曲,關(guān)鍵字是詞;Tag是詩歌,關(guān)鍵字是文字;Tag是情緒的,關(guān)鍵字是理智的;Tag是自由的,關(guān)鍵字是必然的;Tag是可愛的,關(guān)鍵字是可信的; Tag是“燈”,關(guān)鍵字是“鏡子”……竊以為二者在幫助我們認(rèn)識自我和認(rèn)識世界時(shí)相輔相成,相得益彰,是不二的!
事實(shí)上,上次在讀ooof對Isaac的訪談中提到的google策略與語義網(wǎng)策略時(shí)已隱約有這方面的感受。