這也是個談濫了的題目。
然而感覺有必要整理、匯總一下。
促使感到有必要整理一下的原因見文末。
Taxonomy沒有必要多談,屬于“圈子里”的小眾學(xué)問,有大量的成熟研究。圖書館學(xué)家們很有話語權(quán)。
Ontology計算機(jī)專家正在搞,特別是語義Web的那些家伙們,歐洲最為瘋狂,目前有數(shù)十億歐元的項(xiàng)目在做。
Folksonomy為什么生命力如此旺盛?讓“專業(yè)人士”頗費(fèi)思量。
網(wǎng)頁、圖片、書簽、音樂/視頻片段乃至其他任何“細(xì)粒度”的信息資源需要標(biāo)識,并用“元數(shù)據(jù)”進(jìn)行描述,是基本需求。
這種細(xì)粒度的資源姑且稱為“微資源(micro-resource)”。由于微內(nèi)容(microcontent)已經(jīng)有特殊含義,一般指由某種微格式(microformat)編碼的內(nèi)容,或者最起碼已經(jīng)具有id,能夠獨(dú)立管理的內(nèi)容。
而對微資源的這種操作需求往往在現(xiàn)在的Web(Web1.0)上沒有很好的方式或者工具能夠滿足。數(shù)字圖書館的微觀結(jié)構(gòu)包含作為微資源的數(shù)字對象,如Kahn/Welinsky結(jié)構(gòu)(handle-metadata-data/link)即是一種微資源結(jié)構(gòu)。Warwick Framework也是。
以下對微資源的功能需求進(jìn)行簡單總結(jié):
- 微資源的產(chǎn)生(例如:做網(wǎng)絡(luò)書簽?);
- 微資源需要標(biāo)識(permanent id?);
- 微資源需要描述(metadata);
- 微資源需要重組(聚合);
- 微資源的重用;
- 微資源的呈現(xiàn)(tag cloud?);
- 微資源的管理和利用需要工具(flickr/del.icio.us/blinklist/365key…)。
可以看出,我把folksonomy的產(chǎn)生和應(yīng)用與微資源的產(chǎn)生和應(yīng)用是緊緊聯(lián)系在一起的。
那么,從專業(yè)角度考察,folksonomy有哪些發(fā)展方向呢?
考察folksonomy:
- Folksonomy由tag組成。
- Tag在folksonomy中是微資源的指代物。
- 通過檢出tag而檢出微資源。
- Tag是平面的。
- Tag是隨意的。
- Tag云圖反映了tag的權(quán)重。
Tag的發(fā)展方向(有些目前已經(jīng)有了,但還不完善):
- Tag可以排序(除了目前的字順和權(quán)重,還有多種形式,包括動態(tài)形式,如結(jié)合相關(guān)反饋、合作過濾、點(diǎn)擊次數(shù)、甚至類pagerank等);
- Tag可以層級化(層次關(guān)系,例如del.icio.us目前支持的tag類目);
- Tag可以聚類(反映了資源之間的關(guān)系;經(jīng)常在一起的tag具有較為密切的關(guān)系,等等);
- Tag可以規(guī)范化(同義詞、反義詞歸并指代;用代屬分參關(guān)系標(biāo)注等)。
這些發(fā)展,與應(yīng)用的成本/邊際效用/方便性有關(guān)。
這些發(fā)展,到了一定程度,就不是folksonomy了。
Folksonomy并非絕對“自由”,并非沒有體系,只是做標(biāo)注(tagging)的人沒有意識到(自己的體系)而已。
Folksonomy的一個極端形式是Topic Maps (ISO13250);
Topic Maps可以看成一種Ontology。
Taxonomy是一類概念體系分類方法的總稱,不具有嚴(yán)格的規(guī)定。但也可以看成一種不完整的Ontology。
對應(yīng)于極端自由的Folksonomy,極端規(guī)范的、形式化的概念體系是Ontology。
Ontologies are enabling technology for the Semantic Web. They are a means for people to state what they mean by formal terms used in data that they might generate or consume. Folksonomies are an emergent phenomenon of the social web. They are created as people associate terms with content that they generate or consume. Recently the two ideas have been put into opposition, as if they were right and left poles of a political spectrum.
Tom Gruber又說:其實(shí)半形式化就夠了,就能夠起到很大的作用,Ontology的絕對形式化是做不到的。(大意如此)
半形式化的Folksonomy能夠?qū)ξ①Y源的語義標(biāo)注(annotation)帶來革命性的影響。
“半”到什么程度很難說。
或許一點(diǎn)點(diǎn)就夠了,就可能起到很大作用。
例如同義詞(一個詞的不同寫法:web2/web20/web2.0/web 2.0)的自動后臺歸并?
要知道A little semantics goes a long way.
根本的:需要工具支持,需要2.0應(yīng)用的支持。
前一陣(《圖書館雜志》2月號)發(fā)了一篇講taxonomy的,很好。今天審到一篇投稿,講folksonomy的,也很好,leon已經(jīng)跟王主編說了,快發(fā)。
這些投稿其實(shí)都沒有本文看得深,看得透(嘿嘿,文章是自己的好,;-),吹一個)。
然而本文的許多觀點(diǎn)需要實(shí)驗(yàn)佐證。實(shí)驗(yàn)需要語料,需要樣本,需要系統(tǒng),需要代碼、需要比較數(shù)據(jù)。
圖書館學(xué)屬于人文科學(xué),可以拍腦袋,因而不需要。
而計算機(jī)科學(xué)的論文需要。
這就是科學(xué)和學(xué)科的差別。