照我看來,RSS從1.0到2.0,是一個不可饒恕的、極大的倒退。當然這兩個東西不是一個東西,完全是不同團體(是不是利益團體不知道)開發(fā)的用于同一目的的不同標準。采用混淆視聽的手法,滿足于一時的簡單,而貽患無窮。
Kingsley Idehen在最近的一個帖子里解釋了Mashup與Meshup的不同:
Mashups - 粗暴地聯(lián)結不同來源的數(shù)據(jù)(Brute force joining of disparate Web Data。我的理解:不考慮被聯(lián)結方的Meaning。因為沒有任何屬性描述,也無從查考)
Meshups - 自然地聯(lián)結不同來源的數(shù)據(jù)(Natural joining of disparate Web Data )
也就是說,前者是革命婚姻,后者是自由戀愛;前者也可能碰到好人,而后者才是和諧社會的基礎。
根源就在于RSS2.0的數(shù)據(jù)只比HTML多了一個數(shù)型結構的描述,鏈接關系的描述并不是基于語義的(不支持RDF),數(shù)據(jù)類型不具有自說明性,因而不同應用的數(shù)據(jù)進行集成(互操作)就存在很大的不確定性,沒有人工的參與很難判別數(shù)據(jù)是否一致,從原理上使得數(shù)據(jù)集成的自動化成為不可能。
目前有不少2.0開放應用已經(jīng)事實上支持Meshup了。即:一部分采用了RDF進行數(shù)據(jù)描述的應用,在進行Mashup時,實際上是在進行Meshup(Meshup子集于Mashup)。例如Googlebase以及Yahoo的一些應用,它們也輸出RSS2.0,但卻是規(guī)范的、支持RDF的RSS2.0,因為他們內(nèi)部數(shù)據(jù)是支持RDF的。
Kinsley說:
I can achieve this in minutes without writing a single line of code. I
can do it because of the Data Model prowess of RDF (self-describing
instance-data), the data interchange and transformation power of XML
and XSLT respectively, the inherent power of XML based Web Services
(REST or SOAP), and of course, having a Hybrid Server product like Virtuoso at my disposal that delivers a cross platform solution for exploiting all of these standards coherently.
他還舉了兩個例子:
- Googlebase Query URL as an RDF Data Source
- Perform a simple Data Mesh by adding (via link copy and paste) this Upcoming.org Query Services URL for Ajax Events to the RDF Browsers list of Data Sources (paste into the Data Source URI input field).
介紹這些對我們數(shù)字圖書館建設有什么意義呢?實際上意義特別重大。與這些襁褓中的語義技術相比,目前的資源整合技術,包括跨庫檢索、開放鏈接、門戶整合、單點登錄等等所采用的具體做法,從總體上而言都是權宜之計,說句不好聽的:都是要被淘汰的。對于RDF數(shù)據(jù)的支持將最終使互聯(lián)網(wǎng)發(fā)生天翻地覆的變化。
語義Web現(xiàn)在非正式地給自己貼了個標簽叫Web3.0,也就是Data Web (作為語義Web的第一層:數(shù)據(jù)層,往上還有描述層、推理層等),雖然有些滑稽與無奈,至少說明語義Web運動走出書齋和實驗室,開始注重參與具體應用了。這也是2.0帶來的混亂之后的醒悟吧?,F(xiàn)在仍有許多人不相信語義Web的理想能夠實現(xiàn),但是我始終認為語義Web,也就是Data Web,與數(shù)字圖書館的理想是一致的,但愿Web2.0的發(fā)展能夠順利,并且盡快地過渡到3.0。