什么是本體論
本體論:Ontology(本體論)一詞是由17世紀(jì)的德國(guó)經(jīng)院學(xué)者郭克蘭紐(Goclenius,1547-1628)首先使用的。此詞由ont(?ντ)加上表示“學(xué)問”、“學(xué)說”的詞綴——ology構(gòu)成,即是關(guān)于ont的學(xué)問。ont源出希臘文,是on(?ν)的變式,相當(dāng)于英文的
being;也就是巴門尼德(Parmenides)的“
存在”。“本體”的研究,在希臘哲學(xué)史上有其淵源。從米利都學(xué)派開始,希臘早期哲學(xué)家就致力于探索組成萬有的最基本元素——“本原”(希臘文arche,舊譯為“始基”)。對(duì)此“本原”的研究即成為本體論的先聲,而且逐步逼近于對(duì)being 的探討。之后的巴門尼德深刻地提出,“是以外便無非是,存在之為存在者必一,這就不會(huì)有不存在者存在”。并且認(rèn)為存在永存不變,僅有思維與之同一,亦僅有思維可以獲致此真理;而從感覺得來者僅為意見,從意見的觀點(diǎn)看,則有存在和非存在,存在既非一從而有變滅。巴門尼德對(duì)being(是,存在)的探討, 建立了本體論研究的基本方向:對(duì)于被“是者”所分有的“是”,僅只能由思維向超驗(yàn)之域探尋,而不能由感覺從經(jīng)驗(yàn)之中獲?。淮嗽诔?yàn)之域中尋得之“是”,因其絕對(duì)的普遍性和本原性,必然只能是一。不過,這一點(diǎn)只有蘇格拉底和柏拉圖才能真有領(lǐng)會(huì),與他同時(shí)的希臘哲人或多或少地有所忽略。因而,如原子論者雖然也區(qū)分了真理認(rèn)識(shí)和暗昧認(rèn)識(shí),認(rèn)識(shí)到思維與感覺的不同;但其探尋的“本原”可否由經(jīng)驗(yàn)獲致卻極模糊,因而實(shí)際上并未能區(qū)分超驗(yàn)和經(jīng)驗(yàn)。而在蘇格拉底那些沒有最終結(jié)論的對(duì)話中,已破除了經(jīng)驗(yàn)歸納方法獲取真理的可能性;在柏拉圖的理念論中,則鮮明地以超驗(yàn)世界的“理念”為真理之根本。
本體論的研究
在古希臘羅馬哲學(xué)中,本體論的研究主要是探究世界的本原或基質(zhì)。各派哲學(xué)家力圖把世界的存在歸結(jié)為某種物質(zhì)的、精神的實(shí)體或某個(gè)抽象原則。巴門尼德提出了唯一不變的本原“存在”,使關(guān)于存在的研究成為這一時(shí)期的主題。
亞里士多德認(rèn)為哲學(xué)研究的主要對(duì)象是實(shí)體,而實(shí)體或本體的問題是關(guān)于本質(zhì)、共相和個(gè)體事物的問題。他認(rèn)為研究實(shí)體或本體的哲學(xué)是高于其他一切科學(xué)的第一哲學(xué)。從此,本體論的研究轉(zhuǎn)入探討本質(zhì)與現(xiàn)象、共相與殊相、一般與個(gè)別等的關(guān)系。在西方近代哲學(xué)中,
笛卡爾首先把研究實(shí)體或本體的第一哲學(xué)叫做“形而上學(xué)的本體論”。17~18世紀(jì),萊布尼茨及其繼承者沃爾夫試圖通過純粹抽象的途徑建立一套完整的、關(guān)于一般存在和世界本質(zhì)的形而上學(xué),即獨(dú)立的本體論體系。沃爾夫把一般、晉遍看作是脫離個(gè)別、單一而獨(dú)立存在的本質(zhì)和原因。
康德一方面認(rèn)為建立抽象本體論的形而上學(xué)不可能,本體論要強(qiáng)研究的只能是事物的普遍性質(zhì)及物質(zhì)的存在與精神存在之間的區(qū)別;另一方面又用與認(rèn)識(shí)論相割裂的、先驗(yàn)的哲學(xué)體系來代替本體論。
黑格爾在唯心主義基礎(chǔ)上提出了本體論、認(rèn)識(shí)論和邏輯學(xué)統(tǒng)一原則,并從純存在的概念出發(fā)構(gòu)造了存在自身辯證發(fā)展的邏輯體系。
在現(xiàn)代西方哲學(xué)中,一些流派(實(shí)證主義、分析哲學(xué)等)反對(duì)任何形而上學(xué)和本體論。但也有些人試圖重新建立關(guān)于存在學(xué)說的本體論,如胡塞爾的“先驗(yàn)的本體論”、海德格爾的“基本本體論”、哈特曼的“批判本體論”等,他們往往借助于超感覺和超理性的直覺去建立概念體系,其觀點(diǎn)帶有唯心主義或不可知論,且往往同錯(cuò)誤的社會(huì)觀點(diǎn)相聯(lián)系,為宗教哲學(xué)所支持。
在中國(guó)古代哲學(xué)中,本體論叫做“本根論”,指探究天地萬物產(chǎn)生、存在、發(fā)展變化根本原因和根本依據(jù)的學(xué)說。中國(guó)古代哲學(xué)家一般都把天地萬物的本根歸結(jié)為無形無象的與天地萬物根本不同的東西,這種東西大體可分為三類:(1)沒有固定形體的物質(zhì),如“氣”;(2)抽象的概念或原則,如“無”、“理”;(3)主觀精神,如“心”。這三種觀點(diǎn)分別歸屬于樸素唯物主義、客觀唯心主義和主觀唯心主義。在中國(guó)哲學(xué)史的研究中,有些學(xué)者用“本體論”一詞專指那種在物質(zhì)世界之外尋找物質(zhì)世界存在依據(jù)的唯心主義學(xué)說,如魏晉時(shí)期王弼的貴無論。
本體論其他表述
本體論(ontology)是哲學(xué)概念,它是研究存在的本質(zhì)的哲學(xué)問題。但近幾十年里,這個(gè)詞被應(yīng)用到計(jì)算機(jī)界,并在人工智能、計(jì)算機(jī)語言以及數(shù)據(jù)庫理論中扮演著越來越重要的作用。
然而,到目前為止,對(duì)于本體論,還沒有統(tǒng)一的定義和固定的應(yīng)用領(lǐng)域。
斯坦福大學(xué)的Gruber給出的定義得到了許多同行的認(rèn)可,即本體論是對(duì)概念化的精確描述(Gruber,1995),本體論用于描述事物的本質(zhì)。
在實(shí)現(xiàn)上,本體論是概念化的詳細(xì)說明,一個(gè)ontology往往就是一個(gè)正式的詞匯表,其核心作用就在于定義某一領(lǐng)域或領(lǐng)域內(nèi)專業(yè)詞匯的還以及他們之間的關(guān)系。這一系列的基本概念如同工程一座大廈的基石,為交流各方提供了一個(gè)統(tǒng)一的認(rèn)識(shí)。在這一系列概念的支持下,知識(shí)的搜索、積累和共享的效率將大大提高,真正意義上的知識(shí)重用和共享也成為可能。
本體論可以分為四種類型:領(lǐng)域、通用、應(yīng)用和表示。領(lǐng)域本體包含著特定類型領(lǐng)域(如電子、機(jī)械、醫(yī)藥、教學(xué))等的相關(guān)知識(shí),或者是某個(gè)學(xué)科、某門課程中的相關(guān)知識(shí);通用本體則覆蓋了若干個(gè)領(lǐng)域,通常也稱為核心本體;應(yīng)用本體包含特定領(lǐng)域建模所需的全部知識(shí);表示本體不只局限于某個(gè)特定的領(lǐng)域,還提供了用于描述事物的實(shí)體,如“框架本體”,其中定義了框架、槽的概念。
可見,本體論的建立具有一定的層次性,在教學(xué)領(lǐng)域而言,如果說某門課程中的概念、術(shù)語及其關(guān)系看成是特定的應(yīng)用本體,那么所有課程中的共同的概念和特征則具有一定的通用性。
Ontology 這個(gè)哲學(xué)范疇,被人工智能界賦予了新的定義,從而被引入信息科學(xué)中。然而信息科學(xué)界對(duì) Ontology 的理解也是逐步發(fā)展才走向成熟的。1991 年 Neches 等人最早給出 Ontology 在信息科學(xué)中的定義:“給出構(gòu)成相關(guān)領(lǐng)域詞匯的基本術(shù)語和關(guān)系,以及利用這些術(shù)語和關(guān)系構(gòu)成的規(guī)定這些詞匯外延規(guī)則的定義。”后來在信息系統(tǒng)、知識(shí)系統(tǒng)等領(lǐng)域,隨著越來越多的人研究 Ontology,產(chǎn)生了不同的定義。1993 年 Gruber 定義 Ontology 為“概念模型的明確的規(guī)范說明”。1997 年 Borst 進(jìn)一步完善為“共享概念模型的形式化規(guī)范說明”。Studer 等人對(duì)上述兩個(gè)定義進(jìn)行了深入研究,認(rèn)為 Ontology 是共享概念模型的明確的形式化規(guī)范說明,這也是目前對(duì) Ontology 概念的統(tǒng)一看法。
Studer 等人的 Ontology 定義包含四層含義:概念模型(Conceptualization)、明確(Explicit)、形式化(Formal)和共享(Share)。“概念模型”是指通過抽象出客觀世界中一些現(xiàn)象(Phenomenon)的相關(guān)概念而得到的模型,其表示的含義獨(dú)立于具體的環(huán)境狀態(tài);“明確”是指所使用的概念及使用這些概念的約束都有明確的定義;“形式化”是指 Ontology 是計(jì)算機(jī)可讀的,也就是計(jì)算機(jī)可處理的;“共享”是指 Ontology 中體現(xiàn)的是共同認(rèn)可的知識(shí),反映的是相關(guān)領(lǐng)域中公認(rèn)的概念集,它所針對(duì)的是團(tuán)體而非個(gè)體。Ontology 的目標(biāo)是捕獲相關(guān)領(lǐng)域的知識(shí),提供對(duì)該領(lǐng)域知識(shí)的共同理解,確定該領(lǐng)域內(nèi)共同認(rèn)可的詞匯,并從不同層次的形式化模式上給出這些詞匯(術(shù)語)和詞匯之間相互關(guān)系的明確定義。
盡管定義有很多不同的方式,但是從內(nèi)涵上來看,不同研究者對(duì)于 Ontology 的認(rèn)識(shí)是統(tǒng)一的,都把它當(dāng)作是領(lǐng)域(領(lǐng)域的范圍可以是特定應(yīng)用中,也可以是更廣的范圍)內(nèi)部不同主體(人、機(jī)器、軟件系統(tǒng)等)之間進(jìn)行交流(對(duì)話、互操作、共享等)的一種語義基礎(chǔ),即由 Ontology 提供一種共識(shí)。而且 Ontology 提供的這種共識(shí)更主要的是為機(jī)器服務(wù),機(jī)器并不能像人類一樣理解自然語言中表達(dá)的語義,目前的計(jì)算機(jī)也只能把文本看成字符串進(jìn)行處理。因此,在計(jì)算機(jī)領(lǐng)域討論 Ontology,就要討論如何表達(dá)共識(shí),也就是概念的形式化問題。
Semantic Web 中的 Ontology
Ontology 研究熱點(diǎn)的出現(xiàn)還與 Semantic Web 的提出和發(fā)展直接相關(guān)。
Semantic Web 是 Tim Berners-Lee 提出的又一個(gè)概念。Tim Berners-Lee 認(rèn)為,當(dāng)前的 Web 是供人閱讀和理解的,它作為一個(gè)越來越大的文件媒體,并不利于實(shí)現(xiàn)數(shù)據(jù)和信息的自動(dòng)化處理。新一代的 Semantic Web 將不僅僅為人類而且能為計(jì)算機(jī)(信息代理)帶來語義內(nèi)容,使計(jì)算機(jī)(或信息代理)能夠“理解”Web 內(nèi)容,進(jìn)而實(shí)現(xiàn)信息處理的自動(dòng)化。他認(rèn)為 Semantic Web 不是與當(dāng)前 Web 隔離的另一個(gè) Web,而是對(duì)當(dāng)前 Web 的擴(kuò)充,在 Semantic Web 中,信息的語義經(jīng)過完好的定義,能夠更好地促進(jìn)計(jì)算機(jī)和人之間的相互合作。
為了實(shí)現(xiàn) Semantic Web 的功能,需要提供一種計(jì)算機(jī)能夠理解的、結(jié)構(gòu)化的語義描述機(jī)制,以及一系列的推理規(guī)則以實(shí)現(xiàn)自動(dòng)化推理。Semantic Web 的挑戰(zhàn)在于提供一種語言,
它能夠表述數(shù)據(jù)和在數(shù)據(jù)中進(jìn)行推理的規(guī)則,而且需要這種語言能夠?qū)⒛壳按嬖谟谥R(shí)表述系統(tǒng)之中的規(guī)則能夠被應(yīng)用到 Web 上。
在 Tim Berners-Lee 的 Semantic Web 框架中,有幾個(gè)關(guān)鍵的組成元素。它們分別是 XML,RDF(S) 和 Ontology。
XML 允許用戶定義自己的文件類型,允許用戶定義任意復(fù)雜的信息結(jié)構(gòu),但是 XML 只具有語法性,它不能說明所定義的結(jié)構(gòu)的語義。XML 之所以在 Semantic Web 中處于重要的地位與 XML 是一種載體語言、XML 命名機(jī)制等有很大的關(guān)系。
在 Tim Berners-Lee 看來,語義的描述是通過 RDF 進(jìn)行的。RDF 的兩個(gè)特性對(duì)此有著特殊的貢獻(xiàn):
?。?)RDF 是一種由資源、屬性、屬性值組成的三元結(jié)構(gòu)。這種三元結(jié)構(gòu)形似句子中的主語、謂語、賓語之間的關(guān)系。一個(gè)描述資源的 RDF 語句,就如同“某件事具有什么樣的屬性”這樣的句子一樣有效。它能夠表明一種對(duì)事物存在狀態(tài)的斷言,可以表述大多數(shù)情況下計(jì)算機(jī)需要處理的知識(shí)。
?。?)RDF 的另一個(gè)重要特點(diǎn)就是組成 RDF 的資源、屬性、屬性值這三個(gè)元素都必須是被 URI(統(tǒng)一資源標(biāo)識(shí))所標(biāo)識(shí)的。由于 RDF 利用 URI 來對(duì)信息進(jìn)行編碼,它意味著被 RDF 所引用的任何資源、屬性和屬性值都是經(jīng)過預(yù)先定義的、不具二意性的概念。
由于 RDF 能夠表示陳述句,并且主語、謂語和賓語的三個(gè)組成元素都是通過 URI 所標(biāo)識(shí)的,所以它具有語義表述的特性。但 Semantic Web 的要求還遠(yuǎn)不止于此,Semantic Web 還需要加入邏輯功能:Semantic Web 需要能夠利用規(guī)則進(jìn)行推理、選擇行動(dòng)路線和回答相關(guān)問題。Ontology 是 Semantic Web 實(shí)現(xiàn)邏輯推理的基礎(chǔ)。
Semantic Web 研究者也認(rèn)為,Ontology 是一個(gè)形式化定義語詞關(guān)系的規(guī)范化文件。對(duì)于 Semantic Web 而言,最典型的 Ontology 具有一個(gè)分類體系和一系列的推理原則。其中,分類體系定義對(duì)象的類別和類目之間的關(guān)系。實(shí)體之間的類/子類關(guān)系對(duì)于 Web 應(yīng)用具有重要的價(jià)值。在 Ontology 中,還可以為某個(gè)類添加屬性來定義更多的類目關(guān)系。這些類目關(guān)系提供了的推理的基礎(chǔ)。
借助 Ontology 中的推理規(guī)則,Semantic Web 應(yīng)用系統(tǒng)可以提供更強(qiáng)的推理能力,例如可以在一個(gè)地理 Ontology 中加入這樣一條規(guī)則,“如果一個(gè)城市代碼與一個(gè)省代碼相關(guān),并且一個(gè)地址利用了城市代碼,那么這個(gè)地址與就與相應(yīng)的省代碼相關(guān)”。通過這一規(guī)則,程序可以推理出中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心,在中關(guān)村,應(yīng)當(dāng)在北京市。
為了 Semantic Web 研究者為了實(shí)現(xiàn)對(duì) Ontology 的描述,在 RDF 的基礎(chǔ)之上,發(fā)展了 RDFS。RDFS 借助幾個(gè)預(yù)先義的語詞(如 rdfs:Resource, rdfs:Class, rdf:Property, rdfs:subClassOf, rdfs:subPropertyOf, rdfs:domain, rdfs:range)能夠?qū)Ω拍钪g的關(guān)系進(jìn)行有限的描述。為了更方便全面地實(shí)現(xiàn) Ontology 的描述,W3C 在 RDFS 的基礎(chǔ)之上,借助了 DAML 和 OIL 的相關(guān)研究,正在積極推進(jìn) OWL(Web Ontology Language)的應(yīng)用。自 2004 年 2 月 10 日,OWL 已經(jīng)成為了一個(gè) W3C 推薦的標(biāo)準(zhǔn)。
Gene Ontology
為了查找某個(gè)研究領(lǐng)域的相關(guān)信息,生物學(xué)家往往要花費(fèi)大量的時(shí)間,更糟糕的是,不同的生物學(xué)數(shù)據(jù)庫可能會(huì)使用不同的術(shù)語,好比是一些方言一樣,這讓信息查找更加麻煩,尤其是使得機(jī)器查找無章可循。Gene Ontology (GO) 就是為了解決這種問題而發(fā)起的一個(gè)項(xiàng)目。
Gene Ontology 中最基本的概念是 term 。GO 里面的每一個(gè) entry 都有一個(gè)唯一的數(shù)字標(biāo)記,形如 GO:nnnnnnn,還有一個(gè) term 名,比如 "cell", "fibroblast growth factor receptor binding",或者 "signal transduction"。每個(gè) term 都屬于一個(gè) ontology,總共有三個(gè)ontology,它們分別是 molecular function, cellular component 和 biological process。
一個(gè)基因 product 可能會(huì)出現(xiàn)在不止一個(gè) cellular component 里面,也可能會(huì)在很多 biological process 里面起作用,并且在其中發(fā)揮不同的 molecular function。比如,基因 product "cytochrome c" 用 molecular function term 描述是 "oxidoreductase activity",而用 biological process term 描述就是 "oxidative phosphorylation" 和 "induction of cell death",最后,它的 celluar component term 是 "mitochondrial matrix" 和 "mitochondrial inner membrane"。
Gene Ontology 中的 term 有兩種相互關(guān)系,它們分別是 is_a 關(guān)系和 part_of 關(guān)系。is_a 關(guān)系是一種簡(jiǎn)單的包含關(guān)系,比如 A is_a B 表示 A 是 B 的一個(gè)子集。比如 nuclear chromosome is_a chromosome。part_of 關(guān)系要稍微復(fù)雜一點(diǎn),C part_of_D 意味著如果 C 出現(xiàn),那么它就肯定是 D 的一部分,但 C 不一定總會(huì)出現(xiàn)。比如 nucleus part_of cell,核肯定是細(xì)胞的一部分,但有的細(xì)胞沒有核。
Gene Ontology 的結(jié)構(gòu)是一個(gè)有向無環(huán)圖,有點(diǎn)類似于分類樹,不同點(diǎn)在于 Gene Ontology 的結(jié)構(gòu)中一個(gè) term 可以有不止一個(gè) parent。比如 biological process term "hexose biosynthesis" 有兩個(gè) parents,它們分別是 "hexose metabolism" 和 "monosaccharide biosynthesis",這是因?yàn)樯锖铣墒谴x的一種,而己糖又是單糖的一種。
Gene Ontology 使用 Oxford Dictionary of Molecular Biology (1997) 中的定義,在分選時(shí)還要參考 SWISS-PROT, PIR, NCBI CGAP, EC…中的注釋。建立起來的標(biāo)準(zhǔn)不是唯一的標(biāo)準(zhǔn)(這是 GOC 所一直強(qiáng)調(diào)的),自然也不規(guī)定每個(gè)研究者必須遵循這套控制字集系統(tǒng)。所采用的動(dòng)態(tài)結(jié)構(gòu) (dynamic structure) 使用 DAGs(Directed Acyclic Graphs) 方式的 network,將每一個(gè) ontology 串連起來,形成樹狀結(jié)構(gòu)(hierarchical tree),也就是由前面所說的“is a”和“part of”兩種關(guān)系。
由于 GO 是一種整合性的分類系統(tǒng),其下的 3 類主 ontology 我們前面說是獨(dú)立的,但是無論是 GOC 原初的設(shè)計(jì)還是我們的使用中其實(shí)都還是存在一定的流程關(guān)系。一個(gè)基因/蛋白質(zhì)或者一個(gè) ontology 在注解的過程中,首先是考慮涉及在構(gòu)成細(xì)胞內(nèi)的組分和元件 (cellular component),其次就是此組分/元件在分子水平上所行使的功能 (molecular function),最后能夠呈現(xiàn)出該分子功能所直接參與的生物過程 (biological process)。由于這是一種存在反饋機(jī)制的注釋過程,并且整個(gè)系統(tǒng)是動(dòng)態(tài)開放實(shí)時(shí)更新的,因此在某種程度上說它具有糾錯(cuò)的能力。
TAMBIS 計(jì)劃是目前唯一實(shí)現(xiàn)了在概念和聯(lián)系層次上集成信息源的系統(tǒng)。但是還有其他一些相關(guān)計(jì)劃正在研究之中。
比如 BioKleisli (賓夕法尼亞大學(xué)計(jì)算機(jī)系),采用 Mediator(調(diào)節(jié)器)技術(shù)實(shí)現(xiàn)了若干數(shù)據(jù)源的集成,其后的 K2/Kleisli 系統(tǒng)還利用數(shù)據(jù)倉庫實(shí)現(xiàn)了 OLAP(聯(lián)機(jī)分析處理)。
DiscoveryLink (IBM 研究院),基于 Wrapper/ Mediator(包裝器/調(diào)節(jié)器)實(shí)現(xiàn)了信息源集成,提出了查詢的分解和基于代價(jià)的優(yōu)化策略。
TAMBIS (曼徹斯特大學(xué)計(jì)算機(jī)系)基于 Wrapper/ Mediator 實(shí)現(xiàn)了信息源集成,借助 BioKleisli 中的 CPL 語言作為查詢語言并給出了查詢優(yōu)化的方法。通過 TaO(TAMBIS Ontology)本體定義為用戶瀏覽和查詢處理提供領(lǐng)域知識(shí)。
TINet (GSK 公司和 IBM 研究院),基于多數(shù)據(jù)庫中間件 OPM(Object-Protocol Model,對(duì)象協(xié)議模型)定義數(shù)據(jù)源的對(duì)象視圖,其 CORBA(Common Object Request Broker Architecture,公共對(duì)象請(qǐng)求代理體系結(jié)構(gòu))服務(wù)器使各數(shù)據(jù)源 Wrapper(包裝器) 更易于擴(kuò)充。
但是他們都存在一定的缺陷。BioKleisli 系統(tǒng)查詢能力相對(duì)較弱,而且并未給出查詢優(yōu)化策略;TAMBIS 系統(tǒng)和 DiscoveryLink 系統(tǒng)集成的數(shù)據(jù)源數(shù)量相對(duì)還很少,后者在查詢處理中并未運(yùn)用領(lǐng)域知識(shí),因而查詢分解也未從語義角度考慮;TINet 系統(tǒng)中的查詢處理能力不強(qiáng)。
現(xiàn)在面臨的突出問題是在數(shù)據(jù)庫查詢中尤其是當(dāng)多個(gè)數(shù)據(jù)庫存在信息重疊時(shí),缺乏從中選擇最佳檢索成員,動(dòng)態(tài)生成優(yōu)化檢索方案的能力。而且現(xiàn)有的工作主要面向數(shù)據(jù)集成,而對(duì)服務(wù)集成考慮不多。支持?jǐn)?shù)據(jù)與服務(wù)綜合性集成的體系仍欠完備。因此這也將是 GO 未來發(fā)展和提升的一個(gè)重要方向。
如何構(gòu)建一個(gè)簡(jiǎn)單的本體
在實(shí)際的應(yīng)用中,本體論學(xué)者、知識(shí)管理、人工智能、情報(bào)學(xué)(圖書館學(xué))甚至任何一個(gè)具有大量需要?dú)w類和劃分信息的部門及領(lǐng)域都可以成為本體論的應(yīng)用對(duì)象。本體論的基本元素是詞匯(term)/概念(concept),轉(zhuǎn)而構(gòu)成同質(zhì)化的類(class)和子類(sub-class),然后各個(gè)類和概念之間加入了適合的關(guān)系(relation)后,形成了一個(gè)簡(jiǎn)單的本體。概念和類皆用來表達(dá)詞匯本身,而關(guān)系則為詞匯提供連接(mapping),并加入限制條件(constraint),使之與現(xiàn)實(shí)情況相符合。
構(gòu)建本體最為常用的軟件是由斯坦福大學(xué)開發(fā)的Protege,最初是應(yīng)用在醫(yī)學(xué)領(lǐng)域,后來被逐漸的擴(kuò)展至其它領(lǐng)域。該軟件本身也是一個(gè)開源軟件,用戶可以在http://protege.stanford.edu/上免費(fèi)下載安裝。
構(gòu)建本體的簡(jiǎn)單步驟是:
1. 列出研究課題所涉及到的詞條(terms)
2. 按照詞條的固有屬性和專屬特征進(jìn)行歸納和修改,對(duì)詞條建立類(class)以及層級(jí)化的分類模型(taxonomy)
3. 加入關(guān)系(relation)連系terms和taxonomies
4. 按照需要,添加實(shí)例(instance)作為概念的具象
最后在Protege中,還可以利用其附帶的功能和插件對(duì)本體進(jìn)行文字和圖形化的導(dǎo)出,格式也可以自由選擇。
本體論的基本問題
ontology的根本問題是:“存在的最初分類是什么?”不同流派的哲學(xué)家對(duì)這個(gè)問題有不同的解釋。
這個(gè)問題使得在神學(xué)、圖書館學(xué)和人工智能的研究方面都需要運(yùn)用本體論的知識(shí),而且反映到宇宙學(xué)、道德和審美觀念上。另外存在論提出的問題還包括:
什么是存在?
什么是物質(zhì)物體?
什么是物體的基本屬性
用什么區(qū)別確定一個(gè)物體?
“物質(zhì)物體存在”的基本定義是什么?
物體的特性是什么?
存在的特性是什么?
什么時(shí)候物體不再存在?并不僅僅是變化。
為什么物體可以相對(duì)于虛無存在?
存在論歷史
存在論最早可推朔到古希臘的柏拉圖和亞里士多德,亞里士多德曾經(jīng)定義存在論為“研究物體的存在的科學(xué)”。具體地說是研究物體的分類,也就是說:在什么情況下,一個(gè)物體可以被定義為“存在”。比論包括“普遍”的問題和“具體”的問題
觀念,物體,聯(lián)系
關(guān)于存在可以提出許多問題:“什么是存在?”“什么在存在?”“我是什么?”等,對(duì)于本體論來說,最基本的是找出什么是物體、什么是觀念以及它們之間的聯(lián)系。啟蒙時(shí)代笛卡兒提出的“我思故我在”開啟了本體論基本問題的先例,但笛卡兒并沒有深入研究,也認(rèn)為沒有深入研究的必要,他認(rèn)為“我思故我在”證明了上帝的存在,后來的神學(xué)家們也認(rèn)為:“究竟是誰可以將這句話普遍應(yīng)用到一切事物中?”當(dāng)然只有上帝。但到了20世紀(jì),當(dāng)數(shù)理哲學(xué),科學(xué)哲學(xué)和基本粒子物理學(xué)的新發(fā)現(xiàn),將以前許多物質(zhì)的所謂界限都打破了,人們不再滿足于神學(xué)的說法。
實(shí)體和環(huán)境
在20世紀(jì)各個(gè)不同時(shí)期存在著形而上學(xué)的主觀主義學(xué)派,客觀主義學(xué)派,相對(duì)論學(xué)派等不同流派,后現(xiàn)代主義的實(shí)體哲學(xué)家們力圖通過在不同環(huán)境下的哲學(xué)行動(dòng)來重新定義上述的各個(gè)問題,主要依賴于生物學(xué)、生態(tài)學(xué)和認(rèn)知科學(xué)的最新研究成果,了解動(dòng)物在自然和人工提供的環(huán)境中的認(rèn)知情況。
命題相對(duì)于不同環(huán)境的變化,使得存在更難定義。如果人們說:“A是B”,“A必定是B”或“A曾經(jīng)是B”究竟有什么含義?有的哲學(xué)家主張去掉英語中的“是”一詞,改用以免造成容易混淆的抽象含義;另一些哲學(xué)家力圖了解詞匯中的深層含義和使用方式;馬丁·海德格爾想?yún)^(qū)分開“存在”和“物體”的意義。
存在
存在主義者認(rèn)為“存在”是最基本的概念,好多事物都可以說“是”,動(dòng)詞“是”有許多種用法,因此是易于混淆的,所以有許多種存在。
簡(jiǎn)單的說,本體論就是探討這個(gè)世界上存在的一切是不是在背后都有一個(gè)抽象的、不依賴于現(xiàn)實(shí)世界的基礎(chǔ)。精神的或是物質(zhì)的,是不是都有自己的抽象的根據(jù)。簡(jiǎn)單的說,形而下就是指的現(xiàn)實(shí)的我們可感的世界,而形而上指的是可感的世界背后的原因,是抽象的,是不可感的,并且是作為可感世界的根據(jù)存在的。本體論就是探討形而下的世界的形而上根據(jù)的。