信息是客觀(guān)存在的嗎?很多人認(rèn)為科學(xué)理論的目標(biāo)是描述世界的“本來(lái)面目”,這種觀(guān)點(diǎn)在物理學(xué)界尤為流行,甚至常常被當(dāng)作不言自明的常識(shí)。然而,信息不是某種東西,不是對(duì)象的客觀(guān)屬性,而是對(duì)應(yīng)于某種觀(guān)察、分析、思考的方法。
撰文 | 王培(美國(guó)天普大學(xué)計(jì)算機(jī)與信息科學(xué)系)
在和智能、認(rèn)知、思維有關(guān)的研究中,似乎一個(gè)概念越基本,歧義就越嚴(yán)重,使用中的混亂程度也越高。我前面分析過(guò)“智能”(《當(dāng)你談?wù)撊斯ぶ悄軙r(shí),到底在談?wù)撌裁??》?/span>“意思”(《“意思”是什么意思?》)和“意識(shí)”(《意識(shí)是腦中涌現(xiàn)的嗎?一場(chǎng)關(guān)于人腦、智能和意識(shí)的深入對(duì)話(huà)》)等概念,也討論了概念定義的一般情形(《新理論該怎么為概念下定義?》),這次讓我們談?wù)劇靶畔ⅰ薄?/span>
乍看起來(lái),“信息”的意思應(yīng)該是清楚的。和前面提到的那些概念相比,這個(gè)概念的技術(shù)味道較濃,而哲學(xué)味道較淡。更加上有信息論為依靠,似乎已經(jīng)是個(gè)科學(xué)概念。其實(shí),這恰恰使里面的問(wèn)題更加隱蔽,而麻煩一點(diǎn)也不小。
讓我們先仔細(xì)看看“信息論”到底說(shuō)了什么。人們通常將香農(nóng)(C. E. Shannon,也譯作“申農(nóng)”或“仙農(nóng)”)1948年的論文《通信的數(shù)學(xué)理論》[1]看作信息論的基礎(chǔ),其中的一個(gè)核心概念就是“信息量”。比如說(shuō)在一個(gè)通信過(guò)程中可能出現(xiàn)的消息或信號(hào)只有A、B、C、D四種,而它們的發(fā)生概率分別是1/2、1/4、1/8、1/8,那么,報(bào)告某條消息確實(shí)發(fā)生所需要的信息量分別是1比特、2比特、3比特和3比特。即使我們不提具體的計(jì)算公式(據(jù)說(shuō)科普文章中每增加一條公式就要流失一定量的讀者),這個(gè)例子也足以說(shuō)明,香農(nóng)信息量刻畫(huà)的是不確定性的減少或是確定性的增加,或者說(shuō)一條信息的信息量反映了其出乎意料的程度。
這聽(tīng)上去很符合我們的直觀(guān):“老生常談”自然是沒(méi)有“聞所未聞”信息量大??梢坏┪覀儼延懻摰姆秶鷱纳鲜龅暮?jiǎn)單例子推廣到通信交流的一般情形,各種問(wèn)題就出現(xiàn)了:
我認(rèn)為這些問(wèn)題的共同根源就是:目前的“信息論”其實(shí)還是“通信編碼理論”,盡管其中覆蓋了信息的編碼、傳輸、存儲(chǔ)等若干重要方面,卻基本沒(méi)有涉及對(duì)信息的理解和加工等方面。因此,不是所有和信息有關(guān)的問(wèn)題都能夠在信息論里面找到答案的。香農(nóng)在《通信的數(shù)學(xué)理論》中明確說(shuō)他的理論是不涉及語(yǔ)義的,而這一點(diǎn)被很多人忽略了。
即使只談“信息量”,至少可以在符號(hào)學(xué)的下述層面上度量信息:
總而言之,即使只談通信交流,“信息”也有不同的含義,而現(xiàn)有的信息論只處理了其中最簡(jiǎn)單的情形。上面的討論同樣適用于人類(lèi)和人工智能。對(duì)一個(gè)特定系統(tǒng)而言,說(shuō)某個(gè)輸入“信息量較大”,這既可能是說(shuō)其體量大,也可能是指其內(nèi)容新,還可能是說(shuō)其影響深。這些度量各有用途,不加區(qū)分就容易造成混亂。
如前所述,作為一個(gè)科學(xué)概念,“信息”先是在通信領(lǐng)域中被引入的,如“主體A向主體B發(fā)送了關(guān)于對(duì)象C的信息”。后來(lái),其使用被推廣到描述領(lǐng)域,如“主體B得到了關(guān)于對(duì)象C的信息”,這里信息的來(lái)源既可能是來(lái)自某個(gè)未說(shuō)明的發(fā)送者(主體A),也有可能來(lái)自B對(duì)C的觀(guān)察和分析。最后,一些研究者直接把信息當(dāng)作對(duì)象的屬性,如“對(duì)象C所包含的信息”。
由于最后一種用法里面的C可以是任何事物,信息的概念在這里就可能被看作是客觀(guān)世界的一部分,以至于一種常見(jiàn)的說(shuō)法是“世界是由物質(zhì)、能量和信息組成的”。更有人認(rèn)為,信息甚至比其它二者更基本。物理學(xué)家John Wheeler 曾提出了一個(gè)廣為流傳的口號(hào) “It from bit”[2],這句話(huà)常常被理解為“萬(wàn)物起源于比特”,就是說(shuō)信息才是世界的本原,而各種事物都是信息的具體表現(xiàn)形式。類(lèi)似地,霍金(Stephen Hawking)提出了“物體被黑洞吞噬后,其中的信息哪里去了”的問(wèn)題,有些學(xué)者將“萬(wàn)物起源于比特”修改成“萬(wàn)物起源于量子比特”,還有些學(xué)者甚至斷言宇宙可以被看作一臺(tái)進(jìn)行信息加工的計(jì)算機(jī)。這些結(jié)論自然都不是信口胡言,而是有相應(yīng)的論證和根據(jù)的,其中大部分來(lái)自物理學(xué)。盡管它們的確為一些現(xiàn)象提供了解釋?zhuān)@些觀(guān)點(diǎn)仍有明顯的反直觀(guān)之處。無(wú)論如何,“信息”不是實(shí)實(shí)在在的東西,說(shuō)物質(zhì)和能量都來(lái)自于它,難免給人“無(wú)中豈能生有”的疑惑感。
在“一個(gè)對(duì)象”和“對(duì)此對(duì)象的描述”之間,存在著微妙的差別,而信息在其一般意義下是關(guān)聯(lián)于后者的?!耙粋€(gè)人”和“這個(gè)人的照片”顯然有關(guān)聯(lián),但不是一回事。問(wèn)這張照片里有多少信息是有意義的(比如說(shuō)其中的像素?cái)?shù)量就是一種語(yǔ)形信息量),但問(wèn)這個(gè)人里有多少信息就未必有意義了。由于信息的基本意義是關(guān)于描述的,將其直接用于描述對(duì)象只有在存在唯一描述時(shí)才行。就拿前面的例子來(lái)說(shuō),如果某人只有一張照片,那么以照片的屬性作為此人的屬性還算是情有可原(盡管?chē)?yán)格說(shuō)來(lái)仍不妥),但如果此人已有若干不同的照片,以某張照片的屬性作為此人的屬性就沒(méi)道理了。
很多人仍然認(rèn)為科學(xué)理論的目標(biāo)是描述世界的“本來(lái)面目”,而這種觀(guān)點(diǎn)在物理學(xué)界尤為流行,甚至常常被當(dāng)作不言自明的常識(shí)。我在《證實(shí)、證偽、證明、證據(jù):何以為“證”?》中已經(jīng)列舉了若干反對(duì)理由,其中就包括量子力學(xué)所展示的觀(guān)察者對(duì)觀(guān)察結(jié)論的影響。盡管世界不依賴(lài)于觀(guān)察者而存在,但對(duì)世界和其中的事物的所有描述都或多或少地依賴(lài)于觀(guān)察者的特征與狀態(tài)。嚴(yán)格說(shuō)來(lái),“描述”所體現(xiàn)的不是描述對(duì)象的屬性,而是描述者和描述對(duì)象的關(guān)系。當(dāng)一個(gè)對(duì)象可以在不同角度用不同詞匯來(lái)描述時(shí),每個(gè)描述都提供了對(duì)象的信息,但又都不能窮盡對(duì)象的所有信息。因此,除非針對(duì)一個(gè)特定的觀(guān)察過(guò)程,否則談?wù)撘粋€(gè)事物中“有什么(或多少)信息”是沒(méi)有一般意義的。沒(méi)人有理由認(rèn)為他們目前的理論或概念來(lái)自于世界本身,或代表了認(rèn)識(shí)所能達(dá)到的極限,而不受他們自身的認(rèn)知能力和歷史環(huán)境的影響。
根據(jù)上述理由,我認(rèn)為把信息看作對(duì)象的客觀(guān)屬性是缺乏一般性的做法,只能在特定的范圍內(nèi)作為一種簡(jiǎn)化或近似的說(shuō)法。問(wèn)一個(gè)人或一塊石頭里面“到底有多少信息”不是個(gè)有意義的問(wèn)題。
在我看來(lái),“信息”及其相關(guān)概念(信息量、信息收集/表示/加工/處理、…)屬于一種方法論,而非本體論。這就是說(shuō),“信息”不是某種東西,而是對(duì)應(yīng)于某種觀(guān)察、分析、思考的方法。因此,我們不能說(shuō)一個(gè)事物中有什么信息,而是要說(shuō)如果以這種視角來(lái)分析一個(gè)事物,我們能得到什么結(jié)論。
舉個(gè)例子:“我得到了外面正在下雨的信息”是“我看到了外面正在下雨”“我聽(tīng)到了外面正在下雨”“我聽(tīng)說(shuō)了外面正在下雨”等等情形的籠統(tǒng)表示。我采取這種說(shuō)法來(lái)抽象地表達(dá)對(duì)外界狀態(tài)的認(rèn)識(shí),而有意省略達(dá)到這一認(rèn)識(shí)的具體過(guò)程。類(lèi)似地,在設(shè)計(jì)和分析計(jì)算機(jī)中的過(guò)程時(shí),我們常常采用“信息加工”的觀(guān)點(diǎn),即抽象地討論系統(tǒng)的狀態(tài)轉(zhuǎn)移過(guò)程,而不涉及具體實(shí)現(xiàn)這一過(guò)程的物理細(xì)節(jié)。同樣,當(dāng)我們討論人腦中的“信息加工”過(guò)程時(shí),也是抽象地討論其中的狀態(tài)轉(zhuǎn)移過(guò)程,而不涉及具體實(shí)現(xiàn)這一過(guò)程的生物、化學(xué)活動(dòng)。
這種抽象的必要性和可能性都來(lái)自于“高層描述”和“低層描述”的“一對(duì)多”關(guān)系。這就是說(shuō)盡管“看到”“聽(tīng)到”“聽(tīng)說(shuō)”等等是非常不同的過(guò)程,它們對(duì)我“是否要打傘”這一決定而言是不必區(qū)分的,所以可以統(tǒng)稱(chēng)“得到信息”。同理,當(dāng)在計(jì)算機(jī)中對(duì)一組數(shù)據(jù)進(jìn)行排序時(shí),我們只需抽象地考慮操作步驟,而不去提及在此過(guò)程中電子是怎樣流動(dòng)的。這當(dāng)然不是說(shuō)排序不需要電流,而是因?yàn)楹芏嗖煌碾娏骰顒?dòng)都會(huì)導(dǎo)致同樣的排序結(jié)果。在這種情況下,在電子水平上討論排序反而是說(shuō)不清楚了。
在計(jì)算機(jī)科學(xué)中有一個(gè)重要概念:“虛擬機(jī)”,指某些軟件為系統(tǒng)提供了一個(gè)特定的描述,包括可以執(zhí)行的操作等等。這樣做的一個(gè)常見(jiàn)目的就是用一種計(jì)算機(jī)去模擬(或“仿真”)另一種計(jì)算機(jī)。每個(gè)虛擬機(jī)都提供了一個(gè)抽象層次,使得用戶(hù)不必考慮在這個(gè)層次之下的過(guò)程。比如說(shuō)所有數(shù)字計(jì)算機(jī)都采用二進(jìn)制表示,但這不意味著十進(jìn)制運(yùn)算不可能完成。只要有一套恰當(dāng)?shù)某绦颍瑢?duì)用戶(hù)來(lái)說(shuō)這個(gè)系統(tǒng)就是一臺(tái)能進(jìn)行十進(jìn)制運(yùn)算的機(jī)器。至于這些運(yùn)算是由機(jī)器硬件直接完成的,還是經(jīng)過(guò)了軟件的“翻譯”,這是無(wú)關(guān)宏旨的。用戶(hù)完全可以認(rèn)為是前者,盡管這種機(jī)器是“虛擬”的。
虛擬機(jī)抽象可以進(jìn)行任意多層,而每層上面所得到的“機(jī)器”可能有不同甚至相反的特征。不了解這一點(diǎn)就會(huì)對(duì)計(jì)算機(jī)的能力產(chǎn)生重大誤解。比如說(shuō),現(xiàn)在仍有人說(shuō)計(jì)算機(jī)歸根結(jié)底是用二值邏輯的,因此不可能具有人腦的很多認(rèn)知功能——其實(shí)這就和說(shuō)“計(jì)算機(jī)歸根結(jié)底是用二進(jìn)制的,因此不可能進(jìn)行十進(jìn)制運(yùn)算”一樣荒謬。這種“歸根結(jié)底”式的論證盡管乍聽(tīng)起來(lái)直截了當(dāng),在分析一個(gè)復(fù)雜系統(tǒng)時(shí)卻常常做出似是而非的結(jié)論。當(dāng)抽象層次足夠多、足夠復(fù)雜時(shí),系統(tǒng)的高層性質(zhì)和低層性質(zhì)已經(jīng)沒(méi)有直接關(guān)系了。
信息的抽象性恰恰是反對(duì)“歸根結(jié)底”式的還原論證的。如果對(duì)某個(gè)過(guò)程的描述或解釋不可避免涉及其中的物理、化學(xué)、生物等層面上的活動(dòng),那么將這一過(guò)程作為“信息加工”來(lái)分析就是不恰當(dāng)?shù)?。就像?dāng)你找一本書(shū)來(lái)墊桌腿時(shí)不把它看作信息載體一樣。計(jì)算機(jī)當(dāng)然常常是作為信息系統(tǒng)來(lái)分析的,但如果現(xiàn)在要解決的是其散熱問(wèn)題,那么談信息就于事無(wú)補(bǔ)。如前面提到的,這里的問(wèn)題不是這臺(tái)計(jì)算機(jī)是不是信息系統(tǒng),而是應(yīng)不應(yīng)被當(dāng)成信息系統(tǒng)來(lái)分析。同理,人腦中的某些過(guò)程可以被作為信息加工來(lái)分析(這就是認(rèn)知心理學(xué)的基本思路),但另一些過(guò)程則不可以這么分析,比如大腦的供血機(jī)制。
這個(gè)問(wèn)題對(duì)人工智能有根本性的意義,因?yàn)檫@個(gè)領(lǐng)域的一個(gè)基本假設(shè)就是計(jì)算機(jī)和人腦在某個(gè)抽象層面上相似甚至可能相同,盡管在這個(gè)層面之下二者完全不同(前者是機(jī)電的,后者是生物的)。如果有一天發(fā)現(xiàn)我們叫做“智能”(或者“認(rèn)知”“思維”“精神”等等)的性質(zhì)具有不可擺脫的“生物性”,那就說(shuō)明非生物的計(jì)算機(jī)不可能真的有這種性質(zhì)。當(dāng)然一直有人這么想,但他們的論證還沒(méi)有強(qiáng)到說(shuō)服很多人的程度。我自然認(rèn)為這種抽象是可能的,而“信息”恰恰提供了一個(gè)合適的描述層次。A General Theory of Intelligence這篇書(shū)稿[3]就是我在信息層面上構(gòu)建智能理論的努力。
這篇文章里有多少信息?你說(shuō)“完全不知所云”或“徹底顛覆三觀(guān)”都算正常,而且你實(shí)際接受到的信息也未必就是我在試圖發(fā)送的信息。
參考文獻(xiàn)
[2] Wheeler, J. A. (1990). "Information, physics, quantum: The search for links". In Zurek, Wojciech Hubert (editor). Complexity, Entropy, and the Physics of Information. Addison-Wesley.
[3] Wang, P. (2009). A General Theory of Intelligence (a developing eBook, online since 2009). URL: https://cis.temple.edu/~pwang/GTI-book/.
特 別 提 示
聯(lián)系客服