簡單介紹一下編程方式的歷史演變。
-- Erik O'shaughnessy(作者)
在計算機誕生不久的早期年代,硬件非常昂貴,而程序員比較廉價。這些廉價程序員甚至都沒有“程序員”這個頭銜,并且常常是由數(shù)學(xué)家或者電氣工程師來充當(dāng)這個角色的。早期的計算機被用來快速解決復(fù)雜的數(shù)學(xué)問題,所以數(shù)學(xué)家天然就適合“編程”工作。
首先來看一點背景知識。計算機自己是做不了任何事情的,它們的任何行為都需要程序來引導(dǎo)。你可以把程序看成是非常精確的菜譜,這種菜譜讀取一個輸入,然后生成對應(yīng)的輸出。菜譜里的各個步驟由操作數(shù)據(jù)的指令構(gòu)成。聽上去有點兒復(fù)雜,不過你或許知道下面這個語句是什么意思:
其中的加號是“指令”,而數(shù)字 1 和 2 是數(shù)據(jù)。數(shù)學(xué)上的等號意味著等式兩邊的部分是“等價”的,不過在大部分編程語言中對變量使用等號是“賦值”的意思。如果計算機執(zhí)行上面這個語句,它會把這個加法的結(jié)果(也就是“3”)儲存在內(nèi)存中的某個地方。
計算機知道如何使用數(shù)字進行數(shù)學(xué)運算,以及如何在內(nèi)存結(jié)構(gòu)中移動數(shù)據(jù)。在這里就不對內(nèi)存進行展開了,你只需要知道內(nèi)存一般分為兩大類:“速度快/空間小”和“速度慢/空間大”。CPU 寄存器的讀寫速度非???,但是空間非常小,相當(dāng)于一個速記便簽。主存儲器通常有很大的空間,但是讀寫速度就比寄存器差遠了。在程序運行的時候,CPU 不斷將它所需要用到的數(shù)據(jù)從主存儲器挪動到寄存器,然后再把結(jié)果放回到主存儲器。
當(dāng)時的計算機很貴,而人力比較便宜。程序員需要耗費很多時間把手寫的數(shù)學(xué)表達式翻譯成計算機可以執(zhí)行的指令。最初的計算機只有非常糟糕的用戶界面,有些甚至只有前面板上的撥動開關(guān)。這些開關(guān)就代表一個內(nèi)存“單元”里的一個個 “0” 和 “1”。程序員需要配置一個內(nèi)存單元,選擇好儲存位置,然后把這個單元提交到內(nèi)存里。這是一個既耗時又容易出錯的過程。
程序員 Betty Jean Jennings (左) 和 Fran Bilas (右) 在操作
后來有一名 電氣工程師 認(rèn)為自己的時間很寶貴,就寫了一個程序,能夠把人們可以讀懂的“菜譜”一樣的輸入轉(zhuǎn)換成計算機可以讀懂的版本。這就是最初的“匯編器”,在當(dāng)時引起了不小的爭議。這些昂貴機器的主人不希望把計算資源浪費在人們已經(jīng)能做的任務(wù)上(雖然又慢又容易出錯)。不過隨著時間的推移,人們逐漸發(fā)現(xiàn)使用匯編器在速度和準(zhǔn)確性上都勝于人工編寫機器語言,并且計算機完成的“實際工作量”增加了。
盡管匯編器相比在機器面板上切換比特的狀態(tài)已經(jīng)是很大的進步了,這種編程方式仍然非常專業(yè)。上面加法的例子在匯編語言中看起來差不多是這樣的:
01 MOV R0, 102 MOV R1, 203 ADD R0, R1, R204 MOV 64, R005 STO R2, R0
每一行都是一個計算機指令,前面是一個指令的簡寫,后面是指令所操作的數(shù)據(jù)。這個小小的程序首先會將數(shù)值 1 “移動”到寄存器 R0,然后把 2 移動到寄存器 R1。03 行把 R0 和 R1 兩個寄存器里的數(shù)值相加,然后將結(jié)果儲存在 R2 寄存器里。最后,04 行和 05 行決定結(jié)果應(yīng)該被放在主存儲器里的什么位置(在這里是地址 64)。管理內(nèi)存中存儲數(shù)據(jù)的位置是編程過程中最耗時也最容易出錯的部分之一。
匯編器已經(jīng)比手寫計算機指令要好太多了,不過早期的程序員還是渴望能夠按照他們所習(xí)慣的方式,像書寫數(shù)學(xué)公式一樣地去寫程序。這種需求推動了高級編譯語言的發(fā)展,其中有一些已經(jīng)成為歷史,另一些如今還在使用。比如 ALGO 就已經(jīng)成為歷史了,但是像 Fortran 和 C 這樣的語言仍然在不斷解決實際問題。
ALGO 和 Fortran 編程語言的譜系樹
這些“高級”語言使得程序員可以用更簡單的方式編寫程序。在 C 語言中,我們的加法程序就變成了這樣:
第一個語句描述了該程序?qū)⒁褂玫囊粔K內(nèi)存。在這個例子中,這塊內(nèi)存應(yīng)該占一個整數(shù)的大小,名字是 x。第二個語句是加法,雖然是倒著寫的。一個 C 語言的程序員會說這是 “X 被賦值為 1 加 2 的結(jié)果”。需要注意的是,程序員并不需要決定在內(nèi)存的什么位置儲存 x,這個任務(wù)交給編譯器了。
這種被稱為“編譯器”的新程序可以把用高級語言寫的程序轉(zhuǎn)換成匯編語言,再使用匯編器把匯編語言轉(zhuǎn)換成機器可讀的程序。這種程序組合常常被稱為“工具鏈”,因為一個程序的輸出就直接成為另一個程序的輸入。
編譯語言相比匯編語言的優(yōu)勢體現(xiàn)在從一臺計算機遷移到不同型號或者品牌的另一臺計算機上的時候。在計算機的早期歲月里,包括 IBM、DEC、德州儀器、UNIVAC 以及惠普在內(nèi)的很多公司都在制造除了大量不同類型的計算機硬件。這些計算機除了都需要連接電源之外就沒有太多共同點了。它們在內(nèi)存和 CPU 架構(gòu)上的差異相當(dāng)大,當(dāng)時經(jīng)常需要人們花費數(shù)年來將一臺計算機的程序翻譯成另一臺計算機的程序。
有了高級語言,我們只需要把編譯器工具鏈遷移到新的平臺就行了。只要有可用的編譯器,高級語言寫的程序最多只需要經(jīng)過小幅修改就可以在新的計算機上被重新編譯。高級語言的編譯是一個真正的革命性成果。
1983 發(fā)布的 IBM PC XT 是硬件價格下降的早期例子。
程序員們的生活得到了很好的改善。相比之下,通過高級語言表達他們想要解決的問題讓事情變得輕松很多。由于半導(dǎo)體技術(shù)的進步以及集成芯片的發(fā)明,計算機硬件的價格急劇下降。計算機的速度越來越快,能力也越來越強,并且還便宜了很多。從某個時間點往后(也許是 80 年代末期吧),事情發(fā)生了反轉(zhuǎn),程序員變得比他們所使用的硬件更值錢了。
隨著時間的推移,一種新的編程方式興起了。一種被稱為“解釋器”的特殊程序可以直接讀取一個程序?qū)⑵滢D(zhuǎn)換成計算機指令以立即執(zhí)行。和編譯器差不多,解釋器讀取程序并將它轉(zhuǎn)換成一個中間形態(tài)。但和編譯器不同的是,解釋器直接執(zhí)行程序的這個中間形態(tài)。解釋型語言在每一次執(zhí)行的時候都要經(jīng)歷這個過程;而編譯程序只需要編譯一次,之后計算機每次只需要執(zhí)行編譯好的機器指令就可以了。
順便說一句,這個特性就是導(dǎo)致人們感覺解釋型程序運行得比較慢的原因。不過現(xiàn)代計算機的性能出奇地強大,以至于大多數(shù)人無法區(qū)分編譯型程序和解釋型程序。
解釋型程序(有時也被成為“腳本”)甚至更容易被移植到不同的硬件平臺上。因為腳本并不包含任何機器特有的指令,同一個版本的程序可以不經(jīng)過任何修改就直接在很多不同的計算機上運行。不過當(dāng)然了,解釋器必須得先移植到新的機器上才行。
一個很流行的解釋型語言是 perl 。用 perl 完整地表達我們的加法問題會是這樣的:
$x = 1 2
雖然這個程序看起來和 C 語言的版本差不多,運行上也沒有太大區(qū)別,但卻缺少了初始化變量的語句。其實還有一些其它的區(qū)別(超出這篇文章的范圍了),但你應(yīng)該已經(jīng)注意到,我們寫計算機程序的方式已經(jīng)和數(shù)學(xué)家用紙筆手寫數(shù)學(xué)表達式非常接近了。
最新潮的編程方式要數(shù)虛擬機(經(jīng)常簡稱 VM)了。虛擬機分為兩大類:系統(tǒng)虛擬機和進程虛擬機。這兩種虛擬機都提供一種對“真實的”計算硬件的不同級別的抽象,不過它們的作用域不同。系統(tǒng)虛擬機是一個提供物理硬件的替代品的軟件,而進程虛擬機則被設(shè)計用來以一種“系統(tǒng)獨立”的方式執(zhí)行程序。所以在這個例子里,進程虛擬機(往后我所說的虛擬機都是指這個類型)的作用域和解釋器的比較類似,因為也是先將程序編譯成一個中間形態(tài),然后虛擬機再執(zhí)行這個中間形態(tài)。
虛擬機和解釋器的主要區(qū)別在于,虛擬機創(chuàng)造了一個虛擬的 CPU,以及一套虛擬的指令集。有了這層抽象,我們就可以編寫前端工具來把不同語言的程序編譯成虛擬機可以接受的程序了。也許最流行也最知名的虛擬機就是 Java 虛擬機(JVM)了。JVM 最初在 1990 年代只支持 Java 語言,但是如今卻可以運行 許多 流行的編程語言,包括 Scala、Jython、JRuby、Clojure,以及 Kotlin 等等。還有其它一些不太常見的例子,在這里就不說了。我也是最近才知道,我最喜歡的語言 Python 并不是一個解釋型語言,而是一個 運行在虛擬機上的語言 !
虛擬機仍然在延續(xù)這樣一個歷史趨勢:讓程序員在使用特定領(lǐng)域的編程語言解決問題的時候,所需要的對特定計算平臺的了解變得越來越少了。