字庫(kù)基本知識(shí)
要想定制自己的字庫(kù),最好有一些相應(yīng)的知識(shí)。一者,隨著相關(guān)知識(shí)的增加,進(jìn)入到專業(yè)人士之內(nèi),你可以對(duì)這個(gè)行業(yè)內(nèi)部的規(guī)律更加了解,花多少錢,辦多少事,自己心里明白,可以做到少花錢多辦事;二者也便于我們相互之間的交流和溝通。下面就字庫(kù)的基本知識(shí)作一個(gè)十分簡(jiǎn)要的介紹:
字庫(kù),就是我們使用計(jì)算機(jī)是顯示漢字的圖像源。計(jì)算機(jī)調(diào)用字庫(kù)顯示漢字,不是直接調(diào)用相同的圖像,而是調(diào)用這個(gè)漢字的內(nèi)碼,程序通過這個(gè)內(nèi)碼,再到相應(yīng)的圖像源(字庫(kù))當(dāng)中尋找相應(yīng)的圖像信息,并畫到屏幕上或者打印到紙上。所以,只要是文本文件,在以二進(jìn)制模式打開的時(shí)候,顯示的都是這些字的內(nèi)碼而不是圖形。
人們一般常用的都是PC機(jī)。操作環(huán)境一般使用的都是Windows操作系統(tǒng)。它的字庫(kù)都存放在C:\Windows\fonts\目錄下。打開這個(gè)目錄就可以看到各式各樣的字庫(kù)。其中顯示為漢字的(如"宋體"),就是中文字庫(kù)。安裝字庫(kù)的時(shí)候,只要用鼠標(biāo)點(diǎn)擊瀏覽器的文件→安裝新字體,就顯示出一個(gè)文件操作界面。選中相關(guān)字庫(kù)文件所在的目錄,系統(tǒng)就會(huì)自動(dòng)掃描字庫(kù)文件,選中之后再點(diǎn)擊"安裝",字庫(kù)就會(huì)拷貝到C:\Windows\fonts\目錄下了,這就算安裝好了。如果你對(duì)文件所在位置比較熟悉,也可以直接將其拷貝到該目錄下,之后,當(dāng)你再啟動(dòng)應(yīng)用軟件(如Word、WPS等等)的時(shí)候,在選擇字庫(kù)的時(shí)就可以選用你安裝的字庫(kù)了。想刪除字庫(kù),同樣也是進(jìn)入到該目錄下,選中想要?jiǎng)h除的字庫(kù),點(diǎn)擊文件→刪除就可以了,更為便捷的,使用鼠標(biāo)右鍵,直接刪除。
字庫(kù)的內(nèi)部結(jié)構(gòu)。用常見的字庫(kù)程序(詳見文件下載部分)可以打開字庫(kù)。字庫(kù)打開之后可以發(fā)現(xiàn),字庫(kù)內(nèi)的每一個(gè)字的圖像都是由曲線環(huán)繞而成。曲線上有很多的小點(diǎn)點(diǎn)。當(dāng)鼠標(biāo)拖動(dòng)這些控制點(diǎn)的時(shí)候,曲線會(huì)發(fā)生變化,字的圖像也就改變了。如果就這樣存盤,在使用這個(gè)字庫(kù)的這個(gè)字的時(shí)候,就會(huì)和原來的不一樣而和你修改后的樣子相同。這就是字庫(kù)的編輯,很簡(jiǎn)單,每一個(gè)人都會(huì)做的。
這時(shí)你會(huì)發(fā)現(xiàn),打開一個(gè)西方文字的字庫(kù),最多也不會(huì)超過256個(gè)字符圖像。一般大致二十六個(gè)拉丁字母(因文字不同而小有區(qū)別)的大小寫、數(shù)字、常用標(biāo)點(diǎn)符號(hào)等等,一個(gè)人搞個(gè)一天兩天,完全可以解決問題。而漢字的就大不相同了。最小的漢字字庫(kù)也要6763個(gè)漢字。要想搞定一版漢字字庫(kù),顯然不是一兩個(gè)人一兩年的事(一般需要3~5人/年)。它需要大量的人力和時(shí)間。所以說,漢字庫(kù)不是太復(fù)雜,而是太繁瑣,非專業(yè)人士難以涉足。
現(xiàn)在全世界有文字的語言至少有幾百種,它代表著全人類的文化。從前,當(dāng)您發(fā)行一種文件(譬如報(bào)紙)或者軟件,都需要使用當(dāng)?shù)卣Z言的操作系統(tǒng)重新輸入語言代碼。由于代碼不同,如果一種語言的文化想跟上世界發(fā)展水平,或者發(fā)展水平高的向水平低的普及的話,就很困難。所以人們發(fā)明了UNICODE,將全人類的文字統(tǒng)編到同一個(gè)編碼系統(tǒng)當(dāng)中。雖然各種語言文化系統(tǒng)使用不同的代碼系統(tǒng),但是使用UNICODE就可以使用同一個(gè)操作系統(tǒng)去識(shí)別不同的語言文字。
LINUX、UNIX、WindowsNT、MAC等都使用UNICODE。由于不少文化歷史地存在著互影響的,所以其語言也有著血緣關(guān)系,譬如中國(guó)大陸使用簡(jiǎn)體中文,臺(tái)灣使用繁體中文。大陸和臺(tái)灣有著血緣關(guān)系。簡(jiǎn)體中文中有一大部分是繁體中文中也使用的。怎樣既區(qū)別又兼容這種現(xiàn)象呢?人們發(fā)明了以代碼頁(yè)命名的區(qū)別系統(tǒng)。譬如同屬于中國(guó)文化圈的中國(guó)大陸、臺(tái)灣、日本、韓國(guó),日常使用的文字當(dāng)中都有漢字,所以以936、950、932、949等四個(gè)代碼頁(yè)相互區(qū)別。
漢字的使用當(dāng)然還是以中國(guó)為核心,所以漢字文化圈叫做CJK系統(tǒng)(C指中國(guó),J指日本,K指韓國(guó))。中國(guó)大陸使用的簡(jiǎn)體中文叫做GBK(即:GB_13000)。其代碼頁(yè)和輸入法在Windows\GBK.txt全部提供了,可以參考。臺(tái)灣繁體字編碼系統(tǒng)叫做BIG5(大5碼)。GBK包含GB_2312和BIG5,共有20902個(gè)漢字。新出版的GB_18064,共有六萬多個(gè)字符,字符代碼又?jǐn)U大了。
聯(lián)系客服