鄭永曉內(nèi)容提要 像筆者這樣的文字工作者經(jīng)常遇到冷僻字難以輸入,在某些情況下,明明知道系統(tǒng)字庫中收有該字,但即使是“全拼”輸入法也難以找出此字。在這種情況下,就只好到GBK 字符集中去尋找,如果GBK字符集中仍找不到,就應(yīng)該到“方正超大字符集”中尋找,該字符集中收錄漢字65,531個。涵蓋GB18030 (以及ISO10646-2000或Unicode 4.0) 中編入的漢字。雖然編制方法不甚科學,但該字符集仍能幫助我們輸入絕大部分漢字。如果該字符集仍然沒有你需要的字符,就只好造字或到日本“文字鏡”中查詢了。因而,只要我們能細心查詢,一般情況下極少會遇到不能輸入的漢字。此處整理的《GBK 代碼集字符定義表》和《方正超大字符集》所收漢字有六萬之多,根據(jù)筆者的使用體會,應(yīng)該能夠解決絕大部分漢字的錄入問題。 |
GBK字符定義表使用說明:①在windows中安裝區(qū)位輸入法。②點擊輸入法的工具條,使其變成GBK內(nèi)碼輸入狀態(tài)。③在相關(guān)頁碼中找到所需字符后,按照左上角(兩位數(shù)字)—下方(一位)—上方(一位)之順序組成的四位數(shù)字鍵入即可完成輸入。當然,最簡單的方法即直接復制到word 中。筆畫索引是筆者制作,偏旁后面的數(shù)字是本字符在本文件中的頁碼。該索引不很完備,用戶在使用時需注意。
方正超大字符集使用說明:用戶可以通過輸入漢字的Unicode(或Surrogate)碼來輸入漢字。如在Word 2003 中,可以直接鍵入Unicode碼,然后按Alt+X 轉(zhuǎn)換成漢字。對于擴展B的漢字,請將前面兩個“去掉。比如,針對Unicode 是00020000的一個冷僻字,在word中輸入020000 ,然后按Alt+X即可,即可出現(xiàn)相應(yīng)的漢字。要想知道每個字符的Unicode,也可以將光標定位在漢字后面,然后按ALT+X,相應(yīng)的Unicode碼則會顯示出來。
為便于用戶使用,筆者提供的此表包含了每個字符在《康熙字典》或《漢語大辭典》的頁碼。先查這其中的一部字典,找到該字所在頁碼,而后根據(jù)該頁碼在“超大字符集”中利用word 提供的搜索功能搜索此字,如果頁碼不足4位,請在前面加零。找到所需文字后復制到相應(yīng)的編輯器如Word中。
注:“GBK”是繼 簡體中文Windows3.2 之后的簡體中文 Windows 所使用之代碼頁,它涵蓋了 Unicode 所有 20902 個中文字符以及中國國家標準化組織添加的大約 80 個中文字符。此前之“GB-2312”是簡體中文 Windows 3.2 的代碼頁,僅含有 6763 個漢字?!癎BK” 包含了“Big5”的繁體中文字符和“GB2312”中的簡體中文字符。國際標準化組織在 ISO10646-2000 的基本平面(BMP 或者 Unicode 3.0, 下簡稱 Unicode)編入了27,564 漢字(U+4E00~U+9FFF以及U+3400~U+4DFF),即2000年3月在GB18030頒布時所建議支持的字匯。其中U+3400~U+4DFF部分的6582個漢字又稱為擴展A。該組織還在ISO10646-2000 的第二平面擴展了42,711漢字(又稱為擴展B)。由于這42,711漢字編排在ISO10646-2000 的第二平面,所以編碼需要4個字節(jié)。為了能夠存取處理這些4字節(jié)字符,在Unicode 中引入了Surrogate 機制(在ISO10646-2000中命名為UTF-16)。根據(jù)這樣一種機制, 在Unicode中用兩個16位編碼就可以對ISO10646-2000 第二平面中的漢字進行存取。
可以使用 Alt+X 來顯示特殊字符的 Unicode 字符代碼。將插入點置于字符右側(cè),然后按 Alt+X。字符代碼將取代字符,再按 Alt+X 將切換為字符。
如果字符當前使用系統(tǒng)代碼頁進行編碼,您可將其轉(zhuǎn)換為 Unicode 編碼。若要執(zhí)行該操作,請在字符前鍵入“x”,將插入點置于字符后,按 Alt+X,然后再按 Alt+X。
Windows 98 、Winme 等微軟早期操作系統(tǒng)不能支持超大字符集。自Windows 2000始可使用該字符集,但需安裝相關(guān)補丁(補丁程序本站“軟件下載”一欄中提供下載)。在WindowsXP 、Windwos 2003 server 等操作系統(tǒng)中,配合安裝Office 2003 ,使用方正超大字符集最為方便。
要安裝宋體-方正超大字符集,請在安裝界面上選擇Office共享功能 –> 中文字體->中文超大字符集字體。如果您是從多語言包進行安裝,請在安裝界面上選擇Office Shared Features- >Chinese fonts->Chinese Extended font。宋體-方正超大字符集字體包括了上面提到的全部27,564個漢字以及在第二平面中(42,711)選出的36,862個在中國大陸,香港特別行政區(qū)(以及部分臺灣地區(qū))使用的漢字。因此包括西文等常用字符在內(nèi),宋體-方正超大字符集共包括65,531個字符。
另一種安裝方正超大字符集的方式是直接下載本文檔附件10,打開“我的電腦”或“資源管理器”,依次打開“Windows ---Font"目錄,然后選擇”文件“--安裝字體。將該字庫安裝到系統(tǒng)中。
有關(guān)本文檔的幾個附件:
附件1為 GBK 字符表,附有本人編纂的簡單索引;
附件2為本人選取之GBK 難字表,按筆畫排列;
附件3為 超大字符集第1部分;
附件4為 超大字符集第2部分。
以上附件均為不加密Word 文檔,使用方便。
附件5為CJK基本字符集(CJK Unified Ideographs),5166KB,20901字;
附件6為CJK擴充集A(CJK Unified Ideographs Extension A),1682KB,6581字;
附件7為CJK擴充集B(CJK Unified Ideographs Extension B),12,442KB, 42710字。
附件8為CJK Compatibility Ideographs ,695KB;
附件9 CJK Compability Ideographs Supplement ;741 KB;
以上文件為PDF文檔,需要Adobe pdf Reader 打開。
附件10 為方正超大字符集之字體文件。如沒有Offce 2003或Office 2007安裝盤,可使用該文件直接安裝該字庫。該文件為ZIP文檔,請解壓縮后使用。文件大小: 40,507K。
附件11 為超大字符集手寫輸入法, 為ZIP文檔,解壓縮后點擊Setup 安裝,安裝后輸入法中出現(xiàn)”逍遙筆 版本 4.0字樣“,可用鼠標手寫輸入冷僻字,極為方便實用。文件大?。杭s20MB。
注:CJK為中日韓之縮寫;
1993年中國發(fā)布GB13000.1-1993標準,收錄CJK基本集和CJK擴充集A,替代原有GB2312-1980標準。該標準俗稱GBK。
2000年中國發(fā)布GB18030-2000標準,開始收錄CJK擴充集B,替代原有的GB13000.1-1993標準
Windows 3.x及Windows95只支持GB2312-1980
Windows 98開始支持GBK
Windows 2000開始支持Unicode 3.0
Windows XP開始支持GB18030-2000。