国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

打開(kāi)APP
userphoto
未登錄

開(kāi)通VIP,暢享免費(fèi)電子書(shū)等14項(xiàng)超值服

開(kāi)通VIP
“漢字”再統(tǒng)一

——張軸材談漢字交換碼標(biāo)準(zhǔn)建立歷程

本報(bào)記者 黃偉敏 肖春江
    如果中文詞匯也由0、1兩個(gè)元素構(gòu)成,大概就不需要漢字交換碼這門(mén)學(xué)問(wèn)了。可惜人認(rèn)識(shí)的是漢字,計(jì)算機(jī)卻偏認(rèn)二進(jìn)制代碼死理,人們只好削足適履,發(fā)明漢字交換碼這種人與機(jī)的交流工具。而為了避免一盤(pán)散沙式的混亂交流,還要建立更重要的統(tǒng)一編碼標(biāo)準(zhǔn),以便使應(yīng)用規(guī)范化。CJK-JRK漢字交換碼中日韓聯(lián)合研究組主編兼召集人張軸材先生介紹了漢字交換碼標(biāo)準(zhǔn)的建立歷程。

GB2312:漢字信息技術(shù)的秦始皇


    我國(guó)漢字信息技術(shù)標(biāo)準(zhǔn)化,首先選擇了制定漢字交換碼標(biāo)準(zhǔn)。1980年發(fā)布的GB2312《信息交換用漢字編碼字符集》基本集是第一個(gè)漢字信息技術(shù)標(biāo)準(zhǔn),也是我國(guó)信息技術(shù)領(lǐng)域內(nèi)重要的基礎(chǔ)標(biāo)準(zhǔn)。它的廣泛實(shí)施,對(duì)于促進(jìn)漢字信息技術(shù)發(fā)展和計(jì)算機(jī)的推廣應(yīng)用,保證全國(guó)范圍內(nèi)漢字處理系統(tǒng)、漢字通信系統(tǒng)的信息交換,發(fā)揮了重要作用,是信息時(shí)代名副其實(shí)的的秦始皇。
    GB2312解決的第一個(gè)問(wèn)題,就是選定能容納數(shù)萬(wàn)漢字的中西文兼容的編碼體系。GB2312用兩個(gè)七位字節(jié)表示漢字的編碼方案。設(shè)定若干編碼集合,每個(gè)可容納8836個(gè)字符,這樣只要選用幾個(gè)集合,就能解決全部漢字編碼的問(wèn)題。
    第二個(gè)要解決的問(wèn)題是選定放入基本集的漢字。GB2312以文化部發(fā)布的“印刷通用字形表”為依據(jù),以漢字頻度的高低、構(gòu)詞能力的強(qiáng)弱、實(shí)際用處的大小為原則進(jìn)行選字,最后選定6763個(gè)漢字和682個(gè)其他字符進(jìn)入基本集,并按人們普遍熟知的規(guī)律對(duì)所選漢字進(jìn)行分級(jí)和排序,形成了標(biāo)準(zhǔn)圖形字符代碼表。
    GB2312只是對(duì)廣泛通用的漢字進(jìn)行編碼,它適用于一般漢字信息處理系統(tǒng)的要求。繼GB2312之后,又?jǐn)U充制定了GB7589、GB12345、GB113131等5個(gè)輔助集標(biāo)準(zhǔn),共收了將近四萬(wàn)個(gè)漢字,它們形成了漢字交換碼的標(biāo)準(zhǔn)系列。

GB13000:四海皆準(zhǔn)“書(shū)同文”


    由于存在各自的利益,日、韓和中國(guó)臺(tái)灣省等國(guó)家和地區(qū)的漢字交換碼標(biāo)準(zhǔn)各唱各的戲,多種聲音雖然顯示“民主”,但給漢字信息交換帶來(lái)了相當(dāng)?shù)幕靵y。80年代中期,西文已在信息高速公路上加速前行,漢字卻仍在信息高速公路上開(kāi)著拖拉機(jī)。 為了取得電腦時(shí)代的“書(shū)同文”,GB13000標(biāo)準(zhǔn),即《信息技術(shù)通用多八位編碼字符集》,滿懷統(tǒng)一大任的使命感,于1992年降臨人世。
    GB13000是我國(guó)制定的與國(guó)際標(biāo)準(zhǔn)ISO/IEC 10646對(duì)應(yīng)的標(biāo)準(zhǔn),它標(biāo)志著ISO/IEC 10646標(biāo)準(zhǔn)的漢字編碼部分基本采納了我國(guó)方案。它的制訂,大體上經(jīng)歷了前期的斗爭(zhēng)和后期確立主導(dǎo)地位兩個(gè)階段。
    斗爭(zhēng)期(1985年~1990年10月)。國(guó)際標(biāo)準(zhǔn)化組織ISO中主管信息技術(shù)標(biāo)準(zhǔn)制訂的技術(shù)委員會(huì)TC97(后更名為ISO-IEC/JTC1)于1984年底決定立項(xiàng)制訂“雙字節(jié)two-byte)編碼字符集”國(guó)際標(biāo)準(zhǔn),并在其字符集和編碼分委會(huì)SC2下設(shè)立工作組WG2專門(mén)負(fù)責(zé)該項(xiàng)目。
    這段時(shí)期,國(guó)際上正因該標(biāo)準(zhǔn)究竟采用16位還是雙八位的編碼結(jié)構(gòu)吵架。我國(guó)贊成采用雙八位,提出漢字基本集和輔助集分別占用編碼空間右下角和左下角的方案。這個(gè)方案在1987年的ISO/TC97/SC2年會(huì)上得以通過(guò),我國(guó)開(kāi)始正式進(jìn)入國(guó)際標(biāo)準(zhǔn)起草階段。
    1987年12月電子工業(yè)部決定把“漢字雙八位(多字節(jié))編碼體系(即多八位編碼字符集)研究”列入“七五”國(guó)家重點(diǎn)科技攻關(guān)項(xiàng)目,并立即成立了由電子部十五所、四所和國(guó)家語(yǔ)委等單位組成的攻關(guān)小組。
    1988年攻關(guān)小組發(fā)現(xiàn)當(dāng)時(shí)新完成的標(biāo)準(zhǔn)DP 10646工作草案文本中存在兩個(gè)嚴(yán)重問(wèn)題:
    (1)將祖國(guó)大陸用的漢字和臺(tái)灣省少用的漢字作為兩種文字排列在編碼字符的不同位置,把我國(guó)臺(tái)灣省的標(biāo)準(zhǔn)作為主要參考標(biāo)準(zhǔn)之一,以“中華民國(guó)標(biāo)準(zhǔn)”的名義列入。
    (2)將原已商定的我國(guó)漢字占用編碼空間下半平面兩塊的方案改為只占左下塊。
    帶著上述問(wèn)題,我國(guó)參加SC2年會(huì)的代表團(tuán)在會(huì)上要求在“多八位編碼字符集”工作草案中去掉并修改有關(guān)我國(guó)臺(tái)灣省的不正確及不恰當(dāng)?shù)男形?,聲明我們將?lián)合我國(guó)臺(tái)灣省的同行一起討論解決海峽兩岸使用不同編碼標(biāo)準(zhǔn)的問(wèn)題,并研制出統(tǒng)一的中國(guó)漢字字符集納入國(guó)際標(biāo)準(zhǔn)。這一意見(jiàn)被SC2采納。
    由于日、韓的堅(jiān)決反對(duì),1990年SC2年會(huì)否決了我國(guó)提出的HCC方案(中、日、韓三國(guó)漢字經(jīng)認(rèn)同后,相同和認(rèn)同的漢字只給一個(gè)代碼,然后按某種順序統(tǒng)一排列。使常用的和次常用的中、日、韓漢字排列在BMP中)。在當(dāng)時(shí)的形勢(shì)下,作為緩沖,國(guó)內(nèi)有關(guān)專家提出了將BMP中的I00、I10和I11區(qū)留空,而將中、日、韓的表意文字分別旋轉(zhuǎn)在各自平面的一種折衷方案。該方案于1990年5月作為國(guó)家提案提交到WG2,獲得通過(guò),并在第一個(gè)DIS文本中采納了該方案。WG2同時(shí)決定:BMP的I01、I10和I11區(qū)將來(lái)旋轉(zhuǎn)中、日、韓三國(guó)同意的C、J、K文字。
    此后,我國(guó)暫停了在國(guó)際范圍內(nèi)進(jìn)行中、日、韓漢字統(tǒng)一編碼的理論上的爭(zhēng)論,在組織力量研究中國(guó)漢字字表的同時(shí),啟動(dòng)了緊張的建立“多字符集漢字?jǐn)?shù)據(jù)庫(kù)”的工作,進(jìn)而推進(jìn)從理論到實(shí)踐,從定性到定量,從手工到機(jī)助的轉(zhuǎn)化。
    確立主導(dǎo)地位(1990年12月~1993年11月)。1990年11月我國(guó)正式成立了“通用字符集”國(guó)際工作組,由張軸材、王之任副組長(zhǎng),陳力為、傅永和任工作組高級(jí)顧問(wèn),成員共13名,包括了計(jì)算機(jī)系統(tǒng)、軟件、硬件、語(yǔ)言文字及標(biāo)準(zhǔn)化方面的專家及技術(shù)人員。
    國(guó)際工作組成立之初便面臨著重大的抉擇。當(dāng)時(shí)ISO拒絕在DIS 10646中采用C、J、K漢字統(tǒng)一編碼,并采用回避C0、C1區(qū)的編碼結(jié)構(gòu)。與此同時(shí),我國(guó)還面臨著世界上將出現(xiàn)兩套標(biāo)準(zhǔn)(UCS和Unicode)的嚴(yán)峻形勢(shì)。國(guó)標(biāo)工作組經(jīng)慎重研究,在短時(shí)間內(nèi)達(dá)成共識(shí),確定了“立足基本中文平面,瞄準(zhǔn)基本多文種平面,注視/溝通Unicode”的方針。
    1991年1月20日體現(xiàn)了CJK統(tǒng)一編碼原則的漢字字符集HCS1.0問(wèn)世,國(guó)家技術(shù)監(jiān)督局破例預(yù)先給國(guó)標(biāo)號(hào)GB 13000。
    1991年2月至3月在有關(guān)方面努力下,形成了Unicode中的漢字部分UniHan與HCS相互對(duì)齊的協(xié)議,并先后得到中國(guó)國(guó)標(biāo)工作組和Unicode技術(shù)委員會(huì)的批準(zhǔn)。為了真正實(shí)現(xiàn)CJK漢字統(tǒng)一編碼,我國(guó)又參加了CJK-JRG(中日韓聯(lián)合研究組)。1991年7月CJK-JRG的第一次會(huì)議一致確認(rèn)了漢字統(tǒng)一編碼的要求。此后,又選舉我國(guó)的張軸材同志擔(dān)任CJK-JRG的主編兼召集人,從而確立了我國(guó)在CJK-JRG中的主導(dǎo)地位。
    1991年8月,WG2在日內(nèi)瓦舉行了第20次會(huì)議,確認(rèn)了CJK漢字統(tǒng)一編碼進(jìn)入BMP。我國(guó)提交的GB 13000漢字字符集HCSA2.1版作為工作起點(diǎn),已在ISO文件記錄在案。以后,1991年12月初我國(guó)如期向ISO提交了CJK統(tǒng)一漢字字符集第一版(CJK V1.0)。1992年4月25日提交了CJKV2.0。至此,ISO/IEC 10646.1中的漢字編碼部分勝利完成。
    由于ISO/IEC 10646.1是一個(gè)多文種的編碼標(biāo)準(zhǔn),因此除漢字外,ISO/IEC 10646.1中已將我國(guó)維、哈、柯文的字收入阿拉伯文;將我國(guó)朝鮮文字符與韓國(guó)文字符進(jìn)行了統(tǒng)一編碼;而蒙文、藏文和彝文等還有待今后擴(kuò)充收入ISO/IEC 10646(GB 13000)中。
    1992年4月至7月,我國(guó)又應(yīng)ISO及AFII(國(guó)際字型交換協(xié)會(huì),負(fù)責(zé)ISO/IEC 10646.1中字表的印刷工作)的要求,提交可供印刷ISO/IEC 10646.1中G屬下漢字的48×48點(diǎn)陣字型。
    至此,國(guó)際標(biāo)準(zhǔn)ISO/IEC 10646.1及對(duì)應(yīng)的國(guó)家標(biāo)準(zhǔn)GB 13000.1中的漢字編碼及字型開(kāi)發(fā)工作告一段落,而下一階段的編碼結(jié)構(gòu)擴(kuò)充方案及字匯擴(kuò)充方案的研制工作,也已馬不停蹄地展開(kāi)。
本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)。
打開(kāi)APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
GB(國(guó)家標(biāo)準(zhǔn))
多媒體數(shù)據(jù)為什么要壓縮?
漢字的編碼體系
漢字編碼標(biāo)準(zhǔn)與識(shí)別
中文化和國(guó)際化問(wèn)題權(quán)威解析之一:字符編碼發(fā)展歷程
編程技術(shù)中漢字問(wèn)題的分析及解決
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服