機內(nèi)碼,輸入碼,處理碼,字形碼,區(qū)位碼的定義 - 已解決 - 搜搜問問
1.漢字信息的編碼知識
⑴國標碼:是指我國1981年公布的“中華人民共和國國家標準信息交換漢字編碼”,代號為“GB2312-80”。由連續(xù)的兩個字節(jié)組成。
2.機內(nèi)碼:在計算機內(nèi)表示漢字的代碼是漢字機內(nèi)碼,漢字機內(nèi)碼由國標碼演化而來,把表示國標碼的兩個字節(jié)的最高位分別加“1”,就變成漢字機內(nèi)碼
3.輸入碼: 漢字輸入碼是指直接從鍵盤輸入的各種漢字輸入方法的編碼,屬于外碼。
4.字型點陣碼:用點陣方式來構(gòu)造漢字字型,然后存儲在計算機內(nèi),構(gòu)成漢字字模庫。目的是為了能顯示和打印漢字。
編碼的轉(zhuǎn)換舉例
漢字 區(qū)位碼 16進制 國標碼 機內(nèi)碼
文 4636 2E24H 4E44H CEC4H
“文”的區(qū)位碼為4636,區(qū)碼和位碼分別用16進制表示即為“2E24H”, 0010 1110 0010 0100
轉(zhuǎn)換成國標碼“4E44H”,0100 1110 0100 0100
機內(nèi)碼為“CEC4H”, 1100 1110 1100 0100
回答時間:2006-09-12 11:50:48
計算機只識別由0、1組成的代碼,ASCII碼是英文信息處理的標準編碼,漢字信息處理也必須有一個統(tǒng)一的標準編碼。我國國家標準局于1981年5月頒布了《信息交換用漢字編碼字符集——基本集》,代號為GB2312-80,共對6763個漢字和682個圖形字符進行了編碼,其編碼原則為:漢字用兩個字節(jié)表示,每個字節(jié)用七位碼(高位為0),;國家標準將漢字和圖形符號排列在一個94行94列的二維代碼表中,;每兩個字節(jié)分別用兩位十進制編碼,前字節(jié)的編碼稱為區(qū)碼,后字節(jié)的編碼稱為位碼,此即區(qū)位碼,;如“保”字在二維代碼表中處于17區(qū)第3位,區(qū)位碼即為“1703 ”。
國標碼并不等于區(qū)位碼,它是由區(qū)位碼稍作轉(zhuǎn)換得到,其轉(zhuǎn)換方法為:先將十進制區(qū)碼和位碼轉(zhuǎn)換為十六進制的區(qū)碼和位碼,;這樣就得了一個與國標碼有一個相對位置差的代碼,;再將這個代碼的第一個字節(jié)和第二個字節(jié)分別加上20H,就得到國標碼。如:“?!保斪值膰鴺舜a為3123H,它是經(jīng)過下面的轉(zhuǎn)換得到的:1703D->1103H->+20H->3123H。
國標碼是漢字信息交換的標準編碼,但因其前后字節(jié)的最高位為0,與ASCII碼發(fā)生沖突,如“保”字,國標碼為31H和23H,而西文字符“1”和“#”的SCII也為31H和23H,現(xiàn)假如內(nèi)存中有兩個字節(jié)為31H和23H,;這到底是一個漢字,還是兩個西文字符“1”;和“#”?于是就出現(xiàn)了二義性,顯然,國標碼是不可能在計算機內(nèi)部直接采用的,于是,;漢字的機內(nèi)碼采用變形國標碼,其變換方法為:將國標碼的每個字節(jié)都加上128,即將兩個字節(jié)的最高位由0改1,其余7位不變,如:由上面我們知道,“?!弊值膰鴺舜a為3123H,前字節(jié)為00110001B,后字節(jié)為00100011B,高位改1為10110001B和10100011B 即為B1A3H,因此,字的機內(nèi)碼就是B1A3H;。
本站僅提供存儲服務,所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請
點擊舉報。