国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
windows環(huán)境下unicode編程總結(jié)
 

UNICODE環(huán)境設(shè)置

在安裝Visual Studio時,在選擇VC++時需要加入unicode選項,保證相關(guān)的庫文件可以拷貝到system32下。

 

UNICODE編譯設(shè)置:

C/C++, Preprocessor difinitions 去除_MBCS,加_UNICODE,UNICODE

ProjectSetting/link/output 中設(shè)置EntrywWinMainCRTStartup

反之為MBCSANSI)編譯。

 

Unicode :寬字節(jié)字符集

 

1. 如何取得一個既包含單字節(jié)字符又包含雙字節(jié)字符的字符串的字符個數(shù)?

可以調(diào)用Microsoft Visual C++的運行期庫包含函數(shù)_mbslen來操作多字節(jié)(既包括單字節(jié)也包括雙字節(jié))字符串。

調(diào)用strlen函數(shù),無法真正了解字符串中究竟有多少字符,它只能告訴你到達結(jié)尾的0之前有多少個字節(jié)。

 

2. 如何對DBCS(雙字節(jié)字符集)字符串進行操作?

函數(shù) 描述

PTSTR CharNext LPCTSTR ; 返回字符串中下一個字符的地址

PTSTR CharPrev LPCTSTR, LPCTSTR ); 返回字符串中上一個字符的地址

BOOL IsDBCSLeadByte( BYTE ); 如果該字節(jié)是DBCS字符的第一個字節(jié),則返回非0

 

3. 為什幺要使用Unicode?

1 可以很容易地在不同語言之間進行數(shù)據(jù)交換。

2 使你能夠分配支持所有語言的單個二進制.exe文件或DLL文件。

3 提高應用程序的運行效率。

Windows 2000是使用Unicode從頭進行開發(fā)的,如果調(diào)用任何一個Windows函數(shù)并給它傳遞一個ANSI字符串,那幺系統(tǒng)首先要將字符串轉(zhuǎn)換成Unicode,然后將Unicode字符串傳遞給操作系統(tǒng)。如果希望函數(shù)返回ANSI字符串,系統(tǒng)就會首先將Unicode字符串轉(zhuǎn)換成ANSI字符串,然后將結(jié)果返回給你的應用程序。進行這些字符串的轉(zhuǎn)換需要占用系統(tǒng)的時間和內(nèi)存。通過從頭開始用Unicode來開發(fā)應用程序,就能夠使你的應用程序更加有效地運行。

Windows CE 本身就是使用Unicode的一種操作系統(tǒng),完全不支持ANSI Windows函數(shù)

Windows 98 只支持ANSI,只能為ANSI開發(fā)應用程序。

Microsoft公司將COM16Windows轉(zhuǎn)換成Win32時,公司決定需要字符串的所有COM接口方法都只能接受Unicode字符串。

 

4. 如何編寫Unicode源代碼?

Microsoft公司為Unicode設(shè)計了WindowsAPI,這樣,可以盡量減少代碼的影響。實際上,可以編寫單個源代碼文件,以便使用或者不使用Unicode來對它進行編譯。只需要定義兩個宏(UNICODE_UNICODE),就可以修改然后重新編譯該源文件。

_UNICODE宏用于C運行期頭文件,而UNICODE宏則用于Windows頭文件。當編譯源代碼模塊時,通常必須同時定義這兩個宏。

 

5. Windows定義的Unicode數(shù)據(jù)類型有哪些?

數(shù)據(jù)類型 說明

WCHAR Unicode字符

PWSTR 指向Unicode字符串的指針

PCWSTR 指向一個恒定的Unicode字符串的指針

對應的ANSI數(shù)據(jù)類型為CHAR,LPSTRLPCSTR

ANSI/Unicode通用數(shù)據(jù)類型為TCHAR,PTSTR,LPCTSTR。

 

6. 如何對Unicode進行操作?

字符集 特性 實例

ANSI 操作函數(shù)以str開頭 strcpy

Unicode 操作函數(shù)以wcs開頭 wcscpy

MBCS 操作函數(shù)以_mbs開頭 _mbscpy

ANSI/Unicode 操作函數(shù)以_tcs開頭 _tcscpyC運行期庫)

ANSI/Unicode 操作函數(shù)以lstr開頭 lstrcpyWindows函數(shù))

所有新的和未過時的函數(shù)在Windows2000中都同時擁有ANSIUnicode兩個版本。ANSI版本函數(shù)結(jié)尾以A表示;Unicode版本函數(shù)結(jié)尾以W表示。Windows會如下定義:

#ifdef UNICODE

#define CreateWindowEx CreateWindowExW

#else

#define CreateWindowEx CreateWindowExA

#endif // !UNICODE

 

7. 如何表示Unicode字符串常量?

字符集 實例

ANSI “string”

Unicode L“string”

ANSI/Unicode T(string)_TEXT(string)if( szError[0] == _TEXT(J) ){ }

 

8. 為什幺應當盡量使用操作系統(tǒng)函數(shù)?

這將有助于稍稍提高應用程序的運行性能,因為操作系統(tǒng)字符串函數(shù)常常被大型應用程序比如操作系統(tǒng)的外殼進程Explorer.exe所使用。由于這些函數(shù)使用得很多,因此,在應用程序運行時,它們可能已經(jīng)被裝入RAM。

如:StrCat,StrChrStrCmpStrCpy等。

 

9. 如何編寫符合ANSIUnicode的應用程序?

1 將文本串視為字符數(shù)組,而不是chars數(shù)組或字節(jié)數(shù)組。

2 將通用數(shù)據(jù)類型(如TCHARPTSTR)用于文本字符和字符串。

3 將顯式數(shù)據(jù)類型(如BYTEPBYTE)用于字節(jié)、字節(jié)指針和數(shù)據(jù)緩存。

4 TEXT宏用于原義字符和字符串。

5 執(zhí)行全局性替換(例如用PTSTR替換PSTR)。

6 修改字符串運算問題。例如函數(shù)通常希望在字符中傳遞一個緩存的大小,而不是字節(jié)。這意味著不應該傳遞sizeof(szBuffer),而應該傳遞(sizeof(szBuffer)/sizeof(TCHAR)。另外,如果需要為字符串分配一個內(nèi)存塊,并且擁有該字符串中的字符數(shù)目,那幺請記住要按字節(jié)來分配內(nèi)存。這就是說,應該調(diào)用

malloc(nCharacters *sizeof(TCHAR)),而不是調(diào)用malloc(nCharacters)。

 

10. 如何對字符串進行有選擇的比較?

通過調(diào)用CompareString來實現(xiàn)。

標志 含義

NORM_IGNORECASE 忽略字母的大小寫

NORM_IGNOREKANATYPE 不區(qū)分平假名與片假名字符

NORM_IGNORENONSPACE 忽略無間隔字符

NORM_IGNORESYMBOLS 忽略符號

NORM_IGNOREWIDTH 不區(qū)分單字節(jié)字符與作為雙字節(jié)字符的同一個字符

SORT_STRINGSORT 將標點符號作為普通符號來處理

 

11. 如何判斷一個文本文件是ANSI還是Unicode?

判斷如果文本文件的開頭兩個字節(jié)是0xFF0xFE,那幺就是Unicode,否則是ANSI。

 

12. 如何判斷一段字符串是ANSI還是Unicode?

IsTextUnicode進行判斷。IsTextUnicode使用一系列統(tǒng)計方法和定性方法,以便猜測緩存的內(nèi)容。由于這不是一種確切的科學方法,因此 IsTextUnicode有可能返回不正確的結(jié)果。

 

13. 如何在UnicodeANSI之間轉(zhuǎn)換字符串?

Windows函數(shù)MultiByteToWideChar用于將多字節(jié)字符串轉(zhuǎn)換成寬字符串;函數(shù)WideCharToMultiByte將寬字符串轉(zhuǎn)換成等價的多字節(jié)字符串。

 

14. UnicodeDBCS之間的區(qū)別

Unicode使用(特別在C程序設(shè)計語言環(huán)境里)“寬字符集”?!?/span>Unicode中的每個字符都是16位寬而不是8位寬?!乖?/span>Unicode中,沒有單單使用8位數(shù)值的意義存在。相比之下,在“雙位組字符集”中我們?nèi)匀惶幚?/span>8位數(shù)值。有些位組自身定義字符,而某些位組則顯示需要和另一個位組共同定義一個字符。

處理DBCS字符串非常雜亂,但是處理Unicode文字則像處理有秩序的文字。您也許會高興地知道前128Unicode字符(16位代碼從0x00000x007F)就是ASCII字符,而接下來的128Unicode字符(代碼從0x00800x00FF)是ISO 8859-1ASCII的擴展。Unicode中不同部分的字符都同樣基于現(xiàn)有的標準。這是為了便于轉(zhuǎn)換。希臘字母表使用從0x03700x03FF的代碼,斯拉夫語使用從0x04000x04FF的代碼,美國使用從0x05300x058F的代碼,希伯來語使用從0x05900x05FF的代碼。中國、日本和韓國的象形文字(總稱為CJK)占用了從0x30000x9FFF的代碼。Unicode的最大好處是這里只有一個字符集,沒有一點含糊。

 

15.衍生標準

Unicode是一個標準。UTF-8是其概念上的子集,UTF-8是具體的編碼標準。而UNICODE是所有想達到世界統(tǒng)一編碼標準的標準。UTF-8標準就是UnicodeISO10646)標準的一種變形方式,

UTF的全稱是:Unicode/UCS Transformation Format,其實有兩種UTF,一種是UTF-8,一種是UTF-16

不過UTF-16使用較少,其對應關(guān)系如下:

Unicode中編碼為 0000 - 007F UTF-8 中編碼形式為: 0xxxxxxx

Unicode中編碼為 0080 - 07FF UTF-8 中編碼形式為: 110xxxxx 10xxxxxx

Unicode中編碼為 0000 - 007F UTF-8 中編碼形式為: 1110xxxx 10xxxxxx 10xxxxxx

 

utf-8unicode的一個新的編碼標準,其實unicode有過好幾個標準.我們知道一直以來使用的unicode字符內(nèi)碼都是16,它實際上還不能把全世界的所有字符編在一個平面系統(tǒng),比如中國的藏文等小語種,所以utf-8擴展到了32,也就是說理論在utf-8中可容納二的三十二次方個字符. UNICODE的思想就是想把所有的字符統(tǒng)一編碼,實現(xiàn)一個統(tǒng)一的標準.big5gb都是獨立的字符集,這也叫做遠東字符集,把它拿到德文版的WINDOWS上可能將會引起字符編碼的沖突....早期的WINDOWS默認的字符集是ANSI.notepad中輸入的漢字是本地編碼,但在NT/2000內(nèi)部是可以直接支持UNICODE的。notepad.exeWIN9598中都是ANSI字符,NT中則是UNICODE.ANSIUNICODE可以方便的實現(xiàn)對應映射,也就是轉(zhuǎn)換 ASCII8位范圍內(nèi)的字符集,對于范圍之外的字符如漢字它是無法表達的。unicode16位范圍內(nèi)的字符集,對于不同地區(qū)的字符分區(qū)分配,unicode是多個IT巨頭共同制定的字符編碼標準。如果在unicode環(huán)境下比如WINDOWS NT上,一個字符占兩字節(jié)16位,而在ANSI環(huán)境下如WINDOWS98下一個字符占一個字節(jié)8.Unicode字符是16位寬,最多允許65,535字符,數(shù)據(jù)類型被稱為WCHAR

對于已有的ANSI字符,unicode簡單的將其擴展為16位:比如ANSI"A"=0x43,則對應的UNICODE

"A"= 0x0043

ASCII用七存放128個字符,ASCII是一個真正的美國標準,所以它不能滿足其他國家的需要,例如斯拉夫語的字母和漢字于是出現(xiàn)了Windows ANSI字符集,是一種擴展的ASCII,8位存放字符,128位仍然存放原來的ASCII,

而高128位加入了希臘字母等

if def UNICODE

  TCHAR = wchar

else

  TCHAR = char

你需要在Project\Settings\C/C++\Preprocesser definitions中添加UNICODE_UNICODE

UINCODE,_UNICODE都要定義。不定義_UNICODE的話,用SetText(HWND,LPCTSTR),將被解釋為SetTextA(HWND,LPTSTR),這時API將把你給的Unicode字符串看作ANSI字符串,顯示亂碼。因為windows API是已經(jīng)編譯好存在于dll中的,由于不管UNICODE還是ANSI字符串,都被看作一段buffer,"0B A3 00 35 24 3C 00 00"如果按ANSI讀,因為ANSI字串是以‘\0‘結(jié)束的,所以只能讀到兩字節(jié)"0B A3 \0",如果按UNICODE讀,將完整的讀到‘\0\0‘結(jié)束。

由于UNICODE沒有額外的指示位,所以系統(tǒng)必須知道你提供的字串是哪種格式。此外,UNICODE好象是ANSI C++規(guī)定的,_UNICODEwindows SDK提供的。如果不編寫windows程序,可以只定義UNICODE

 

 

 

開發(fā)過程:

圍繞著文件讀寫、字符串處理展開。文件主要有兩種:.txt.ini文件

1.    unicode和非unicode環(huán)境下字符串做不同處理的,那么需要參考以上9,10兩條,以適應不同環(huán)境得字符串處理要求。

對文件讀寫也一樣。只要調(diào)用相關(guān)接口函數(shù)時,參數(shù)中的字符串前都加上_TEXT等相關(guān)宏。如果寫成的那個文件需要是unicode格式保存的,那么在創(chuàng)建文件時需要加入一個字節(jié)頭。

CFile file;

    WCHAR szwBuffer[128];

   

    WCHAR *pszUnicode = L"Unicode string\n"; // unicode string

    CHAR *pszAnsi = "Ansi string\n"; // ansi string

    WORD wSignature = 0xFEFF;

   

    file.Open(TEXT("Test.txt"), CFile::modeCreate|CFile::modeWrite);

   

    file.Write(&wSignature, 2);

   

    file.Write(pszUnicode, lstrlenW(pszUnicode) * sizeof(WCHAR));

    // explicitly use lstrlenW function

   

    MultiByteToWideChar(CP_ACP, 0, pszAnsi, -1, szwBuffer, 128);

   

    file.Write(szwBuffer, lstrlenW(szwBuffer) * sizeof(WCHAR));

   

file.Close();

//以上這段代碼在unicode和非unicode環(huán)境下都有效。這里顯式的指明用Unicode來進行操作。

2.    在非unicode環(huán)境下,缺省調(diào)用的都是ANSI格式的字符串,此時TCHAR轉(zhuǎn)換為CHAR類型的,除非顯式定義WCHAR。所以在這個環(huán)境下,如果讀取unicode文件,那么首先需要移動2個字節(jié),然后讀取得字符串需要用MultiByteToWideChar來轉(zhuǎn)換,轉(zhuǎn)換后字符串信息才代表unicode數(shù)據(jù)。

3.    unicode環(huán)境下,缺省調(diào)用得都是unicode格式得字符串,也就是寬字符,此時TCHAR轉(zhuǎn)換為WCHAR,相關(guān)得API函數(shù)也都調(diào)用寬字符類型的函數(shù)。此時讀取unicode文件也和上面一樣,但是讀取得數(shù)據(jù)是WCHAR的,如果要轉(zhuǎn)換成ANSI格式,需要調(diào)用WideCharToMultiByte。如果讀取ANSI的,則不用移動兩個字節(jié),直接讀取然后視需要轉(zhuǎn)換即可。

 

某些語言(如韓語)必須在unicode環(huán)境下才能顯示,這種情況下,在非unicode環(huán)境下開發(fā),就算用字符串函數(shù)轉(zhuǎn)換也不能達到顯示文字的目的,因為此時調(diào)用得API函數(shù)是用ANSI的(雖然底層都是用UNICODE處理但是處理結(jié)果是按照程序員調(diào)用的API來顯示的)。所以必須用unicode來開發(fā)。

本站僅提供存儲服務,所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊舉報
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
Windows核心編程(第五版)筆記 第二章 字符和字符串(Working with Ch...
關(guān)于Unicode字符集
Ansi,UTF8,Unicode編碼(續(xù))
使你的C/C++代碼支持Unicode
關(guān)于char, wchar_t, TCHAR, _T(),L,宏 _T、TEXT,_TEXT、L
VC中unicode項目向多字節(jié)字符集項目移植
更多類似文章 >>
生活服務
分享 收藏 導長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服