char :單字節(jié)變量類型,最多表示256個(gè)字符,
wchar_t :寬字節(jié)變量類型,用于表示Unicode字符,
它實(shí)際定義在<string.h>里:typedef unsigned short wchar_t。
為了讓編譯器識(shí)別Unicode字符串,必須以在前面加一個(gè)“L”,定義寬字節(jié)類型方法如下:
wchar_t c = `A' ;
wchar_t * p = L"Hello!" ;
wchar_t a[] = L"Hello!" ;
其中,寬字節(jié)類型每個(gè)變量占用2個(gè)字節(jié),故上述數(shù)組a的sizeof(a) = 14
TCHAR / _T( ) :
如果在程序中既包括ANSI又包括Unicode編碼,需要包括頭文件tchar.h。TCHAR是定義在該頭文件中的宏,它視你是否定義了_UNICODE宏而定義成:
定義了_UNICODE: typedef wchar_t TCHAR ;
沒有定義_UNICODE: typedef char TCHAR ;
#ifdef UNICODE
typedef char TCHAR;
#else
typede wchar_t TCHAR;
#endif
_T( )也是定義在該頭文件中的宏,視是否定義了_UNICODE宏而定義成:
定義了_UNICODE: #define _T(x) L##x
沒有定義_UNICODE: #define _T(x) x
注意:如果在程序中使用了TCHAR,那么就不應(yīng)該使用ANSI的strXXX函數(shù)或者Unicode的wcsXXX函數(shù)了,而必須使用tchar.h中定義的_tcsXXX函數(shù)。
以strcpy函數(shù)為例子,總結(jié)一下:
Code
//如果你想使用ANSI字符串,那么請(qǐng)使用這一套寫法:
char szString[100];
strcpy(szString,"test");
//如果你想使用Unicode字符串,那么請(qǐng)使用這一套:
wchar_t szString[100];
wcscpy(szString,L"test");
//如果你想通過定義_UNICODE宏,而編譯ANSI或者Unicode字符串代碼:
TCHAR szString[100];
_tcscpy(szString,_TEXT("test"));
CSDN:superarhow說(shuō): 不要再使用TCHAR和_T了!他分析了原因后總結(jié):如 果您正開始一個(gè)新的項(xiàng)目,請(qǐng)無(wú)論如何也要頂住壓力,直接使用UNICODE編碼!切記!您只需要對(duì)您的組員進(jìn)行10分鐘的培訓(xùn),記住strcpy用 wcscpy,sprintf用swprintf代替,常數(shù)前加L,就可以了!它不會(huì)花您很多時(shí)間的,帶給您的是穩(wěn)定和安全!相信偶,沒錯(cuò)的?。?/p>
一、 在字符串前加一個(gè)L作用:
如 L"我的字符串" 表示將ANSI字符串轉(zhuǎn)換成unicode的字符串,就是每個(gè)字符占用兩個(gè)字節(jié)。
strlen("asd") = 3;
strlen(L"asd") = 6;
二、 _T宏可以把一個(gè)引號(hào)引起來(lái)的字符串,根據(jù)你的環(huán)境設(shè)置,使得編譯器會(huì)根據(jù)編譯目標(biāo)環(huán)境選擇合適的(Unicode還是ANSI)字符處理方式
如果你定義了UNICODE,那么_T宏會(huì)把字符串前面加一個(gè)L。這時(shí) _T("ABCD") 相當(dāng)于 L"ABCD" ,這是寬字符串。
如果沒有定義,那么_T宏不會(huì)在字符串前面加那個(gè)L,_T("ABCD") 就等價(jià)于 "ABCD"
三、TEXT,_TEXT 和_T 一樣的
如下面三語(yǔ)句:
TCHAR szStr1[] = TEXT("str1");
char szStr2[] = "str2";
WCHAR szStr3[] = L("str3");
那么第一句話在定義了UNICODE時(shí)會(huì)解釋為第三句話,沒有定義時(shí)就等于第二句話。
但二句話無(wú)論是否定義了UNICODE都是生成一個(gè)ANSI字符串,而第三句話總是生成UNICODE字符串。
為了程序的可移植性,建議都用第一種表示方法。
但在某些情況下,某個(gè)字符必須為ANSI或UNICODE,那就用后兩種方法。
四、_T()函數(shù)詳解
_T("")是一個(gè)宏,他的作用是讓你的程序支持Unicode編碼
因?yàn)閃indows使用兩種字符集ANSI和UNICODE,
前者就是通常使用的單字節(jié)方式,
但這種方式處理象中文這樣的雙字節(jié)字符不方便,
容易出現(xiàn)半個(gè)漢字的情況。
而后者是雙字節(jié)方式,方便處理雙字節(jié)字符。
Windows NT的所有與字符有關(guān)的函數(shù)都提供兩種方式的版本,而Windows 9x只支持ANSI方式。
如果你編譯一個(gè)程序?yàn)锳NSI方式,
_T實(shí)際不起任何作用。
而如果編譯一個(gè)程序?yàn)閁NICODE方式,則編譯器會(huì)把"Hello"字符串以UNICODE方式保存。_T和_L的區(qū)別在于,_L不管你是以什么方式編譯,一律以UNICODE方式保存。
LPSTR:32bit指針指向一個(gè)字符串,每個(gè)字符占1字節(jié)
LPCSTR:32-bit指針指向一個(gè)常字符串,每個(gè)字符占1字節(jié)
LPCTSTR:32-bit指針指向一個(gè)常字符串,每字符可能占1字節(jié)或2字節(jié),取決于Unicode是否定義
LPTSTR:32-bit指針每字符可能占1字節(jié)或2字節(jié),取決于Unicode是否定義
L是表示字符串資源為Unicode的。
比如
wchar_t Str[] = L"Hello World!";
這個(gè)就是雙子節(jié)存儲(chǔ)字符了。
_T是一個(gè)適配的宏~
當(dāng)
#ifdef _UNICODE的時(shí)候
_T就是L
沒有#ifdef _UNICODE的時(shí)候
_T就是ANSI的。
比如
LPTSTR lpStr = new TCHAR[32];
TCHAR* szBuf = _T("Hello");
以上兩句使得無(wú)論是在UNICODE編譯條件下都是正確編譯的。
而且MS推薦你使用相匹配的字符串函數(shù)。
比如處理LPTSTR或者LPCTSTR 的時(shí)候,不要用strlen ,而是要用_tcslen
否則在UNICODE的編譯條件下,strlen不能處理 wchar_t*的字符串。
T是非常有意思的一個(gè)符號(hào)(TCHAR、LPCTSTR、LPTSTR、_T()、_TEXT()...),它表示使用一種中間類型,既不明確表示使用 MBCS,也不明確表示使用 UNICODE。那到底使用哪種字符集?編譯的時(shí)候才決定