MySQL的“SET NAMES xxx”字符集問題分析
還有一篇關(guān)于Apache和PHP編碼的:http://potatows.eeie.cn/?p=40
近來接受BBT的培訓,做一個投票系統(tǒng)。系統(tǒng)代碼倒不是很難,但是我的時間主要花費在了研究字符集和編碼上面。MySQL和Apache兩個系統(tǒng)的編碼(字符集)問題讓我費勁腦筋,吃盡苦頭。網(wǎng)上對這些問題的解決比較零散,比較片面,大部分是提供解決方法,卻不說為什么。于是我將這幾天收獲總結(jié)一下,避免后來者再走彎路。這篇文章對PHP編寫有一點幫助(看完你就知道,怎樣讓你的PHP程序在大部分空間提供商的服務(wù)器里顯示正常),但是更多幫助在于網(wǎng)絡(luò)服務(wù)器的架設(shè)和設(shè)置。
先說MySQL的字符集問題。Windows下可通過修改my.ini內(nèi)的
這兩個字段來更改數(shù)據(jù)庫的默認字符集。第一個是客戶端默認的字符集,第二個是服務(wù)器端默認的字符集。假設(shè)我們把兩個都設(shè)為utf8,然后在MySQL Command LineClient里面輸入“show variebles like“character_set_%”;”,可看到如下字符:
character_set_client latin1
character_set_connection latin1
character_set_database utf8
character_set_results latin1
character_set_server utf8
character_set_system utf8
其中的utf8隨著我們上面的設(shè)置而改動。此時,要是我們通過采用UTF-8的PHP程序從數(shù)據(jù)庫里讀取數(shù)據(jù),很有可能是一串“?????”或者是其他亂碼。網(wǎng)上查了半天,解決辦法倒是簡單,在連接數(shù)據(jù)庫之后,讀取數(shù)據(jù)之前,先執(zhí)行一項查詢“SET NAMES UTF8”,即在PHP里為
即可顯示正常(只要數(shù)據(jù)庫里信息的字符正常)。為什么會這樣?這句查詢“SET NAMES UTF8”到底是什么作用?
到MySQL命令行輸入“SET NAMES UTF8;”,然后執(zhí)行“show variebleslike“character_set_%”;”,發(fā)現(xiàn)原來為latin1的那些變量“character_set_client”、“character_set_connection”、“character_set_results”的值全部變?yōu)閡tf8了,原來是這3個變量在搗蛋。查閱手冊,上面那句等于:
看看這3個變量的作用:
信息輸入路徑:client→connection→server;
信息輸出路徑:server→connection→results。
換句話說,每個路徑要經(jīng)過3次改變字符集編碼。以出現(xiàn)亂碼的輸出為例,server里utf8的數(shù)據(jù),傳入connection轉(zhuǎn)為latin1,傳入results轉(zhuǎn)為latin1,utf-8頁面又把results轉(zhuǎn)過來。如果兩種字符集不兼容,比如latin1和utf8,轉(zhuǎn)化過程就為不可逆的,破壞性的。所以就轉(zhuǎn)不回來了。
但這里要聲明一點,“SET NAMES UTF8”作用只是臨時的,MySQL重啟后就恢復(fù)默認了。
接下來就說到MySQL在服務(wù)器上的配置問題了。豈不是我們每次對數(shù)據(jù)庫讀寫都得加上“SETNAMESUTF8”,以保證數(shù)據(jù)傳輸?shù)木幋a一致?能不能通過配置MySQL來達到那三個變量默認就為我們要想的字符集?手冊上沒說,我在網(wǎng)上也沒找到答案。所以,從服務(wù)器配置的角度而言,是沒辦法省略掉那行代碼的。
總結(jié):為了讓你的網(wǎng)頁能在更多的服務(wù)器上正常地顯示,還是加上“SET NAMES UTF8”吧,即使你現(xiàn)在沒有加上這句也能正常訪問。
問題多多,多謝指正!