那些事01
什么是編碼呢?簡而言之就是把我們能看懂的數(shù)據(jù)轉(zhuǎn)化成計算機可以讀懂的數(shù)據(jù)。
最初的計算機編碼方式是英文,也就是最初的ASCII碼。
ASCII碼是計算機剛剛起步的時候用的編碼方式,一直沿用至今。雖然可以表示的字符特別少,但簡單易用。后來計算機全球方面的普及,ASCII 碼只能將英文文件轉(zhuǎn)化成計算機能看懂的數(shù)據(jù)的問題就暴露了出來。于是各個國家和地區(qū)也都開始根據(jù)本土語言開發(fā)出了各種編碼。但隨著世界各國聯(lián)系越來越緊密,計算機通訊用得越加頻繁,不同國家編碼格式對彼此之間的交流造成了很大的障礙。
后來就有了統(tǒng)一編碼的出現(xiàn)。
國際組織ISO(國際標準化組織簡稱)對各國編碼進行了匯總,就是Unicode字符集。
它不是某一種具體的編碼,而是UTF-8,UTF-16,UTF-32三種編碼的統(tǒng)稱。因為我們中國的電腦一般默認是UTF-16的編碼,所以日常說的Unicode編碼主要是UTF-16。本國電腦互相交流時,用本國編碼字節(jié)長度更小,相同的計算機存儲空間里下能'說'更多內(nèi)容。在Unicode還沒開發(fā)出來時,寫出來的文本和開發(fā)出來的程序全是用本國編碼。這些文件全部改成Unicode編碼是一個非常大的工作量。計算機也主要是基于這點原因,到目前還沒統(tǒng)一使用Unicode編碼。而且計算機在“交流”時也很容易出現(xiàn)“亂讀”的編碼問題。
這種亂碼大家在電腦打開別人發(fā)來的文件時或多或少都遇到過一兩次吧。編碼問題產(chǎn)生的原因總結(jié)出來就是4個字 —— 雞同鴨講。你的電腦讀寫文本的編碼也許跟別人發(fā)來的文件編碼不一致,而用UTF-8編碼打開一個GBK編碼寫出的文件,必定是會出現(xiàn)'亂讀'的情況。想要解決出現(xiàn)亂碼的問題,只需要簡單幾步就可以完成:打開VS Code,點擊編碼設置,選擇UTF-8即可。在Auto Guess Encoding上打鉤,即可每次打開文件根據(jù)文件本身的編碼自動選擇編碼來打開!