胸大美女视频,刘亦菲床戏视频

urlencode和文本編碼

2012.09.04

電腦中一個(gè)字符大都用八位數(shù)的二進(jìn)制數(shù)字表示，標(biāo)準(zhǔn)的ANSI編碼規(guī)范規(guī)定0～127總共128個(gè)數(shù)字代表信息（字母，數(shù)字，標(biāo)點(diǎn)，控制碼，空格等），剩下沒用到的128個(gè)編碼沒用做規(guī)定，不同國家地區(qū)制定了不同的標(biāo)準(zhǔn)，由此產(chǎn)生了GB2312，BIG5以及JIS等各自的編碼標(biāo)準(zhǔn)。這些使用 2 個(gè)字節(jié)（0x80~0xFF范圍內(nèi)）來代表一個(gè)字符的各種漢字延伸編碼方式，稱為 ANSI 編碼。在簡(jiǎn)體中文系統(tǒng)下，ANSI 編碼代表 GB2312 編碼，在日文操作系統(tǒng)下，ANSI 編碼代表 JIS 編碼。不同 ANSI 編碼之間互不兼容，當(dāng)信息在國際間交流時(shí)，無法將屬于兩種語言的文字，存儲(chǔ)在同一段 ANSI 編碼的文本中。

ISO-8859-1(2,3...)是歐美以及拉丁地區(qū)的編碼方式，通過使用剩下的128位來擴(kuò)充自己國家語言的編碼

事實(shí)證明，對(duì)可以用ASCII表示的字符使用UNICODE并不高效，因?yàn)閁NICODE比ASCII占用大一倍的空間

我們通過UrlEncode函數(shù)即可得到漢字的編碼，比如對(duì)ANSI編碼的asp代碼，和UTF-8編碼的asp代碼執(zhí)行urlecode得到的結(jié)果就不一樣。

[vb] view plain copy

<%
Response.Write(Server.URLpathencode("花心"))
' 得到 %BB%A8%D0%C4
%>

上面是ANSI編碼的文本，下面是UTF-8編碼的代碼文件，編碼結(jié)果大不一樣

[vb] view plain copy

<%
Response.Write(Server.URLEncode("花心"))
' 得到 %E8%8A%B1%E5%BF%83
%>

同樣針對(duì)ANSI編碼的php腳本和UTF-8編碼的腳本調(diào)用同樣的函數(shù)也是不同結(jié)果

[php] view plain copy

<?php
echo urlencode("花心");
// %BB%A8%D0%C4
?>

[php] view plain copy

<?php
echo urlencode("花心");
// E8%8A%B1%E5%BF%83
?>

針對(duì)某種編碼encode后的結(jié)果需要用同樣編碼的文本格式解碼才可讀，不然就是一堆亂碼。所以我們?cè)诔绦蛑凶詈米龅骄幋a統(tǒng)一，比如統(tǒng)一使用utf8這種全球通用包含各種語言文字的編碼。

下面再看看ansi，unicode，unicode big endian，utf8編碼的文件用十六進(jìn)制打開的樣子：同樣的文本“a花心”

[plain] view plain copy

ANSI 61 BB A8 D0 C4
UNICODE FF FE 61 00 B1 82 C3 5F
UNICODE-BIG-ENDIAN FE FF 00 61 82 B1 5F C3
UTF-8 EF BB BF 61 E8 8A B1 E5 BF 83

可以看出第一種編碼方式全部都是文本信息，后面三種都有頭部表示自己的信息，所以ANSI中也沒有用FE FF來編碼的漢字（為了不沖突）UNICODE中對(duì)字母的編碼也是采用了2個(gè)字符，增加了冗余。我們比較ANSI和UTF-8編碼的格式，可以看到正好就是我們urlencode后的結(jié)果

本站僅提供存儲(chǔ)服務(wù)，所有內(nèi)容均由用戶發(fā)布，如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊舉報(bào)。

打開APP，閱讀全文并永久保存查看更多類似文章

淺談文字編碼和Unicode

UNICODE與UTF8，UTF16的含義

字符編碼：ANSI、UNICODE、UTF

ASCII、ANSI、UNICODE及UTF-8編碼

ASCII，Unicode和UTF-8

編碼方式之ASCII、ANSI、Unicode概述

更多類似文章 >>

国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看