1. HTTP消息頭
(1)通用信息頭
即能用于請求消息中,也能用于響應(yīng)信息中,但與被傳輸?shù)膶嶓w內(nèi)容沒有關(guān)系的信息頭,如Data,Pragma
主要: Cache-Control , Connection , Data , Pragma , Trailer , Transfer-Encoding , Upgrade
(2)請求頭
用于在請求消息中向服務(wù)器傳遞附加信息,主要包括客戶機可以接受的數(shù)據(jù)類型,壓縮方法,語言,以及客戶計算機上保留的信息和發(fā)出該請求的超鏈接源地址等.
主要: Accept , Accept-Encoding , Accept-Language , Host ,
(3)響應(yīng)頭
用于在響應(yīng)消息中向客戶端傳遞附加信息,包括服務(wù)程序的名稱,要求客戶端進行認(rèn)證的方式,請求的資源已移動到新地址等.
主要: Location , Server , WWW-Authenticate(認(rèn)證頭)
(4)實體頭
用做實體內(nèi)容的元信息,描述了實體內(nèi)容的屬性,包括實體信息的類型,長度,壓縮方法,最后一次修改的時間和數(shù)據(jù)的有效期等.
主要: Content-Encoding , Content-Language , Content-Length , Content-Location , Content-Type
(4)擴展頭
主要:Refresh, Content-Disposition
2. 幾個主要頭的作用
(1)Content-Type的作用
該實體頭的作用是讓服務(wù)器告訴瀏覽器它發(fā)送的數(shù)據(jù)屬于什么文件類型。
例如:當(dāng)Content-Type 的值設(shè)置為text/html和text/plain時,前者會讓瀏覽器把接收到的實體內(nèi)容以HTML格式解析,后者會讓瀏覽器以普通文本解析.
(2)Content-Disposition 的作用
當(dāng)Content-Type 的類型為要下載的類型時 , 這個信息頭會告訴瀏覽器這個文件的名字和類型。
在講解這個內(nèi)容時,張老師同時講出了解決中文文件名亂碼的解決方法,平常想的是使用getBytes() , 實際上應(yīng)使用email的附件名編碼方法對文件名進行編碼,但IE不支持這種作法(其它瀏覽器支持) , 使用javax.mail.internet.*包的MimeUtility.encodeWord("中文.txt")的方法進行編碼。
Content-Disposition擴展頭的例子:
<%@ page pageEncoding="GBK" contentType="text/html;charset=utf-8" import="java.util.*,java.text.*" %>
<%=DateFormat.getDateTimeInstance(DateFormat.SHORT, DateFormat.SHORT, Locale.CHINA).format(new Date())
%>
<%
response.setHeader("Content-Type","video/x-msvideo");
response.setHeader("Content-Disposition", "attachment;filename=aaa.doc");
%>
Content-Disposition中指定的類型是文件的擴展名,并且彈出的下載對話框中的文件類型圖片是按照文件的擴展名顯示的,點保存后,文件以filename的值命名,保存類型以Content中設(shè)置的為準(zhǔn)。
注意:在設(shè)置Content-Disposition頭字段之前,一定要設(shè)置Content-Type頭字段。
(3)Authorization頭的作用
Authorization的作用是當(dāng)客戶端訪問受口令保護時,服務(wù)器端會發(fā)送401狀態(tài)碼和WWW-Authenticate響應(yīng)頭,要求客戶機使用Authorization來應(yīng)答。
例如:
<%@ page pageEncoding="GBK" contentType="text/html;charset=utf-8" import="java.util.*,java.text.*" %>
<%=DateFormat.getDateTimeInstance(DateFormat.SHORT, DateFormat.SHORT, Locale.CHINA).format(new Date())
%>
<%
response.setStatus(401);
response.setHeader("WWW-Authenticate", "Basic realm=\"Tomcat Manager Application\"");
%>
3.如何實現(xiàn)文件下載
要實現(xiàn)文件下載,我們只需要設(shè)置兩個特殊的相應(yīng)頭,它們是什么頭?如果文件名帶中文,該如何解決?
兩個特殊的相應(yīng)頭:
----Content-Type: application/octet-stream
----Content-Disposition: attachment;filename=aaa.zip
例如:
response.setContentType("image/jpeg");response.setHeader("Content- Disposition","attachment;filename=Bluehills.jpg");
如果文件中filename參數(shù)中有中文,則就會出現(xiàn)亂碼。
解決辦法:
(1)MimeUtility.encodeWord("中文.txt");//現(xiàn)在版本的IE還不行
(2)new String("中文".getBytes("GB2312"),"ISO8859- 1");//實際上這個是錯誤的
4. 測試并分析文件名亂碼問題
response.setHeader()下載中文文件名亂碼問題
response.setHeader("Content-Disposition", "attachment; filename=" + java.net.URLEncoder.encode(fileName, "UTF-8"));
下載的程序里有了上面一句,一般在IE6的下載提示框上將正確顯示文件的名字,無論是簡體中文,還是日文。不過當(dāng)時確實沒有仔細測試文件名為很長的中文文件名的情況?,F(xiàn)如今經(jīng)過仔細測試,發(fā)現(xiàn)文字只要超過17個字,就不能下載了。分析如下:
一. 通過原來的方式,也就是先用URLEncoder編碼,當(dāng)中文文字超過17個時,IE6 無法下載文件。這是IE的bug,參見微軟的知識庫文章 KB816868 。原因可能是IE在處理 Response Header 的時候,對header的長度限制在150字節(jié)左右。而一個漢字編碼成UTF-8是9個字節(jié),那么17個字便是153個字節(jié),所以會報錯。而且不跟后綴也不對.
二. 解決方案:將文件名編碼成ISO8859-1是有效的解決方案,代碼如下:
response.setHeader( "Content-Disposition", "attachment;filename=" + new String( fileName.getBytes("gb2312"), "ISO8859-1" ) );
在確保附件文件名都是簡體中文字的情況下,那么這個辦法確實是最有效的,不用讓客戶逐個的升級IE。如果臺灣同胞用,把gb2312改成big5就行。但現(xiàn)在的系統(tǒng)通常都加入了 國際化的支持,普遍使用UTF-8。如果文件名中又有簡體中文字,又有繁體中文,還有日文。那么亂碼便產(chǎn)生了。另外,在上Firefox (v1.0-en)下載也是亂碼。
三. 參看郵件中的中文附件名的形式,用outlook新建一個帶有中文附件的郵件,然后看這個郵件的源代碼,找到:
Content-Disposition: attachment;
filename="=?gb2312?B?0MK9qCDOxLG+zsS1tS50eHQ=?="
用這個filename原理上就可以顯示中文名附件,但是現(xiàn)在IE并不支持,F(xiàn)irefox是支持的。嘗試使用 javamail 的MimeUtility.encode()方法來編碼文件名,也就是編碼成 =?gb2312?B?xxxxxxxx?= 這樣的形式,并從 RFC1522 中找到對應(yīng)的標(biāo)準(zhǔn)支持。
折中考慮,結(jié)合了一、二的方式,代碼片斷如下:
String fileName = URLEncoder.encode(atta.getFileName(), "UTF-8");
/*
* see http://support.microsoft.com/default.aspx?kbid=816868
*/
if (fileName.length() > 150) {
String guessCharset = xxxx
//根據(jù)request的locale 得出可能的編碼,中文操作系統(tǒng)通常是gb2312
fileName = new String(atta.getFileName().getBytes(guessCharset), "ISO8859-1");
}
response.setHeader("Content-Disposition", "attachment; filename=" + fileName);
編碼轉(zhuǎn)換的原理:
首先在源程序中將編碼設(shè)置成GB2312字符編碼,然后將源程序按Unicode編碼轉(zhuǎn)換成字節(jié)碼加載到內(nèi)存中(java加載到內(nèi)存中的字節(jié)碼都是 Unicode編碼),然后按GB2312編碼獲得中文字符串的字節(jié)數(shù)組,然后生成按ISO8859-1編碼形式的Unicode字符串(這時的4個字節(jié)就變成了8個字節(jié),高位字節(jié)補零),
java培訓(xùn) 北京java培訓(xùn) java培訓(xùn)班 java就業(yè)培訓(xùn) java培訓(xùn)機構(gòu) 軟件培訓(xùn) 最好的java培訓(xùn)
當(dāng)在網(wǎng)絡(luò)中傳輸時,因為setHeader方法中的字符只能按ISO8859-1傳輸,所以這時候就又把Unicode字符轉(zhuǎn)換成了 ISO8859-1的編碼傳到瀏覽器(就是把剛才高位補的零全去掉),這時瀏覽器接收到的ISO8859-1碼的字符因為符合GB2312編碼,所以就可以顯示中文了。
5. jsp翻譯成class時的編碼問題
記事本中代碼塊1:
<%=
"a中文".length()
%>
代碼塊2:
<%@ page pageEncoding="gbk"%>
<%=
"a中文".length()
%>
為什么上面的輸出值為5,改成下面的則輸出3?
因為上面的代碼沒有添加該文件的編碼說明 , WEB應(yīng)用程序在將jsp翻譯成class文件時 , 把該字符串的內(nèi)容按默認(rèn)的保存方式指定的編碼ASCII碼來算的,在UTF-8中,原ASCII字符占一個字節(jié),漢字占兩個字節(jié),對應(yīng)兩個字符,長度就變成了5 , 而下面的是GBK編碼, 一個漢字和一個英文都對應(yīng)一個字符,得到結(jié)果就為3.
]
response.setHeader(...)文件名中有空格的時候
String fileName = StringUtils.trim(file.getName());
String formatFileName = encodingFileName(name);//在后面定義方法encodingFileName(String fileName);
response.setHeader("Content-Disposition", "attachment; filename=" + formatFileName );
//處理文件名中出現(xiàn)的空格
//其中%20是空格在UTF-8下的編碼
public static String encodingFileName(String fileName) {
String returnFileName = "";
try {
returnFileName = URLEncoder.encode(fileName, "UTF-8");
returnFileName = StringUtils.replace(returnFileName, "+", "%20");
if (returnFileName.length() > 150) {
returnFileName = new String(fileName.getBytes("GB2312"), "ISO8859-1");
returnFileName = StringUtils.replace(returnFileName, " ", "%20");
}
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
if (log.isWarnEnabled()) {
log.info("Don't support this encoding ...");
}
}
return returnFileName;
}