有關(guān)Last-Modified 與 If-Modified-Since
在http中Last-Modified 與If-Modified-Since 都是用于記錄頁面最后修改時間的 HTTP 頭信息,注意,在這 Last-Modified 是由服務(wù)器往客戶端發(fā)送的 HTTP 頭,另一個 If-Modified-Since是由客戶端往服務(wù)器發(fā)送的頭,可以看到,再次請求本地存在的 cache 頁面時,客戶端會通過 If-Modified-Since 頭將先前服務(wù)器端發(fā)過來的 Last-Modified 最后修改時間戳發(fā)送回去,這是為了讓服務(wù)器端進行驗證,通過這個時間戳判斷客戶端的頁面是否是最新的,如果不是最新的,則返回新的內(nèi)容,如果是最新的,則 返回 304 告訴客戶端其本地 cache 的頁面是最新的,于是客戶端就可以直接從本地加載頁面了,這樣在網(wǎng)絡(luò)上傳輸?shù)臄?shù)據(jù)就會大大減少,同時也減輕了服務(wù)器的負擔(dān)。而且在一些ajax應(yīng)用中,要求獲取的數(shù)據(jù)永遠是最新的,而不是讀取位于緩存中的數(shù)據(jù),做這樣的設(shè)置是非常有必要的。
無意中測試發(fā)現(xiàn)nginx與apache對此有不同的算法:
APACHE:
(1)直接發(fā)送請求,返回200,Last-Modified: Mon, 26 Apr 2010 13:22:17 GMT
[root@test ~]# curl -I http://www.pengyao.org/test.html
HTTP/1.1 200 OK
Date: Mon, 26 Apr 2010 14:59:09 GMT
Server: Apache/1.3.41 (Unix)
Last-Modified: Mon, 26 Apr 2010 13:22:17 GMT
ETag: “92c027-897-4bd59389″
Accept-Ranges: bytes
Content-Length: 2199
Content-Type: text/plain
(2)指定與Last-Modified時間相同的If-Modified-Since 發(fā)送GET請求,返回304
[root@test ~]# curl -I -G -H “If-Modified-Since: Mon, 26 Apr 2010 13:22:17 GMT” http://www.pengyao.org/test.html
HTTP/1.1 304 Not Modified
Date: Mon, 26 Apr 2010 15:02:06 GMT
Server: Apache/1.3.41 (Unix)
ETag: “92c027-897-4bd59389″
(3)調(diào)后If-Modified-Since 1小時,再次發(fā)送GET請求,返回依然為304
[root@test ~]# curl -I -G -H “If-Modified-Since: Mon, 26 Apr 2010 14:22:17 GMT” http://www.pengyao.org/test.html
HTTP/1.1 304 Not Modified
Date: Mon, 26 Apr 2010 15:05:02 GMT
Server: Apache/1.3.41 (Unix)
ETag: “92c027-897-4bd59389″
說明Apache 在判斷瀏覽器cache是否過期時,依據(jù)從If-Modified-Since開始,文件Last-Modified是否修改過來判斷的,與RFC1945中對If-Modified-Since描述吻合.
那么再看下nginx對于此的測試結(jié)果:
(1)直接發(fā)送請求,返回200,Last-Modified: Wed, 21 Apr 2010 13:14:21 GMT
[root@test pengyao.org]# curl -I http://www.pengyao.org/index.html
HTTP/1.1 200 OK
Server: nginx/0.7.61
Date: Mon, 26 Apr 2010 15:18:29 GMT
Content-Type: text/html; charset=UTF-8
Content-Length: 323
Last-Modified: Wed, 21 Apr 2010 13:14:21 GMT
Connection: keep-alive
Accept-Ranges: bytes
(2)指定與Last-Modified時間相同的If-Modified-Since 發(fā)送GET請求,返回304
[root@test pengyao.org]# curl -I -G -H “If-Modified-Since: Wed, 21 Apr 2010 13:14:21 GMT” http://www.pengyao.org/index.html
HTTP/1.1 304 Not Modified
Server: nginx/0.7.61
Date: Mon, 26 Apr 2010 15:20:45 GMT
Last-Modified: Wed, 21 Apr 2010 13:14:21 GMT
Connection: keep-alive
(3)調(diào)后If-Modified-Since 1小時,再次發(fā)送GET請求,發(fā)現(xiàn)返回的結(jié)果為200,與Apache不同
[root@test pengyao.org]# curl -I -G -H “If-Modified-Since: Wed, 21 Apr 2010 14:14:21 GMT” http://www.pengyao.org/index.html
HTTP/1.1 200 OK
Server: nginx/0.7.61
Date: Mon, 26 Apr 2010 15:21:19 GMT
Content-Type: text/html; charset=UTF-8
Content-Length: 323
Last-Modified: Wed, 21 Apr 2010 13:14:21 GMT
Connection: keep-alive
Accept-Ranges: bytes
由此可以判斷出,nginx在判斷瀏覽器cache是否過期時,判斷If-Modified-Since與Last-Modified是否匹配,如果不匹配,則認為cache過期,返回200重新下載.
要說更喜歡哪種算法,個人更傾向于nginx的這種,因為在對文件更新前,本人習(xí)慣于對需要修改的文件進行備份(保留時間戳),一旦測試出現(xiàn)問題,及時的回滾,使用nginx的這種算法就能保障回滾前后瀏覽器cache失效,而Apache的這種策略導(dǎo)致回滾到之前的時間戳的話(Last- Modified),本地由于進行了測試,本地cache文件的If-Modified-Since時間一般比回滾后的Last-Modified新,這樣本地的cache認為依然有效,返回304,而實際上文件已經(jīng)不是最新的。當(dāng)然,Apache的這樣設(shè)計完全遵守RFC,個人喜好不代表真實需求.
如何利用客戶端緩存對網(wǎng)站進行優(yōu)化? If-Modified-Since & If-None-Match
介紹
你的網(wǎng)站在并發(fā)訪問很大并且無法承受壓力的情況下,你會選擇如何優(yōu)化?
很多人首先會想從服務(wù)器緩存方面著手對程序進行優(yōu)化,許多不同的服務(wù)器緩存方式都有他們自己的特點,像我曾經(jīng)參與的一些項目中,根據(jù)緩存的命中率不同使用過 Com+/Enterprise Libiary Caching/Windows服務(wù),靜態(tài)文件等方式的服務(wù)器端緩存和 HTTP Compression技術(shù),但客戶端緩存往往卻被人們忽略了,即使服務(wù)器的緩存讓你的頁面訪問起來非常地快,但她依然需要依賴瀏覽器下載并輸出,而當(dāng)你加入客戶端緩存時,會給你帶來非常多的好處.因為她可以對站點中訪問最頻繁的頁進行緩存充分地提高 Web 服務(wù)器的吞吐量(通常以每秒的請求數(shù)計算)以提升應(yīng)用程序性能和可伸縮性。
一個在線購物調(diào)查顯示,大多數(shù)人愿意去商店排隊,但在在線購物時卻不愿意等待。Websense調(diào)查公司稱多達70%的上網(wǎng)者表示不愿意在頁面讀取上超過10秒鐘。超過70%的人會因為中途速度過慢而取消當(dāng)前的訂單。
基礎(chǔ)知識
1) 什么是”Last-Modified”?
在瀏覽器第一次請求某一個URL時,服務(wù)器端的返回狀態(tài)會是200,內(nèi)容是你請求的資源,同時有一個Last-Modified的屬性標(biāo)記此文件在服務(wù)期端最后被修改的時間,格式類似這樣:
Last-Modified: Fri, 12 May 2006 18:53:33 GMT
客戶端第二次請求此URL時,根據(jù) HTTP 協(xié)議的規(guī)定,瀏覽器會向服務(wù)器傳送 If-Modified-Since 報頭,詢問該時間之后文件是否有被修改過:
If-Modified-Since: Fri, 12 May 2006 18:53:33 GMT
如果服務(wù)器端的資源沒有變化,則自動返回 HTTP 304 (Not Changed.)狀態(tài)碼,內(nèi)容為空,這樣就節(jié)省了傳輸數(shù)據(jù)量。當(dāng)服務(wù)器端代碼發(fā)生改變或者重啟服務(wù)器時,則重新發(fā)出資源,返回和第一次請求時類似。從而保證不向客戶端重復(fù)發(fā)出資源,也保證當(dāng)服務(wù)器有變化時,客戶端能夠得到最新的資源。
2) 什么是”Etag”?
HTTP 協(xié)議規(guī)格說明定義ETag為“被請求變量的實體值” (參見 —— 章節(jié) 14.19)。 另一種說法是,ETag是一個可以與Web資源關(guān)聯(lián)的記號(token)。典型的Web資源可以一個Web頁,但也可能是JSON或XML文檔。服務(wù)器單獨負責(zé)判斷記號是什么及其含義,并在HTTP響應(yīng)頭中將其傳送到客戶端,以下是服務(wù)器端返回的格式:
ETag: "50b1c1d4f775c61:df3"
客戶端的查詢更新格式是這樣的:
If-None-Match: W/"50b1c1d4f775c61:df3"
如果ETag沒改變,則返回狀態(tài)304然后不返回,這也和Last-Modified一樣。本人測試Etag主要在斷點下載時比較有用。
Last-Modified和Etags如何幫助提高性能?
聰明的開發(fā)者會把Last-Modified 和ETags請求的http報頭一起使用,這樣可利用客戶端(例如瀏覽器)的緩存。因為服務(wù)器首先產(chǎn)生 Last-Modified/Etag標(biāo)記,服務(wù)器可在稍后使用它來判斷頁面是否已經(jīng)被修改。本質(zhì)上,客戶端通過將該記號傳回服務(wù)器要求服務(wù)器驗證其(客戶端)緩存。
過程如下:
1. 客戶端請求一個頁面(A)。
2. 服務(wù)器返回頁面A,并在給A加上一個Last-Modified/ETag。
3. 客戶端展現(xiàn)該頁面,并將頁面連同Last-Modified/ETag一起緩存。
4. 客戶再次請求頁面A,并將上次請求時服務(wù)器返回的Last-Modified/ETag一起傳遞給服務(wù)器。
5. 服務(wù)器檢查該Last-Modified或ETag,并判斷出該頁面自上次客戶端請求之后還未被修改,直接返回響應(yīng)304和一個空的響應(yīng)體。
示例代碼
下面的例子描述如何使用服務(wù)器端代碼去操作客戶端緩存:
Code
1//默認緩存的秒數(shù)
2 int secondsTime = 100;
3
4 //判斷最后修改時間是否在要求的時間內(nèi)
5 //如果服務(wù)器端的文件沒有被修改過,則返回狀態(tài)是304,內(nèi)容為空,這樣就節(jié)省了傳輸數(shù)據(jù)量。如果服務(wù)器端的文件被修改過,則返回和第一次請求時類似。
6 if (request.Headers["If-Modified-Since"] != null && TimeSpan.FromTicks(DateTime.Now.Ticks - DateTime.Parse(request.Headers["If-Modified-Since"]).Ticks).Seconds < secondsTime)
7 {
8 //測試代碼,在這里會發(fā)現(xiàn),當(dāng)瀏覽器返回304狀態(tài)時,下面的日期并不會輸出
9 Response.Write(DateTime.Now);
10
11 response.StatusCode = 304;
12 response.Headers.Add("Content-Encoding", "gzip");
13 response.StatusDescription = "Not Modified";
14 }
15 else
16 {
17 //輸出當(dāng)前時間
18 Response.Write(DateTime.Now);
19
20 //設(shè)置客戶端緩存狀態(tài)
21 SetClientCaching(response, DateTime.Now);
22 }
23
24 /**//// <summary>
25 /// 設(shè)置客戶端緩存狀態(tài)
26 /// </summary>
27 /// <param name="response"></param>
28 /// <param name="lastModified"></param>
29 private void SetClientCaching(HttpResponse response, DateTime lastModified)
30 {
31 response.Cache.SetETag(lastModified.Ticks.ToString());
32 response.Cache.SetLastModified(lastModified);
33 //public 以指定響應(yīng)能由客戶端和共享(代理)緩存進行緩存。
34 response.Cache.SetCacheability(HttpCacheability.Public);
35 //是允許文檔在被視為陳舊之前存在的最長絕對時間。
36 response.Cache.SetMaxAge(new TimeSpan(7, 0, 0, 0));
37 //將緩存過期從絕對時間設(shè)置為可調(diào)時間
38 response.Cache.SetSlidingExpiration(true);
39 }
如果你的緩存是基于文件的方式,如XML或http中的.ashx處理,也可以使用下面的基于文件方式的客戶端緩存:
SetFileCaching
1/**//// <summary>
2/// 基于文件方式設(shè)置客戶端緩存
3/// </summary>
4/// <param name="fileName"></param>
5private void SetFileCaching(HttpResponse response, string fileName)
6{
7 response.AddFileDependency(fileName);
8 //基于處理程序文件依賴項的時間戳設(shè)置 ETag HTTP 標(biāo)頭。
9 response.Cache.SetETagFromFileDependencies();
10 //基于處理程序文件依賴項的時間戳設(shè)置 Last-Modified HTTP 標(biāo)頭。
11 response.Cache.SetLastModifiedFromFileDependencies();
12 response.Cache.SetCacheability(HttpCacheability.Public);
13 response.Cache.SetMaxAge(new TimeSpan(7, 0, 0, 0));
14 response.Cache.SetSlidingExpiration(true);
15}
16
結(jié)論
我們已經(jīng)看了如何使用客戶端緩存減少帶寬和計算的方法,如前所述,如果能正確合理的利用各種不同的緩存,他們會給你帶來很多的好處.我希望本文已為你當(dāng)下或?qū)砘赪eb的項目提供了精神食糧,并正確地在底層利用Last- Modified和ETag響應(yīng)頭去優(yōu)化你的項目。
本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請
點擊舉報。