Cal Henderson 是大名鼎鼎的 Flickr 網(wǎng)站的開發(fā)者之一.在一篇名為 Serving JavaScript Fast 的文章中,他介紹了用于 Flickr 站點應(yīng)用優(yōu)化的技巧,讀罷感覺獲益良多."嚼一下別人的饃",概括一下該文的主要內(nèi)容.
Flickr 是 Web 2.0 的代表站點。面對的網(wǎng)絡(luò)問題除了一般 Web 站點都會有的內(nèi)容優(yōu)化之外, 還有必須要靈活處理 JavaScript 與 CSS 的頻繁變化后部署分發(fā)帶來的復(fù)雜性。
設(shè)定文件大小的策略 首先面臨的一個問題是把所有的 JavaScript 與 CSS 放到一個文件中好呢,還是分割成多個文件 ? 從減少網(wǎng)絡(luò)請求的角度上考慮, 前者更好,后者差。但是從并行的角度考慮, IE 與 Firefox 默認情況下都只能同時從一個域請求兩個資源. 這會在很多情況下給用戶帶來不良的使用體驗--必須所有的文件都下載完畢才可以看到像樣的頁面. Flickr 采用了折衷的辦法--在保持文件數(shù)量盡可能少的情況下,把 JavaScript 與 CSS 分成多個子文件. 這在開發(fā)上帶來了復(fù)雜性,但是對性能的收益是巨大的。
壓縮的優(yōu)化問題 毫無疑問,對站點內(nèi)容進行壓縮是一個比較常用的 Web 優(yōu)化手段.但是并不一定都能達到理想的效果.原因在于 mod-gzip 模塊不但消耗服務(wù)器端 CPU 資源,也消耗客戶端 CPU 資源. 而且, mod_gzip 壓縮文件后創(chuàng)建的臨時文件是放到磁盤上的,這也會給磁盤 IO 帶來嚴重的問題. Flickr 采用的是 Httpd 2.x 以后支持的 mod_deflate 模塊.壓縮操作都在內(nèi)存中進行.mod_deflate 在 Httpd 1.x 是不可用的, 不過可以通過創(chuàng)建 RAM 盤的方式來間接提高性能.
當(dāng)然, mod_gzip 到也不是一無是處, 對于預(yù)壓縮的文件, 還是有好處的. 而且, 采用壓縮的時候,也要注意策略. 圖片文件壓縮就沒什么必要了(Flickr 上圖像多, 而且壓縮得不到什么好處). Flickr 只對 JavaScript 和 CSS 進行壓縮. mod_gzip 新一點的版本能夠自動通過配置 mod_gzip_update_static 選項自動處理 預(yù)壓縮的文件. Cal 也指出這個特性在一些舊版本的瀏覽器上會出問題.
壓縮的另一個主要手段是內(nèi)容的壓縮. 針對 JavaScript 可以進行通過減少注釋、合并空格、使用緊湊的語法等小技巧(Google 的所有腳本都非常難讀,而且非常緊湊,思想類似).當(dāng)然,經(jīng)過這樣處理的 JavaScript 可能帶了很多括號不容易解析,Flickr 使用了 Dojo Compressor 來構(gòu)建解析樹。Dojo Compressor 開銷很低,而且對于最終用戶是透明的. JavaScript 的處理方法介紹過,CSS 處理則相對簡單.通過簡單的正則表達式替換(比如把多個空格替換為一個空格符), 最高可以獲得 50% 的壓縮比。
Caching 的優(yōu)化 Flickr 的開發(fā)者充分利用了 Http 1.1 規(guī)范定義的 Etag 與 Last-Modified 機制 來提高 Caching 的效率. 值得注意的是,Cal 介紹了一個在負載均衡條件下的 e-Tag 小技巧. 即可以設(shè)定 Apache 通過文件調(diào)整時間與文件大小獲得 E-Tag ,而默認情況下, Apache 是通過文件節(jié)點獲取 e-Tag 的。當(dāng)然,這也不是很完美,因為會影響 if-modified-since 。
靈活運用 mod_rewrite 據(jù)說 Flickr 網(wǎng)站應(yīng)用是進行每日構(gòu)建的(Daily Build)。 如果沒有一個靈活的機制恐怕這是不可想象的。而且,在 Flickr 這樣的站點, 內(nèi)容的修改同步的處理都是很讓人頭疼的難題. 他們的利器是 mod_rewrite 的靈活運用。通過配置 URL 重寫規(guī)則,很容易切換到不同的環(huán)境下。聽起來很簡單, 但是沒有一定的 Web 技術(shù)功力談何容易做到 ?!
通過這幾個主要方法的運用,我們看到了如夢幻一般高性能的 Flickr .
BTW: 因為在 Flickr 在國內(nèi)沒有服務(wù)器, 大陸用戶訪問的速度就別提了 :(