1. PlentyOfFish 網(wǎng)站架構(gòu)學(xué)習(xí)
http://www.dbanotes.net/arch/plentyoffish_arch.html采取 Windows 技術(shù)路線的 Web 2.0 站點(diǎn)并不多,除了 MySpace ,另外就是這個(gè)PlentyOfFish。這個(gè)站點(diǎn)提供 “Online Dating”服務(wù)。一個(gè)令人津津樂道的、驚人的數(shù)據(jù)是這個(gè)只有一個(gè)人(創(chuàng)建人Markus Frind)的站點(diǎn)價(jià)值 10 億,估計(jì)要讓很多人眼熱,更何況Markus Frind 每天只用兩個(gè)小時(shí)打理網(wǎng)站–可操作性很強(qiáng)嘛。
2. 從LiveJournal后臺(tái)發(fā)展看 大型網(wǎng)站系統(tǒng)架構(gòu)以及性能優(yōu)化方法
http://www.example.net.cn/archives/2006/03/olivejournaloio.htmlLiveJournal是99年始于校園中的項(xiàng)目,幾個(gè)人出于愛好做了這樣一個(gè)應(yīng)用,以實(shí)現(xiàn)以下功能:
* 博客,論壇
* 社會(huì)性網(wǎng)絡(luò),找到朋友
* 聚合,把朋友的文章聚合在一起
LiveJournal采用了大量的開源軟件,甚至它本身也是一個(gè)開源軟件。
在上線后,LiveJournal實(shí)現(xiàn)了非常快速的增長(zhǎng):
* 2004年4月份:280萬(wàn)注冊(cè)用戶。
* 2005年4月份:680萬(wàn)注冊(cè)用戶。
* 2005年8月份:790萬(wàn)注冊(cè)用戶。
* 達(dá)到了每秒鐘上千次的頁(yè)面請(qǐng)求及處理。
* 使用了大量MySQL服務(wù)器。
* 使用了大量通用組件。
3. YouTube 的架構(gòu)擴(kuò)展
http://www.dbanotes.net/opensource/youtube_web_arch.html在西雅圖擴(kuò)展性的技術(shù)研討會(huì)上,YouTube 的 Cuong Do 做了關(guān)于 YouTube Scalability的報(bào)告。視頻內(nèi)容在 Google Video 上有(地址),可惜國(guó)內(nèi)用戶看不到。
Kyle Cordes 對(duì)這個(gè)視頻中的內(nèi)容做了介紹。里面有不少技術(shù)性的內(nèi)容。值得分享一下。(Kyle Cordes的介紹是本文的主要來(lái)源)
4. WikiPedia 技術(shù)架構(gòu)學(xué)習(xí)分享
http://www.dbanotes.net/opensource/wikipedia_arch.html維基百科(WikiPedia.org)位列世界十大網(wǎng)站,目前排名第八位。這是開放的力量。
來(lái)點(diǎn)直接的數(shù)據(jù):
* 峰值每秒鐘3萬(wàn)個(gè) HTTP 請(qǐng)求
* 每秒鐘 3Gbit 流量, 近乎375MB
* 350 臺(tái) PC 服務(wù)器
5. Tailrank 網(wǎng)站架構(gòu)
http://www.dbanotes.net/review/tailrank_arch.html每天數(shù)以千萬(wàn)計(jì)的 Blog 內(nèi)容中,實(shí)時(shí)的熱點(diǎn)是什么? Tailrank 這個(gè) Web 2.0 Startup致力于回答這個(gè)問(wèn)題。
專門爆料網(wǎng)站架構(gòu)的 Todd Hoff 對(duì) Kevin Burton 進(jìn)行了采訪。于是我們能了解一下 Tailrank架構(gòu)的一些信息。每小時(shí)索引 2400 萬(wàn)的 Blog 與 Feed,內(nèi)容處理能力為 160-200Mbps,IO寫入大約在10-15MBps。每個(gè)月要處理 52T 之多的原始數(shù)據(jù)。Tailrank所用的爬蟲現(xiàn)在已經(jīng)成為一個(gè)獨(dú)立產(chǎn)品:spinn3r。
6. LinkedIn 架構(gòu)筆記
http://www.dbanotes.net/arch/linkedin.htmlLinkedIn 雇員有 180 個(gè),在 Web 2.0 公司中算是比較多的,不過(guò)人家自從 2006 年就盈利了,這在 Web 2.0站點(diǎn)中可算少的。用戶超過(guò) 1600 萬(wàn),現(xiàn)在每月新增 100 萬(wàn),50% 會(huì)員來(lái)自海外(中國(guó)用戶不少,也包括我).
7. Yahoo!社區(qū)架構(gòu)
http://www.dbanotes.net/arch/yahoo_arch.html舊金山舉行的 QCon會(huì)議帶給我們很多新鮮的信息。雖然沒機(jī)會(huì)參加,但是看看各個(gè)網(wǎng)站”曬架構(gòu)”也是個(gè)比較過(guò)癮的事情。請(qǐng)參觀并收藏這個(gè)頁(yè)面:Architecturesyou’ve always wondered about。
8. Craigslist 的數(shù)據(jù)庫(kù)架構(gòu)
http://www.dbanotes.net/database/craigslist_database_arch.htmlCraigslist 絕對(duì)是互聯(lián)網(wǎng)的一個(gè)傳奇公司。根據(jù)以前的一則報(bào)道:
每月超過(guò) 1000 萬(wàn)人使用該站服務(wù),月瀏覽量超過(guò) 30 億次,(Craigslist每月新增的帖子近 10億條??)網(wǎng)站的網(wǎng)頁(yè)數(shù)量在以每年近百倍的速度增長(zhǎng)。Craigslist 至今卻只有 18 名員工(現(xiàn)在可能會(huì)多一些了)。
9. Fotolog.com 的技術(shù)信息拾零
http://www.dbanotes.net/review/fotolog_arch.html盡管是世界上最大的圖片服務(wù)網(wǎng)站, Fotolog.com 在國(guó)內(nèi)的名氣并不是很響亮, 每當(dāng)提到圖片服務(wù), 很多人第一個(gè)會(huì)想起Flickr. 但實(shí)際上 Fotolog 也的確是很猛的, Alexa 上的排名一直在 Flickr 前面, 目前注冊(cè)用戶超過(guò)1100 萬(wàn). 而前不久也賣了一個(gè)好價(jià)錢, 9000 萬(wàn)美金. 算下來(lái)的話, 1 個(gè)注冊(cè)用戶大約 9 美金. Yupoo的劉平陽(yáng)可以偷著算算自己的網(wǎng)站如果賣給老外是怎樣一個(gè)價(jià)格了.
10. Digg 網(wǎng)站架構(gòu)
http://www.dbanotes.net/arch/digg_arch_cache_and_shard.htmlDigg 工程師采用 LAMP (Linux, Apache, MySQL and PHP) 模式。這個(gè) Alexa 排名在 100左右的、自我估價(jià) 1.5 億美金的站點(diǎn)目前有超過(guò) 100 臺(tái)的 PC 服務(wù)器(足夠少了),可以粗略分成三個(gè)部分:數(shù)據(jù)庫(kù)服務(wù)器,Web服務(wù)器,搜索服務(wù)器。
11. Amazon 的 Dynamo 架構(gòu)
http://www.dbanotes.net/techmemo/amazon_dynamo.html我在 DBAnotes.net 上記錄過(guò)不少比較大的網(wǎng)站架構(gòu)分析(eg: eBay [1], eBay [2]) ,Amazon一直找不到太多的資料。國(guó)慶期間讀到了一篇關(guān)于 Amazon Dynamo 的論文,非常精彩。Amazon Dynamo這個(gè)高可用、可擴(kuò)展存儲(chǔ)體系支撐了Amazon 不少核心服務(wù).
12. 財(cái)幫子(caibangzi.com)網(wǎng)站架構(gòu)
http://www.dbanotes.net/arch/caibangzi_web_arch.html財(cái)幫子(caibangzi.com) 定位在”基金理財(cái)社區(qū)”。是國(guó)內(nèi)訪問(wèn)量最大的基于 Ruby on rails 的 startup項(xiàng)目。“理財(cái)”這個(gè)詞據(jù)說(shuō)是光大銀行發(fā)明的,且不去管,不可否認(rèn)的是,目前國(guó)內(nèi)”理財(cái)”是個(gè)很有潛力的切入點(diǎn)。財(cái)幫子網(wǎng)站潛在用戶群還是很大的。
13. 了解一下 Technorati 的后臺(tái)數(shù)據(jù)庫(kù)架構(gòu)
http://www.dbanotes.net/web/technorati_db_arch.html目前處理著大約 10Tb 核心數(shù)據(jù), 分布在大約 20 臺(tái)機(jī)器上.通過(guò)復(fù)制, 多增加了 100Tb 數(shù)據(jù), 分布在 200 臺(tái)機(jī)器上.每天增長(zhǎng)的數(shù)據(jù) 1TB. 通過(guò) SOA 的運(yùn)用, 物理與邏輯的訪問(wèn)相隔離, 似乎消除了數(shù)據(jù)庫(kù)的瓶頸. 值得一提的是,該擴(kuò)展過(guò)程始終是利用普通的硬件與開源軟件來(lái)完成的. 畢竟 , Web 2.0 站點(diǎn)都不是燒錢的主.從數(shù)據(jù)量來(lái)看,這絕對(duì)是一個(gè)相對(duì)比較大的 Web 2.0 應(yīng)用.
14. 說(shuō)說(shuō)大型高并發(fā)高負(fù)載網(wǎng)站的系統(tǒng)架構(gòu)
http://www.toplee.com/blog/?p=71我在CERNET做過(guò)撥號(hào)接入平臺(tái)的搭建,而后在Yahoo&3721從事過(guò)搜索引擎前端開發(fā),又在MOP處理過(guò)大型社區(qū)貓撲大雜燴的架構(gòu)升級(jí)等工作,同時(shí)自己接觸和開發(fā)過(guò)不少大中型網(wǎng)站的模塊,因此在大型網(wǎng)站應(yīng)對(duì)高負(fù)載和并發(fā)的解決方案上有一些積累和經(jīng)驗(yàn),可以和大家一起探討一下。
15. 大型高負(fù)載網(wǎng)站架構(gòu) 的感想
http://atman.memoab.com/articles/194