手邊有一份 2005 Winter TopTen Award Winners的報告,包含了一些關于世界上排名前幾位的 VLDB 的信息。VLDB,超大數據庫,其實叫做"狂大數據庫"倒是也很貼切。
如果不區(qū)分操作系統(tǒng)環(huán)境,Yahoo! 力拔數據倉庫一項的頭籌,單個數據庫數據大小接近 100T 。采用的是 Oracle 數據庫,部署在 Unix 上, 存儲是 EMC 的設備。這是 2005年的數據,雅虎現在每日接近 40 億 PV,這個數據倉庫現在應該遠超 100T 了吧。 電信巨頭 AT&T 的數據倉庫屈居亞軍。Amazon 的兩個數據倉庫也不小,數據量多達 24773 GB,是用 Oracle RAC 實現的,部署在 Linux 操作系統(tǒng)上。
OLTP Top 10
我比較關心 OLTP 數據庫的情況。下面這個圖表是包括所有操作系統(tǒng)環(huán)境的 OLTP 數據庫情況。前 10 名中只有兩個采用了集群,而且都是集中式集群(Centralized/Cluster)。其余8個席位都采用了 SMP 架構,而且大多是集中式(Centralized)。分布式超大 OLTP 的成功案例看來并不多(只有 1 例,另外有一例是Federated)。讓 Fenng 稍微有些驚訝的是 SQL Server 占了三個席位,數據量最大接近 8T 。整個表看來,數據庫類別、所用的軟件平臺還真的比較平均。并非我想象的完全是 DB2/Oracle+Unix 的格局。
Unix 上 OLTP TOP 10
下表是使用 Unix 操作系統(tǒng) OLTP TOP 10。好家伙,幾乎清一色的 Oracle。DB2 不見蹤影,只有 Sybase ASE 還算爭氣,占了一個席位。 9 個 Unix 平臺上的 Oracle OLTP DB,只有兩個使用了 RAC ,其他都是 Centralized/SMP。
到現在為止,都還沒有看到互聯(lián)網站點的身影。

Linux 上 OLTP Top
終于有互聯(lián)網公司出現了。仍然全部是 Oracle 數據庫。而且, 四個中的三個都是通過 RAC 來實現的。

從上面的數據可以作如下總結:
1) Linux 上 Oracle 通過 RAC 可以提高擴展能力;
2) 但是,Oracle RAC 的擴展性并非那么好;
如果從峰值處理能力(Peak Workload)的角度上看,Oracle 就不那么風光了。DB2 與 CA 的 CA-Datacom 瓜分了 10個 席位。操作系統(tǒng)平臺都是 z/OS。 排在第一的是 UPS 的數據庫系統(tǒng),每個小時處理 1,134,034,718 條 SQL 語句。很強悍。
或許有個的朋友看過我介紹的 eBay 的數據量,可能比較納悶,為何整個報告中沒有 eBay 數據庫上榜? Fenng 猜測是 eBay SOA 化之后,單個的數據庫就并不大了,這樣也避免了風險。
(這份報告的 PDF 下載)