国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
決戰(zhàn)上海灘 shanghai處理器解析
作者:小熊在線  西安  2008年12月05日  【業(yè)界動態(tài)】
[文章 簡介]
基于全新的shanghai核心的Opteron處理器,究竟能否與Intel最新的Xeon處理器相抗衡呢,在這篇評測中,你將會了解到許多關于Shanghai處理器的新特性~~ (13210 字)
第1頁:AMD:從巴塞羅那到上海第2頁:AMD處理器的五個時代第3頁:這顆皓龍小名叫shanghai第4頁:Smart Fetch智能預取節(jié)電技術第5頁:價格和供貨情況第6頁:四核心Opteron皓龍的前世今生第7頁:是否足以和Nehalem相抗衡?第8頁:AMD:走在虛擬化技術前沿第9頁:強大的六核心Fiorano平臺第10頁:未來的Opteron皓龍?zhí)幚砥髌脚_第11頁:測試平臺介紹第12頁:內(nèi)存子系統(tǒng)測試(上)第13頁:內(nèi)存子系統(tǒng)測試(下)第14頁:SPECjbb 2005測試第15頁:處理器渲染性能測試:Cinebench第16頁:XML處理測試第17頁:科學運算:蛋白質分析和流體動力學模擬第18頁:Folding@Home分布式計算第19頁:3D建模與渲染第20頁:視頻編碼測試:x264 HD video第21頁:處理器多媒體性能測試:Sandra multimedia第22頁:寫在最后
第1頁:AMD:從巴塞羅那到上海
近幾年AMD在四核心處理器的道路上有著非??部赖慕?jīng)歷。最初的“Barcelona”巴塞羅那處理器由于受到時鐘頻率和性能的制約無法滿足業(yè)界對它的預期,在加上一些致命的Bug漏洞,迫使AMD幾乎停止了這款處理器的出貨。當我們苦苦等待的修訂版重新上市的時候,AMD又要面對Intel巨大的競爭態(tài)勢。Intel基于45nm制造工藝技術的“Harpertown”核心Xeon至強處理器成為了AMD可怕的敵人,新款至強處理器大大改善了性能功耗之比,在服務器市場中,瘋狂的蠶食著本屬于Opteron的市場份額。小熊在線www.beareyes.com.cn
不過AMD也并非吳下阿蒙,它也在努力尋找著扭轉命運的契機。設計一款全新的四核心Opteron處理器的計劃被提出,它就是傳說中研發(fā)代號為“shanghai”的新一代核心架構。同時,它也會采用全新的45nm制造工藝技術。這有助于大幅提高處理器的時鐘速度和性能功耗之比。shanghai也有許多新的改進,相較巴塞羅那,它算是第二代全新設計的處理器。在高效的巴塞羅那核心的基礎之上,設計師可以更充分的優(yōu)化性能,充分挖掘這一代處理器的潛能。全新的Opteron處理器將會有更高的時鐘頻率,每個時鐘周期內(nèi)可以處理更多指令,并且它的功耗也會更低。小熊在線www.beareyes.com.cn
基于全新的shanghai核心的Opteron處理器,究竟能否與Intel最新的Xeon處理器相抗衡呢,在這篇評測中,你將會了解到許多關于Shanghai處理器的新特性。小熊在線www.beareyes.com.cn
shanghai服務器堆棧
《決戰(zhàn)上海灘 shanghai處理器解析》分頁索引
第1頁:AMD:從巴塞羅那到上海
第2頁:AMD處理器的五個時代
第3頁:這顆皓龍小名叫shanghai
第4頁:Smart Fetch智能預取節(jié)電技術
第5頁:價格和供貨情況
第6頁:四核心Opteron皓龍的前世今生
第7頁:是否足以和Nehalem相抗衡?
第8頁:AMD:走在虛擬化技術前沿
第9頁:強大的六核心Fiorano平臺
第10頁:未來的Opteron皓龍?zhí)幚砥髌脚_
第11頁:測試平臺介紹
第12頁:內(nèi)存子系統(tǒng)測試(上)
第13頁:內(nèi)存子系統(tǒng)測試(下)
第14頁:SPECjbb 2005測試
第15頁:處理器渲染性能測試:Cinebench
第16頁:XML處理測試
第17頁:科學運算:蛋白質分析和流體動力學模擬
第18頁:Folding@Home分布式計算
第19頁:3D建模與渲染
第20頁:視頻編碼測試:x264 HD video
第21頁:處理器多媒體性能測試:Sandra multimedia
第22頁:寫在最后
全文
第2頁:AMD處理器的五個時代
AMD的處理器發(fā)展是經(jīng)歷了漫長的演化階段,目前最新的shanghai處理器已經(jīng)算是K10.5代的產(chǎn)品。要想真正了解shanghai在AMD處理器大家族的地位,我們先來簡要回顧一下AMD處理器的五個發(fā)展階段。小熊在線www.beareyes.com.cn
第一代
80486至K6時代。初期的產(chǎn)品策略主要是以較低廉的產(chǎn)品價格為訴求,雖然最高性能不如同期的Intel產(chǎn)品,但卻擁有較佳的價格性能比。小熊在線www.beareyes.com.cn
第二代
K7時代。K7的性能尤其是在浮點運算能力方面,受到不少DIY用戶的歡迎。由于相對于Intel,AMD對于CPU的倍頻鎖定限制較松,因此廣受許多超頻用戶的歡迎。但也由于缺乏過熱保護,超頻過度的K7系列CPU有較高的燒毀風險,導致部分消費者對其穩(wěn)定度的信心偏低。小熊在線www.beareyes.com.cn
第三代
K8時代。由于率先于Intel之前優(yōu)先投入64位CPU的市場,使得AMD在64位CPU的領域有比較早發(fā)展的優(yōu)勢,此時代的AMD產(chǎn)品仍采取了一貫的低主頻高性能策略,解決因為電氣性能有限導致CPU不穩(wěn)定和發(fā)熱量、耗電功率過大的問題,并導入使用IBM開發(fā)的SOI技術,使得K8相較同期Intel公司的P4處理器相同性能上有較低的功耗。小熊在線www.beareyes.com.cn
第四代
K10時代,由于原生四核心的設計復雜,加上電路設計Bug。導致AMD初期B2核心步進的Opteron(Barcelon)和Phenom(Agena)效能不彰,頻率提升困難。為此AMD特別發(fā)布解決B2核心步進BUG的Patch,名稱為“TLB Patch”。AMD接下來還將發(fā)布解決TLB Bug問題的B3核心步進,可使AMD K10處理器的整體效能再提升15%。小熊在線www.beareyes.com.cn
第五代
K10.5時代,AMD在2007年5月已完成45nm的SRAM晶圓生產(chǎn),10月宣布45nm的處理器開始試產(chǎn)。AMD的45nm處理器在德國德累斯頓300mm晶圓廠Fab 36生產(chǎn),生產(chǎn)工藝由AMD與IBM合作開發(fā)。譬如沉浸平版印刷術、AMD第四代SOI、Ultra-Low-K等,與Intel的有所不同。AMD認為,即使沒有High-K、金屬柵極技術也能順利步入45nm時代,并不是必要的,不過到了32nm就是必需的了。此番展示的處理器包括服務器版本“Shanghai”和桌面版本“Deneb”,均為高端四核心型號。AMD將在今年10月正式發(fā)布45nm處理器,首先推出的是“Shanghai”,接下來將推出6核心 Opteron ,代號“Istanbul”,仍使用Socket F腳位,明年上半年推出AMD第三代Opteron平臺,改用Socket G34腳位,推出代號“San Paulo”的6核心 Opteron,將支持DDR3內(nèi)存與HyperTransport3.0協(xié)定,還會推出12核心 Opteron,代號為“Magny-Cours”。小熊在線www.beareyes.com.cn
第3頁:這顆皓龍小名叫shanghai
雖然AMD的巴塞羅那處理器出現(xiàn)了許多這樣和那樣的問題,但是作為AMD專門為高端服務器市場所設計的處理器來說,巴塞羅那仍然是史上第一顆原生四核心x86處理器,四個處理器核心被集成在一個硅片上。每個處理核心都有自己獨立的512KB容量的L2高速緩存,四個處理核心還可以共享一個容量更大的2MB的L3高速緩存。巴塞羅那內(nèi)部的四個處理核心也可以通過共享L3高速緩存的方式來進行快速通信。為了降低處理器的整體功耗,在功耗管理方面,巴塞羅那每個處理核心的速度都可以根據(jù)其任務量獨立調(diào)節(jié)。另外在處理器芯片中,還有2個供電電源層。一個專門為處理核心供電,另一個專門為處理器中其他組件和電路供電。這些其他電路部分包括:L3高速緩存,整合的內(nèi)存控制器,HyperTransport總線連接等等。處理器中各個部分的電壓都可以獨立進行調(diào)節(jié),這樣可以大幅加快從休眠模式激活的時間。它基于Socket F架構,本身就有著非常強悍的架構優(yōu)勢,基于高速的拓撲架構設計,點對點的直連架構設計和集成在處理器內(nèi)部的高效的內(nèi)存控制器。在巴塞羅那核心中所有這些先進的設計,都使得他成為了最理想化的服務器和工作站處理器。小熊在線www.beareyes.com.cn
雙路shanghai系統(tǒng)
很少有人會認為這種體系架構設計是雞肋,特別是現(xiàn)在,就連Intel最新發(fā)布的Nehalem處理器平臺,也幾乎“照搬”了全部的特色。桌面版本的Core i7處理器與巴塞羅那在架構設計上,有著太多的相似。待到明年上半年,Intel將會把Nehalem平臺推向服務器市場。小熊在線www.beareyes.com.cn
shanghai繼承了Barcelona的許多優(yōu)勢,并且在shanghai這一代核心中可以將這些優(yōu)勢發(fā)揚光大。為此,AMD已經(jīng)為shanghai裝配了更大的6MB容量的L3高速緩存,這樣shanghai每個時鐘周期就可以執(zhí)行更多任務,同時增加它的功耗性能之比。小熊在線www.beareyes.com.cn
就如同它命名的城市一樣,上海,給人感覺是一個繁華而擁擠的大都市。shanghai內(nèi)部集成了7.58億個晶體管,而以前的巴塞羅那僅僅集成了4.63億個。由于采用了先進的45nm制造工藝技術,shanghai的核心面積反而要比巴塞羅那要小。shanghai的核心面積為258平方毫米,而巴塞羅那有283平方毫米。小熊在線www.beareyes.com.cn
AMD的45nm制造工藝技術結合了應變硅和絕緣硅片技術,它可以達到更高速的開關速度和低功耗水平。與前兩代半導體制造工藝技術相似。不過這次AMD使用更加先進的浸沒式光刻技術達到更小的幾何結構。小熊在線www.beareyes.com.cn
如圖所示,AMD這次在鏡頭與晶圓之間,采用了液體介質作為支撐。因此它要比在傳統(tǒng)的空氣中蝕刻電路技術具有更好的聚焦特性和更高的分辨率。AMD生成這種浸沒式的光刻技術將是未來半導體制造業(yè)的趨勢,也是轉產(chǎn)到32nm制造工藝技術的轉折點。即使Intel已經(jīng)向全世界宣稱自己將是第一個轉產(chǎn)到32nm制造工藝的半導體廠商。AMD也會憑借浸沒式光刻緊隨其后。小熊在線www.beareyes.com.cn
大多數(shù)shanghai處理器中增加的晶體管(與巴塞羅那相比)都是用來擴大L3高速緩存的容量,這些優(yōu)勢會在承擔繁重計算任務的服務器級別的計算機中相當明顯的體現(xiàn)出來。大量數(shù)據(jù)的邏輯運算和轉化需要較大規(guī)模的高速緩存。雖然這會消耗許多晶體管資源,但是所帶來的性能提升也是非常值得的。例如,隨著處理器擁有更大的緩存,可以支持更復雜的預取機制。這種預取機制可以從處理器對數(shù)據(jù)的操作歷史中發(fā)現(xiàn)某些特定的規(guī)律。從而在未經(jīng)任何指示的情況下,提前從高速緩存中讀取數(shù)據(jù)加以處理。這樣會大大提高處理器的工作進度,始終讓處理器處于忙碌狀態(tài)。隨著處理器高速緩存容量的激增,預取的算法也可以變得更加智能和高效。shanghai可以探測L1和L2緩存在處理器核心中的連貫性信息,其探測的容量是老巴塞羅那的兩倍。這樣可以有效的在處理核心閑置時,降低它的時鐘頻率,達到更加節(jié)能省電的效果。小熊在線www.beareyes.com.cn
為了不讓較大容量的高速緩存發(fā)生數(shù)據(jù)混亂和錯誤,AMD建立起了一套應急機制,該功能可以請求禁用L3高速緩存。如果機器檢查系統(tǒng)報告出現(xiàn)了許多錯誤,那么它允許處理器關閉部分L3緩存的區(qū)域。當然這項技術需要操作系統(tǒng)級別的支持,因此AMD公司承諾,努力在明年選擇比較普遍而典型的操作系統(tǒng),支持這項技術。小
第4頁:Smart Fetch智能預取節(jié)電技術
相比之下,有些出現(xiàn)在shanghai中的新技術名詞就要難理解的多。例如,Smart Fetch智能預取技術。雖然這項技術聽上去,更像是能加快系統(tǒng)某些處理效能的技術,但事實上,它的主要功能是采用較為變通的方式來節(jié)省電能。眾所周知,AMD的高速緩存層級架構,都是采用獨立設計的,也就是說,較低級別的高速緩存,不會將全部的內(nèi)容都復制到更高級的高速緩存,或者是其他高速緩存中。在shanghai處理器中,獨立高速緩存的各種層級架構的總和足有8MB之多。但是為了達到節(jié)能降耗的目的,這些高速緩存并不總是全部都被開啟。例如在巴塞羅那核心中,一個完全閑置的處理核心會持續(xù)的工作,但是它的頻率會被降低,這樣可以保證其內(nèi)部的高速緩存是激活狀態(tài)的,并且其他處理核心可以訪問這中間的數(shù)據(jù)。在shanghai處理器中,L1、L2和L3高速緩存可以用來獨立存儲數(shù)據(jù),這樣處理核心就可以完全被關閉。基本上它的時鐘頻率可以降低為零。AMD生成這項技術可以降低處理器的功耗達21%。不過至少要有1個處理核心在系統(tǒng)中運作,保持著激活狀態(tài)。但是,如果你的系統(tǒng)中,有四路shanghai處理器,那么在服務器空閑的時候,只有一個處理器的一個核心在工作,將會非常節(jié)電。雖然shanghai處理器中智能預取機制的節(jié)電效果,并沒有Nehalem平臺中的電源管理單元那么強悍,但是它仍然要比上一代巴塞羅那有較為明顯的技術改進。小熊在線www.beareyes.com.cn
在shanghai中改進的不僅僅是層級緩存架構,整個存儲體系也開始支持嵌套頁表,這項技術可以加速在虛擬化軟件中,內(nèi)存地址的轉換效率。shanghai的基本配置與巴塞羅那相當,但是AMD聲稱shanghai的切換速度要提高了25%之多。這就意味著基于shanghai的虛擬化平臺中,從客戶端模式到管理程序模式的轉化將更為迅速。在客戶端可以明顯感到速度的提升。AMD在進行虛擬化測試時,運行過兩個測試,一個是將客戶端轉換為管理程序,另一個是將管理程序轉換為客戶端。在這個轉換的過程中,巴塞羅那使用了1360個周期,而shanghai僅僅使用了900個周期。目前的虛擬化軟件已經(jīng)開始支持AMD的shanghai處理器新特性“AMD-V”,這使得虛擬化服務器的性能得到了明顯的改善。小熊在線www.beareyes.com.cn
事實上,VMware公司已經(jīng)公布了一些shanghai處理器的性能數(shù)據(jù),在VMware ESX 3.5中,基于硬件級別的嵌套頁表要比軟件模擬的嵌套頁表性能高很多。小熊在線www.beareyes.com.cn
雙路Opteron系統(tǒng),支持16GB容量的DDR2-800內(nèi)存
除此之外,shanghai還有不少讓人興奮的改進之處,shanghai內(nèi)部集成的內(nèi)存控制器開始正式支持DDR2 667至800MHz的頻率。另外對于HyperTransport 3總線規(guī)范的支持也是迫在眉睫。第一批shanghai處理器并不支持HyperTransport 3總線。主要原因是AMD并沒有想過在shanghai中引進,AMD在等待HyperTransport 3總線草案變成正式版。預計在明年春天Opteron有望開始正式支持HT3總線。屆時處理器與處理器之間的通信帶寬將激增一倍。HT3總線的速度會高達2.2GHz,最大雙向合計帶寬會達到可怕的17.6Gb/s。在2009年發(fā)布的Fiorano平臺將會完全支持HT3系統(tǒng)總線。小
第5頁:價格和供貨情況
shanghai核心的處理器如此令人期待,而它的價格和供貨情況也不可小視。這是shanghai成敗的關鍵。目前AMD已經(jīng)公布了Opteron的各種型號和價格,請詳見下面的表格,最終上市的產(chǎn)品價格只會比這些預發(fā)布的價格要低。小熊在線www.beareyes.com.cn
Model Clock speed North bridge speed ACP Price
Opteron 2384 2.7GHz 2.2GHz 75W $989
Opteron 2382 2.6GHz 2.2GHz 75W $873
Opteron 2380 2.5GHz 2.0GHz 75W $698
Opteron 2378 2.4GHz 2.0GHz 75W $523
Opteron 2376 2.3GHz 2.0GHz 75W $377
Opteron 8384 2.7GHz 2.2GHz 75W $2,149
Opteron 8382 2.6GHz 2.2GHz 75W $1,865
Opteron 8380 2.5GHz 2.0GHz 75W $1,514
Opteron 8378 2.4GHz 2.0GHz 75W $1,165
所有這些處理器的工作頻率范圍從2.3到2.7GHz,根據(jù)AMD的“ACP”功耗設計為75W。這個ACP與Intel的TDP相類似,都是衡量處理器功耗設計的指標。shanghai的時鐘頻率有較大的提升,這都是45nm制造工藝的功勞。而另一方面值得注意的是,北橋的時鐘頻率也被當作處理器的參數(shù)被加入進來。這是因為北橋時鐘頻率掌控著L3高速緩存的速度,因此北橋芯片的時鐘速度,也會影響Opteron處理器的總體性能發(fā)揮。小熊在線www.beareyes.com.cn
上述表格中所有處理器是目前已經(jīng)確認的型號,而HE版低功耗階層的處理器和SE版shanghai核心的衍生處理器目前尚不清楚具體的規(guī)格。不過AMD透露HE和SE版本的處理器的設計功耗為55W和105W。在明年第一季度上市。另外還有性能更強勁的處理器蓄勢待發(fā),SE版本的處理器會達到3GHz的頻率,只是具體的上市時間AMD并未透露。小熊在線www.beareyes.com.cn
CPU-z檢測信息
四路處理器系統(tǒng),共計16個處理核心
第6頁:四核心Opteron皓龍的前世今生
Opteron是美國AMD公司首款K8系列微處理器,于2003年4月22日推出,其中文官方名稱為“皓龍”,它也是首款與AMD64架構相容的。Opteron處理器主要用于服務器上,與英特爾的Xeon(至強)處理器競爭。小熊在線www.beareyes.com.cn
2007年9月10日,AMD推出首批采用K10微架構,核心代號Barcelona的Opteron 2300及8300系列B2步進處理器,全數(shù)均采用原生四核心設計及65nm SOI制程。小熊在線www.beareyes.com.cn
2008年3月1日,AMD正式出貨B3步進制程Barcelona處理器,解決了B2步進制程的TLB Bug。HP、IBM、DELL將推出采用B3步進制程的Barcelona處理器的高效能服務器。小熊在線www.beareyes.com.cn
2008年3月,德國漢諾威電腦展Cebit 2008,AMD正式展出K10.5核心架構,代號為“Shanghai”(上海)的處理器,OEM廠商對此一新架構處理器效能感到滿意。該處理器針對IPC(每一時脈周期指令)進行改進,并且將L3快取加大至6MB。小熊在線www.beareyes.com.cn
2008年5月25日,IBM為美國國家核能安全管理部打造一臺代號為走鵑(Geococcyx californianus)的超級電腦,當中即采用6192顆AMD Opteron處理器與12960顆PowerX Cell 8i處理器搭配,計算峰值高達1.026PetaFLOPS,目前高居世界500強超級電腦的第一位。小熊在線www.beareyes.com.cn
2008年7月25日,AMD計劃推出12核心的Opteron處理器,并升級為Socket G34插槽搭配Maranello服務器平臺。最新的Socket G34插槽將有1974腳位,比目前Socket F的1207腳位Opteron處理器,性能最多可以提升64%,12核心的Opteron處理器預計2010年面世,屆時將支援DDR3內(nèi)存與4路HyperTransport3.0協(xié)定,到時AMD將推出45nm制程的12核心Magny Cours和同樣采用45納米制程的6核心Sao Paulo。AMD另外計劃在明年下半年為現(xiàn)有的服務器平臺推出6核心的Opteron處理器。小熊在線www.beareyes.com.cn
2008年7月28日,中央電視臺引進1千多臺內(nèi)含AMD Opteron四核心的雙路服務器,提供550Kbps編碼的北京2008運動會賽事實況轉播。1千多臺內(nèi)含Opteron四核心的雙路服務器將分別用于前端服務器、串流媒體服務器、數(shù)據(jù)庫服務器、二級媒體內(nèi)容轉發(fā)服務器、節(jié)目編碼服務器。小熊在線www.beareyes.com.cn
2008年7月29日,AMD Opteron四核心處理器在雙路、四路服務器創(chuàng)造了SPEC Web2005兩項新的世界紀錄。惠普ProLiant DL385 G5服務器配置了兩顆四核心的Opteron 2356 2.3GHz,SPEC Web2005得分30007,而惠普ProLiant DL585 G5服務器配置了四顆四核心的Opteron 8356 2.3GHz,SPEC Web2005得分高達43854,比之前的記錄提高了大約2.5%。另外四路Opteron 8356也首次使用10Gbps 以太網(wǎng)路進行測試,展示了Opteron直連架構的優(yōu)異性能。小熊在線www.beareyes.com.cn
2008年8月11日,搭載AMD Opteron四核心處理器2360SE 型號的惠普ProLiant DL785 G5服務器在TPC-H@300 GB 決策支持測試中取得突破世界紀錄的成績,另外也在SAP? Sales 和 Distribution Standard Application Benchmark雙重測試中,在配置和工作負載相似的8顆Opteron 處理器共32顆核心的x86服務器中,榮獲第一名。小熊在線www.beareyes.com.cn
大陸北京天文館即將上映的 8000 x 8000 高清晰電影將使用30臺8路的 SUN 服務器進行集體渲染,這些Sun 服務器一共內(nèi)含160顆AMD Opteron處理器。小熊在線www.beareyes.com.cn
AMD 45nm Opteron將在2008年年底上市,并同時推出服務器芯片組,命名為AMD SR5600,不再單純依賴nVIDIA與Broadcom等第三方廠商提供芯片組。45nm Opteron將推出9種不同型號,時脈自2.3GHz~2.7GHz不等,采用Socket F腳位、6MB L2快取、TDP一律75w,但HyperTransport仍將采用2.0版本。小熊在線www.beareyes.com.cn
shanghai處理器芯片晶圓
第7頁:是否足以和Nehalem相抗衡?
雖然從各種已經(jīng)透露出來的資料來看,shanghai確實是一款非常出色的處理器,但是仍然有不少人懷疑shanghai的性能是否足以和Intel的Nehalem相抗衡。AMD已經(jīng)許諾,為消費者提供與上一代相同的體系架構,提供更高的性價比,更強的性能功耗比。小熊在線www.beareyes.com.cn
AMD全新一代shanghai處理器會集成705M個晶體管,芯片面積為243平方毫米,預計采用45nm制造工藝之后,這個數(shù)值還有可能進一步縮減。集成四個處理核心,每個核心具備512KB的L2高速緩存。整個處理器具備L3 6MB。集成128bit的DDR2內(nèi)存控制器,4條HT總線。每個處理器核心大概占據(jù)15.3平方毫米的芯片面積。每個MB的L2高速緩存約占居7.5平方毫米的面積。小熊在線www.beareyes.com.cn
對比shanghai,采用Nehalem平臺的Core i7處理器集成有731M個晶體管,采用45nm制造工藝技術。集成有4個處理核心,每個處理核心帶有256KB的L2高速緩存,共計L3 8MB。集成有3×64bit DDR3內(nèi)存控制器。具備2條全新的QPI總線。單獨一個處理核心的面積為24.4平方毫米。L2高速緩存每MB占用7.1平方毫米的面積。而L3每個MB占用5.7平方毫米的面積。i7的L2與L3占用芯片面積的不同,是因為L3采用的T8晶體管構造,L2采用T6晶體管構造。小熊在線www.beareyes.com.cn
從兩個核心的對比,我們不難看出,i7的256KB L2顯然不敵shanghai的512KB L2。不過i7在單個處理核心方面使用的晶體管和芯片面積都要比shanghai多出許多。預計i7的處理核心將更為強大。通過更大容量的8MB L3,各個處理核心核心之間也可以更充分的共享數(shù)據(jù)。而shanghai是首次采用45nm制造工藝技術,其頻率沖上3GHz也是比較困難的事情。可以說,shanghai雖然與i7有一拼之力,但想要各個方面全面超越i7并不是一件輕松的事情。小熊在線www.beareyes.com.cn
有趣的是,隨著shanghai處理器的發(fā)布,AMD也透露了一些未來Opteron皓龍?zhí)幚砥鞯陌l(fā)展規(guī)劃。小熊在線www.beareyes.com.cn
這是AMD Opteron皓龍?zhí)幚砥鞯穆肪€圖,我們可以看到歷史追溯到2006年,未來展望到2011年。小熊在線www.beareyes.com.cn
Opteron處理器目前最為棘手的問題就是在明年春天的時候啟用HyperTransport 3系統(tǒng)總線。在下一代Fiorano平臺中,會有較大革新與變化。新的平臺會在2009年中期的時候與大家見面。Fiorano平臺的第一款芯片組將會是基于ATI的邏輯核心。這款芯片組由SR5690 北橋和SP5100南橋所組成。Fiorano仍然會保留對Socket F處理器插槽的兼容性,但是也會增加一些顯著的特性,例如HT3總線的支持,PCI Express 2.0總線的支持,支持設備的熱插拔。正如我們早前猜測的那樣Fiorano平臺將會支持AMD的IOMMU虛擬化技術,它可以支持快速而安全的硬件輔助虛擬化I/O設備。在今后的服務器領域中,虛擬化技術是未來發(fā)展的一大趨勢,無論是具備較大優(yōu)勢的AMD,還是后來迎頭趕上的Intel,都非??春眠@一領域的應用。因此,未來的高端服務器領域之爭,也可以看作是虛擬化領域的技術械斗。小熊
第8頁:AMD:走在虛擬化技術前沿
虛擬化技術是指在x86的系統(tǒng)中,一個或以上的客操作系統(tǒng)在一個主操作系統(tǒng)下運行的一種技術。這種技術只要求對客操作系統(tǒng)有很少的修改或甚至根本沒有修改。x86處理器架構起先并不滿足虛擬化環(huán)境的需求,這使得在x86處理器下對普通虛擬機的操作變得十分復雜。在2005年與2006年,英特爾與AMD分別在它們的x86架構上解決了這個問題以及其他的虛擬化困難。小熊在線www.beareyes.com.cn
AMD虛擬化(AMD Virtualization),縮寫為“AMD-V”,是AMD為64位的x86架構提供的虛擬化擴展的名稱。但有時仍然會用“Pacifica”,AMD開發(fā)這項擴展時的內(nèi)部項目代碼來指代它。小熊在線www.beareyes.com.cn
AMD-V在AMD的步進為“F”與“G”的速龍64以及速龍64 X2處理器、使用Socket S1的炫龍64處理器,炫龍64 X2處理器,弈龍?zhí)幚砥?,以及全部更新的處理器上可用。(后?jīng)證實 炫龍64 X2 TL-50處理器可支持虛擬化技術)
在Linux中,支持虛擬化的AMD處理器會在一個特別文件/proc/cpuinfo中有一個名為svm的標志。小熊在線www.beareyes.com.cn
AMD為一項名為AMD-V的IO內(nèi)存管理單元(IOMMU)發(fā)布過一份技術規(guī)范。這份技術規(guī)范提供了一種配置傳送給獨立虛擬機的中斷,與配置IO內(nèi)存單元的方式,以防止虛擬機使用DMA來終止與真實硬件的隔離。IOMMU在高級的操作系統(tǒng)(如缺席虛擬化,absent virtualization)與AMD的Torrenza架構中起到了重要的作用。小熊在線www.beareyes.com.cn
AMD-V虛擬化技術
第9頁:強大的六核心Fiorano平臺
這是四路Opteron處理器架構圖
Fiorano平臺具有良好的擴展升級性,從2P到4P再到8P,系統(tǒng)都可以平滑升級。上面這張圖表示四路Opteron處理器的架構圖,整個系統(tǒng)仍然有希望再擴充為8P的系統(tǒng)。另一個值得注意的地方,它并不支持DDR3內(nèi)存。盡管在桌面領域Phenom II處理器可以在2009年早期就可以支持DDR3內(nèi)存技術,但是服務器級別的Opteron處理器就沒有這么幸運了。由于受限于Socket插槽的兼容性問題,至少要等到2010年,AMD才會在Opteron處理器平臺中使用全新的Socket插槽。因此在2010年之前,我們很難看到支持DDR3的Opteron平臺問世。小熊在線www.beareyes.com.cn
在2009年年底的時候,Opteron皓龍?zhí)幚砥鲿苌?核心的版本,它的研發(fā)代號為Istanbul。它采用45nm制造工藝技術,看上去與目前的shanghai處理器非常類似。但是,它會額外的增加2個處理核心。依舊板載6MB容量的L3高速緩存。內(nèi)部集成DDR2內(nèi)存控制器,支持HT3系統(tǒng)總線。當然在這期間Intel也會有自己的產(chǎn)品路線圖,基于Nehalem架構的四核心、八核心Xeon至強處理器也會相繼到來。究竟鹿死誰手還要看高端服務器市場的反應。小熊在線www.beareyes.com.cn
Istanbul看上去與shanghai核心非常相似,只是多了2個處理核心
AMD計劃在2010年,采用一種全新的G34處理器插槽,它會是首個長方形的Socket插槽。屆時處理器將會有更為密集而龐大的引腳數(shù)量。預計將應用在下一代Opteron處理器上。令人興奮的是,Opteron將集成真正的DDR3內(nèi)存控制器,同時DDR3內(nèi)存的通道數(shù)量將達到4路。此外,北橋芯片中HT3系統(tǒng)總線的鏈接數(shù)量也要由現(xiàn)在的3條,進化為4條。這些強悍的配置都會應用于4路處理器系統(tǒng)中。小熊在線www.beareyes.com.cn
盡管AMD一直盡力保證處理器插槽的向下兼容性,但是這次升級物理改動的地方相當大。全新一代處理器平臺的研發(fā)代號為Maranello法拉利,為了保證多路處理器系統(tǒng)中有足夠的數(shù)據(jù)傳輸帶寬。法拉利平臺中將使用2顆Fiorano中的主板邏輯核心。小熊
第10頁:未來的Opteron皓龍?zhí)幚砥髌脚_
全新的處理器平臺,將會有兩個不同的階層,Sao Paulo圣保羅,他擁有6個處理核心和6MB的L3高速緩存。而研發(fā)代號Magny Cours馬尼庫爾的處理器將具備高達12個處理核心和12MB容量的L3高速緩存。目前我們尚不知曉AMD是如何將眾多的處理核心和緩存都集成在一個小小的芯片中的。不過可以肯定Magny Cours仍然會采用同shanghai處理器一樣的45nm制造工藝技術生產(chǎn)。同時它的高速緩存層級架構也與傳統(tǒng)的Opteron處理器保持一致。不過L3中的緩存架構則稍有不同。AMD在L3中加入了額外的智能控制芯片。它會以探針過濾器,或窺探過濾器的形式工作。在多路多核心處理器系統(tǒng)中,它可以有效的管理高速L3緩存中數(shù)據(jù)信息的相關性。這種設計與Nehalme中的片上功耗管理單元相類似。它可以控制處理核心的速度,降低他們的電壓,同時還能監(jiān)測處理器的熱量。小熊在線www.beareyes.com.cn
除了上述一些AMD未來的處理特性細節(jié)之外,AMD今后的處理器產(chǎn)品還是比較撲朔迷離的。我們知道,在前不久AMD宣布賣掉自己的晶圓制造工廠,轉而去依靠技術更為先進的晶圓代工公司生產(chǎn)處理器產(chǎn)品。小熊在線www.beareyes.com.cn
而在2010年上半年,AMD有計劃推出兩個高級的32nm制造工藝技術。首先在2010年中期,推出高性能的32nm制造工藝技術,一個是高性能的SOI硅絕緣工藝技術,high-k金屬門電路的低功耗加工工藝技術。小熊在線www.beareyes.com.cn
據(jù)我們所知,AMD正在致力于下一代CPU架構的研發(fā)工作,它的代號為Bulldozer推土機。根據(jù)先前的報道,推土機可能使用45nm制造工藝技術。不過根據(jù)小編我的分析,如果推土機架構能在2011年到來面向桌面處理器市場,那么它很有可能會采用更為高級的32nn制造工藝技術。小熊在線www.beareyes.com.cn
shanghai 4S server
第11頁:測試平臺介紹
Processors Dual Xeon E5450 3.0GHz Dual Xeon X5492 3.4GHz Dual Xeon L5430 2.66GHz Dual Opteron 2347 HE 1.9GHz
Dual Opteron 2356 2.3GHz Dual Opteron 2384 2.7GHz
System bus 1333MHz (333MHz quad-pumped) 1600MHz (400MHz quad-pumped) 1333MHz (333MHz quad-pumped) 1GHz HyperTransport 1GHz HyperTransport
Motherboard SUPERMICRO X7DB8+SuperMicro X7DWA asus RS160-E5 SuperMicro H8DMU+ SuperMicro H8DMU+
BIOS revision 6/23/2008 8/04/2008 8/08/2008 3/25/08 10/15/08
North bridge Intel 5000P MCH Intel 5400 MCH Intel 5100 MCHnVIDIA nForce Pro3600 Nvidia nForce Pro3600
South bridge Intel 6321 ESB ICH Intel 6321 ESB ICH Intel ICH9R Nvidia nForce Pro3600 Nvidia nForce Pro3600
Chipset drivers INF Update 9.0.0.1008 INF Update 9.0.0.1008 INF Update 9.0.0.1008 - -
Memory size 16GB (8 DIMMs) 16GB (8 DIMMs) 6GB (6 DIMMs) 16GB (8 DIMMs) 16GB (8 DIMMs)
Memory type 2048MB DDR2-800 FB-DIMMs  2048MB DDR2-800 FB-DIMMs 1024MB registered ECC
DDR2-667 DIMMs 2048MB registeredECC
DDR2-800 DIMMs 2048MB registered ECC
DDR2-800 DIMMs
Memory speed (Effective) 667MHz 800MHz 667MHz 667MHz 800MHz
CAS latency (CL) 5 5 5 5 6
RAS toCAS delay (tRCD) 5 5 5 5 5
RAS precharge (tRP) 5 5 5 5 5
Storage controller Intel 6321 ESB ICH with
Matrix Storage Manager 8.6 Intel 6321 ESB ICH with
Matrix Storage Manager 8.6 Intel ICH9R with
Matrix Storage Manager 8.6 Nvidia nForce Pro3600 LSI Logic Embedded MegaRAID
with 8.9.518.2007 drivers
Power supply Ablecom PWS-702A-1R 700W Ablecom PWS-702A-1R 700W FSP GroupFSP460-701UG 460W Ablecom PWS-702A-1R 700W Ablecom PWS-702A-1R 700W
Graphics IntegratedATI ES1000 with 8.240.50.3000 drivers Integrated ATI ES1000 with 8.240.50.3000 drivers Integrated xgi Volari Z9s with 1.09.10_Asus drivers Integrated ATI ES1000 with 8.240.50.3000 drivers Integrated ATI ES1000 with 8.240.50.3000 drivers
Hard drive WD CaviarWD1600YD 160GB
OS Windows Server 2008 Enterprise x64 Edition with Service Pack 1
在我們的測試中,一共選用了6顆服務器級的處理器,其中有3顆Intel的Xeon至強處理器,3顆Opteron皓龍?zhí)幚砥?,其中Opteron 2384采用45nm的shanghai處理器。另外我們選用了11款最為專業(yè)的服務器級別的評測軟件作為本次評測的工具。它們包括:
SPECjbb 2005 1.07 with Oracle JRockIt JRE R27.6 Windows 64-bit
SiSoft Sandra 2009.1.15.42
CPU-Z 1.48
Valve VRAD map build benchmark
Cinebench R10 64-bit Edition
POV-Ray for Windows 3.7 beta 29 64-bit
CASE Lab Euler3d CFD benchmark multithreaded edition
MyriMatch proteomics benchmark
notfred's Folding benchmark CD 9/28/08 revision
x264 HD benchmark 2.0 with x264 version 0.59.819
TR XML benchmark
第12頁:內(nèi)存子系統(tǒng)測試(上)
這張圖表非常直觀的顯示了不同系統(tǒng)平臺之間高速緩存與內(nèi)存帶寬之間的差異。其中我們可以看到Opteron 2384處理器具有16MB的L3高速緩存,因此它比其他四核心Opteron具備更出色的性能。不過Xeon的緩存層級架構更加典型,因此在這項測試中Xeon全面勝出。小熊在線www.beareyes.com.cn
由于集成了改良型的內(nèi)存控制器,因此Opteron 2384比其他處理器具備更強的內(nèi)存帶寬性能。同時AMD的處理器也在這項測試中全面勝出。小熊在線www.beareyes.com.cn
Opteron 2384改進了高速緩存層級架構,改進了TLB的層次,再加上更快的內(nèi)存訪問速度,使得它的內(nèi)存訪問延遲大大減小,這要比傳統(tǒng)的65nn巴塞羅那有不小的性能提升。
第13頁:內(nèi)存子系統(tǒng)測試(下)
下面我們來看看各款處理器的內(nèi)存訪問延遲情況。通過這個可視化圖表,我們可以很清楚看到,Opteron的L3高速緩存再次發(fā)揮出了極大的優(yōu)勢,它的潛伏期要比老巴塞羅那快20~30ns之多。
第14頁:SPECjbb 2005測試
SPECjbb 2005可以模擬一臺服務器在真實的商業(yè)活動中的運行環(huán)境。它可以模擬客戶端、數(shù)據(jù)庫、后臺服務的運行。它是一個java編寫的程序,通過java虛擬機來運行。它有許多系統(tǒng)測試項目,這里我們主要來考察處理器的峰值運算量和數(shù)據(jù)吞吐量。
Opteron 2384處理器的測試成績給人印象十分深刻,他比上一代2356有著巨大的性能飛躍,性能超越對手Xeon E5450。2.7GHz的shanghai性能已經(jīng)直逼3.4GHz的Xeon X5492。小熊在線www.beareyes.com.cn
在功耗測試方面,Xeon X5492的性能驚人,但是其功耗也同樣驚人。75W的Opteron 2384功耗處在一個比較合理的水平內(nèi)。令人贊嘆的是低功耗版本的Xeon L5430確實已與常人,功耗要遠遠低于其他對手。小熊在線www.beareyes.com.cn
在性能功耗比的測試中,45nm制造工藝的Opteron 2384絕對出彩。雖然L5430排在第一,但是它也是用較大的性能代價才換取的第一。雖然Opteron 2384排在第二位,但是其性能功耗之比,要遠遠超過其他處理器。小熊
第15頁:處理器渲染性能測試:Cinebench
Cinebench是較為常見的處理器性能測試工具,它通過對一幅3D圖片進行渲染處理,來考察處理器的運行效能。小熊在線www.beareyes.com.cn
在這項測試中Xeon處理器憑借著較高的主頻和優(yōu)秀的多媒體性能占盡了優(yōu)勢。小熊在線www.beareyes.com.cn
在運行這款測試軟件是,處理器開足馬力全力沖刺,功耗最高的還是Xeon X5492,而shanghai核心的Opteron 2384功耗僅僅高于Intel低功耗版本的Xeon L5430,可見45nm制造工藝確實有極大的優(yōu)勢。小熊在線www.beareyes.com.cn
第16頁:XML處理測試
在XML性能的測試中,我們盡力模擬真實的XML編譯環(huán)境,使用了開源的XML Benchmark測試工具。使用了微軟的C#和.NET語言腳本。
這里有一個比較奇怪的問題,Opteron 2384并沒有他的前輩2356得分高。而Intel也憑借著較高的頻率與架構優(yōu)勢在這項測試中全面勝出。小熊
第17頁:科學運算:蛋白質分析和流體動力學模擬
MyriMatch proteomics是一款蛋白質分析軟件,用來分析蛋白質的的基因序列,它可以進行多線程運算,這樣可以加速蛋白質的分析速度。在這里,我們選用不同線程數(shù)量,來測試不同的處理器,在不同線程數(shù)量下的性能表現(xiàn)。
Opteron 2384性能表現(xiàn)優(yōu)異,除了低于頻率遠高于它的Xeon X5492處理器之外,其他處理器均已不在話下。不過我們也可以看到,老巴塞羅那由于受到頻率的制約,很難超越頻率較高的Xeon處理器。小熊在線www.beareyes.com.cn
STARS Euler3d是流體動力學計算軟件,以前它僅僅是支持單線程的程序,不過它目前已經(jīng)有了多線程版本的試用版可用。我們從一個網(wǎng)站上下載了大規(guī)模數(shù)據(jù)集,和多線程測試軟件。小熊在線www.beareyes.com.cn
該程序還處在多線程內(nèi)部測試版本,并未對任何多核心處理器平臺做優(yōu)化,因此頻率較高的Xeon處理器具有很大優(yōu)勢。不過我們也可以看到Opteron 2384同樣超越了老巴塞羅那處理器。
第18頁:Folding@Home分布式計算
Folding@Home是比較知名的分布式運算程序。它采用分布式的計算方式,來調(diào)集分布在全世界各處的計算機,來運行蛋白質分析程序。目前Folding@Home支持許多處理器技術,如AMD的3DNow!,Intel的SSE,同時還支持ATI和NVIDIA顯示卡的通用計算。
很顯然Xeon至強處理器在這項測試中又是大獲全勝,憑借較高的主頻和不錯的性能,至強表現(xiàn)出了非凡的實力。而在AMD的處理器中,Opteron 2384依舊憑借較高的時鐘頻率和優(yōu)秀的改良架構跑在了第一位。小熊在線
第19頁:3D建模與渲染
POV-Ray rendering
POV-Ray rendering是一款出色的渲染工具,目前它的最高版本為3.7,支持多線程和64bit處理器。
雖然shanghai核心的Opteron 2384有較強的性能提升,但是它并不足以完全趕超Xeon E5450。POV-Ray rendering對緩存大小和內(nèi)存帶寬并不敏感,因此AMD的處理器性能不能凸顯出來。不過shanghai在分支預測算法方面有較大的調(diào)整,這也是它超越巴塞羅那的重要原因。小熊在線www.beareyes.com.cn
Valve VRAD map compilation
它使用了Half-Life 2的引擎,是一款游戲編輯程序。同樣我們可以看到Xeon在渲染方面的不俗實力表現(xiàn)。而Opteron 2384雖然超越了巴塞羅那,但是難以在這方面與Intel的處理相抗衡。
第20頁:視頻編碼測試:x264 HD video
這是目前比較流行的視頻編碼器,開源的x264 HD編碼。它的版本號為,0.59.819,有兩個測試部分。
這款軟件針對工作站級別的處理器做了更多優(yōu)化,因此Xeon處理器具有明顯的優(yōu)勢。而像是shanghai這樣的處理器,雖然超越了老巴塞羅那核心,但是AMD的處理器仍然不敵Intel。小
第21頁:處理器多媒體性能測試:Sandra multimedia
SiSoft Sandra的multimedia是處理器測試三項鐵人賽中的一個測試項目,很多系統(tǒng)評測都會跑這個測試項目。它主要考察處理器的多媒體處理效能。
這里我們可以看到Opteron 2384某些測試項目中超越了Intel的Xeon L5430,但是總體而言,難以超越Intel的其他高端Xeon處理器。而Intel的Xeon處理器在多媒體處理器方面有著一貫的優(yōu)勢。
第22頁:寫在最后
全新的shanghai核心處理器具備更高的時鐘速度,更大更快的L3高速緩存,同時提高了四核心處理器的內(nèi)存子系統(tǒng)的性能。由于采用了全新的45nm制造工藝技術,使得shanghai處理器的整體功耗要比巴塞羅那低不少。通過上述測試,可以看出Opteron 2384相較Xeon E5450處理器在SPECjbb測試中具備更好的性能表現(xiàn)。在整個測試中,2.7GHz的皓龍緊緊咬住3.0GHz的至強處理器。但是面對3.4GHz的高頻率Xeon處理器,僅有2.7GHz的shanghai核心也難以對捍。
可見高端處理器市場,除了體系架構與處理器的指令架構,高速緩存層級架構之外,頻率依然是較為重要的性能指標。雖然shanghai此次采用了45nm制造工藝技術,但是這是AMD初次嘗試新的制程。而Intel的45nm已經(jīng)發(fā)展到第二代了。若相同頻率下比拼,AMD的shanghai定然不會落后于人。
至于說到處理器的架構設計,集成內(nèi)存控制器一直是AMD處理器的一大優(yōu)勢,在繁重的多任務環(huán)境下,優(yōu)勢尤為明顯。不過Intel的Nehalem架構已經(jīng)徹底扭轉了這種局勢。小編我認為shanghai最關鍵的,是就要把握機會,在雙路服務器版的Nehalem處理器上市之前,迅速搶占市場。并且進一步提高shanghai處理器的頻率,這樣才能與Intel有一拼的機會。小熊在線www.beareyes.com.cn
本站僅提供存儲服務,所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權內(nèi)容,請點擊舉報
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
原生16核皓龍(Opteron)現(xiàn)身AMD官方文檔
AMD系列CPU型號的區(qū)別
英特爾推出可與AMD核心產(chǎn)品競爭的新芯片
生存的力量!AMD帶領Intel前進五大步
AMD過去十年慘敗Intel的原因剖析
[譯]CMT 的神話
更多類似文章 >>
生活服務
分享 收藏 導長圖 關注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服