自2006年Core架構(gòu)發(fā)布以來(lái),Intel 處理器已經(jīng)完全擺脫了奔騰4時(shí)代Netburst架構(gòu)因過(guò)長(zhǎng)流水線所帶來(lái)的高主頻低效能的狀態(tài),取而代之的是注重每瓦效能的環(huán)保理念。為此,Core架構(gòu)處理器不但在性能上相比Netburst架構(gòu)有了質(zhì)的飛躍,更受到了市場(chǎng)消費(fèi)者的熱烈歡迎。Intel 也迅速開(kāi)啟了酷睿微架構(gòu)時(shí)代。 隨著tick tock(工藝年-構(gòu)架年)的推進(jìn),Core架構(gòu)在經(jīng)歷了2年市場(chǎng)風(fēng)光之后也將迎來(lái)他的繼任者。而這全新一代的性能王者架構(gòu)也吸引了無(wú)數(shù)硬件愛(ài)好者的眼光,人們不斷的猜測(cè)著這位繼任者的面貌,也在透過(guò)各大新聞媒體的焦點(diǎn),慢慢的掀開(kāi)全新一代Nehalem架構(gòu)的神秘面紗。
Intel 發(fā)布的LGA1366平臺(tái)Nehalem架構(gòu)圖
2008年11月18日,Intel 正式發(fā)布了采用全新Nehalem架構(gòu)處理器酷睿i7家族。隨后針對(duì)Nehalem架構(gòu)處理器的全方位測(cè)試也不斷的對(duì)外公布。人們驚訝的發(fā)現(xiàn),采用Nehalem架構(gòu)的酷睿i7家族在性能方面不僅超越了其前代Core架構(gòu),更將競(jìng)爭(zhēng)對(duì)手遠(yuǎn)遠(yuǎn)的甩在了身后。一瞬間酷睿i7變成為了追求極致性能的骨灰級(jí)玩家和大規(guī)??茖W(xué)運(yùn)算用戶的首選產(chǎn)品。
Nehalem架構(gòu)酷睿i7家族雖然性能強(qiáng)大,但是其過(guò)高的價(jià)格讓廣大的普通消費(fèi)者望而卻步。在發(fā)布近一年的時(shí)間里,LGA1366平臺(tái)的市場(chǎng)占有率不足Intel 整體市場(chǎng)的百分之一。其實(shí)這樣的數(shù)字并不感到驚訝,畢竟LGA1366平臺(tái)僅僅是面向極限性能用戶的產(chǎn)品。當(dāng)然Nehalem架構(gòu)并非僅面向高端人群,在時(shí)隔10個(gè)月之后,面向大眾消費(fèi)者的LGA1156平臺(tái)已經(jīng)是箭在弦上,其不僅保留了LGA1366平臺(tái)的極致性能,還將整體成本以及功耗降至了較低的水平上,這就是同為Nehalem的酷睿i5平臺(tái)。
●原生四核心,三級(jí)緩存被引入
與原Core架構(gòu)四核系列不同的是,Nehalem架構(gòu)并沒(méi)有將兩顆雙核處理器Die封裝在一起組成四核產(chǎn)品,而是采用了原生四核心設(shè)計(jì)。引人注意的是,Nehalem架構(gòu)還將三級(jí)緩存引入其中。其L1緩存的設(shè)計(jì)與酷睿微架構(gòu)相同,而L2緩存則采用超低延遲的設(shè)計(jì),不過(guò)容量大大降低,每個(gè)內(nèi)核僅有256KB,新加入的L3緩存采用共享式設(shè)計(jì)。即將發(fā)布的LGA1156接口酷睿i7/i5處理器與目前市場(chǎng)中的LGA1366酷睿i7系列相同,均配備了8MB的三級(jí)緩存。
上圖為Nehalem架構(gòu)緩存結(jié)構(gòu)圖,從圖中我們可以了解到其三級(jí)緩存由四顆核心完全共享,它幾乎可以處理所有的一致性流量問(wèn)題,同時(shí)不需要單獨(dú)打擾每顆獨(dú)立核心自己的L1、L2緩存。如果L3緩存沒(méi)有命中,那么我們需要訪問(wèn)的數(shù)據(jù)也不在L1或者L2中,此時(shí)也不需要偵聽(tīng)所有核心。如果L3緩存命中成功,它還可以作為偵聽(tīng)過(guò)濾器。
Nehalem的每個(gè)核心有64KB的L1和256KB的L2在L3緩存中保留數(shù)據(jù),因此在總共的8MB L3中,有1MB-1.25MB的數(shù)據(jù)與前兩級(jí)緩存相同。
●核心數(shù)量按需分配 Turbo Mode技術(shù)解析
LGA1156接口酷睿i7/i5處理器從LGA1366接口處理器那里很好的繼承了Turbo Mode技術(shù)(中文名為內(nèi)核運(yùn)行動(dòng)態(tài)加速)。他的加入可以很好的幫助處理器在空閑時(shí)刻降低功耗,從而起到提高工作效率同時(shí)節(jié)能的目的。
●北橋徹底消失 DMI總線成FSB替代者
08年11月發(fā)布的LGA1366接口Nehalem處理器雖然已經(jīng)引入了先進(jìn)的QPI總線概念,但是在主板上用戶依然可以看到北橋的身影。其對(duì)PCIe總線的控制依然由北橋方面提供。但此時(shí)的QPI總線架構(gòu)與原FSB架構(gòu)的產(chǎn)品已經(jīng)發(fā)生了至的變化,其總線高達(dá)25.6GB/s的帶寬已經(jīng)遠(yuǎn)遠(yuǎn)超越了FSB的頻率限制。但即將發(fā)布的酷睿i5系列卻采用了僅為2GB/s帶寬的DMI總線。這樣的數(shù)據(jù)帶寬與25.6GB/s的數(shù)據(jù)帶寬相比簡(jiǎn)直是天壤之別。Intel 為何要選用這樣低的DMI總線給大眾消費(fèi)者呢?
● SSE4.2指令集 大幅優(yōu)化文本處理
在45納米Core架構(gòu)時(shí)代,Intel 首次為旗下產(chǎn)品加入了SSE4.1指令集,他的出現(xiàn)令45nm工藝產(chǎn)品相比65nm產(chǎn)品的多媒體性能提升了將近70%。在Nehalem架構(gòu)產(chǎn)品上,Intel 再一次添加了新的指令集SSE4.2,換來(lái)的性能提升自然不言而喻。
SSE 4.1版本的指令集增加了47條指令,主要針對(duì)向量繪圖運(yùn)算、3D游戲加速、視頻編碼加速及協(xié)同處理的加速。英特爾方面指出,在應(yīng)用SSE4指令集后,45納米Penryn核心額外提供了2個(gè)不同的32位向量整數(shù)乘法運(yùn)算支持,并且在此基礎(chǔ)上還引入了8位無(wú)符號(hào)最小值和最大值以及16位、32位有符號(hào)和無(wú)符號(hào)的運(yùn)算,能夠有效地改善編譯器編譯效率,同時(shí)提高向量化整數(shù)和單精度運(yùn)算地能力。另外,SSE4.1還改良了插入、提取、尋找、離散、跨步負(fù)載及存儲(chǔ)等動(dòng)作,保證了向量運(yùn)算地專一化。
經(jīng)過(guò)我們的測(cè)試,SSE4.1指令集的處理器比不具備此指令集的同檔次處理器的視頻編碼效能提高了70%,在游戲中也有很明顯的性能提升。而SSE4.2指令集則將重點(diǎn)放在了文本處理上。據(jù)英特爾透露,Nehalem的SSE4.2指令集中的7條指令用途各不相同,有面向CRC-32和POP Counts的,也有特別針對(duì)XML的流式指令。帕特·基辛格表示,SSE4.2指令集可以將256條指令和并在一起執(zhí)行讓類似XML的工作性能提升3倍!
總結(jié):即將發(fā)布的酷睿i5處理器可以看做是Nehalem架構(gòu)成熟后的產(chǎn)品,因?yàn)閺倪@一代開(kāi)始,北橋的作用真正的被CPU完全取代,并且延續(xù)著每瓦性能這一理念。雖然酷睿i5遺憾的取消了超線程技術(shù),但是對(duì)于普通消費(fèi)者來(lái)講,超線程技術(shù)的缺失并不會(huì)給我們帶來(lái)某些不變,反而到為消費(fèi)者帶來(lái)了更低的價(jià)格。綜上所述,酷睿i5處理器可以看做是Nehalem架構(gòu)的普及先鋒。
聯(lián)系客服