“推土機”是AMD徹底重新設計的核心,將成為AMD下一代高性能處理器技術,用于客戶端和服務器領域,相比于Opteron 6100系列會增加33%的核心、大約50%的性能。
作為嶄新一代的處理器構架,AMD“推土機”將采用32nm SOI工藝,這讓“推土機”相比“Magny-Cours”皓龍處理器可以在不增加功耗的前提下增加33%的核心數量、增加50%的吞吐量。
與AMD之前所有處理器都有所不同的是,“推土機”采用了“模塊化”的設計,每個“模塊”包含兩個處理器核心,這有些像一個啟用了SMT的單核處理器。每個核心具有各自的整數調度器和四個專有的管線,兩個核心共享一個浮點調度器和兩個128位FMAC乘法累加器。
(資料圖片)
Turbo Core全核心加速技術
Turbo Core技術主要是指對于一些沒有完全消耗到最大程度的工作負載,去加快時鐘速度。在多種不同工作負載上,使用了Turbo Core可以最大增加500兆赫茲的性能。最重要的一點,Turbo Core加速指的是所有核的加速,和有些核加速技術明顯不同,以往的核加速技術可能需要關閉一些核,只對部分核進行加速。采用Turbo Core技術,最多可以使所有核增速500兆赫茲,如果再關閉一些核運轉的情況下,加速將會超過500兆赫茲。同時我們還對內存控制器進行了進一步優化,從而提高內存的吞吐量。
除了每個核心獨享4個整數計算管線,在浮點運算上,“推土機”采用了“FlexFP”技術,兩個核心共享一個浮點調度器和兩個128位FMAC乘法累加器,可以進行組合,每個時鐘周期可以完成兩次64位雙精度計算或4次32位單精度計算。如果一個核心沒有進行浮點運算,那么另一個核心可以占用這兩個128位的FMAC,在一個時鐘周期完成4次雙精度運算或8次單精度計算,AMD將其命名為 AVX模式。這種技術保證了“推土機”的浮點運算能力,在高性能計算中并不會因為“共享”而犧牲性能。
新接口和新工藝
推土機處理器將采用Socket AM3+接口,942個針腳,不同于目前938個針腳的Socket AM3接口,其好處是可以支持DDR3-1600內存和高級節能技術,而且AM3+將是AM3+將是AMD的最后一代針腳柵格陣列(PGA)封裝,之后將改用觸點柵格陣列(LGA),等到Fusion融合處理器降臨的時候就會使用LGA AF1新接口,觸點多達1591個,支持DisplayPort 1.2標準、PCI-E 3.0規范(32條信道)、四通道內存。
加強型內存控制器
8年前AMD首家推出集成內存控制器,根據AMD在這一領域的經驗和非常好的技術,又在這一代產品中全面提升了內存控制器的性能。首先對內存控制器在效率方面進行了針對性的重新設計和完善,因此實現30%的內存性能提升。在提升30%性能基礎上,讓內存支持1600MHz頻率,可以獲得額外20%的性能。兩項加起來,可以實現內存控制器50%吞吐量提升。
同時支持AVX指令和SSE指令
FLEX FP是AMD至今為止最有創新意義的浮點計算技術,每一個模塊都有一個FLEX FP進行浮點運算。如果使用傳統128位編碼,意味著每個核會有單獨的浮點運算單元。與友商相比,如果在128位編碼前提下,AMD所執行的數量多一倍。如果是256位AVX編碼,Bulldozer可以把兩個浮點運算單元放在一起執行。所以在256位編碼執行模式下,與友商比較,執行的數量是一樣的。但是Bulldozer有一個非常大的優勢,就是可以同時執行256位AVX指令和SSE指令。而友商就不能做到這點,他們只能在AVX或SSE中選擇其一,這樣的優勢能夠讓Bulldozer在高性能計算、媒體編解碼以及在一些技術型運算方面有更高的性能。
更先進的電源管理技術
每個模塊內第二個整數核心所需要的電路只占總核心面積的12%,從芯片級別上講這只會給整個內核增加5%的電路。更多的核心、更少的空間,這顯然有利于提高單位功耗、單位成本的性能。
能耗大小是由被通電時鐘數量決定的,它取決于執行一個普通指令(運算)需要讓多少晶體管處于通電狀態。在最大時鐘供電的百分比下,正常應用狀態和閑置狀態下,Bulldozer都具有非常好的能耗表現。同時在各能耗單位上進行了優化,可以在各種單位下進行電源關閉。高性能運算能耗之所以高,主要是由于浮點運算,而一般應用運算主要是在執行單元消耗得最高。同時還有閑置狀態下,AMD的技術可以做到對于那些完全用不著的核,把電源完全關閉。去年AMD產品有一個大轉型,AMD推出了新插槽,2011年推出的推土機可以使用2010年的插槽。而友商為推出新平臺,同時推出了新插槽,這也使得AMD更占優勢。
關鍵詞: AMD推土機性能如何
責任編輯:Rex_07