HD7950權威首測!鏖戰(zhàn)新舊2代4大卡皇
在前不久HD7970發(fā)布時,在我們的首發(fā)評測文章《5年架構大革命!HD7970脫胎換骨全測試》已經對Tahiti核心技術與架構進行了全面介紹,因此本文只做簡要介紹,因為HD7970與HD7950除了性能有差別之外,技術、架構、功能方面沒有任何區(qū)別。
Tahiti的核心架構圖
這是AMD官方公布的Tahiti核心架構圖,第一眼看上去,我們就會發(fā)現他與以往所有的AMD GPU架構有了明顯區(qū)別,無論圖形引擎部分還是流處理器部分都有了天翻地覆的變化,如果沒有右側熟悉的UVD、CrossFire、Eyefinity等功能模塊,很難相信這是一顆AMD的GPU。
先看看最上面的圖形引擎部分
Tahiti的圖形引擎部分
Cayman的圖形引擎部分
這一部分Tahiti幾乎沒有什么變化,依然是雙圖形引擎的設計,幾何著色指令分配器、頂點著色指令分配器、曲面細分單元、光柵器、分層消影器都是雙份的設計。
毫不起眼但意義重大的改進:雙ACE
除此之外,還有一個毫不起眼但是意義重大的改進,那就是在圖形引擎上方加入了兩個ACE(Asynchronous Compute Engine,異步計算引擎),這兩個引擎直接與指令處理器、幾何引擎及全局數據緩存相連,作用是管理GPU的任務隊列,將線程分門別類的分發(fā)給流處理器。
ACE將會充當指令處理器的角色用于運算操作,而ACE的主要作用就是接受任務并將其下遣分配給流處理器(主要是分配的過程)。全新架構強化了多任務的并行處理設計,資源分配、上下文切換以及任務優(yōu)先級決策等等。ACE的直接作用就是新架構擁有了一定程度的亂序執(zhí)行能力,雖然嚴格意義上新架構依然是順序執(zhí)行架構,一個完整線程中的指令執(zhí)行順序不能被打亂,但是ACE可以做到對不同的任務進行優(yōu)化和排序,劃分任務執(zhí)行的優(yōu)先級別,進而優(yōu)化資源。從本質上來說,這與很多CPU(比如Atom、ARM A8等等)處理多任務的方式并沒有什么不同。
而且ACE的加入大幅提升了Tahiti的幾何性能,并且使得通用計算時的指令分配更加有序和并行化,緩存使用率和命中率更高。
有針對性的強化曲面細分單元
單從數量上來看,Tahiti明顯不如GF100的4個光柵化引擎(光柵器+分層消影器)以及8個多形體引擎(幾何/頂點分配器及曲面細分單元等)。不過AMD有針對性的強化了曲面細分單元,通過提高頂點的復用率、增強片外緩存命中率、以及更大參數高速緩存的配合下,HD7970在所有級別的曲面細分環(huán)境下都可以達到4倍于HD6970的性能:
此前我們介紹過,HD6970的曲面細分性能是HD6870的兩倍、HD5870的三倍。通過AMD的理論數據來看,Tahiti的曲面細分性能應該達到甚至超越了GF100/110。
看得出來,AMD的Tahiti在圖形引擎方面依然沿用Cayman的設計,從Cypress到Barts再到Cayman,AMD穩(wěn)扎穩(wěn)打的對圖形引擎進行優(yōu)化與改進,AMD認為現有的雙圖形引擎設計足以滿足流處理器的需要,因此只對備受詬病的曲面細分模塊進行了改良,如此有針對性的設計算是亡羊補牢、為時不晚。
關注我們
