決戰(zhàn)性能之巔!NV雙芯旗艦GTX590評測
不管GPU架構改不改,流處理器數(shù)量總是要擴充的,準確的說是以級數(shù)規(guī)模增長,這樣才能大幅提升理論性能。在流處理器數(shù)量急劇膨脹之后,如何管理好如此龐大的規(guī)模、并與其它模塊協(xié)調(diào)工作成為新的難題。
9.3 Fermi(GF100)和Cayman圖形架構對比
自從DX10時代以來,ATI在架構上就一直沒有太大的變化,即使到了DX11時代的HD5000/HD6000系列產(chǎn)品上,其核心架構仍然延續(xù)當年R600的設計思想。當然,細節(jié)進行了改進。
HD6970/HD6950(Cayman)核心架構圖
這一次發(fā)布的HD6900系列從整體架構上來說也沒有什么變化,和之前的幾代產(chǎn)品都差不多。不過在一些細節(jié)的改進上,采用 Cayman 核心的 HD6900可以說是改進最多的一款產(chǎn)品,拋棄了沿用數(shù)年的VLIW5架構(俗稱5D),而采用了VLIW4架構,增強了后端渲染能力,DX11中的Tesselation執(zhí)行單元也從一個增加到了兩個。
GF100芯片透視圖,GF100圖形架構:居然是四核心GPU
如果說Cypress是“雙核心”設計的話,那么GF100的流處理器部分就是“四核心”設計,因為GF100擁有四個GPC(圖形處理器集群)模塊,每個GPC內(nèi)部包含一個獨立的Raster Engine(光柵化引擎),而在以往都是整顆GPU共享一個Raster Engine。
在特性方面,除了完全符合DirectX 11關于Compute Shader和并行kernel所要求的硬件環(huán)境之外,GF100還支持分支論斷和基于CTA(線程塊)級別的亂序執(zhí)行,這使得GF100的整體Thread效率得到了進一步的顯著提升。
當然,由于NV自GT200一來對通用計算市場的規(guī)劃和態(tài)度,GF100中包含著規(guī)模龐大的DP單元,在特性上也支持了雖然同樣劃時代但僅對C++體系有巨大意義的統(tǒng)一定址體系。這部分晶體管的沉重負擔不僅對圖形過程毫無助益,甚至直接導致了NVIDIA不得不再次在紋理和后端作出了妥協(xié),削減了紋理資源與運算資源的比例。這也是無法被抹殺的事實。
關注我們
