決戰(zhàn)性能之巔!NV雙芯旗艦GTX590評測
縱觀GF100構架,眾多技術亮點舉不勝舉,而首次引入GPU構架的多級cache結構、分為兩級的線程分配管理體系、并行式的GPC單元設計、增大的shared memory以及徹底融入運算部分的TS單元更是重中之重。
9.2 八倍于上代旗艦的幾何性能
多級cache的引入不僅使得運算單元可以享受CPU才能夠享有的包含一致性的高速緩沖平臺,為整個體系提供了真正聯(lián)通本地顯存和寄存器的直接雙向讀寫手段,其可編程的操作方式更可以令其在要求透明延遲的shared和應對寄存器溢出的cache、甚至是texture cache之間自由轉化,靈活的應對不同的傳統(tǒng)場合和新的DirectX 11中關于Compute Shader部分的需求。
GF100構架除了在體系最外圍配備了充足的線程仲裁資源意外,每個SM內(nèi)部也都配備了完整的分派式多線程管理單元。多級的線程分派機制可以保證kernel在不同的GPC內(nèi)被解離成Thread之后依舊能夠讓ALU團簇在第一時間得到任務。
之前在G80上出現(xiàn)并且一直持續(xù)至今的融入SM的分離式Texture Arroy設計在GF100上產(chǎn)生了重大的影響。GF100體系分成四個對等并且完全并行的GPC單元,每個GPC單元都包含獨立的幾何引擎以及光柵化流水線,GPC模塊之間透過新加入的L2 cache進行通訊、kernel和Thread的協(xié)調(diào)以及數(shù)據(jù)共享。這不僅使得GF100的三角形吞吐能力較之同規(guī)模的舊結構提升了300%,可以實現(xiàn)并行的分塊化的渲染動作,更使得DirectX 11所要求的TS單元直接融入到了整個光柵化流水線內(nèi)部。
GTX480的幾何性能達到GTX285的8倍之多!
關注我們
