av免费福利片在线播放,99热精品久久只有精品,18video性欧美19sex,ysl蜜桃色www,国产精品一区二区久久国产

泡泡網顯卡頻道 PCPOP首頁      /      顯卡     /      評測    /    正文

決戰(zhàn)性能之巔!NV雙芯旗艦GTX590評測

    NVIDIA在與程序員的溝通與反饋中發(fā)現,雖然共享內存能夠惠及許多問題,但它并不能夠用于解決所有問題。一些算法會自然而言地關聯到共享內存,另一些則要求高速緩存,還有一些要求二者的組合。非常好的的內存層級結構應能夠同時為共享內存和高速緩存帶來優(yōu)勢,同時讓編程人員可以選擇在二者之上進行設計。Fermi內存層級結構支持兩種類型的程序行為。

10.5 首次支持顯存ECC

Fermi的緩存層級:其中對于并行計算無用的紋理緩存已被剔除

    為加載/存儲操作添加一個真正的高速緩存層級結構會帶來嚴峻挑戰(zhàn)。傳統(tǒng)的GPU架構為紋理操作提供了只讀“加載”路徑,同時為像素數據輸出提供了只寫“輸出”路徑。然而,這一方法在執(zhí)行要求同時進行讀寫的通用C或C++線程程序時表現非常不佳。例如,向內存發(fā)起一個寄存瀑然后再讀回會形成寫后讀威脅。如果讀和寫路徑不同,可能會直接覆蓋掉整個寫/“導出”路徑,而無法正確發(fā)起讀操作,從而使得讀路徑上的任意高速緩存不能與寫數據保持一致。

    Fermi通過為加載和存儲提供單個統(tǒng)一的內存請求路徑解決了這一挑戰(zhàn),這一方法為每一個SM多處理器提供一個一級高速緩存,同時設置統(tǒng)一的二級高速緩存,以支持所有操作(加載、存儲和紋理)。每個SM多處理器上的一級高速緩存可以進行配置,以支持共享內存和緩存本地與全局內存操作。64KB的內存可分出48 KB用作共享內存,16KB用作一級高速緩存;或者16KB用作共享內存,48KB用作一級高速緩存。當提供48KB的共享內存時,需要廣泛使用共享內存的程序(如電子動態(tài)模擬)的性能將可以提高三倍。對于預先無法確定內存訪問情況的程序,設置48KB的一級高速緩存將能夠比直接訪問DRAM帶來顯著改進的性能。

    在任意一種配置中,一級高速緩存都可以通過緩存復雜程序的臨時寄存器溢出對性能有所幫助。前一代GPU將寄存器直接交給DRAM,從而增加了訪問延遲。通過使用一級高速緩存,性能能夠隨著臨時寄存器容量的增加逐步提升。

    Fermi采用了一個768KB統(tǒng)一二級高速緩存,用于支持所有加載、存儲和紋理請求。二級高速緩存在GPU之間提供了有效、高速的數據共享。針對以前未知的數據地址的算法,如Physics Solver、光線追蹤以及稀疏矩陣相乘等,將能夠從這一高速緩存結構中受益最大。此外,要求多個SM來讀取同一數據的過濾器和卷積內核也能夠從中受益。

第一款支持ECC顯存的GPU

    Fermi是第一個在顯存中提供了基于糾錯碼(ECC)的數據保護功能的GPU。CPU計算用戶使用ECC來在高性能計算環(huán)境中增強數據完整性。ECC是諸如醫(yī)療成像以及大型集群計算等領域中一個迫切需要的特性。

    自然發(fā)生的輻射可能導致內存中的數據被更改,導致軟錯誤。ECC技術能夠在單位軟錯誤影響系統(tǒng)之前就予以發(fā)現并進行糾正。由于此類輻射所致錯誤的可能性隨已安裝系統(tǒng)的數量直線增長,ECC是大型集群部署中的一個必備要求。

    Fermi支持單錯糾正雙錯檢測(SECDED)ECC代碼,能夠在數據被訪問期間糾正硬件中的任意單位錯誤。此外,SECDED ECC還確保了所有雙位錯誤和眾多多位錯誤能夠被發(fā)現和報告,以便能夠重新運行程序,而不是繼續(xù)執(zhí)行不良數據。

    Fermi的寄存器文件、共享內存、一級高速緩存、二級高速緩存和顯存均提供有ECC保護功能,從而不僅是適用于HPC應用的最強大GPU,同時也是最可靠的GPU。此外,Fermi還支持行業(yè)標準,能夠當在芯片間傳輸數據時對其進行檢查。所有NVIDIA GPU均支持用于CRC檢查的PCI-E標準,能夠在數據鏈路層進行重試。Fermi還支持用于CRC檢查的同類GDDR5標準,能夠當數據在內存總線上傳輸時進行重試(也稱作“EDC”)。

    是否支持ECC,成為GeForce與Tesla的最大區(qū)別,當然Tesla還配備了更大容量的顯存,為密集型數據處理提供更高的性能。

4人已贊
第1頁:不可思議的存在:GTX590發(fā)布第2頁:第一章:NVIDIA GTX590產品解析第3頁:首發(fā)產品:華碩GTX590第4頁:首發(fā)產品:索泰GTX590極速版第5頁:首發(fā)產品:映眾GTX590第6頁:首發(fā)產品:七彩虹iGame590第7頁:首發(fā)產品:銘瑄GTX590第8頁:首發(fā)產品:盈通GTX590第9頁:三大雙芯卡皇實物對比第10頁:第二章:GTX590游戲3D性能測試第11頁:DX10理論測試:《3DMark Vantage》第12頁:DX11理論測試:《3DMark 11》第13頁:Tessellation測試:《Heaven 2.1》第14頁:DX11理論測試:《石巨人》第15頁:DX11游戲測試:《塵埃2》第16頁:DX11游戲測試:《異形大戰(zhàn)鐵血戰(zhàn)士》第17頁:DX11游戲測試:《地鐵2033》第18頁:DX11游戲:《失落星球2》第19頁:DX11游戲:《H.A.W.X.2》第20頁:DX10.1游戲測試:《孤島驚魂2》第21頁:DX10游戲測試:《孤島危機:彈頭》第22頁:DX10游戲測試:《沖突世界》第23頁:DX9游戲測試:《街頭霸王IV》第24頁:PhysX測試:《黑手黨II》第25頁:CUDA視頻轉碼測試第26頁:溫度、功耗、噪音全面領先對手第27頁:性能測試總結第28頁:第三章:NVIDIA附加圖形技術之靈活應用第29頁:特色技術應用:NV 3D Vison Srround第30頁:虛擬現實必經之路:CUDA光線追蹤第31頁:第四章:最強游戲即時渲染畫面賞析第32頁:DX10基準:《3DMark Vantage》畫面賞析第33頁:DX11游戲:《HAWX2》畫面賞析第34頁:DX11游戲:《地鐵2033》畫面賞析第35頁:Tessellation軟件:《Heaven》 畫面賞析第36頁:Tessellation軟件:《石巨人》畫面賞析第37頁:DX11基準:《3DMark11》畫面賞析第38頁:第五章:令人興奮的DirectX API發(fā)展歷程第39頁:號稱實現“一切圖形特效”的DX9C第40頁:不應備受冷遇的DX10第41頁:第六章:揭秘DX11技術革新第42頁:DX11五大革新之:Shader Model 5.0第43頁:DX11五大革新之:Multi-Threading第44頁:DX11五大革新之:Texture Compression第45頁:第七章 爭論漩渦中心的Tessellation第46頁:Tessellation(曲面細分)的前世今生第47頁:Tessellation不僅僅會“細分曲面第48頁:當Tessellation遭遇“法線貼圖”第49頁:曲面細分究極奧義 動起來更精彩第50頁:當Tessellation遭遇“物理運算”第51頁:第八章:DX11核心技術:DirectCompute11第52頁:CUDA和Stream之爭的內幕第53頁:DirectCompute 10/11版本間的區(qū)別第54頁:DirectCompute11的妙用:順序無關透明第55頁:DirectCompute11的妙用:電影級景深第56頁:DirectCompute11的妙用:高清晰環(huán)境光第57頁:第九章:GF100/110圖形架構深入解析第58頁:GF100構架八倍于上代旗艦的幾何性能第59頁:GF100/110和Cayman圖形架構對比第60頁:GF100/110圖形架構:強大的多形體引擎第61頁:GF100/110圖形架構:第三代流處理器第62頁:GF100/110圖形架構:精兵簡政的紋理單元第63頁:GF100/110圖形架構:一級緩存與二級緩存第64頁:GF100/110圖形架構:光柵單元高倍抗鋸齒第65頁:第十章:適合并行計算的Fermi架構第66頁:Fermi計算架構:GPU的未來是并行計算第67頁:Fermi計算架構:高效的雙精度性能第68頁:Fermi計算架構:首次支持C++編程第69頁:Fermi計算架構:首次支持顯存ECC第70頁:Fermi計算架構:NVIDIA Nexus開發(fā)平臺第71頁:全文總結:該勝不勝與當敗不敗第72頁:附錄:追尋那些曾經的雙核卡皇第73頁:Rage Fury Maxx——曙光女神第74頁:曇花一現的挑戰(zhàn)者——XGI Volari V8/V5第75頁:不為人知的經典——雙核心9800Pro第76頁:普及雙核心——影馳雙核7600GT第77頁:GeForce 7950GX2——雙拳出擊誓奪王位第78頁:ATI雙核心——Gemini技術第79頁:雙G92核心的怒吼——GeForce 9800GX2第80頁:55nm王者——GeForce GTX 295

關注我們

泡泡網

手機掃碼關注