av免费福利片在线播放,99热精品久久只有精品,18video性欧美19sex,ysl蜜桃色www,国产精品一区二区久久国产

泡泡網(wǎng)顯卡頻道 PCPOP首頁      /      顯卡     /      評(píng)測    /    正文

決戰(zhàn)性能之巔!NV雙芯旗艦GTX590評(píng)測

10.4 統(tǒng)一尋址空間實(shí)現(xiàn)完全的C++支持

    Fermi是第一個(gè)支持新并行線程執(zhí)行(PTX)2.0指令集的體系結(jié)構(gòu)。PTX是級(jí)別較低的虛擬機(jī)和ISA,目的是為了支持并行線程處理器的運(yùn)作。在程序安裝的時(shí)候,PTX指令會(huì)被GPU驅(qū)動(dòng)轉(zhuǎn)譯成機(jī)器代碼。

    PTX的主要目標(biāo)包括:

1. 提供一個(gè)能跨越數(shù)代GPU的穩(wěn)定ISA
2. 讓經(jīng)過編譯的應(yīng)用程序充分利用GPU的性能
3. 提供一個(gè)支持 C、C++、Fortran以及其他編譯器對(duì)象并且與機(jī)器無關(guān)的ISA
4. 為應(yīng)用程序和中間件開發(fā)者提供一個(gè)代碼分發(fā)ISA
5. 為優(yōu)化映射PTX 代碼至對(duì)象機(jī)器的代碼產(chǎn)生器和轉(zhuǎn)移器提供一個(gè)一般化的ISA
6. 讓庫以及性能核心程序(performance kernel)代碼編寫更容易
7. 提供一個(gè)可以跨越GPU內(nèi)核規(guī)模(從幾個(gè)到多個(gè))的可伸縮編程模型

    PTX2.0具備許多新的特性,大大提升了GPU(圖形處理器)的可編程性、精度及性能。這些特性包括:完全的IEEE 32位浮點(diǎn)精度;所有變量和指針都有統(tǒng)一的尋址空間;64位尋址;以及針對(duì)OpenCL和DirectCompute的新指令。尤為重要的是,PTX2.0完全支持C++編程語言。

    Fermi和PTX 2.0 ISA采用統(tǒng)一的尋址空間,將存取操作的三個(gè)不同的尋址空間(線程的私有局部空間、線程塊的共用空間、全局空間)進(jìn)行了統(tǒng)一。在PTX 1.0中,存取指令都具體對(duì)應(yīng)這三個(gè)尋址空間中的一個(gè),程序就可以在一個(gè)編譯時(shí)確知的指定尋址空間中存取數(shù)值。這樣很難為C和C++指針提供完全的支持,因?yàn)橐粋€(gè)指針的目標(biāo)尋址空間在編譯時(shí)可能根本無從知曉而只有在運(yùn)行時(shí)才能動(dòng)態(tài)確定。

    PTX 2.0把三個(gè)尋址空間都統(tǒng)一為一個(gè)單獨(dú)、連續(xù)的尋址空間,因此只需一套存取指令,而不再需要三套針對(duì)不同尋址空間(局部的、共用的及全局存儲(chǔ)器)的存取指令。統(tǒng)一尋址空間為40位,可以支持1 Terabyte的可設(shè)定地址的內(nèi)存,而存取ISA支持64位以適應(yīng)未來的增長。

    采用統(tǒng)一的尋址空間讓Fermi可以真正支持C++程序。在C++中,所有的變量和函數(shù)都存在于對(duì)象中,而對(duì)象又通過指針進(jìn)行傳遞。有了PTX 2.0,就可以利用統(tǒng)一的指針傳遞任意存儲(chǔ)空間里的對(duì)象。Fermi的硬件地址轉(zhuǎn)譯單元自動(dòng)將指針參考映射到正確的存儲(chǔ)空間。

    Fermi和PTX 2.0 ISA還支持C++虛擬函數(shù)、函數(shù)指針、針對(duì)動(dòng)態(tài)對(duì)象分配、解除分配的“new”和“delete”操作以及針對(duì)異常處理的“try”和“catch” 操作。

針對(duì)OpenCL和DirectCompute的優(yōu)化

    OpenCL及DirectCompute同CUDA的編程模型有非常密切的對(duì)應(yīng)關(guān)系,CUDA里的線程、線程塊、線程塊格、障柵同步、共用存儲(chǔ)器、全局存儲(chǔ)器以及原子操作都能在OpenCL和DirectCompute中看到,可以說OpenCL和DirectCompute的整個(gè)框架就是照搬CUDA的,因此基于CUDA的Fermi天生就已經(jīng)為OpenCL和DirectCompute提供了優(yōu)化。

    此外,F(xiàn)ermi還為OpenCL和DirectCompute的表面(surface)格式轉(zhuǎn)換指令提供了硬件支持,允許圖形與計(jì)算程序能簡單地對(duì)相同的數(shù)據(jù)進(jìn)行操作。PTX 2.0 ISA還為DirectCompute提供了population count、append以及bit-reverse 指令的支持。

4人已贊
第1頁:不可思議的存在:GTX590發(fā)布第2頁:第一章:NVIDIA GTX590產(chǎn)品解析第3頁:首發(fā)產(chǎn)品:華碩GTX590第4頁:首發(fā)產(chǎn)品:索泰GTX590極速版第5頁:首發(fā)產(chǎn)品:映眾GTX590第6頁:首發(fā)產(chǎn)品:七彩虹iGame590第7頁:首發(fā)產(chǎn)品:銘瑄GTX590第8頁:首發(fā)產(chǎn)品:盈通GTX590第9頁:三大雙芯卡皇實(shí)物對(duì)比第10頁:第二章:GTX590游戲3D性能測試第11頁:DX10理論測試:《3DMark Vantage》第12頁:DX11理論測試:《3DMark 11》第13頁:Tessellation測試:《Heaven 2.1》第14頁:DX11理論測試:《石巨人》第15頁:DX11游戲測試:《塵埃2》第16頁:DX11游戲測試:《異形大戰(zhàn)鐵血戰(zhàn)士》第17頁:DX11游戲測試:《地鐵2033》第18頁:DX11游戲:《失落星球2》第19頁:DX11游戲:《H.A.W.X.2》第20頁:DX10.1游戲測試:《孤島驚魂2》第21頁:DX10游戲測試:《孤島危機(jī):彈頭》第22頁:DX10游戲測試:《沖突世界》第23頁:DX9游戲測試:《街頭霸王IV》第24頁:PhysX測試:《黑手黨II》第25頁:CUDA視頻轉(zhuǎn)碼測試第26頁:溫度、功耗、噪音全面領(lǐng)先對(duì)手第27頁:性能測試總結(jié)第28頁:第三章:NVIDIA附加圖形技術(shù)之靈活應(yīng)用第29頁:特色技術(shù)應(yīng)用:NV 3D Vison Srround第30頁:虛擬現(xiàn)實(shí)必經(jīng)之路:CUDA光線追蹤第31頁:第四章:最強(qiáng)游戲即時(shí)渲染畫面賞析第32頁:DX10基準(zhǔn):《3DMark Vantage》畫面賞析第33頁:DX11游戲:《HAWX2》畫面賞析第34頁:DX11游戲:《地鐵2033》畫面賞析第35頁:Tessellation軟件:《Heaven》 畫面賞析第36頁:Tessellation軟件:《石巨人》畫面賞析第37頁:DX11基準(zhǔn):《3DMark11》畫面賞析第38頁:第五章:令人興奮的DirectX API發(fā)展歷程第39頁:號(hào)稱實(shí)現(xiàn)“一切圖形特效”的DX9C第40頁:不應(yīng)備受冷遇的DX10第41頁:第六章:揭秘DX11技術(shù)革新第42頁:DX11五大革新之:Shader Model 5.0第43頁:DX11五大革新之:Multi-Threading第44頁:DX11五大革新之:Texture Compression第45頁:第七章 爭論漩渦中心的Tessellation第46頁:Tessellation(曲面細(xì)分)的前世今生第47頁:Tessellation不僅僅會(huì)“細(xì)分曲面第48頁:當(dāng)Tessellation遭遇“法線貼圖”第49頁:曲面細(xì)分究極奧義 動(dòng)起來更精彩第50頁:當(dāng)Tessellation遭遇“物理運(yùn)算”第51頁:第八章:DX11核心技術(shù):DirectCompute11第52頁:CUDA和Stream之爭的內(nèi)幕第53頁:DirectCompute 10/11版本間的區(qū)別第54頁:DirectCompute11的妙用:順序無關(guān)透明第55頁:DirectCompute11的妙用:電影級(jí)景深第56頁:DirectCompute11的妙用:高清晰環(huán)境光第57頁:第九章:GF100/110圖形架構(gòu)深入解析第58頁:GF100構(gòu)架八倍于上代旗艦的幾何性能第59頁:GF100/110和Cayman圖形架構(gòu)對(duì)比第60頁:GF100/110圖形架構(gòu):強(qiáng)大的多形體引擎第61頁:GF100/110圖形架構(gòu):第三代流處理器第62頁:GF100/110圖形架構(gòu):精兵簡政的紋理單元第63頁:GF100/110圖形架構(gòu):一級(jí)緩存與二級(jí)緩存第64頁:GF100/110圖形架構(gòu):光柵單元高倍抗鋸齒第65頁:第十章:適合并行計(jì)算的Fermi架構(gòu)第66頁:Fermi計(jì)算架構(gòu):GPU的未來是并行計(jì)算第67頁:Fermi計(jì)算架構(gòu):高效的雙精度性能第68頁:Fermi計(jì)算架構(gòu):首次支持C++編程第69頁:Fermi計(jì)算架構(gòu):首次支持顯存ECC第70頁:Fermi計(jì)算架構(gòu):NVIDIA Nexus開發(fā)平臺(tái)第71頁:全文總結(jié):該勝不勝與當(dāng)敗不敗第72頁:附錄:追尋那些曾經(jīng)的雙核卡皇第73頁:Rage Fury Maxx——曙光女神第74頁:曇花一現(xiàn)的挑戰(zhàn)者——XGI Volari V8/V5第75頁:不為人知的經(jīng)典——雙核心9800Pro第76頁:普及雙核心——影馳雙核7600GT第77頁:GeForce 7950GX2——雙拳出擊誓奪王位第78頁:ATI雙核心——Gemini技術(shù)第79頁:雙G92核心的怒吼——GeForce 9800GX2第80頁:55nm王者——GeForce GTX 295

關(guān)注我們

泡泡網(wǎng)

手機(jī)掃碼關(guān)注