av免费福利片在线播放,99热精品久久只有精品,18video性欧美19sex,ysl蜜桃色www,国产精品一区二区久久国产

泡泡網(wǎng)顯卡頻道 PCPOP首頁(yè)      /      顯卡     /      評(píng)測(cè)    /    正文

HD7950權(quán)威首測(cè)!鏖戰(zhàn)新舊2代4大卡皇

    看了上頁(yè)圖形引擎部分的介紹,很多人可能會(huì)失望——基本沒(méi)動(dòng)嘛,還說(shuō)什么次世代圖形核心?別著急,好戲在后頭。我們知道AMD歷代GPU的瓶頸除了曲面細(xì)分以外,其實(shí)最重要的是5D/4D VLIW架構(gòu)的效率問(wèn)題。現(xiàn)在Tahiti的GCN架構(gòu)就是要解決這個(gè)問(wèn)題,它的流處理器結(jié)構(gòu)已經(jīng)面目全非了。

    Tahiti徹底拋棄VLIW架構(gòu)

圖形與計(jì)算那些事 AMD次世代架構(gòu)解析

    通過(guò)Tahiti的整體架構(gòu)圖我們看到,傳統(tǒng)的SIMD流處理器陣列消失了,取而代之的是GCN陣列,Tahiti總計(jì)擁有2048個(gè)流處理器,這樣每個(gè)GCN陣列里面擁有64個(gè)流處理器?,F(xiàn)在來(lái)看看GCN陣列的微觀(guān)結(jié)構(gòu)。

    GCN與GF100的SM何其相似

圖形與計(jì)算那些事 AMD次世代架構(gòu)解析

Tahiti的GCN陣列微觀(guān)結(jié)構(gòu)

    GCN陣列里有4組SIMD單元,每組SIMD單元里面包括16個(gè)流處理器、或者說(shuō)是標(biāo)量運(yùn)算器。GCN架構(gòu)已經(jīng)完全拋棄了此前5D/4D流處理器VLIW超長(zhǎng)指令架構(gòu)的限制,不存在5D/4D指令打包-派發(fā)-解包的問(wèn)題,所有流處理器以16個(gè)為一組SIMD陣列完成指令調(diào)度。簡(jiǎn)單來(lái)說(shuō),以往是指令集并行,而現(xiàn)在是線(xiàn)程級(jí)并行。

GF100的SM(流處理器簇)微觀(guān)結(jié)構(gòu)

    可以這么理解,一個(gè)GCN陣列與GF100當(dāng)中的一組SM相當(dāng),GF100的一組SM當(dāng)中有4組共計(jì)32個(gè)流處理器,而Tahiti的一組GCN當(dāng)中有4組共計(jì)64個(gè)流處理器。

    緩存部分

    每個(gè)SIMD-16單元都擁有64KB向量寄存器

    每組GCN陣列擁有64KB的本地?cái)?shù)據(jù)共享緩存,還有16KB的一級(jí)緩存

    每組GCN陣列有一個(gè)標(biāo)量運(yùn)算單元,用于執(zhí)行整數(shù)指令、媒體指令和浮點(diǎn)原子操作,這個(gè)標(biāo)量運(yùn)算單元擁有自己的4KB寄存器

    而GF100的緩存設(shè)計(jì)得更加靈活,每組SM里面擁有總計(jì)64KB的共享緩存+一級(jí)緩存,這64KB緩存可以根據(jù)實(shí)際運(yùn)算量來(lái)動(dòng)態(tài)調(diào)整,如果把16KB分配給一級(jí)緩存的話(huà),那剩下的48KB就是共享緩存,反之亦然。

    一般來(lái)說(shuō),進(jìn)行圖形渲染時(shí)需要共享緩存比較多,而并行計(jì)算時(shí)則會(huì)用到更多的一級(jí)緩存。GF100這種靈活的緩存分配機(jī)制更適合做并行計(jì)算,而GCN架構(gòu)更大的共享緩存會(huì)有更好的圖形渲染性能,并行計(jì)算則會(huì)稍遜一籌。

    更多的線(xiàn)程調(diào)度

    從緩存部分的設(shè)計(jì)來(lái)看,雖然GCN擁有更大的緩存容量,但在并行計(jì)算領(lǐng)域經(jīng)營(yíng)多年的NVIDIA顯然要棋高一手。

    從線(xiàn)程級(jí)別來(lái)看,GCN與SM是不可分割的最小單元,GCN一次可以執(zhí)行64個(gè)線(xiàn)程,而SM是48個(gè)(其實(shí)就是流處理器的數(shù)量)。

    從多線(xiàn)程執(zhí)行上來(lái)看,GCN可以同時(shí)執(zhí)行4個(gè)硬件線(xiàn)程,而SM是雙線(xiàn)程調(diào)度器的設(shè)計(jì)(參見(jiàn)架構(gòu)圖)。

    如此來(lái)看,GCN架構(gòu)的多線(xiàn)程性能會(huì)更好一些。

    小結(jié):AMD GCN借鑒NVIDIA SM架構(gòu)

    在流處理器部分,終于不用費(fèi)勁的把AMD和NVIDIA GPU架構(gòu)分開(kāi)介紹了,因?yàn)镚CN與SM已經(jīng)沒(méi)有本質(zhì)區(qū)別。剩下的只是緩存容量、流處理器簇的數(shù)量、線(xiàn)程調(diào)度機(jī)制的問(wèn)題,雙方根據(jù)實(shí)際應(yīng)用自然會(huì)有不同的判斷,自家的前后兩代產(chǎn)品也會(huì)對(duì)這些數(shù)量和排列組合進(jìn)行微調(diào)。

    AMD向NVIDIA的架構(gòu)靠攏,GCN架構(gòu)改動(dòng)之大,前所未有!

0人已贊
第1頁(yè):前言:AMD“南方群島”二哥閃耀登場(chǎng)第2頁(yè):HD7950之規(guī)格:刪減得很有“誠(chéng)意”第3頁(yè):HD7950之架構(gòu):GCN次世代圖形核心解析第4頁(yè):HD7950之核心:流處理器完全重新設(shè)計(jì)第5頁(yè):HD7950之緩存:Tahiti和GF100異曲同工第6頁(yè):HD7950之功能:支持PCI-E 3.0第7頁(yè):HD7950之功能:再度領(lǐng)跑DirectX 11.1第8頁(yè):HD7000全家福:南方群島全系列發(fā)售前瞻第9頁(yè):HD7950之應(yīng)用:音頻/視頻/多屏/計(jì)算第10頁(yè):HD7900之演示:完美光影演繹Demo第11頁(yè):首測(cè)顯卡曝光:訊景HD7950第12頁(yè):首測(cè)顯卡曝光:迪蘭HD7950酷能+第13頁(yè):首測(cè)顯卡曝光:鐳風(fēng)7950毒蜥版第14頁(yè):首測(cè)顯卡曝光:藍(lán)寶 HD7950白金版第15頁(yè):首測(cè)顯卡曝光:藍(lán)寶HD7950至尊版第16頁(yè):首測(cè)顯卡曝光:微星R7950第17頁(yè):參測(cè)顯卡首曝:HIS 7950 Fan第18頁(yè):六核3960X客串:HD7950鏖戰(zhàn)眾卡皇第19頁(yè):DX10基準(zhǔn)測(cè)試:《3DMark Vantage》第20頁(yè):DX10游戲性能測(cè)試:《孤島危機(jī)》第21頁(yè):DX10.1游戲測(cè)試:《孤島驚魂2》第22頁(yè):DX11基準(zhǔn)測(cè)試:《3DMark11》第23頁(yè):DX11游戲性能測(cè)試:《塵埃3》第24頁(yè):DX11游戲性能測(cè)試:《戰(zhàn)地3》第25頁(yè):DX11游戲性能測(cè)試:《AVP》第26頁(yè):DX11游戲性能測(cè)試:《地鐵 2033》第27頁(yè):DX11游戲性能測(cè)試:《孤島危機(jī)2》第28頁(yè):曲面細(xì)分專(zhuān)項(xiàng)測(cè)試:《石巨人》第29頁(yè):曲面細(xì)分專(zhuān)項(xiàng)測(cè)試:《Heaven 2.5》第30頁(yè):PhysX特效專(zhuān)項(xiàng)測(cè)試:《BatmanAC》第31頁(yè):通用計(jì)算:紋理壓縮/光線(xiàn)追蹤第32頁(yè):通用計(jì)算:流體模擬/蒙特卡羅算法第33頁(yè):附加測(cè)試:AES加解密/像素紋理填充第34頁(yè):附加測(cè)試:HD7950功耗最低3W第35頁(yè):成績(jī)匯總:HD7950 PK GTX580第36頁(yè):成績(jī)匯總:HD7950 PK HD6970第37頁(yè):成績(jī)匯總:HD7950 PK HD6990第38頁(yè):成績(jī)匯總:HD7950 PK HD7970第39頁(yè):成績(jī)匯總:HD7950 超頻效能測(cè)試第40頁(yè):總結(jié):架構(gòu)、效能與應(yīng)用的全面勝利第41頁(yè):展望:南方群島向NVIDIA發(fā)出強(qiáng)有力的挑戰(zhàn)

關(guān)注我們

泡泡網(wǎng)

手機(jī)掃碼關(guān)注