久久久久久久视色,久久电影免费精品,中文亚洲欧美乱码在线观看,在线免费播放AV片

<center id="vfaef"><input id="vfaef"><table id="vfaef"></table></input></center>

    <p id="vfaef"><kbd id="vfaef"></kbd></p>

    
    
    <pre id="vfaef"><u id="vfaef"></u></pre>

      <thead id="vfaef"><input id="vfaef"></input></thead>

    1. 站長(zhǎng)資訊網(wǎng)
      最全最豐富的資訊網(wǎng)站

      NVIDIA RTX 30系列架構(gòu)詳解:8nm安培GPU的兩倍性能從何而來(lái)?

      在當(dāng)前的顯卡市場(chǎng)上,占據(jù)80%的NVIDIA公司被玩家愛(ài)且恨著——他們帶來(lái)了最近十多年來(lái)最好的顯卡,同時(shí)也讓高端游戲卡的價(jià)格高企,發(fā)燒顯卡至少五位數(shù)起。

      在RTX 30系列顯卡發(fā)布之后,玩家的不滿似乎釋然了,相比當(dāng)前的圖靈顯卡,安培架構(gòu)的RTX 3090/3080/3070顯卡一下子變得真香了,因?yàn)樗鼈冃阅芊恫徽f(shuō),國(guó)內(nèi)價(jià)格反而下降了。

      NVIDIA RTX 30系列架構(gòu)詳解:8nm安培GPU的兩倍性能從何而來(lái)?

      ·GeForce RTX 3090:取代RTX Titan,相比于Titan RTX快了50%,性能是RTX 2080 Ti顯卡的2倍,配備24GB GDDR6X顯存,售價(jià)11999元,9月24日上市。

      ·GeForce RTX 3080:取代RTX 2080 Ti,相比于RTX 2080性能快2倍,搭配10GB GDDR6X顯存,海外699美元沒(méi)變,國(guó)內(nèi)從上代6499降至5499元,9月17日上市。

      ·GeForce RTX 3070:價(jià)格不到RTX 2080 Ti的一半,但是平均性能更高,同時(shí)比RTX 2070快足足60%,配備8GB GDDR6顯存,售價(jià)3899元,10月份上市。

      NVIDIA RTX 30系列架構(gòu)詳解:8nm安培GPU的兩倍性能從何而來(lái)?
      RTX 30系列顯卡售價(jià)及上市時(shí)間

      NVIDIA RTX 30系列架構(gòu)詳解:8nm安培GPU的兩倍性能從何而來(lái)?
      RTX 30系列顯卡性能變化

      NVIDIA RTX 30系列架構(gòu)詳解:8nm安培GPU的兩倍性能從何而來(lái)?
      RTX 30系列顯卡規(guī)格

      從這個(gè)規(guī)格表中可以看出,與RTX 2080 Ti顯卡相比,RTX 3090的標(biāo)志性FP32性能從13.4T提升到了35.7T,翻倍還多,光追及AI加速提升也同樣明顯。

      與圖靈顯卡相比,安培GPU的變化之大讓人驚訝,在過(guò)去十多年的顯卡升級(jí)換代中,性能翻倍的提升很少見到了,NVIDA是怎么做到的?

      今天我們就來(lái)從詳細(xì)解讀一下安培GPU的架構(gòu),探究它到底帶來(lái)了哪些技術(shù)升級(jí)以致于讓NVIDIA創(chuàng)始人黃仁勛稱之為有史以來(lái)性能提升最大的一次。

      先從工藝說(shuō)起:12nm干掉7nm之后 8nm如何再進(jìn)一步

      對(duì)于半導(dǎo)體芯片來(lái)說(shuō),很關(guān)鍵的一部分是制程工藝,先進(jìn)的架構(gòu)也要通過(guò)工藝來(lái)實(shí)現(xiàn),這是影響芯片能效、性能甚至成本的一大因素。

      對(duì)NVIDIA來(lái)說(shuō),他們的Volta伏特、Turing圖靈兩代架構(gòu)都是臺(tái)積電12nm FFN工藝了,這是臺(tái)積電16nm工藝的改進(jìn)版,如果再算上16nm的Pascal架構(gòu),實(shí)際上過(guò)去三代GPU都沒(méi)有重大工藝上的升級(jí)了。

      在Ampere安培架構(gòu)上,NVIDIA終于升級(jí)工藝了,只不過(guò)這次有兩個(gè)意外——首先沒(méi)有選擇臺(tái)積電,其次沒(méi)有上7nm,而是三星定制的8nm工藝,雖然跟7nm看起來(lái)只差了1nm,但實(shí)際上是兩代工藝。

      考慮到NVIDIA之前對(duì)工藝的表態(tài),沒(méi)用7nm工藝而是三星8nm工藝又在意料之中,最關(guān)鍵的問(wèn)題在于NVIDIA能夠做到多好。

      NVIDIA RTX 30系列架構(gòu)詳解:8nm安培GPU的兩倍性能從何而來(lái)?

      三星的8nm工藝是基于10nm工藝改良的,至少有LPP和LPU兩個(gè)版本,前者適合移動(dòng)SoC,后者適合高性能芯片,NVIDIA的定制大概是基于后者。

      與臺(tái)積電的7nm工藝晶體管密度大約1億/mm2相比,8nm工藝大概是6000萬(wàn)晶體管/mm2,但這是單一的SRAM芯片的對(duì)比,實(shí)際上GPU芯片比較復(fù)雜,差距會(huì)縮小很多。

      根據(jù)是NVIDIA公布的信息,臺(tái)積電7nm工藝制造的安培A100核心是540億晶體管,核心面積826mm2,而三星8nm工藝制造的GA102核心是280億晶體管,核心面積官方?jīng)]公布,據(jù)悉是628mm2,也是大核心了。

      這么算下來(lái),7nm A100核心的晶體管密度6560萬(wàn)晶體管/mm2,而三星8nm的GA102核心也有4460萬(wàn)晶體管/mm2——差距仍在,但似乎可以接受了。

      三星8nm工藝的晶圓代工價(jià)格還是秘密,但是不論技術(shù)還是商業(yè)策略上,三星都會(huì)比臺(tái)積電便宜很多,預(yù)計(jì)代工價(jià)格能差30%或者更高,所以這也是RTX 30系列顯卡能夠不漲價(jià)甚至降價(jià)的關(guān)鍵。

      NVIDIA RTX 30系列架構(gòu)詳解:8nm安培GPU的兩倍性能從何而來(lái)?

      那三星8nm工藝帶來(lái)了多大的性能及能效提升呢?首先大家可以看到RTX 30系列顯卡的頻率提升了,從RTX 20系列的1.5GHz+提升到了1.7GHz+,升級(jí)工藝還是有性能提升的。

      不過(guò)RTX 20系列的加速頻率實(shí)際可以達(dá)到1.9GHz甚至接近2GHz,RTX 30系列預(yù)計(jì)也就這個(gè)水平。

      但是能效還是有提升的,NVIDIA官方稱在60fps性能下,圖靈顯卡的功耗大約有240W,安培顯卡則是120W多點(diǎn),算下來(lái)是1.9倍能效,提升了90%,同時(shí)溫度還低了3度,噪音減少2分貝。

      總的來(lái)說(shuō),在工藝這方面大家對(duì)安培GPU有驚喜有失望,失望的是沒(méi)有上預(yù)期中的7nm工藝(不管臺(tái)積電還是三星),工藝依然升級(jí)到了8nm。

      但是NVIDIA工藝雖然并不算激進(jìn),但性能、能效進(jìn)步還是挺大的,安培顯卡各方面指標(biāo)都是大幅勝過(guò)現(xiàn)在的圖靈卡,而且價(jià)格做到了不升反降,這也是不追求激進(jìn)工藝的好處,反正之前12nm都能贏,現(xiàn)在上8nm更加穩(wěn)妥了。

      安培GPU架構(gòu)詳解之:FP32單元翻倍 CUDA核心改了什么?

      發(fā)布安培的時(shí)候,NVIDIA CEO黃仁勛表示這是GPU有史以來(lái)最大的性能飛躍,而2018年推出圖靈GPU時(shí),老黃也是類似的說(shuō)詞——GPU有史以來(lái)最大的變革,這兩個(gè)評(píng)價(jià)其實(shí)也沒(méi)錯(cuò)。

      圖靈GPU架構(gòu)有很多第一次,首次支持RTX Core(光追加速單元),首次支持Tensor Core,同時(shí)還改進(jìn)了CUDA內(nèi)核,不過(guò)前兩個(gè)是重點(diǎn)。

      NVIDIA RTX 30系列架構(gòu)詳解:8nm安培GPU的兩倍性能從何而來(lái)?

      在安培GPU上,RT Core、Tensor Core當(dāng)然繼續(xù)加強(qiáng),不過(guò)最主要的亮點(diǎn)是CUDA架構(gòu)的改進(jìn),性能翻倍的根源就在這里,我們先來(lái)看看這方面的變化。

      NVIDIA RTX 30系列架構(gòu)詳解:8nm安培GPU的兩倍性能從何而來(lái)?

      NVIDIA RTX 30系列架構(gòu)詳解:8nm安培GPU的兩倍性能從何而來(lái)?
      GA102核心架構(gòu)示意圖

      GA102核心總計(jì)7組GPC單元,每組有12組SM單元,總計(jì)84組,RTX 30系列顯卡視乎規(guī)格不同啟用的SM單元總數(shù)不同,RTX 3090是82組,RTX 3080是68組,RTX 3070是46組。

      NVIDIA RTX 30系列架構(gòu)詳解:8nm安培GPU的兩倍性能從何而來(lái)?

      在之前的GA100大核心中,每組SM是64個(gè)INT32單元、64個(gè)FP32單元及32個(gè)FP64單元組成的,但在GA102核心中,F(xiàn)P64單元大幅減少,增加了RT Core,Tensor Core也略微減少。

      NVIDIA RTX 30系列架構(gòu)詳解:8nm安培GPU的兩倍性能從何而來(lái)?
      GA102核心的SM單元

      按照之前圖靈GPU的路線走,安培GPU的SM單元增加的并不多,但實(shí)際上FP32性能翻倍了還多,算上頻率,RTX 3080的理論性能差不多是RTX 2080的三倍了,這是怎么做到的?

      答案就是CUDA核心的FP32翻倍,但翻倍的方式有點(diǎn)特殊,每個(gè)SM單元中有4個(gè)分區(qū),每個(gè)分區(qū)除了第三代Tensor Core核心之外,還有一組是16個(gè)FP32單元及16個(gè)FP32、16個(gè)IN32組成的單元,后者可以同時(shí)執(zhí)行FP32或者INT32運(yùn)算。

      16個(gè)FP32單元每周期可執(zhí)行16個(gè)FP32運(yùn)算,混合的那個(gè)單元可以執(zhí)行32個(gè)FP32或者16個(gè)FP32+16個(gè)INT32。

      如此一來(lái),每個(gè)SM單元可以同時(shí)執(zhí)行4x(16FP32+16FP32)=128個(gè)FP32運(yùn)算,或者4x(16FP32+16INT32)=64個(gè)FP32+64個(gè)INT32運(yùn)算。

      只算FP32浮點(diǎn)的話,那么就是浮點(diǎn)翻倍了,因?yàn)閳D靈以及GA100都是每周期64個(gè)FP32浮點(diǎn)而已,現(xiàn)在可以做128個(gè)FP32運(yùn)算了。

      NVIDIA RTX 30系列架構(gòu)詳解:8nm安培GPU的兩倍性能從何而來(lái)?

      提升FP32性能不論對(duì)游戲還是運(yùn)算都大有裨益,但也需要配套的提升,GA102的L1容量提升了33%,L1帶寬從116GB/s翻倍到219GB/s,共享內(nèi)存的性能也從每周期64B翻倍到128B。

      NVIDIA RTX 30系列架構(gòu)詳解:8nm安培GPU的兩倍性能從何而來(lái)?

      安培GPU架構(gòu)詳解之:RTX光追升級(jí) 從能用到好用

      上代的圖靈GPU架構(gòu)最大的亮點(diǎn)就是引入了RTX實(shí)時(shí)光追技術(shù),開啟了3D游戲的光追時(shí)代,意義重大。

      但是先行者的代價(jià)也不小,而且圖靈GPU的光追效果在實(shí)際游戲中并不明顯,對(duì)性能的影響頗大,第一代RTX光追只能說(shuō)解決了有無(wú)問(wèn)題,現(xiàn)在的安培GPU才是RTX光追更好用。

      NVIDIA RTX 30系列架構(gòu)詳解:8nm安培GPU的兩倍性能從何而來(lái)?

      在圖靈GPU上,NVIDIA使用的第一代RT Core可以提供10Giga Rays/s的性能,而在安培GPU上,RT Core升級(jí)到了第二代,號(hào)稱性能翻倍,僅此一點(diǎn)就可以大幅提升光追性能了。

      NVIDIA RTX 30系列架構(gòu)詳解:8nm安培GPU的兩倍性能從何而來(lái)?
      圖靈GPU光追架構(gòu)

      NVIDIA RTX 30系列架構(gòu)詳解:8nm安培GPU的兩倍性能從何而來(lái)?
      安培GPU光追

      不過(guò)這還不夠,在安培GPU上,參與光追應(yīng)用加速的不只是SM單元、RT單元了,第三代Tensor Core單元也更多的參與其中,而安培架構(gòu)中SM、RT、Tensor單元的性能都是大幅提升的,以RTX 3080為例,SM單元性能11T提升到了30T,RT性能從上代34T提升到了58T,Tensor性能從89暴漲到238T.

      NVIDIA RTX 30系列架構(gòu)詳解:8nm安培GPU的兩倍性能從何而來(lái)?

      這帶來(lái)的一個(gè)結(jié)果就是光追性能大幅提升,不支持硬件加速的Pascal GPU渲染一幀要51ms,圖靈可以提升到19ms,加上DLSS等可以縮短到13ms,已經(jīng)大大低于60fps所需的16.6ms幀時(shí)間了。

      NVIDIA RTX 30系列架構(gòu)詳解:8nm安培GPU的兩倍性能從何而來(lái)?

      在安培GPU上,時(shí)間還可以更快,單純硬件加速就可以從13ms縮短到7.5ms,加上第二代技術(shù)的加成就只有6.7ms了。

      NVIDIA RTX 30系列架構(gòu)詳解:8nm安培GPU的兩倍性能從何而來(lái)?

      總之,在RT光追性能上,不說(shuō)沒(méi)有硬件加速的Pascal顯卡,對(duì)比RTX 2080到RTX 3080的變化,軟件渲染的性能提升了40%,硬件加速的話提升70%,硬件加速+DLSS也提升了70%,再加上其他技術(shù)的輔助,最高可以提升90%的光追性能。

      目前還沒(méi)有實(shí)際評(píng)測(cè)解禁,具體游戲中的提升還不好說(shuō),但是刨去官方測(cè)試的理想狀態(tài),光追性能提升個(gè)50%應(yīng)該無(wú)壓力,這足以讓當(dāng)前的光追游戲更具實(shí)用性,不再是開了RTX性能就大幅下降的情況了。

      至于我們可以預(yù)期,以前1080p 30fps運(yùn)行的光追游戲在今年可以實(shí)現(xiàn)1080p 60或者2K 144流暢運(yùn)行了,可用性至少提高一個(gè)等級(jí),從湊合能用變得更好用了。

      安培GPU架構(gòu)詳解之:第三代Tensor Core、8K游戲成為可能

      Tensor Core是伏特GPU引入的一種新核心,現(xiàn)在也是SM單元的三大子核心之一,不過(guò)在數(shù)據(jù)中心GPU上,AI加速功能非常重要,所以A100大核心的Tensor Core占據(jù)了相當(dāng)大的面積,功能及性能都改進(jìn)不少。

      NVIDIA RTX 30系列架構(gòu)詳解:8nm安培GPU的兩倍性能從何而來(lái)?

      在GA102核心中,Tensor Core也是第三代架構(gòu)的,但是跟GA100核心的還是有所不同,每組SM單元也是4個(gè)Tensor Core,但是性能減半。

      但在游戲GPU上,Tensor Core的意義沒(méi)那么大了,NVIDIA官方的應(yīng)用中DLSS算是發(fā)揮AI加速比較好的,可以進(jìn)一步提升游戲性能,這一次雖然還是DLSS 2.0,但是配合RTX 3090顯卡強(qiáng)大的性能,8K DLSS游戲成為可能。

      NVIDIA RTX 30系列架構(gòu)詳解:8nm安培GPU的兩倍性能從何而來(lái)?

      8K游戲的分辨率是4K的4倍了,是1080p的16倍,光是高分辨率帶來(lái)的挑戰(zhàn)就足以讓當(dāng)前的高端硬件吃不消了,但在DLSS的加持下,RTX 3090在多款主流游戲中可以實(shí)現(xiàn)60fps以上的性能,最高可以超過(guò)100fps,可玩性已經(jīng)不是問(wèn)題。

      這大概就是Tensor Core對(duì)游戲的重要意義,不過(guò)我們得說(shuō)8K現(xiàn)在還比較遙遠(yuǎn),性能跟上了硬件設(shè)備也跟不上,現(xiàn)在能玩好4K就差不多了。

      安培GPU架構(gòu)詳解之:升級(jí)GDDR6X顯存 帶寬堪比HBM2

      除了GPU本體之外,顯存技術(shù)這一代也升級(jí)了,上代的圖靈GPU首發(fā)了GDDR6顯存,這一次NVIDIA又迅速商業(yè)化了GDDR6X顯存,其中RTX 3090不僅頻率飆上了19.5Gbps,還達(dá)到了24GB超大容量。

      NVIDIA RTX 30系列架構(gòu)詳解:8nm安培GPU的兩倍性能從何而來(lái)?

      GDDR6X基于目前的GDDR6升級(jí)而來(lái),基本架構(gòu)和技術(shù)保持不變,重點(diǎn)加入了PAM4信令機(jī)制,在處理器和內(nèi)存之間,使用四檔電壓,每個(gè)周期內(nèi)編碼和傳輸兩個(gè)比特位。

      對(duì)于PAM4機(jī)制,大家可以理解為閃存從SLC到MLC的升級(jí),每周期傳輸?shù)臄?shù)據(jù)量可以翻倍,因此實(shí)現(xiàn)了超高速率的等效頻率,起步就可以做到21Gbps,NVIDIA目前使用的略微保守,RTX 3090是19.2Gbps,RTX 3080是18Gbps。

      NVIDIA RTX 30系列架構(gòu)詳解:8nm安培GPU的兩倍性能從何而來(lái)?

      使用GDDR6X顯存之后,在等效帶寬提升50%的情況下,能效也提升了,每bit功耗降低了15%。

      但是想象一下,如今GDD6X就可以實(shí)現(xiàn)HBM2顯存的1TB/s帶寬,但又不需要后者那么復(fù)雜的工藝和成本,在消費(fèi)級(jí)顯卡上真的可以不需要考慮HBM2了。

      NVIDIA RTX 30系列架構(gòu)詳解:8nm安培GPU的兩倍性能從何而來(lái)?

      安培GPU架構(gòu)詳解之:視頻解碼、接口、PCIe 4.0

      在安培GPU上,還有一些其他技術(shù)升級(jí),這里簡(jiǎn)單說(shuō)一下吧:

      ·AV1視頻解碼升級(jí) 支持8K

      NVIDIA RTX 30系列架構(gòu)詳解:8nm安培GPU的兩倍性能從何而來(lái)?

      8K是NVIDIA這次升級(jí)的一個(gè)重要,除了游戲性能可以支持8K之外,接口及解碼上也做了準(zhǔn)備。

      首先,安培GPU更新的NVDEC首次實(shí)現(xiàn)了AV1的8K 60p解碼支持,這個(gè)編碼比H264能夠節(jié)省大量帶寬,但CPU軟解的話,9900K這樣的CPU占用率也要達(dá)到85%,而安培GPU的NVDEC硬解占有率只有4%,同時(shí)幀速能從28fps達(dá)到60fps,流暢度也提升了。

      ·首發(fā)HDMI 2.1接口、8K輸出

      NVIDIA RTX 30系列架構(gòu)詳解:8nm安培GPU的兩倍性能從何而來(lái)?

      輸出接口方面,除了3個(gè)DP1.4a接口之外,這次首發(fā)了HDMI 2.1接口,支持4屏輸出,48Gbps的新接口可以實(shí)現(xiàn)8K 60Hz HDR支持,適合搭配新一代顯示器。

      ·支持PCIe 4.0 不用擔(dān)心性能損失

      RTX 30系列顯卡還支持了PCIe 4.0,這也是大勢(shì)所趨了,不過(guò)PCIe 4.0的問(wèn)題在于只有AMD的X570平臺(tái)才能完整支持,Intel的桌面平臺(tái)還沒(méi)支持的,有些尷尬。

      玩家可以考慮搭配AMD的銳龍平臺(tái),但也不必為了PCIe 4.0強(qiáng)行搭配,NVIDIA表示PCIe 4.0降回PCIe 3.0對(duì)性能影響有限,只有幾個(gè)百分點(diǎn),還不如CPU的影響大,言外之意就是該用酷睿i9-9900K或者酷睿i9-10900K的繼續(xù)。

      游戲工具升級(jí):Reflex、Broadcast、Omniverse Machinima

      這幾年中NVIDIA在顯卡市場(chǎng)份額不斷提升,不僅僅跟顯卡的性能、功耗有關(guān),他們?cè)谲浖绑w驗(yàn)上也著墨不少,GFE中集成了多個(gè)備受游戲玩家歡迎的工具,比如Ansel、Highlights等等。

      在安培顯卡上,NVIDIA這次又帶來(lái)了三項(xiàng)新功能,包括降低延遲的NVIDIA Reflex、AI加速的直播NVIDIA Broadcast以及NVIDIA Omniverse Machinima。

      ·NVIDIA Reflex:延遲再降50%

      游戲玩家,特別是網(wǎng)絡(luò)游戲?qū)ρ舆t很敏感,這個(gè)延遲不僅僅跟網(wǎng)絡(luò)、顯卡性能有關(guān),還跟系統(tǒng)有關(guān),包括鍵鼠的輸入延遲等。

      NVIDIA RTX 30系列架構(gòu)詳解:8nm安培GPU的兩倍性能從何而來(lái)?

      NVIDIA Reflex就是一款可以降低延遲的工具,在支持該技術(shù)的游戲中,如《Apex英雄》、《使命召喚:戰(zhàn)區(qū)》、《堡壘之夜》、《VALORANT》等熱門電競(jìng)游戲,可將延遲降低50%。

      NVIDIA RTX 30系列架構(gòu)詳解:8nm安培GPU的兩倍性能從何而來(lái)?

      此外,NVIDIA Reflex未來(lái)還會(huì)有個(gè)Reflex延遲分析器(Reflex Latency Analyzer),它可監(jiān)測(cè)鼠標(biāo)點(diǎn)擊,并測(cè)量屏幕上相應(yīng)像素變化所需的時(shí)間,比如槍焰閃光,效果堪比超過(guò)7000美元的專用高速攝像機(jī)和設(shè)備。

      ·NVIDIA Broadcast:游戲主播的好幫手

      如今游戲跟直播息息相關(guān),NVIDIA Broadcast軟件可以讓游戲主播更加輕松省力,它通過(guò)顯卡的AI加速實(shí)現(xiàn)了多種功能,比如噪音消除、虛擬背景、自動(dòng)框顯,從而提升麥克風(fēng)和網(wǎng)絡(luò)攝像頭的效果。

      NVIDIA RTX 30系列架構(gòu)詳解:8nm安培GPU的兩倍性能從何而來(lái)?

      ·NVIDIA Omniverse Machinima:自己拍大片

      Omniverse Machinima一款引擎電影工具,它可以讓玩家利用游戲中的資源自己拍電影,精確地模擬光線、實(shí)物、材料和人工智能,并且可以適用于大部分第三方設(shè)計(jì)工具,如3DS、Max、Maya、Photoshop、Epic Unreal和Rhino等,最終使用RTX系列顯卡渲染出電影級(jí)的效果。它也是游戲開發(fā)商制作游戲CG的利器,顯著簡(jiǎn)化制作游戲過(guò)場(chǎng)動(dòng)畫的流程。

      NVIDIA RTX 30系列架構(gòu)詳解:8nm安培GPU的兩倍性能從何而來(lái)?

      One More Thing:RTX IO或許是下一個(gè)規(guī)則改變者

      有關(guān)NVIDIA的安培GPU架構(gòu)及技術(shù)上的介紹差不多了,不過(guò)最后這一點(diǎn)留給一個(gè)看似不起眼但有可能改變游戲體驗(yàn)的新技術(shù)——RTX IO,它可以讓SSD硬盤實(shí)現(xiàn)游戲近乎實(shí)時(shí)加載的體驗(yàn)。

      NVIDIA RTX 30系列架構(gòu)詳解:8nm安培GPU的兩倍性能從何而來(lái)?

      SSD硬盤現(xiàn)在差不多普及了,它超快的性能也讓游戲玩家受益不少,游戲加載速度大幅提升,不過(guò)這還沒(méi)到頭,隨著游戲容量越來(lái)大,數(shù)據(jù)讀取越來(lái)越頻繁,SSD的性能并不能完美發(fā)揮出來(lái)。

      NVIDIA RTX 30系列架構(gòu)詳解:8nm安培GPU的兩倍性能從何而來(lái)?

      導(dǎo)致這一問(wèn)題的根源就在于傳統(tǒng)的IO設(shè)計(jì),經(jīng)過(guò)壓縮的游戲數(shù)據(jù)需要經(jīng)過(guò)硬盤、主控、PCIe、CPU、GPU及各自的內(nèi)存系統(tǒng),過(guò)程比較繁瑣,存在瓶頸可能。

      NVIDIA RTX 30系列架構(gòu)詳解:8nm安培GPU的兩倍性能從何而來(lái)?

      有了RTX IO之后,游戲數(shù)據(jù)就不需要經(jīng)過(guò)CPU和內(nèi)存了,直接讓GPU讀取,并且支持無(wú)損解壓縮,使得CPU占用率低了20倍,吞吐量提升了100倍。

      NVIDIA RTX 30系列架構(gòu)詳解:8nm安培GPU的兩倍性能從何而來(lái)?

      最終帶來(lái)的好處就是游戲加載速度大幅提升,如上圖所示,不說(shuō)HD硬盤的38秒加載時(shí)間,PCIe 4.0硬盤加速也要5秒,但RTX IO技術(shù)只要1.5秒即可。

      1秒多的時(shí)間在感覺(jué)上差不多就是實(shí)時(shí)加載了,一眨眼的功夫就完成了切換,游戲中地圖或者場(chǎng)景切換極為迅捷。

      NVIDIA的RTX IO技術(shù)其實(shí)跟新一代主機(jī)中的技術(shù)差不多,但支持更多的壓縮格式,同時(shí)在解壓縮上也更有效率。它也支持微軟的DirectStorage,后者預(yù)計(jì)也會(huì)在2021年登陸Windows 10平臺(tái),讓主機(jī)及PC都能享受到這一技術(shù)。

      贊(0)
      分享到: 更多 (0)
      網(wǎng)站地圖   滬ICP備18035694號(hào)-2    滬公網(wǎng)安備31011702889846號(hào)