科技改變生活 · 科技引領(lǐng)未來(lái)
NVIDIA在CES2022大展上,公開(kāi)了新款卡皇GeForceRTX3090Ti。其擁有10752個(gè)流處理器,基本頻率為1560MHz,加速頻率為1860MHz,配有24GB的GDDR6X顯存,速率達(dá)到21Gbps,加上384位的顯存位寬
NVIDIA在CES 2022大展上,公開(kāi)了新款卡皇GeForce RTX 3090 Ti。其擁有10752個(gè)流處理器,基本頻率為1560 MHz,加速頻率為1860 MHz,配有24GB的GDDR6X顯存,速率達(dá)到21 Gbps,加上384位的顯存位寬,理論顯存帶寬超過(guò)了1 TB/s,這將是GeForce顯卡歷史上首次跨過(guò)1 TB/s的帶寬。

NVIDIA表示,GeForce RTX 3090 Ti單精度浮點(diǎn)性能為40T FLOPS,達(dá)到了目前Ampere架構(gòu)顯卡的最高水平。其TDP提高到450W,同時(shí)也是第一款采用新型PCIe 5.0外接供電接口的顯卡。不過(guò),GeForce RTX 3090 Ti的身上其實(shí)還有些有趣的事情,接下來(lái)我們扒開(kāi)它看一下。
完全體的GA102核心現(xiàn)身
完全體的GA102核心這次終于來(lái)了,它仍然沿用了從NVIDIA Pascal架構(gòu)開(kāi)始定下的GPC-TPC-SM層級(jí)架構(gòu),完全體的GA102核心一共具有7組完整的GPC,每組GPC包含6組TPC,每組TPC包含2組SM,所以完整的GA102核心擁有84個(gè)SM單元。
而且在Ampere架構(gòu)中,每個(gè)SM單元擁有的CUDA核心數(shù)現(xiàn)在為128個(gè),這就使得GeForce RTX 3090 Ti一共擁有10752個(gè)流處理器的超大規(guī)模。但是,與之前的GeForce RTX 3090相比,GeForce RTX 3090 Ti主要只是多了些流處理器嗎?并不是這樣。
我們先來(lái)看一下GeForce RTX 3090 Ti與TITAN RTX、GeForce RTX 3090和GeForce RTX 3080 Ti規(guī)格參數(shù)對(duì)比:
從定位上來(lái)說(shuō),GeForce RTX 3090 Ti以及GeForce RTX 3090都是上代TITAN RTX的繼任者,上一代TITAN RTX的定位是面向AI和數(shù)據(jù)科學(xué)的解決方案,不過(guò)從目前這一代來(lái)看,TITAN這個(gè)系列似乎是被砍掉了,于是GeForce RTX 3090 Ti以及GeForce RTX 3090被錄入了GeForce陣容,但是他們的目標(biāo)群體很明確——面向8K游戲玩家及重度創(chuàng)作者,而這兩者之中,其實(shí)更加偏向于重度創(chuàng)作者用戶。
帶糾錯(cuò)碼(ECC)的24GB GDDR6X顯存
如果說(shuō)GeForce RTX 3090定位是生產(chǎn)力工具的一個(gè)鮮明的特點(diǎn)是24GB大容量的GDDR6X顯存的話,那么GeForce RTX 3090 Ti在這上又漸進(jìn)了一步,那就是其顯存配置不僅容量大,而且支持ECC糾錯(cuò)碼了,這是筆者個(gè)人認(rèn)為GeForce RTX 3090 Ti相比GeForce RTX 3090區(qū)別最大的兩個(gè)地方之一。同時(shí)這也讓GeForce RTX 3090 Ti看著很像設(shè)計(jì)與可視化解決方案領(lǐng)域的專業(yè)卡——RTX A6000。
但是GeForce RTX 3090 Ti與RTX A6000各有長(zhǎng)處,RTX A6000的典型特點(diǎn)是可以配備最高達(dá)48GB的顯存容量,但是GeForce RTX 3090 Ti的特點(diǎn)是配備了比RTX A6000更快的顯存——GDDR6X。相對(duì)來(lái)說(shuō),設(shè)計(jì)與可視化生產(chǎn)流程更加偏重于需求大容量,而游戲需要低延遲,所以對(duì)顯存速度也有要求,越快越好,當(dāng)然,游戲的分辨率以及貼圖質(zhì)量也影響著顯存容量的需求。
所以這里我們可以看到一個(gè)GeForce RTX 3090 Ti一個(gè)無(wú)出其右的點(diǎn)——那就是它的顯存特點(diǎn)綜合了GDDR6X的“快”、24GB的“大”容量以及支持ECC糾錯(cuò)碼的“穩(wěn)”,可以說(shuō)是一個(gè)沒(méi)有短板的多面手。
驅(qū)動(dòng)的控制面板中有顯存的ECC開(kāi)關(guān),默認(rèn)是關(guān)閉的,對(duì)于創(chuàng)作軟件來(lái)說(shuō)開(kāi)ECC會(huì)增加穩(wěn)定性,而對(duì)于游戲用戶來(lái)說(shuō),就不用打開(kāi)了,由于多了一步糾錯(cuò)碼計(jì)算,會(huì)稍微影響性能,默認(rèn)不動(dòng)就好。
頻率提升巨大
上面說(shuō)顯存支持ECC糾錯(cuò)碼是筆者個(gè)人認(rèn)為GeForce RTX 3090 Ti相比GeForce RTX 3090區(qū)別最大的兩個(gè)地方之一,而第二個(gè)地方并不是更多的流處理器,而是頻率。
對(duì)于GeForce RTX 3090的GA102-300和GeForce RTX 3090 Ti的GA102-350這樣的大核心來(lái)說(shuō),同時(shí)擁有高頻是比較難的,因?yàn)榧词箍梢愿哳l,它也會(huì)面臨功耗和發(fā)熱的難題,畢竟隨著頻率的提升,功耗與發(fā)熱是以超越線性的比例提升的,這也是為什么我們看到每一代的旗艦卡往往頻率并不是同架構(gòu)中最高的。
而這次的GeForce RTX 3090 Ti確實(shí)令人驚訝,它的Boost頻率達(dá)到了1860MHz,相比GeForce RTX 3090的1695MHz提高了大約10%,相比較而言,流處理器單元只不過(guò)提高了不到3%而已。
顯存帶寬終于越過(guò)1 TB/s大關(guān)
在GeForce RTX 3090身上,顯存帶寬已經(jīng)來(lái)到了936 GB/s,距離1 TB/s大關(guān)只差臨門(mén)一腳了,這最后一腳由誰(shuí)來(lái)實(shí)現(xiàn)呢?當(dāng)然是NVIDIA自己,于是這一次于猛獸盡頭更進(jìn)一步的GeForce RTX 3090 Ti終于實(shí)現(xiàn)了超越1 TB/s的顯存帶寬,達(dá)到了1008 GB/s,這是GeForce顯卡歷史上第一次跨過(guò)1 TB/s的帶寬。
而且除了這個(gè)第一,GeForce RTX 3090 Ti也是第一款采用新型PCIe 5.0外接供電接口的顯卡。
同樣的,基于新一代Ampere架構(gòu)的GeForce RTX 3090 Ti顯卡也具有這一代Ampere顯卡的一些通用特性,并且相比上一代Turing架構(gòu)有很大的進(jìn)步。
NVIDIA Ampere架構(gòu)簡(jiǎn)介
GeForce RTX 30系顯卡上的SM單元相比GeForce RTX 20系的,最大變化是加倍了針對(duì)傳統(tǒng)計(jì)算的FP32單元、引入第二代RT Core以及第三代Tensor Core。
大家都知道在Turing架構(gòu)中,NVIDIA整數(shù)型(INT32)和單精度浮點(diǎn)型(FP32)兩種不同的數(shù)據(jù)類(lèi)型交給兩種不同的ALU進(jìn)行計(jì)算。不過(guò)現(xiàn)代游戲應(yīng)用中最為常見(jiàn)的還是FP32,因此為了提高計(jì)算效率NVIDIA在NVIDIA Ampere 架構(gòu)上引入了可同時(shí)支持INT32或FP32兩種數(shù)據(jù)類(lèi)型的新ALU。也就是說(shuō),現(xiàn)在有兩條不同的數(shù)據(jù)路徑,一條能夠同時(shí)處理整數(shù)或者單精度浮點(diǎn),另一條則單純處理處理單精度浮點(diǎn)計(jì)算。
負(fù)責(zé)進(jìn)行實(shí)時(shí)光線追蹤運(yùn)算的專用硬件單元RT Core在NVIDIA Ampere 架構(gòu)上也更新到了第二代,最主要是增加了動(dòng)態(tài)模糊的加速運(yùn)算支持。NVIDIA在其中新加入的插值算法可以在保證動(dòng)態(tài)模糊精確性的同時(shí)提高了實(shí)時(shí)光線追蹤效率,官方表示最高可達(dá)8倍于上代的速度。另外在基礎(chǔ)的BVH計(jì)算上,第二代RT Core也可以比第一代快2倍。
Tensor Core這個(gè)負(fù)責(zé)運(yùn)行AI計(jì)算的硬件單元在NVIDIA Ampere 架構(gòu)上也升級(jí)到了第三代。其實(shí)之前發(fā)布的A100計(jì)算卡上已經(jīng)用上了新的第三代Tensor Core,它能夠提供比第二代Tensor Core高出4倍的效能,不過(guò)游戲卡上面的Tensor Core進(jìn)行了一定的精簡(jiǎn),其FP16 FMA計(jì)算的吞吐量只有GA100核心中的Tensor Core的一半。
而第三代Tensor Core帶來(lái)的更強(qiáng)勁AI運(yùn)算有些什么用呢? 答案就是DLSS。隨著GeForce RTX 30系顯卡一同發(fā)布的,還有DLSS的更新版 - DLSS 8K。顧名思義,DLSS 8K就是通過(guò)深度學(xué)習(xí)技術(shù)將畫(huà)面分辨率拉伸至8K的新版DLSS,具體來(lái)說(shuō)就是把1440P的畫(huà)面拉伸至4320P,像素?cái)?shù)量跨越了整整9倍。
再之后就是HDMI 2.1這個(gè)備受期待的新輸出端口了。在HDMI 2.1之下,顯卡可以用單線材做到8K60Hz或者4K120Hz的輸出。對(duì)于想用大尺寸電視打游戲的玩家來(lái)說(shuō)是一個(gè)不錯(cuò)的福音。
華碩TUF RTX 3090 Ti O24G GAMING顯卡外觀
華碩TUF RTX 3090 Ti O24G GAMING顯卡的外觀與這一代TUF顯卡的設(shè)計(jì)基本相同,同樣采用了金屬整流罩搭配低調(diào)的暗色花紋設(shè)計(jì),并配置有金屬背板,保護(hù)PCB的同時(shí)也可以輔助散熱。另外整流罩的表面采用了兩種工藝進(jìn)行加工,分別是磨砂工藝和拉絲工藝。
顯卡散熱器配備的是三把約10cm直徑的Axial-Tech軸流風(fēng)扇,此款風(fēng)扇采用雙滾珠軸承,扇葉末端帶有風(fēng)扇環(huán),可以形成比普通扇葉更高且更具導(dǎo)向性的風(fēng)量和風(fēng)壓,并且具有低溫自動(dòng)停轉(zhuǎn)的功能。另外值得一提的是,位于中間的風(fēng)扇在旋轉(zhuǎn)方向上與另外兩把是相反的,這樣的設(shè)計(jì)可以有效減少風(fēng)扇相互之間的氣流干擾,同樣是有利于提升散熱效果的。
華碩TUF RTX 3090 Ti O24G GAMING顯卡的金屬背板表面采用拉絲工藝處理,厚度約為2mm,可以保護(hù)顯卡PCB不會(huì)因?yàn)橹亓Χ鴱澢捕擞羞M(jìn)行開(kāi)窗,可以讓散熱風(fēng)流更好地通過(guò),以增強(qiáng)散熱器以及背板的散熱效果。顯卡的總體長(zhǎng)度為32.4cm,高度為12.7cm,厚度為5.9cm,相當(dāng)于3槽厚度。
顯卡采用的并非是傳統(tǒng)的PCIE供電接口,而是新式PCIe 5.0外接供電接口設(shè)計(jì),即16Pin供電接口。這是這張卡在外觀方面與其他GPU型號(hào)的顯卡相比非常獨(dú)特的一點(diǎn),同時(shí)為了保證與老式電源的兼容性,華碩TUF RTX 3090 Ti O24G GAMING顯卡也提供了一條12Pin轉(zhuǎn)3個(gè)8Pin的轉(zhuǎn)接線。
由于顯卡上是16Pin供電接口,而轉(zhuǎn)接線是12Pin,用戶可能擔(dān)心用3個(gè)8Pin轉(zhuǎn)12Pin的供電線接在顯卡的16Pin供電接口上會(huì)不會(huì)有影響,這點(diǎn)其實(shí)可以放心,那個(gè)4 Pin的信號(hào)接口目前是不影響的。
PCIe 5.0外接供電接口的發(fā)展經(jīng)歷了一個(gè)過(guò)程,NVIDIA在GeForce RTX 30系列顯卡發(fā)布的時(shí)候推出了12Pin接口,可以提供最大600W的供電,而不久前英特爾發(fā)布ATX 3.0和ATX12VO 2.0規(guī)范則往前推進(jìn)了一步,將接口定為16Pin,其中12Pin負(fù)責(zé)供電,另外4Pin負(fù)責(zé)信號(hào)傳輸,用于電源與PCIe 5.0顯卡直接通信確定供電極限。
不過(guò)之前ATX 3.0和ATX12VO 2.0規(guī)范說(shuō)的“新款線材接頭會(huì)標(biāo)出對(duì)應(yīng)的額定功率,分別有150W、300W、450W和600W四檔”這次還沒(méi)看到,手里的線材上面并沒(méi)有標(biāo)注功率信息。
看完了供電接口,我們?cè)倏达@示器接口方面,顯卡提供了3個(gè)DP 1.4a接口和2個(gè)HDMI 2.1接口,比大多數(shù)顯卡都多提供了1個(gè)HDMI 2.1接口,對(duì)于用戶進(jìn)行多屏輸出的話有更好的兼容性。
顯卡的供電接口旁邊有個(gè)開(kāi)關(guān),可在顯卡的雙BIOS中進(jìn)行切換,兩個(gè)BIOS分別對(duì)應(yīng)性能模式和靜音模式,筆者拿到卡的默認(rèn)狀態(tài)是性能模式,后面的測(cè)試也會(huì)在這個(gè)模式下進(jìn)行測(cè)試以反映大多數(shù)用戶的實(shí)際使用情況。
最后,另外一個(gè)在外觀方面與其他GPU型號(hào)的顯卡相比非常獨(dú)特的一點(diǎn)就是NV link接口了。
華碩TUF RTX 3090 Ti O24G GAMING顯卡拆解
華碩TUF RTX 3090 Ti O24G GAMING顯卡的主體散熱采用用了6根6mm直徑的熱管,使用回流焊工藝與底座以及散熱鰭片結(jié)合;鰭片則可以分成前后兩大區(qū)域,除了GPU本身外還照顧了顯卡前后的VRM供電區(qū)域,整體散熱面積非常大;底座則為純銅鍍鎳設(shè)計(jì),表面進(jìn)行了鏡面打磨,可讓散熱器表面與GPU芯片更好的接觸,以提升導(dǎo)熱效率。
并且它還有一根熱管把顯卡PCB左側(cè)的供電MosFET的熱量傳遞面積最大的那組鰭片上,而且也有通過(guò)導(dǎo)熱貼與主散熱器互聯(lián),能把熱量傳遞到主散熱器,同時(shí)底部采用一體化設(shè)計(jì),能做到一定程度的熱量均衡。
顯卡背板除了加固保護(hù)PCB的作用之外,其上面也貼有導(dǎo)熱膠,可以將顯存和供電電路的部分熱量引導(dǎo)至背板上,起到較好的輔助散熱效果。
顯卡使用的是GA102-350核心,具有GA102核心完整的規(guī)格,共有84組SM單元,一共10752個(gè)流處理器。
周?chē)?2顆美光的GDDR6X顯存,型號(hào)為美光的D8BZC,單顆2GB容量,32-bit位寬,12顆一共組成24GB 384-bit的顯存規(guī)格。
顯存這次的變化是相比于GeForce RTX 3090很重大的一點(diǎn)變化,新款2GB顆粒取代GeForce RTX 3090的1GB顆粒可以讓GeForce RTX 3090 Ti配備的顯存顆粒數(shù)量限制在12個(gè),于是可以全部都安放在PCB正面,通過(guò)散熱器高效散熱,這簡(jiǎn)化了顯卡的設(shè)計(jì),而且降低了顯卡背面的散熱需求。
筆者至今都對(duì)之前GeForce RTX 3090的背面高發(fā)熱記憶猶新,GeForce RTX 3090由于背面的顯存發(fā)熱量比較大,對(duì)顯卡整體散熱設(shè)計(jì)提出了較高的要求,不少用戶也為此苦惱,而GeForce RTX 3090 Ti的2GB顆粒可以降低顯卡背面發(fā)熱情況。而且與GeForce RTX 3090相比的話,新的顯存顆粒數(shù)據(jù)速率也提高了,從19.5Gbps提高到了21Gbps。
PCB上除了GPU和顯存外,剩余空間基本上都用于布置供電元件,GPU的左右兩側(cè)都有供電電路,一共是21相,其中18相給GPU核心供電,3相為顯存供電。供電部分的mosFET均是芯源系統(tǒng)(MPS) 的MP86957,供電控制方面主要是1顆芯源系統(tǒng)(MPS) 的MP2891來(lái)負(fù)責(zé)。
性能測(cè)試
通過(guò)GPU-Z可以看到,華碩TUF RTX 3090 Ti O24G GAMING顯卡的基礎(chǔ)頻率為1560MHz,Boost頻率為1920MHz,相比公版方案1860MHz的頻率OC了60MHz,顯存等效數(shù)據(jù)速率為21Gbps。
通過(guò)GPU-Z還可以看到待機(jī)狀態(tài)下風(fēng)扇轉(zhuǎn)速為零,這是由于前面說(shuō)過(guò)的華碩TUF RTX 3090 Ti O24G GAMING具有風(fēng)扇智能啟停功能。
此外,華碩TUF RTX 3090 Ti O24G GAMING的默認(rèn)溫度上限是83攝氏度,玩家可以選擇向上解鎖到90攝氏度,功耗上限默認(rèn)為450W,玩家可以選擇向上解鎖到最大516W。
測(cè)試平臺(tái)與說(shuō)明
測(cè)試平臺(tái)如上表所示,主板采用的是ROG STRIX Z690-A GAMING WIFI D4吹雪主板,內(nèi)存用兩根芝奇 皇家戟 DDR4-3600 16GB組成雙通道,其中BIOS設(shè)置方面,除了開(kāi)啟XMP讓內(nèi)存運(yùn)行在3600MHz頻率上之外,同時(shí)在主板BIOS中打開(kāi)Resizable BAR的支持,其他均采用默認(rèn)設(shè)置。
代表各款GPU型號(hào)的顯卡分別是:華碩TUF RTX 3090 Ti O24G GAMING,Boost頻率1920MHz;NVIDIA GeForce RTX 3090 Founder Edition,Boost頻率1695MHz;訊景XFX Radeon RX 6900 XT海外版,Boost頻率2365MHz。
這次的電源要特別介紹一下,因?yàn)樗詭б桓?6Pin的原生線,用于適配新的GeForce RTX 3090 Ti顯卡,對(duì)于之前已經(jīng)購(gòu)買(mǎi)了雷神2代1000W及以上和雷神1代1200W及以上的用戶,可以像之前申請(qǐng)Z690的LGA 1700扣具一樣在網(wǎng)上申請(qǐng),華碩就會(huì)給老的ROG雷神用戶補(bǔ)發(fā)16Pin線材。
基準(zhǔn)測(cè)試
我們以3DMark作為顯卡基準(zhǔn)性能測(cè)試,測(cè)試項(xiàng)目包括Fire Strike、Fire Strike Extreme、Fire Strike Ultra、Time Spy、Time Spy Extreme以及Port Royal六個(gè)項(xiàng)目。其中Fire Strike、Fire Strike Extreme、Fire Strike Ultra三個(gè)項(xiàng)目分別測(cè)試的是顯卡在DX11游戲中的1080p分辨率、2K分辨率和4K分辨率下的性能指數(shù),Time Spy、Time Spy Extreme兩個(gè)項(xiàng)目則是顯卡在DX12游戲中的2K分辨率和4K分辨率下的性能指數(shù),Port Royal是測(cè)試的顯卡實(shí)時(shí)光線追蹤的性能指數(shù),具體成績(jī)見(jiàn)下表,表中所列成績(jī)均為3DMark顯卡單項(xiàng)的得分。
基準(zhǔn)測(cè)試方面,GeForce RTX 3090 Ti相比GeForce RTX 3090平均提升幅度為10%,而與Radeon RX 6900 XT比較仍然是隨著渲染壓力不同呈現(xiàn)出不同的結(jié)果,在渲染壓力最小的FireStrike項(xiàng)目中,Radeon RX 6900 XT的跑分是最高的,比GeForce RTX 3090 Ti還要高,隨著渲染壓力越來(lái)越大,GeForce RTX 3090 Ti的優(yōu)勢(shì)就越來(lái)越大,到了Time Spy Extreme項(xiàng)目已經(jīng)是GeForce RTX 3090 Ti呈現(xiàn)大幅領(lǐng)先,而且?guī)в泄庾返腜ort Royal項(xiàng)目更是拉大了差距。總的來(lái)說(shuō),6個(gè)項(xiàng)目的平均值結(jié)果是GeForce RTX 3090 Ti相比Radeon RX 6900 XT平均提升幅度為7%。
4K游戲測(cè)試
4K光柵化游戲測(cè)試
傳統(tǒng)光柵化游戲畫(huà)面測(cè)試這部分均將游戲畫(huà)質(zhì)設(shè)置為預(yù)設(shè)里面的最高畫(huà)質(zhì)設(shè)置(《地鐵:離去》選擇Ultra畫(huà)質(zhì),《賽博朋克2077》為默認(rèn)不開(kāi)啟光線追蹤的預(yù)設(shè)中最高一檔),默認(rèn)不是全屏的手動(dòng)改為全屏,默認(rèn)開(kāi)啟了垂直同步的手動(dòng)關(guān)閉垂直同步,除此之外其他選項(xiàng)均為默認(rèn)設(shè)置,均采用游戲自帶的Benchmark輸出結(jié)果。
傳統(tǒng)光柵化游戲畫(huà)面測(cè)試中,GeForce RTX 3090 Ti相比GeForce RTX 3090平均提升幅度為8.5%,在《賽博朋克2077》、《孤島驚魂6》和《戰(zhàn)爭(zhēng)機(jī)器5》中差距超過(guò)了10%,分別幀數(shù)高了12.5%、10.8%和12%。
GeForce RTX 3090 Ti相比Radeon RX 6900 XT平均提升幅度為16%,在《賽博朋克2077》、《全面戰(zhàn)爭(zhēng):三國(guó)》和《紀(jì)元1800》中差距最大,GeForce RTX 3090 Ti相比Radeon RX 6900 XT分別高了30%、24%和25%。
實(shí)時(shí)光線追蹤游戲測(cè)試
光追游戲畫(huà)面測(cè)試方面,光線追蹤效果均設(shè)為“高”,由于DLSS以及FSR等分辨率拉伸技術(shù)的算法并不一樣,最后的畫(huà)面效果也不一樣,為了保持測(cè)試的準(zhǔn)確性,保證同樣的畫(huà)面結(jié)果,這些測(cè)試均不開(kāi)啟DLSS以及FSR等分辨率拉伸技術(shù)。
光追游戲畫(huà)面測(cè)試方面,GeForce RTX 3090 Ti相比GeForce RTX 3090平均提升幅度為10.6%,在《賽博朋克2077》、《光明記憶》和《邊境》中差距較大,GeForce RTX 3090 Ti分別幀數(shù)高了13.8%、12%和14.4%。
GeForce RTX 3090 Ti相比Radeon RX 6900 XT平均提升幅度為40%,在《賽博朋克2077》、《看門(mén)狗:軍團(tuán)》和《邊境》中差距最大,GeForce RTX 3090 Ti相比Radeon RX 6900 XT分別高了105%、65%和86%。
8K光追游戲測(cè)試
這部分就沒(méi)有Radeon RX 6900 XT的成績(jī)了,Radeon RX 6900 XT即使借助FSR目前也無(wú)法勝任8K光追游戲。這部分均將游戲畫(huà)質(zhì)設(shè)置為預(yù)設(shè)里面的最高畫(huà)質(zhì)設(shè)置(《地鐵:離去》選擇Ultra畫(huà)質(zhì)),開(kāi)啟光線追蹤效果至“高”(《賽博朋克2077》的預(yù)設(shè)最高畫(huà)質(zhì)已經(jīng)開(kāi)啟了光線追蹤效果,這部分不再變動(dòng)),打開(kāi)DLSS至超級(jí)性能模式,默認(rèn)不是全屏的手動(dòng)改為全屏,默認(rèn)開(kāi)啟了垂直同步的手動(dòng)關(guān)閉垂直同步,除此之外其他選項(xiàng)均為默認(rèn)設(shè)置,均采用游戲自帶的Benchmark輸出結(jié)果。
8K光追游戲畫(huà)面測(cè)試中,GeForce RTX 3090 Ti相比GeForce RTX 3090平均提升幅度為12%,在《賽博朋克2077》、《地鐵:離去(增強(qiáng)版)》、《光明記憶》和《古墓麗影:暗影》中差距較大,分別幀數(shù)高了12.4%、13.2%、12.8%和12.5%。
創(chuàng)作應(yīng)用體驗(yàn)
GeForce RTX 3090 Ti適合重度創(chuàng)作者,原因主要是其大容量的顯存配置,所以這里對(duì)比的顯卡不是同樣容量的GeForce RTX 3090,而是GeForce RTX 3080 Ti,同時(shí)由于測(cè)試的重度創(chuàng)作項(xiàng)目文件較大,需要大容量的內(nèi)存容量才能全部正確的載入,故而又加了兩根16GB內(nèi)存組成了64GB的總?cè)萘俊lender的部分由于Windows 11下出現(xiàn)bug,故而是在Windows 10下對(duì)比的,其他項(xiàng)目都是在Windows 11下對(duì)比的。
GeForce RTX 3090 Ti與GeForce RTX 3080 Ti相比,在創(chuàng)作方面的體驗(yàn)區(qū)別還主要不是一個(gè)快一些一個(gè)慢一些的區(qū)別,而是面對(duì)一些大的項(xiàng)目的時(shí)候,直接一個(gè)是可以正常工作,而另一個(gè)則會(huì)因?yàn)轱@存容量不夠出現(xiàn)項(xiàng)目無(wú)法繼續(xù)進(jìn)行、或者直接程序報(bào)錯(cuò)的情況,對(duì)于創(chuàng)作流程影響很大。
Blender
在Blender里面,這次測(cè)試的素材加載之后,由于顯存不夠用,GeForce RTX 3080 Ti在執(zhí)行渲染的時(shí)候直接報(bào)錯(cuò),提示顯存不夠。
而GeForce RTX 3090/3090 Ti則可以正常完成工作流程。
Davinci
在Davinci中,本次測(cè)試的是一個(gè)8K RED RAW素材,在為素材添加了一些效果之后,GeForce RTX 3080 Ti已經(jīng)不能正確的播放,顯存占用慢慢變高直至溢出掉后清空,然后軟件會(huì)提示顯存不足而報(bào)錯(cuò)。
而GeForce RTX 3090/3090 Ti則可以在同樣的效果設(shè)置下正常完成播放預(yù)覽。
OctaneRender
OctaneRender的情況也和前面差不多,GeForce RTX 3080 Ti在渲染的過(guò)程中出現(xiàn)橙色的“OCC”提醒,即顯卡的顯存不足,渲染調(diào)用了內(nèi)存作為臨時(shí)存儲(chǔ)。可以看到GeForce RTX 3080 Ti的顯存占用到8.7GB顯存,還向內(nèi)存借了6.9GB。
而GeForce RTX 3090/3090 Ti則很輕松,大約18.5GB的項(xiàng)目數(shù)據(jù)全部可以放在顯存中,這也導(dǎo)致它渲染起來(lái)特別的快。
可以看到由于顯存不足導(dǎo)致渲染時(shí)間天壤之別,GeForce RTX 3080 Ti總共用了479秒,差不多8分鐘才渲染完成。而GeForce RTX 3090 Ti只需要15秒就完成。
功耗測(cè)試
通過(guò)我們手中的PCAT套件,可以分別精確地測(cè)量顯卡PCI-E、外接電源接口瓦特?cái)?shù),顯卡最大功耗在3DMark Time Spy壓力測(cè)試中獲得,待機(jī)功耗則是在進(jìn)入系統(tǒng)后記錄1分鐘取平均值。
統(tǒng)計(jì)功耗測(cè)試的結(jié)果算出,這張華碩TUF RTX 3090 Ti O24G GAMING的整卡待機(jī)功耗平均為32.4W,滿載功耗平均為448.2W,峰值功耗到過(guò)472W。對(duì)于這樣級(jí)別的顯卡功耗來(lái)說(shuō),電源的話如果平臺(tái)其他部件的功耗不高那么可以850W的電源來(lái)帶動(dòng),如果其他部件的功耗也較高建議至少1000W的電源起步。
溫度測(cè)試
我們的GPU散熱測(cè)試均在裸機(jī)狀態(tài)(如果安裝在機(jī)箱內(nèi),GPU溫度會(huì)高出5℃左右)下進(jìn)行測(cè)試,測(cè)試環(huán)境溫度約為21.1℃。待機(jī)溫度是開(kāi)機(jī)以后記錄10分鐘,滿載溫度則是完成3DMark Time Spy壓力測(cè)試后記錄下,數(shù)據(jù)通過(guò)GPU-Z的Log to File功能記錄,以下為溫度測(cè)試曲線。
這張華碩TUF RTX 3090 Ti O24G GAMING具有風(fēng)扇待機(jī)停轉(zhuǎn)的功能,所以待機(jī)狀態(tài)下全靠被動(dòng)散熱。經(jīng)過(guò)十分鐘的待機(jī)測(cè)試,從開(kāi)始的37.6攝氏度上升到42.4攝氏度左右,10分鐘待機(jī)過(guò)程中最熱點(diǎn)溫度則是最低是開(kāi)始的46.3攝氏度,偏后段是50.8攝氏度。
滿載狀態(tài)下,最高溫度出現(xiàn)在風(fēng)扇剛啟動(dòng)之前的瞬間,達(dá)到了72.5攝氏度,隨著主動(dòng)散熱開(kāi)始,溫度就被控制住了,穩(wěn)定后該卡最高溫度僅僅才只有65.3℃,關(guān)注最熱點(diǎn)溫度的話,穩(wěn)定后也最高才75.7攝氏度,屬于非常好的滿載溫度表現(xiàn)了。
超頻測(cè)試
將功耗上限和溫度上限解鎖到最高之后,經(jīng)過(guò)多番手動(dòng)超頻嘗試,GeForce RTX 3090 Ti最終在核心頻率+150MHz,GDDR6X顯存數(shù)據(jù)速率+2Gbps下完成超頻。這個(gè)狀態(tài)下,這張華碩TUF RTX 3090 Ti O24G GAMING能順利通過(guò)3DMark的Time Spy Extreme項(xiàng)目測(cè)試并且分?jǐn)?shù)最高, 此時(shí)這張卡的Boost頻率為2070MHz,顯存等效頻率為23Gbps。這張華碩TUF RTX 3090 Ti O24G GAMING在超頻狀態(tài)下運(yùn)行3DMark Time Spy Extreme項(xiàng)目的GPU得分與默頻狀態(tài)下GPU得分的對(duì)比如下表所示。
在這個(gè)幅度之下,華碩這張GeForce RTX 3090 Ti O24G GAMING在Time Spy Extreme中的顯卡得分為11994分,比默頻時(shí)高8.1%左右,對(duì)于卡皇級(jí)別的大核心來(lái)說(shuō),很恐怖了。
總結(jié)
總的來(lái)說(shuō),GeForce RTX 3090 Ti的定位大體與之前的GeForce RTX 3090差不多,面向8K游戲玩家及重度創(chuàng)作者,不過(guò)GeForce RTX 3090 Ti全方位超越GeForce RTX 3090,相當(dāng)于就是將目前頂級(jí)的消費(fèi)級(jí)顯卡再向上推進(jìn)了一步,給了目前消費(fèi)者對(duì)于最頂級(jí)的GPU的一個(gè)新選擇。
而對(duì)于4K及以下分辨率的游戲環(huán)境來(lái)說(shuō),其實(shí)最推薦的還是GeForce RTX 3080 Ti,GeForce RTX 3080 Ti已經(jīng)可以滿足4K下頂級(jí)的游戲體驗(yàn),并且就價(jià)格來(lái)說(shuō),也是相當(dāng)合適的,GeForce RTX 3080 Ti整張卡的各方面設(shè)計(jì)也是面向游戲設(shè)計(jì)的。對(duì)于GeForce RTX 3090 Ti,相對(duì)來(lái)說(shuō)還是推薦創(chuàng)作用途,只不過(guò)它也提供很好的游戲性能,但是用于創(chuàng)作用途的話,它的價(jià)值發(fā)揮的更大,顯存帶糾錯(cuò)碼(ECC)的特性也可以發(fā)揮出來(lái)。
顯卡迷你天梯榜 (完整顯卡天梯榜)
GeForce RTX 3090 Ti的450W功耗也是不可忽視的點(diǎn),不過(guò)這個(gè)功耗也是頻率大幅度提升的結(jié)果,由此也帶來(lái)強(qiáng)大的性能提升。綜合來(lái)說(shuō),對(duì)于一張售價(jià)幾乎1.5萬(wàn)元起步的顯卡來(lái)說(shuō),它注定是少數(shù)人的囊中之物,而且就邊際效用來(lái)說(shuō),對(duì)于游戲玩家也完全不如GeForce RTX 3080 Ti更合適。總的來(lái)說(shuō),這張卡看起來(lái)展示意味很重。
結(jié)合最近英特爾的銳炫A系列移動(dòng)端獨(dú)顯以及AMD或許將不久后要推出Radeon RX 6x50 XT系列顯卡,而NVIDIA后面的新顯卡發(fā)布估計(jì)就是要等到下一代的GeForce RTX 40系列再見(jiàn)面了,這中間很長(zhǎng)一段時(shí)間顯卡市場(chǎng)的焦點(diǎn)可能會(huì)落在英特爾和AMD身上,故而筆者認(rèn)為這次GeForce RTX 3090 Ti的推出是NVIDIA想傳遞出一個(gè)信息,那就是——在顯卡領(lǐng)域,即使我暫時(shí)“隱市”,你們也不要忘記還有如此一座難以逾越的高山存在。
最后,有點(diǎn)意思的是,從目前的環(huán)境來(lái)看,GeForce RTX 3090 Ti或許是最近兩年來(lái)最有可能用戶能在首發(fā)日前后就能以建議零售價(jià)買(mǎi)到的顯卡產(chǎn)品。目前筆者從華碩得到的消息是其TUF系列的GeForce RTX 3090 Ti顯卡如果是公版頻率的話,那么售價(jià)就是建議零售價(jià)的14999元,如果是TUF系列的OC版顯卡,售價(jià)稍高一點(diǎn)為15499元(也就是本次測(cè)試的這張顯卡),更高端的STRIX系列則是16499元。
并且,華碩表示價(jià)格會(huì)被鎖定,不會(huì)再漲價(jià),對(duì)于用戶來(lái)說(shuō)這可能是最近兩年關(guān)于顯卡價(jià)格聽(tīng)到的最好的消息了,沒(méi)有之一。
高龍林
版權(quán)所有 未經(jīng)許可不得轉(zhuǎn)載
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證備案號(hào):遼ICP備14006349號(hào)
網(wǎng)站介紹 商務(wù)合作 免責(zé)聲明 - html - txt - xml