【評測】NVIDIA GeForce RTX 4090 vs RTX 3090 DLSS 效能、畫質比較 + 光線追蹤效能 + 遊戲效能測試

Published by
Lawton

繼上次小編為大家開箱 NVIDIA GeForce RTX 4090 公版卡與 4 間廠商推出的 RTX 4090 產品之後,今次小編終於可為大家做一個更為詳細的效能評測。從結論講起,今次 NVIDIA 可說是擠爆牙膏,使出渾身解數,新卡效能對比上代同級在最新 DLSS 技術加持下最多有 1 倍以上提升,以電腦硬件來說近年真的是絕無僅有。本評測將詳細比對 DLSS 3 的畫質與效能。不過在睇效能測試之前,首先再詳細放大睇各大廠商頭批推出的 GeForce RTX 4090 產品。

 

 

NVIDIA GeForce RTX 4090 公版卡 Founders Edition 雖然在港沒有正式發售,不過在睇其他各大廠的產品之前,大家可再次細看這張公版卡。它的金屬外殼、X 型設計與圓邊結尾,突然它高檔次顯示卡的格局。公版卡一向以設計行先,不過卡身仍然極厚,大約有 6cm,足以佔據 3 個 PCI 插槽位置。其中一把風扇設置在顯示晶片的正上方,另一把則於卡尾的巨大散熱器之上。散熱器佔據此卡絕大部份體積,總重量有 2,176g,打直機箱的用戶可能要同時購入機內卡座以穩固卡身,避免整張顯示卡的下沉力都施在插槽上。

 

▲Founders Edition 在 X 型設計的交叉位置與 GEFORCE RTX 字樣同具簡單的燈號

 

我們也拆開了這張 Founder Edition。顯示卡在扭開與散熱器的螺絲後就能看到 RTX 4090 晶片的真身,也看到記憶體與電容。可看到顯示晶片的位置其實距離卡邊的插口不遠,從機箱外吸收的生風能盡快打落晶片附近的散熱器,配合正上方的散熱扇迅速散熱。

 

▲拆開這張公版卡,可看到晶片與其他記憶體都用同一塊巨大的金屬板傳熱,導熱到散熱器上。至於晶片的型號則為 AD102-300-A1。而電路板設計為配合 X 型卡身設計也留了一個很大的缺口,卡內置有 13 個 16V 電容。

 

GEFORCE RTX 4090 顯示卡的外部供電插口位仍然在卡頂,是一個 PCIe 5.0 16 Pin(12 + 4)的插頭。而盒內有一條電源轉接線,將 4 個 PCI-e 8 pin電源線插入後,可連上 RTX 4090 顯示卡的 PCIe 5.0 16 Pin 插頭了。而官方建議使用 1000W 功率的變壓器,為顯示卡與電腦系統供電。

 

▲NVIDIA 官方建議用戶使用 1000W 或以上電腦系統變壓器

 

在未睇效能之前先看看溫度,我們使用 Furmark 的壓力測試使顯示卡以接近 100% 效能運作,測出卡背位置溫度為攝氏 50 度(但留意晶片底部被金屬板蓋住),上方散熱器的溫度約 40 度。而 CPU Temp 軟件表示其核心溫度為 71 度,此溫度比對其他廠新卡較高,原因也很簡單,因為各大廠在散熱器的設計上比公版卡更為落本。

 

▲卡背溫度▲上方散熱器溫度

 

利用 GPU-Z 軟件顯示了此卡製程為 4nm,Shaders 數量增至 16384 個核心,比對 RTX 3090 多了接近 60%。公版卡的基礎時脈為 2235MHz,記憶體時脈為 1313MHz,而 Boost 時脈則為 2520MHz,比起其他廠的產品會略低,當然這也是一向公版卡的特色。首批卡記憶體比對上代同樣用上 24GB,但記憶體頻寬就由 936GB/s 提升 1008.4GB/s。

 

 

 

 

各品牌 GEFORCE RTX 4090 新卡詳細睇

今次我們找來了 4 間大廠推出的 RTX 4090 顯示卡產品,頭批新卡有 Zotac、ROG(Asus)、MSI 還有 INNO3D。上次小編帶大家睇過各顯示卡的外觀,今次編輯部為大家更詳細睇睇。

 

 

INNO3D GEFORCE RTX 4090 ICHILL X3

INNO3D GEFORCE RTX 4090 ICHILL X3 同其他各大廠的顯示卡一樣,用上 3 個散熱扇的設計,更為細密的散熱片與多支散熱管,由卡頭至卡尾貫穿整張顯示卡。顯示卡的電路板本身只佔卡長度的 5 分之 2 左右,其後有更為大型的散熱器。

 

 

INNO3D 的卡頂部與正面都有大面積的 RGB 燈光點綴,頂部的燈光長度更有整張卡的一半以上,讓幻彩的演出更為震撼。

 

 

壓力測試的溫度方面,在接近100% 穩定運作一段時間後的溫度為卡背晶片背後 62 度、晶片上方散熱器 35 度。CPU Temp 顯示出的溫度為 67 度,比起公版卡略低。

 

 

利用 GPU-Z 軟件顯示了此卡的基礎時脈為 2235Mhz、記憶體時脈為 1313MHz,而 Boost 時脈則為 2580MHz,比公版的 2520MHz 略高。

 

 

MSI GAMING X TRIO GEFORCE RTX 4090

MSI GAMING X TRIO GEFORCE RTX 4090 擁有非常搶眼的 3 風扇設計,在卡頂望下去可看到由卡頭至卡尾都排滿細密的散熱片。卡身長度有 34.5cm,厚度足有 7.6cm,可說是眾多卡中較厚的一張,重量則為 2,170g。不過大家都是佔用整整 3 個 PCI-e 卡槽,其實不會額外佔據更多空間。

 

 

卡中間的導熱管外露,此卡望上去非常有金屬感。

 

 

我們更留意到卡頭部份幾乎向外露出所有散熱導管,有助生風直接打落導管上。

 

 

拆卡後,我們留意到與晶片接觸的部份用上一大塊金屬板,並有大量導熱管連至卡頭與卡尾的導熱管。

 

 

而此卡所用到的晶片型號與公版卡同樣是 AD102-300-A1,電路板的設計與公板卡類似。

 

 

利用 GPU-Z 軟件顯示了此卡的基礎時脈為 2235Mhz、記憶體時脈為 1313MHz,而 Boost 時脈則為 2595MHz,比公版的 2520MHz 略高。

 

 

 

ROG STRIX GAMING GEFORCE RTX 4090

ROG STRIX GAMING GEFORCE RTX 4090重量達 2,487g,是今次 4 款卡中最有份量。卡身厚度足有 7cm,卡頭至卡尾都無密封設計,三把風扇設計協助散熱,可看到風扇下方細密的散熱片與由頭貫穿到尾的散熱導管。

 

 

 

此卡與其他卡最大分別,是跟來已經有 2 個 HDMI 插口與 3 個 DisplayPort 插口,多出 1 個 HDMI 插口。

 

 

顯示卡插上主機板後有壓倒性的重量感,因此廠方也附隨了一個卡座,方便打直機箱的用戶穩固住卡尾,讓重量能均衡分佈接觸機箱。

 

 

RGB 燈光集中在尾部,卡頂透出 REPUBLIC OF GAMERS 字樣與卡頭的 GEFORCE RTX 字樣平衡配置。集中在卡尾位置的環繞式 RGB 燈光塑造出長方形卡尾設計。相對於卡頂較型格的設計,卡尾的燈光就較為震撼。

 

 

拆卡後,我們看到使用的晶片型號與公版卡同樣為 AD102-300-A1。在右方可看卡身右方有 12 個 16V 電容與 14 個 2.5V 電容。


 

壓力測試的溫度方面,在接近100% 穩定運作一段時間後的溫度為卡背晶片背後 51 度、晶片上方散熱器 33 度。CPU Temp 顯示出的溫度為 62 度。

 

 

利用 GPU-Z 軟件顯示基礎時脈為 2235Mhz、記憶體時脈為 1313MHz,而 Boost 時脈則為 2610MHz,比公版的 2520MHz 略高,也是眾多產品中較高的卡款。


 

ZOTAC GAMING GEFORCE RTX 4090

ZOTAC GAMING GEFORCE RTX 4090 擁有非常型格流線形設計,卡身整齊排列 3 個散熱扇。從卡底我們已看到重量相當十足的散熱器,其散熱片貫穿整張卡身。其散熱導管從顯示卡晶片的散熱片導至整張卡的散熱器。

 

 

此卡卡身重量為 2,029g,隨卡附隨一個卡座可讓顯示卡更穩固插上打直機身,不怕卡身所有重力聚於卡槽上。而香港首賣的 ZOTAC RTX 4090 更會送一個 RGB 卡座,插上後的燈光更型。

 

 

卡身的漸變色燈光效果也用上波浪紋設計,貫穿卡頭至卡尾非常大面積。卡背的 ZOTAC 標誌亦有燈光效果。

 

 

 

壓力測試的溫度方面,在接近100% 穩定運作一段時間後的溫度為卡背晶片背後 56 度、晶片上方散熱器 45 度。CPU Temp 顯示出的溫度為 67 度。

 

 

利用 GPU-Z 軟件顯示了此卡的基礎時脈為 2235Mhz、記憶體時脈為 1313MHz,而 Boost 時脈則為 2580MHz,比公版的 2520MHz 略高。

 

 

5 張顯示卡溫度比較

RTX 4090 顯示卡各部溫度測試
顯示卡型號 GPU-Temp(攝氏度) 卡背(攝氏度) 散熱器(攝氏度)
NVIDIA GeForce RTX 4090 Founders Edition 71 50 40
INNO3D GEFORCE RTX 4090 ICHILL X3 67 62 35
ROG STRIX GAMING GEFORCE RTX 4090 62 51 33
ZOTAC GAMING GEFORCE RTX 4090 67 54 45

 

 

3DMark 跑分評測 RTX 4090 vs RTX 3090

今代 RTX 4090 最為突出表現在於 DLSS 3 的推出令到遊戲的流暢度提升超過 1 倍。而在沒有 DLSS 的情況下,兩代卡的跑分仍有大幅度的差別。以 3DMark Time Spy 來說 Graphics score 跑分由上代 RTX 3090 的 20219 分提升至今代 RTX 4090 的 31946 分,升幅為 58%;而 3DMark Port Royal 評測分數則由上代 RTX 3090 的 13548 分提升到今代 RTX 4090 的 24664 分,效能提升足有 82%。

 

RTX 4090 vs RTX 3090 跑分測試 顯示晶片型號
3DMark跑分 GeForce RTX 4090 GeForce RTX 3090
3DMark Time Spy 跑分(Graphics score) 31946 20219
3DMark Port Royal 跑分 24664 13548

 

測試平台:

CPU: Intel Core i9 10900K @3.7GHz

RAM: DDR4 16GB

主機板: ASUS Z490 ROG MAXIMUS X11 EXTREME

儲存裝置: 1TB SSD

 

DLSS 3 畫質、速度大提升,變得真正可用

DLSS 是 NVIDIA 利用人工智能技術,計算「Super Resolution」所產生的像素重構畫面,可令遊戲流暢度有大幅度提升。然而在 RTX 3090 面對的最大問題,是其畫質會有顯著下降,令到玩家無興趣開啟這個功能。今代 RTX 4090 就引入了全新一代 DLSS 3 技術,此技術能進一步提升遊戲畫面流暢度,兼且在 DLSS 處理後的遊戲畫面畫質,能夠得到大幅度提升,官方稱畫質提升可達上代的 4 倍。

 

 

▲在 NVIDIA 向傳媒發佈的《Cyberpunk 2077》DLSS 3 對應版當中,我們看到設定畫面中加入了全新的 DLSS Frame Generation 選項,另外亦有過往已有的 DLSS Sharpness、DLSS Super Resolution 選項。

 

DLSS 3DMark 跑分測試

首先看看跑分。在開啟了 DLSS 3 的情況下,在 3DMark 的 NVIDIA DLSS feature test 效能測試中,得到了 168.64FPS 的結果。接著小編換成 RTX 3090 再做測試,它未能在 DLSS 3 中取得任何結果,這也是意料中事,而轉換為 DLSS 2.0 測試時,開啟 DLSS 後的結果為 76.54FPS。兩者比較之下,RTX 4090 結合新一代的 DLSS 3 得到了 120% 的效能提升。

 

DLSS 效能測試 RTX 4090 vs RTX 3090 顯示晶片型號
NVIDIA DLSS feature test 跑分 GeForce RTX 4090 GeForce RTX 3090
開啟 DLSS 168.64 76.54
關閉 DLSS 57.05 30.06

 

 

 

DLSS 遊戲流暢度測試

接下來我們看看畫面流暢度。小編使用 Cyberpunk 2077 遊戲內的效能測試,可發現在開啟 DLSS 技術之後,畫面流暢度可由上代 RTX 3090 的 65-85fps,大幅提升到 125-135fps,遊戲效能提升足有 73%。

 

DLSS 效能測試 RTX 4090 vs RTX 3090
DLSS 效能測試(平均FPS) GeForce RTX 4090 GeForce RTX 3090
開啟 DLSS 130 75
關閉 DLSS 70 22

 

效能測試使用 NVIDIA 提供的效能顯示器「FrameView」,效能測試中開啟 DLSS 的 Frame Generation,DLSS Super Resolution 設定為「Performance」,並開啟 Ray Tracing 功能將 Ray-Traced Lighting 選項設定為「Ultra」。

 

 

 

之後再用 Unreal Engine Lyra 再做效能測試,可發現 RTX 4090 在開啟 DLSS 技術後,其遊戲流暢度可由 66fps 大幅提升到 152fps。

 

 

DLSS 3 畫質提升放大睇

在睇過速度比對之後,很多人相信會關心遊戲畫質方面有多大的提升。我們就使用《Cyberpunk 2077》效能測試的畫面,逐個位詳細比較。我們可看到《Cyberpunk 2077》每一個畫面的細緻位置,即使是放大 100% 觀看,也非常難以看得出兩者有詳細分別,而在畫面會動的時候,老實說幾乎看不出任何畫質上的分別。這表示 DLSS 3 在《Cyberpunk 2077》上得到畫質大幅提升,至到玩家們都幾乎不能分出關閉 DLSS 時的分別。

 

(以下相片點擊可放大看)

例子 1(畫面放大至100%後比較)

例子 2:其實在沒有放大的情況下,很難比較到分別

例子 3(畫面放大至100%後比較)

例子 4(畫面放大至100%後比較)

例子 5(畫面放大至100%後比較)

例子 6 (畫面放大至100%後比較)

例子 7:在放大 100% 後都看不到分別,更何況沒放大的情況

 

我們再看 Unreal Engine Lyra 的測試,在遊戲畫面擷取一張靜止畫然後再放大,我們才可看出兩者有些微的畫質差別,而在會動的畫面,我們很難看得出這個畫質分別,DLSS 3 已經是實際可用。

 

 

開啟 Ray Tracing 光線追蹤後 4K 流暢度仍可達 130fps

玩遊戲最理想當然是開盡光線追蹤 Ray Tracing 然後再用 4K 解像度擁有最高享受。之不過在 RTX 3090,開啟 Ray Tracing 後無疑對遊戲流暢度有著較大影響,好多人亦因此忍痛關閉了此項功能。而我們在 RTX 4090 再開啟光線追蹤功能後,發現其流暢度仍然有 125-135fps。雖然關掉它可將流暢度提升到 150-175fps,但大家都會認為 130fps 已經是很不錯的遊戲流暢度,相信很多人會選擇開啟光線追蹤功能。

 

▲同一畫面下開啟/關閉光線追蹤效果的畫面比較《Cyberpunk 2077》

▲《Cyberpunk 2077》同一遊戲畫面時開啟/關閉光線追蹤效果的畫面流暢度

 

我們在 Marvel’s Spider-Man Remastered 留意到開/關 Ray Tracing 光線追蹤效果所帶來的畫面差別,相信追求畫質完美的朋友,在 RTX 4090 不會影響流暢體感的情況下,可以好放心開啟光線追蹤功能。

 

▲Marvel’s Spider-Man Remastered 開啟光線追蹤效果

▲Marvel’s Spider-Man Remastered 關閉光線追蹤效果

▲Marvel’s Spider-Man Remastered 開啟光線追蹤效果

 

其他遊戲性能差別

我們在上面就對比完支援 DLSS 3 遊戲包括《Cyberpunk 2077》與《Unreal Engine Lyra》的效能差別。至於尚未支援 DLSS 3 遊戲的效能差別又如何呢?我們馬上給大家看結果。我們看到部份遊戲在沒有對應 DLSS 3 的情況下,都有達 70% 的效能增幅。

 

 

遊戲效能測試 RTX 4090 vs RTX 3090
NVIDIA DLSS feature test 跑分 GeForce RTX 4090 GeForce RTX 3090 效能增長
Assassin’s Creed Valhalla 111 74 50%
Shadow of the Tomb Raider 103 80 28%
Tom Clancy’s Rainbow Six Extraction 186 107 73%

 

▲Assassin’s Creed Valhalla

▲Tom Clancy’s Rainbow Six Extraction

▲Shadow of Tomb Raider

 

 

將會支援 DLSS 3 遊戲大作最新發佈

NVIDIA 正式公佈多間廠商將會陸續加入 DLSS 3 的支援。重點遊戲包括有《SUPER PEOPLE》、《Loopmancer》、《Justice ‘Fuyun Court’》、《Microsoft Flight Simulator》,還有《A Plague Tale: Requiem》,另外還有超過 35 款遊戲、應用宣佈即將支援 DLSS 3 技術。

 

重點遊戲:

SUPER PEOPLE 搶先體驗版將於 10 月 12 日 13:00 發佈支援 DLSS 3

Loopmancer 將於 10 月 12 日發佈更新版支援 DLSS 3

Justice ‘Fuyun Court’ 將於 10 月 13 日發佈更新支援 DLSS 3

Microsoft Flight Simulator 將於 10 月 17 日向 Xbox Insider 計劃成員推出測試版支援 DLSS 3

A Plague Tale: Requiem 將於 10 月 18 日發佈支援 DLSS 3

 

超過 35 款遊戲、應用宣佈支援 DLSS 3 技術:

A Plague Tale: Requiem

Atomic Heart

Black Myth: Wukong

Bright Memory: Infinite

Chernobylite

Conqueror’s Blade

Cyberpunk 2077

Dakar Desert Rally

Deliver Us Mars

Destroy All Humans! 2 – Reprobed

Dying Light 2: Stay Human

F1 22

F.I.S.T.: Forged In Shadow Torch

寒霜引擎

HITMAN 3

Hogwarts Legacy

ICARUS

Jurassic World Evolution 2

Justice

Loopmancer

Marauders

Marvel’s Spider-Man Remastered

Microsoft Flight Simulator

Midnight Ghost Hunt

Mount & Blade II: Bannerlord

Naraka: Bladepoint

NVIDIA Omniverse

NVIDIA Racer RTX

PERISH

Portal with RTX

Ripout

S.T.A.L.K.E.R. 2:Heart of Chernobyl

Scathe

SUPER PEOPLE

Sword and Fairy 7

SYNCED

The Lord of the Rings: Gollum

The Witcher 3: Wild Hunt

THRONE AND LIBERTY

Tower of Fantasy

Unity 

虚幻引擎 4 & 5

Warhammer 40,000: Darktide

 

 

全新 AV1 編碼提升串流直播畫質

RTX 4090 除了提升遊戲有關的運算效能之外,另一個重點更新就是提升 AV1 編碼器的運算效能,在遊戲畫面串流直播、遊戲畫面錄影時,能在相同碼率的串流數據流量下,獲得更佳畫質。

 

 

今次我們就登入了 NVIDIA 特別為傳媒提供的 Discord 直播頻道。裡面展示了利用 AV1 編碼器與 H264 編碼器的畫面分別。我們可看到使用 H264 編碼器在畫面移動幅度較大的場景中,會出現畫質顯著下跌的情況,例如畫面大幅起格、變得模糊,而在轉用 AV1 編碼器後,即使畫面出現大幅變動情況下,畫質仍能保持亮麗清晰。

 

例子1:

例子2:

 

我們亦使用了 NVIDIA 提供的開發版本 OBS 串流直播程式,測試 AV1 編碼器與 H264 編碼器在錄影遊戲時的分別。小編使用 8000Kbps 錄影《Cyberpunk 2077》裡面的遊戲畫面,發現在 H264 編碼器的影片中,會較易出現起格、畫面模糊的情況,而使用 AV1 編碼器在同一場景中,仍然能保持畫面清晰。

 

例子 1:

例子 2:

 

RTX 4090 與 RTX 3090 規格比對

最後我們再一次比對 GeForce RTX 4090 與 RTX 3090 硬件規格。今代顯示卡有幾個重大更新,包括使用全新 Ada Lovelace 架構,升級成第 4 代 Tensor Core,並加入 Optical Flow Accelerator,以及 RT Core 升級到第 3 代。

 

RTX 4090 RTX 3090
CUDA核心數 16384 10496
核心架構 Ada Lovelace NVIDIA Ampere
光線追蹤核心 128(3rd Gen) 82(2nd Gen)
動態超頻時脈 2520MHz 1695MHz
記憶體數量 24GB GDDR6X 24GB GDDR6X

 

 

總結:真正流暢地享受 4K 畫質 + 光線追蹤效果

過往我們很多時要在開/關 DLSS、用 4K 還是 2K 畫質,又或者在開/關光線追蹤效果上作出抉擇。但隨著 GeForce RTX 4090 的推出,除了在硬件升級之外,NVIDIA 亦改進或加入很多新技術令到玩家在接近無損畫質的情況下,遊戲 FPS 格數可得到進一步提升,令要求高畫質遊戲體驗的玩家震奮。我們可將光線追蹤效果全開,在 4K 畫質下享受到超過 100 fps 的流暢遊戲體驗。即使你未必買 RTX 4090 頂級顯示卡,往後推出的中階產品也值得期待。

 

Published by
Lawton