深入解析AMD Radeon RX6000：性能翻倍的祕密

說到AMD的RDNA2架構，可能算得上是近年來“保密工作”做得最差的一次GPU設計了。先是早在一年多前初代RDNA架構發佈時，官方就主動公佈了下代產品的架構名稱。此後隨着XSX/XSS與PS5次時代遊戲主機，由於使用了RDNA2的GPU設計，也讓新架構的大部分軟件特性被外界所知。並且不僅如此，就在距離新卡正式上市還有一個多月的前段時間，AMD方面甚至乾脆把新品的外觀圖也給公佈了出來。

那麼這是否意味着，AMD在今天凌晨舉辦的的Radeon RX6000發佈會，就沒有什麼“乾貨”可以繼續挖掘了呢？當然不至於。下面我們三易生活就來帶大家看看，隱藏在此次Radeon RX6000系列背後，那些技術與市場層面上的有趣事實。

性能翻倍的背後，這次的命名似乎有點令人迷惑

AMD昨晚發佈了Radeon RX6000系列的哪些產品？相信稍有關注科技新聞的朋友都已經知道了。他們一口氣推出了三款新顯卡，也就是Radeon RX6900XT、Radeon RX6800XT和Radeon RX6800。

根據官方的說法，Radeon RX6900XT的32位浮點數性能達到20.6TFlops，這是前代RDNA架構旗艦產品Radeon RX5700XT的兩倍還多。請注意這不是對位的比較，因此它並不意味着RDNA 2的能效比有兩倍的增長。但考慮到Radeon RX6900XT所基於的Navi 21（也叫Big Navi）核心，是AMD時隔數代後久違的全新大尺寸核心，所以能夠實現旗艦性能翻番，同時價格還明顯低於競爭對手（Radeon RX6900XT官方售價7999元，對標的Geforce RTX3090官方售價是11999元），AMD的誠意顯然還是很夠的。

但如果大家有仔細研究這次Radeon RX6000系列已發佈型號的具體規格，就會發現一點更不尋常的現象。也就是此次的Radeon RX6000系列顯卡在性能規格與命名上，似乎出現了那麼一點點偏差。

具體來說，此次的旗艦當然是擁有80組CU（5120流處理器）、80個光追單元、128ROP（光柵單元），以及16GB顯存的Radeon RX6900XT。但與它相比，“次旗艦”Radeon RX6800XT的流處理器與光追單元其實只少了10%（從80組減少到72組），光柵單元甚至完全沒有減少；並且與此同時，更次一級的Radeon RX6800在流處理器、光追單元，以及光柵單元的數量上卻大幅減少了25%。

這意味着什麼呢？簡單來說，就是Radeon RX6900XT與Radeon RX6800XT之間的性能差異並不大，甚至可能在相同分辨率、相同畫質水準的遊戲裏，都不會有決定性的流暢度差異，但Radeon RX6800和Radeon RX6800XT的差距就要大得多了。

正因如此，實際上在我們三易生活來看，此次的Radeon RX6800XT或許被叫做Radeon RX6900反而更合適一些。而規格與旗艦差異甚大的Radeon RX6800，可能纔是真正的“Radeon RX6800XT”。那麼爲什麼AMD不這樣做呢？或許定價策略纔是唯一的理由吧。

製程未升級，翻倍的性能祕密在於內存子系統？

說完了基本的產品規格與命名問題，我們是時候來看看AMD這次在新顯卡架構上的一些“魔法”了。

首先大家要明確的是，此次AMD Radeon RX6000系列使用的依然是與上代相同的臺積電7nm製程。因此這意味着新品的性能提升和製程完全沒有關係，純粹是來自於更大的芯片、更多的流處理器、更高的運行頻率，以及更新的架構設計。

很顯然，在製程不改變的前提下，增加芯片規格，提高運行頻率，這注定會帶來更高的功耗壓力。要解決功耗問題，在架構上進行改進也就成爲了唯一的出路，而這一點實際上也正是RDNA2最大的奧祕所在。

對此AMD做了哪些工作呢？首先按照官方說法，此次新GPU其實是AMD旗下的CPU、GPU和定製SoC（就是專爲遊戲主機研發芯片的那一羣人）部門協同研發的成果。這種協同研發的方式，也使得RDNA2架構融入了許多來自Ryzen銳龍CPU，以及遊戲主機芯片的經驗。

比如說爲了讓CU（計算單元）更省電，AMD給RDNA2的CU內部設計了更多的細粒度時鐘門，從而能夠讓GPU的頻率調節更加精準，也降低了頻率調節的漏電率。

又比如說，AMD經過研究發現，對於如今的顯卡來說，移動數據（比如把數據從顯存讀入到核心裏）而不是處理數據的開銷，正逐漸在顯卡的總功耗裏佔據越來越高的份額。爲此RDNA2架構的設計團隊一方面重新設計了GPU核心內部的數據移動路徑，減少了內部數據交換的能耗需求；另一方面他們也吸收了遊戲主機處理器的成功經驗，給RDNA2引入了全新的128MB “Infinity Cache”緩存，將其與256bit顯存共同構成了這代顯卡的內存子系統。

Infinity Cache可以起到什麼作用？簡單來說，以往GPU裏雖然也有緩存（Cache）這個概念。但是它們普遍容量非常之小（比如只有幾百KB或者幾MB），存儲不了太多的圖像數據，因此當顯卡處理和渲染遊戲畫面時，就需要頻繁地到顯存、內存，甚至是硬盤中去讀取數據。這不僅增大了處理的延遲，提高了功耗，更糟糕的是對於那些面向4K、HDR、高幀率遊戲需求的頂級顯卡來說，它們就不得不配備384bit、512bit甚至是更大的顯存位寬。很顯然這會造成顯卡的設計被複雜化，同時產品成本（售價）也大爲上漲。

反之，通過給顯卡加入128MB的大容量Cache，RDNA2就可以在日常工作過程中大幅降低讀取顯存的頻率，同時降低對於顯存物理帶寬的需求。而這也正是它能夠做到有效降低功耗，同時價格也頗有優勢的祕密所在。

什麼樣的電腦才能用好RDNA2？這次的要求可能不低

最後，讓我們來談談AMD Radeon RX6000系列這次的系統需求。

首先根據官方說法，Radeon RX6000系列是一款專爲DX12 Ultimate API設計的GPU，這意味着它僅能支持Windows 10 2020年4月版或之後的新版操作系統。而太老的系統版本將無法使用到新顯卡的許多功能，這一點請大家務必要注意。

其次與NVIDIA RTX30系列一樣，Radeon RX6000系列這次也支持由GPU繞過CPU，直接讀取硬盤遊戲數據的DirecStorage API。很顯然，這同樣是源自AMD遊戲機定製芯片部門的經驗。而它也意味着，如果將來玩家想要在PC上享受到與微軟XSX/XSS和索尼PS5一樣的無加載畫面遊戲體驗，那麼搭配一塊至少是中高端級別的PCIE 4.0 SSD，也是必不可少的操作。

最後，可能有些朋友已經注意到了，AMD Radeon RX6000系列這次還有一個“隱藏武器”，那就是隻有搭配Ryzen銳龍5000系CPU時，才能激活的“AMD Smart Access Memory”技術。按照官方的說法，AMD Smart Access Memory允許CPU直接一次性讀寫顯卡的全部16GB顯存，而不是像現在的CPU那樣，每次只能訪問256MB的有限空間。這樣一來，CPU與GPU之間的通信效率將會大爲提高，同時顯存裏的碎片化現象也會得到有效緩解。

在搭配Ryzen 5000系CPU並啓用新的驅動內超頻功能之後，RDNA2的性能還可以再提升

最爲重要的是，由於AMD Smart Access Memory技術並不嚴格依賴於遊戲的後期優化（也就是說，只要你用的是銳龍5000系CPU和Radeon RX6000顯卡，那麼即使是在老遊戲裏該技術也能起作用），因此它將會對整套系統的遊戲性能，帶來自動而直接的提升效果。當然，反過來說，也就是如果你真想把新顯卡的全部技術特性、所有性能潛力都發揮出來，配一臺新電腦其實還是很有必要的。