說到AMD的RDNA2架構,可能算得上是近年來“保密工作”做得最差的一次GPU設計了。先是早在一年多前初代RDNA架構發佈時,官方就主動公佈了下代產品的架構名稱。此後隨着XSX/XSS與PS5次時代遊戲主機,由於使用了RDNA2的GPU設計,也讓新架構的大部分軟件特性被外界所知。並且不僅如此,就在距離新卡正式上市還有一個多月的前段時間,AMD方面甚至乾脆把新品的外觀圖也給公佈了出來。

那麼這是否意味着,AMD在今天凌晨舉辦的的Radeon RX6000發佈會,就沒有什麼“乾貨”可以繼續挖掘了呢?當然不至於。下面我們三易生活就來帶大家看看,隱藏在此次Radeon RX6000系列背後,那些技術與市場層面上的有趣事實。

性能翻倍的背後,這次的命名似乎有點令人迷惑

AMD昨晚發佈了Radeon RX6000系列的哪些產品?相信稍有關注科技新聞的朋友都已經知道了。他們一口氣推出了三款新顯卡,也就是Radeon RX6900XT、Radeon RX6800XT和Radeon RX6800。

根據官方的說法,Radeon RX6900XT的32位浮點數性能達到20.6TFlops,這是前代RDNA架構旗艦產品Radeon RX5700XT的兩倍還多。請注意這不是對位的比較,因此它並不意味着RDNA 2的能效比有兩倍的增長。但考慮到Radeon RX6900XT所基於的Navi 21(也叫Big Navi)核心,是AMD時隔數代後久違的全新大尺寸核心,所以能夠實現旗艦性能翻番,同時價格還明顯低於競爭對手(Radeon RX6900XT官方售價7999元,對標的Geforce RTX3090官方售價是11999元),AMD的誠意顯然還是很夠的。

但如果大家有仔細研究這次Radeon RX6000系列已發佈型號的具體規格,就會發現一點更不尋常的現象。也就是此次的Radeon RX6000系列顯卡在性能規格與命名上,似乎出現了那麼一點點偏差。

具體來說,此次的旗艦當然是擁有80組CU(5120流處理器)、80個光追單元、128ROP(光柵單元),以及16GB顯存的Radeon RX6900XT。但與它相比,“次旗艦”Radeon RX6800XT的流處理器與光追單元其實只少了10%(從80組減少到72組),光柵單元甚至完全沒有減少;並且與此同時,更次一級的Radeon RX6800在流處理器、光追單元,以及光柵單元的數量上卻大幅減少了25%。

這意味着什麼呢?簡單來說,就是Radeon RX6900XT與Radeon RX6800XT之間的性能差異並不大,甚至可能在相同分辨率、相同畫質水準的遊戲裏,都不會有決定性的流暢度差異,但Radeon RX6800和Radeon RX6800XT的差距就要大得多了。

正因如此,實際上在我們三易生活來看,此次的Radeon RX6800XT或許被叫做Radeon RX6900反而更合適一些。而規格與旗艦差異甚大的Radeon RX6800,可能纔是真正的“Radeon RX6800XT”。那麼爲什麼AMD不這樣做呢?或許定價策略纔是唯一的理由吧。

製程未升級,翻倍的性能祕密在於內存子系統?

說完了基本的產品規格與命名問題,我們是時候來看看AMD這次在新顯卡架構上的一些“魔法”了。

首先大家要明確的是,此次AMD Radeon RX6000系列使用的依然是與上代相同的臺積電7nm製程。因此這意味着新品的性能提升和製程完全沒有關係,純粹是來自於更大的芯片、更多的流處理器、更高的運行頻率,以及更新的架構設計。

很顯然,在製程不改變的前提下,增加芯片規格,提高運行頻率,這注定會帶來更高的功耗壓力。要解決功耗問題,在架構上進行改進也就成爲了唯一的出路,而這一點實際上也正是RDNA2最大的奧祕所在。

對此AMD做了哪些工作呢?首先按照官方說法,此次新GPU其實是AMD旗下的CPU、GPU和定製SoC(就是專爲遊戲主機研發芯片的那一羣人)部門協同研發的成果。這種協同研發的方式,也使得RDNA2架構融入了許多來自Ryzen銳龍CPU,以及遊戲主機芯片的經驗。

比如說爲了讓CU(計算單元)更省電,AMD給RDNA2的CU內部設計了更多的細粒度時鐘門,從而能夠讓GPU的頻率調節更加精準,也降低了頻率調節的漏電率。

又比如說,AMD經過研究發現,對於如今的顯卡來說,移動數據(比如把數據從顯存讀入到核心裏)而不是處理數據的開銷,正逐漸在顯卡的總功耗裏佔據越來越高的份額。爲此RDNA2架構的設計團隊一方面重新設計了GPU核心內部的數據移動路徑,減少了內部數據交換的能耗需求;另一方面他們也吸收了遊戲主機處理器的成功經驗,給RDNA2引入了全新的128MB “Infinity Cache”緩存,將其與256bit顯存共同構成了這代顯卡的內存子系統。

Infinity Cache可以起到什麼作用?簡單來說,以往GPU裏雖然也有緩存(Cache)這個概念。但是它們普遍容量非常之小(比如只有幾百KB或者幾MB),存儲不了太多的圖像數據,因此當顯卡處理和渲染遊戲畫面時,就需要頻繁地到顯存、內存,甚至是硬盤中去讀取數據。這不僅增大了處理的延遲,提高了功耗,更糟糕的是對於那些面向4K、HDR、高幀率遊戲需求的頂級顯卡來說,它們就不得不配備384bit、512bit甚至是更大的顯存位寬。很顯然這會造成顯卡的設計被複雜化,同時產品成本(售價)也大爲上漲。

反之,通過給顯卡加入128MB的大容量Cache,RDNA2就可以在日常工作過程中大幅降低讀取顯存的頻率,同時降低對於顯存物理帶寬的需求。而這也正是它能夠做到有效降低功耗,同時價格也頗有優勢的祕密所在。

什麼樣的電腦才能用好RDNA2?這次的要求可能不低

最後,讓我們來談談AMD Radeon RX6000系列這次的系統需求。

首先根據官方說法,Radeon RX6000系列是一款專爲DX12 Ultimate API設計的GPU,這意味着它僅能支持Windows 10 2020年4月版或之後的新版操作系統。而太老的系統版本將無法使用到新顯卡的許多功能,這一點請大家務必要注意。

其次與NVIDIA RTX30系列一樣,Radeon RX6000系列這次也支持由GPU繞過CPU,直接讀取硬盤遊戲數據的DirecStorage API。很顯然,這同樣是源自AMD遊戲機定製芯片部門的經驗。而它也意味着,如果將來玩家想要在PC上享受到與微軟XSX/XSS和索尼PS5一樣的無加載畫面遊戲體驗,那麼搭配一塊至少是中高端級別的PCIE 4.0 SSD,也是必不可少的操作。

最後,可能有些朋友已經注意到了,AMD Radeon RX6000系列這次還有一個“隱藏武器”,那就是隻有搭配Ryzen銳龍5000系CPU時,才能激活的“AMD Smart Access Memory”技術。按照官方的說法,AMD Smart Access Memory允許CPU直接一次性讀寫顯卡的全部16GB顯存,而不是像現在的CPU那樣,每次只能訪問256MB的有限空間。這樣一來,CPU與GPU之間的通信效率將會大爲提高,同時顯存裏的碎片化現象也會得到有效緩解。

在搭配Ryzen 5000系CPU並啓用新的驅動內超頻功能之後,RDNA2的性能還可以再提升

最爲重要的是,由於AMD Smart Access Memory技術並不嚴格依賴於遊戲的後期優化(也就是說,只要你用的是銳龍5000系CPU和Radeon RX6000顯卡,那麼即使是在老遊戲裏該技術也能起作用),因此它將會對整套系統的遊戲性能,帶來自動而直接的提升效果。當然,反過來說,也就是如果你真想把新顯卡的全部技術特性、所有性能潛力都發揮出來,配一臺新電腦其實還是很有必要的。

相關文章