AMD RDNA 4の探究:メモリと帯域幅の効率性を重視したNavi 44などのコンパクトGPU向けのモジュラーSoC設計と構成可能性

AMD RDNA 4の探究:メモリと帯域幅の効率性を重視したNavi 44などのコンパクトGPU向けのモジュラーSoC設計と構成可能性

AMD は、RDNA 4 GPU アーキテクチャと革新的なモジュラー SoC 設計を詳しく説明し、パフォーマンスを向上させる高度なメモリおよび帯域幅圧縮戦略を導入しました。

Hot Chips 2025でAMDのRDNA 4 GPUアーキテクチャとモジュラーSoCのイノベーションを再検証

AMDは2月初旬にRDNA 4アーキテクチャの包括的な概要を発表しました。Hot Chips 2025での最近のプレゼンテーションでは、特に多用途アプリケーション向けに設計されたこのチップのモジュール性について、さらに詳しい情報が得られました。

AMDが特に力を入れた点の一つは、下位層のRDNA 4 GPU SoCへのLPDDRメモリの採用です。LPDDRメモリは消費電力が低いことで知られていますが、AMDは必要な帯域幅が不足していると指摘しています。その結果、チップの物理的なフットプリントが増加し、LPDDRは高性能グラフィックカードには適さないものとなっています。

AMD RDNA 4 Radeon 9000 GPU が Hot Chips 2025 イベントで発表されました。チップの詳細図です。
RDNA 4 Vision: パフォーマンスとレイトレーシングを強化した、ゲーム向けに最適化された GPU アーキテクチャ。
レンダリング、レイ トレーシング、メモリに重点を置いた AMD Radeon RX 9070 XT の機能を詳しく説明した図。
AMD RDNA 4: 強化されたゲームストリーミング、低遅延ビデオ、FreeSync の最適化の詳細。
RDNA 4 レイトレーシングアーキテクチャ: 強化されたアクセラレータと最適化された BVH メモリチャート
ヒートマップ比較による有向境界ボックスとトラバーサル最適化の詳細な解説
アウトオブオーダー メモリ キューは、リクエストを効率的に処理することで、RDNA 4 GPU のパフォーマンスを向上させます。
RDNA 4 アーキテクチャは、複数の最適化要素によりレイ トラバーサルのパフォーマンスを強化します。
シェーダーにおける RDNA 3 の静的レジスタ割り当てと RDNA 4 の動的レジスタ割り当てを比較したグラフ。
ゲームやコンテンツ作成のための RDNA 4 AI 機能により、効率とパフォーマンスが向上します。
レイトレーシングとパストレーシングの手法の比較を図と主な違いの説明とともに示します。
ロボットや技術ツールがカラフルなストリングライトで照らされ、RDNA 4 パス トレーシングが紹介される居心地の良いワークショップ。

RDNA 3と比較してメモリ帯域幅が減少したことについて尋ねられたAMDは、メモリ帯域幅の効率は特定のワークロードに大きく依存すると説明しました。RDNA 4グラフィックスアーキテクチャのチューニングにより、パフォーマンスを犠牲にすることなく、必要な帯域幅が大幅に削減されました。

Hot Chipsのプレゼンテーションで、AMDはモジュラーSoCアーキテクチャの柔軟性を強調しました。RDNA 4モデルは、様々なRadeon製品向けに多様な構成を可能にする汎用チップとして設計されています。AMDのSoCアーキテクトであるLaks Pappu氏は、将来のRDNA 5およびUDNA世代にも拡張される予定のモジュラー機能について強調しました。

抽象的な幾何学的デザインと AMD ロゴを備えた RDNA 4 SoC アーキテクチャのプレゼンテーション スライド。

このアーキテクチャは、Navi 4X SoC 内に統合された複数のシェーダ エンジンを備えたデータ フロー チャートを活用します。各シェーダ エンジンは、デュアル コンピューティング ユニットを備えた複数のワーク グループ プロセッサ (WGP) で構成されます。

これらのコンポーネント間の通信ネットワークは、GPU側のGL2キャッシュによって促進され、改良されたコヒーレント相互接続機構であるInfinity Fabricに接続されます。このモジュール設計には、LLCに加えて複数のコヒーレントステーションと、PCB上のDRAM(GDDR6)に直接接続されたデュアルチャネルメモリコントローラが含まれています。注目すべきは、Infinity Fabricは1.5GHzから2.5GHzの周波数範囲で、クロックサイクルあたり1KBの速度で動作するということです。

シェーダ エンジンと Infinity Fabric 接続を示す SOC アーキテクチャ データ フロー。

AMDは、モジュラーSoC設計に焦点を当て、より小型のSoCを効率的に製造できる可能性を明確に示しました。AMDの図表に示された赤い線は、モジュラーチップのセグメンテーションと、様々なWeUにわたるスケーラビリティを示しています。例えば、赤い線の下の構成は、2つのシェーダエンジンと4つのGDDR6メモリコントローラを備えたNavi 44設計を示しており、要件に応じてスケールアップまたはスケールダウンの両方向の調整が可能です。

セキュリティ機能とコンポーネント レイアウトを備えたモジュラー SoC アーキテクチャの概要 (RDNA4 チップに重点)。

モジュラーアーキテクチャは、RX 9070 XTグラフィックスカードに搭載されているNavi 48のようなハイエンドWeU向けに、シェーダーエンジン、L3キャッシュ、Infinity Fabricインターコネクト、GDDRメモリコントローラの追加を可能にするだけでなく、セキュリティレベルも向上させます。セキュリティ管理、電力調整、マイクロコントローラ機能において、アクセス制御と異なる権限レベル設定が可能です。このモジュラーダイの様々なコンポーネントには、信頼性、可用性、保守性(RAS)機能が組み込まれています。

SoCアーキテクチャ最適化のための中央圧縮/解凍図

AMDはまた、RDNA 4 SoCの高度な圧縮・解凍アルゴリズムも発表しました。これらの新しい手法により、特定のラスターワークロードにおいてパフォーマンスが15%向上し、ファブリック帯域幅は25%削減されるとされています。この効率化は消費電力の削減だけでなく、圧縮機能がハードウェア内で本質的に管理されるため、ソフトウェアによる圧縮処理の必要性を最小限に抑えます。

SOC RDNA 4 製品 SKU、Radeon RX 9070 および 9060 シリーズ GPU の仕様の概要。

AMDは、モジュラーSoC設計に内在する柔軟な構成可能性を改めて強調し、進化する市場ニーズに対応する多様な製品ポートフォリオの構築を可能にしました。利用可能な構成は、以下の4つの収穫レベルに分類されます。

  • SEハーベスト
  • WGPハーベスト
  • 非対称ハーベスト(加重ピクセルとコンピュートシェーダーの配分を組み込む可能性あり)
  • メモリデバイスの収集(単一デバイスの粒度と64ビットの粒度)
ゲームや創作活動に最適な RDNA 4 機能を搭載した AMD Radeon RX 9070 XT GPU の詳細。

現在、AMD は 4 つの Navi 48 WeU と 3 つの Navi 44 WeU を展示しており、RDNA 4 のスケーラブルなモジュラー SoC の性質により、将来的にはさらに多くの構成が可能になります。

出典と画像

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です