NVIDIAがBlackwell RTXを発表:RTX PRO 6000でサイバーパンク2077の4つのインスタンスをMIG経由で実行し、ニューラルレンダリングとゲーミングを披露

NVIDIAがBlackwell RTXを発表:RTX PRO 6000でサイバーパンク2077の4つのインスタンスをMIG経由で実行し、ニューラルレンダリングとゲーミングを披露

NVIDIA は、特に RTX 5090 や RTX PRO 6000 を含む Blackwell RTX GPU シリーズを通じて、ニューラル レンダリングとゲーミングの最新の進歩により、テクノロジー業界に大きな波を起こし続けています。

NVIDIA、Hot Chips 2025 で Blackwell RTX のイノベーションを披露

2023年1月に発表されたBlackwell RTXアーキテクチャは、主に人工知能(AI)に焦点を当てた画期的な機能を発表しました。このイノベーションはNVIDIAにとって新しい試みではありません。その歩みは2006年のCUDAのリリースに始まり、アクセラレーテッドコンピューティングとAIの大きな進歩を象徴しています。

2006 年から 2025 年までの AI 開発のタイムライン。NVIDIA の主要なイノベーションと成果に焦点を当てています。

NVIDIAは、スパース性、新しい命令セットアーキテクチャ(ISA)、そして最適化された低精度フォーマットといっ​​た技術によって、計算密度の進歩がムーアの法則のスケーリングを超えたと主張しています。2018年のリアルタイム・レイトレーシングの導入と、翌年のDLSSのリリースは、この進化における重要なマイルストーンです。

パフォーマンスのスケーリングに関する GPU、CPU、メモリ仕様の詳細が記載された NVIDIA Blackwell アーキテクチャ図。

これらのイノベーションは、RT コアや Tensor コアなどの高度なテクノロジーを使用して実現されており、Blackwell は現在、これらの機能を新たなレベルにまで高めています。

AI とレンダリング強化のための Blackwell アーキテクチャ ツールを備えた RTX エコシステム フレームワーク。

データセンター分野では、NVIDIA は FP4 精度を導入し、高密度スケーリングを必要とするワークロードの性能を 4 倍に向上させました。NVIDIA CEO のジェンスン フアンは、Blackwell RTX によってニューラル レンダリング時代の到来を促し、グラフィックスにおける AI の重要な役割を再確認することを目指しています。RTX ブランドは、シミュレーション、コンテンツ制作、そしてゲーミングにおけるイノベーションを象徴し、データセンター技術をコンシューマー向け RTX GPU に拡張する道を切り開きます。

ニューラル レンダリングは、AI ビジュアル、スムーズな応答性、適応型エクスペリエンスによるゲーム強化を実現します。

では、Blackwellアーキテクチャはどのような貢献をするのでしょうか?DLSS 4、MFG、ACE、強化されたパストレーシングといった先進技術を誇り、これらはすべてパフォーマンスの高速化と視覚的な忠実度の向上を目的として設計されています。NVIDIAは、Blackwell RTXは「パフォーマンス、フットプリント、そして設計サイクルにおいて10倍の強化」を実現できると主張しています。DLSS 4は、AIを戦略的に活用し、最初のフレームに続くピクセルの100%をレンダリングすることで、モバイルデバイスのレンダリング時間を短縮し、バッテリー寿命を延ばします。

設計原則: 最適化されたニューラル ワークロード、メモリの削減、効率性を備えた RTX Blackwell チップ。

RTX Blackwell GPU の主な設計原則は次のとおりです。

  • 新しいニューラルワークロードの最適化
  • メモリフットプリントの最小化
  • ニューラルおよびグラフィックスタスクの高品質なサービスを保証する
  • スケーラブルなエネルギー効率
AI、Tensor コア、G7 メモリ、高度なレンダリング アーキテクチャを備えた NVIDIA RTX Blackwell チップ。

技術的な面では、RTX Blackwellはエンジニアリングの原動力であり、第5世代Tensorコアをベースに4000TOPS(AIテラオペレーション/秒)のAI演算処理と高速FP4サポートを提供します。第4世代RTコアを搭載し、メガジオメトリをターゲットとした最大360 RT TFLOPsの演算処理能力を提供するとともに、AI管理プロセス(AMP)がグラフィックス処理と並行してAIモデルを効率的に管理します。

シェーダ コアとテンソル コアを備えたニューラル シェーダ用の RTX Blackwell SM アーキテクチャの図。

RTX Blackwellストリーミング・マルチプロセッサ(SM)のアーキテクチャは、データセンター向けとは大きく異なります。注目すべき改良点の一つは、従来別々だったFP32ユニットとINT32ユニットを統合し、処理効率を向上させたことです。

ニューラル シェーダーとコアを使用してシェーダー実行の並べ替えを 2 倍に強化する RTX Blackwell SM を示す図。

さらに、RTX Blackwell はシェーダー実行順序変更 (SER) を強化し、シェーダー実行の効率を 2 倍にします。

FP4 を搭載した Blackwell 第 5 世代 Tensor コアは、前世代の製品に比べてスループットが向上しています。

第 5 世代 Tensor コアでは FP4 サポートが導入され、DLSS 4 に MFG モードが含まれるようになり、GPU が AI を使用して 4 つのフレームを同時にレンダリングできるようになりました。

DLSS4 + RTX Blackwell は、より高速で効率的なフレーム レンダリングと GPU 電力節約によりゲームを強化します。

その結果、DLSS 4とフレームジェネレーションを組み合わせることで、コアレールゲーティング速度が10倍向上し、DRAMセルフリフレッシュレートが100倍高速化されるため、個々のフレームのレンダリング時間が大幅に短縮されます。モバイルプラットフォームでは、GPUの消費電力が最大2分の1に削減され、バッテリー寿命が大幅に向上します。

GDDR7 と GDDR6x: 新しいグラフィックス DRAM 標準でデータ レートと効率が強化されました。

GDDR7の導入により、RTX Blackwellは最大30Gbpsの速度を実現し、前世代のGDDR6の実質2倍のデータレートを実現します。この新しいメモリ規格は、モバイルプラットフォームにおける効率をさらに向上させます。

NVIDIA の AMP ユニットのおかげで、AI とグラフィックス ワークロードの同時実行が可能になり、フレーム配信がよりスムーズになり、モデル応答が速くなります。

ユニバーサル MIG と GPU インスタンスの最適化の詳細を表示する RTX PRO 6000 の概要。

ゲーミングアプリケーションからプロフェッショナルユースへの移行に伴い、NVIDIAはRTX PRO 6000にUniversal MIGなどの革新的な機能を搭載しています。これにより、24GBのVRAMを搭載したRTX PRO GPUの最大4つのインスタンスが、安定したレイテンシとスループットで同時に動作できるようになります。

印象的なデモンストレーションでは、サイバーパンク 2077 のインスタンス 4 つを 1080p の最大設定で実行することで、この強力な GPU で管理可能なタスクである RTX PRO 6000 の能力が示されました。

RTX PRO 6000 マルチテナント スケーリング バー チャート、1080p でのサイバーパンク 2077 のパフォーマンス メトリック。

標準的なタイムスライスインスタンスを基準として、MIG 2xおよび4xモードとの比較では、スケーラビリティが60%も向上することが明らかになりました。RTX PRO 6000 Blackwell GPUは、サイバーパンク2077のような要求の厳しいアプリケーションの複数インスタンスの管理に最適です。

Blackwell FP4 のパフォーマンスと VRAM 使用量を画像サンプルと比較したグラフ。

NVIDIAのBlackwell GPUアーキテクチャは、リリース以来、コンシューマー向けアプリケーションとプロフェッショナル向けアプリケーションの両方において、着実に進化を遂げてきました。Blackwellが提供するAIとニューラルネットワークの高度な機能強化を組み込んだゲームやコンテンツ制作ツールが増えるにつれ、この分野における今後の開発への期待は高まっています。

出典と画像

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です