
最新のMLPerf v5.1 AI推論ベンチマークでは、NVIDIAとAMDの画期的なチップ、Blackwell Ultra GB300とInstinct MI355Xがデビューしました。これらの強力なプロセッサは、その卓越したパフォーマンス指標により、テクノロジーコミュニティで大きな話題を呼んでいます。
NVIDIA Blackwell Ultra GB300とAMD Instinct MI355X:AIパフォーマンスの新たなベンチマーク
MLCommonsは先日、 MLPerf v5.1ベンチマークを用いたAIパフォーマンスの最新評価を発表しました。NVIDIAとAMDの製品が特に優れた結果を示しました。Blackwell Ultra GB300とInstinct MI355Xは、それぞれのメーカーが提供するAIテクノロジーにおける最高峰製品として際立っています。本分析では、ベンチマークを通して実証されたこれらの製品の性能を詳細に検証します。
ブラックウェル ウルトラ GB300 パフォーマンスハイライト
DeepSeek R1(オフライン)カテゴリーにおいて、NVIDIAのGB300は前身のGB200を凌駕し、72GPU構成で45%、8GPU構成で44%という劇的なパフォーマンス向上を達成しました。これらの改善は、NVIDIAが予測するパフォーマンス向上とほぼ一致しています。
DeepSeek R1 (サーバー) カテゴリでは、Blackwell は 72 GPU でパフォーマンスが 25% 向上し、8 GPU 構成では 21% 向上するなど、目覚ましい進歩を遂げました。
AMDのInstinct MI355Xが市場に登場
AMD Instinct MI355Xも、特にLlama 3.1 405B(オフライン)ベンチマークにおいて大きな貢献を果たしました。GB200との比較評価では、27%という驚異的なパフォーマンス向上が示され、AMDのAI分野における進歩を実証しました。
さらに、Llama 2 70B (オフライン) を含むベンチマークでは、MI355X は 64 チップ構成で最大 648, 248 トークン/秒を生成し、8 チップ構成では NVIDIA GB200 の 2.09 倍という驚異的なパフォーマンス向上を示すなど、印象的なスループットを示しました。
NVIDIAは、Blackwell Ultra GB300プラットフォームで達成された様々な記録を含む、ベンチマークの詳細な分析を公開しました。これらの結果は、AI推論能力の大きな進歩を示しています。

総合記録表
MLPerf 推論アクセラレータごとのレコード | |||
ベンチマーク | オフライン | サーバ | 相互の作用 |
ディープシーク-R1 | 5, 842トークン/秒/GPU | 2, 907トークン/秒/GPU | ** |
フレイム 3.1 405B | 224トークン/秒/GPU | 170トークン/秒/GPU | 138トークン/秒/GPU |
コール2 70B 99.9% | 12, 934トークン/秒/GPU | 12, 701トークン/秒/GPU | 7, 856トークン/秒/GPU |
コール2 70B 99% | 13, 015トークン/秒/GPU | 12, 701トークン/秒/GPU | 7, 856トークン/秒/GPU |
ラマ 3.1 8B | 18, 370トークン/秒/GPU | 16, 099トークン/秒/GPU | 15, 284トークン/秒/GPU |
安定拡散XL | 4.07 サンプル/秒/GPU | 3.59 クエリ/秒/GPU | ** |
ミクストラル 8x7B | 16, 099トークン/秒/GPU | 16, 131トークン/秒/GPU | ** |
DLRMv2 99% | 87, 228サンプル/秒/GPU | 80, 515サンプル/秒/GPU | ** |
DLRMv2 99.9% | 48, 666サンプル/秒/GPU | 46, 259 クエリ/秒/GPU | ** |
ささやき | 5, 667トークン/秒/GPU | ** | ** |
R-GAT | 81, 404サンプル/秒/GPU | ** | ** |
レチナネット | 1, 875サンプル/秒/GPU | 1, 801 クエリ/秒/GPU | ** |
さらに、NVIDIA の Blackwell Ultra は、MLPerf で新しい推論ベンチマークを確立し、オフライン モードで従来の Hopper アーキテクチャを 4.7 倍、サーバー構成で 5.2 倍上回り、効率が大幅に向上したことを示しています。
DeepSeek-R1のパフォーマンス比較 | ||
建築 | オフライン | サーバ |
ホッパー | 1, 253トークン/秒/GPU | 556トークン/秒/GPU |
ブラックウェル ウルトラ | 5, 842トークン/秒/GPU | 2, 907トークン/秒/GPU |
ブラックウェル ウルトラ アドバンテージ | 4.7倍 | 5.2倍 |
今後の MLPerf の提出を楽しみにしていますが、NVIDIA、AMD、Intel は、この競争の激しい環境でさらに高いパフォーマンス レベルを目指して、プラットフォームの強化を継続すると予想されます。
コメントを残す