OpenAI CodexモデルはCerebrasインフラストラクチャを活用し、AI推論においてNVIDIAに代わる強力な選択肢を提示

OpenAIは、Cerebrasの先進的なAIチップを自社の業務に統合することで、技術革新において大きな飛躍を遂げました。この提携は極めて重要な節目であり、OpenAIが最新モデルであるCodexを従来のNVIDIAへの依存に加えてCerebrasのサポート対象にすることを明らかにしたことは、コンピューティング環境におけるより広範な変化を浮き彫りにするものです。

OpenAI、Cerebrasの高速技術で驚異の1, 000 TPS出力を達成

OpenAIがNVIDIAとの財務関係を進展させる中で、Cerebrasとの以前のパートナーシップがコンピューティング分野におけるゲームチェンジャーとして浮上したことは注目に値します。OpenAIは最近リリースされたGPT-5.3-Codex-Sparkにおいて、Cerebrasのハードウェア、特に推論タスクにおける卓越した「低レイテンシ」性能の利点を強調しました。この協業は、特にモデル推論の分野において、NVIDIAの優位性に強力な挑戦をもたらすでしょう。

Codex-Sparkバリアントは、従来のCodexモデルとは異なり、運用効率を向上させる能力を備えています。OpenAIは、このモデルは即時応答性を重視して設計されており、レイテンシが大幅に改善されていると主張しています。処理パイプラインを最適化し、Cerebrasの最先端ハードウェアを効果的に活用することで、最初のトークン生成までの時間を驚異的な50%短縮したと同社は主張しており、その能力を際立たせています。特筆すべきは、Codex-SparkがCerebras Wafer Scale Engine 3上で動作し、以下に示すような優れた仕様を誇っていることです。

仕様	WSE-3
プロセスノード	TSMC 5nm
トランジスタ	約4兆
コンピューティングコア	90万個のAI最適化コア
オンチップSRAM	44GB
メモリ帯域幅（オンチップ）	21 PB/秒
ウエハサイズ	300mmウエハスケールチップ
コアアーキテクチャ	AIに最適化されたプログラマブルプロセッシングコア

OpenAIがCerebrasを選択した主な理由は、WSE-3が提供する膨大なメモリ帯域幅にあります。これは、コーディングなどのメモリを大量に消費するタスクに不可欠です。この大容量のサポートにより、Codex-Sparkは1, 000トランザクション/秒（TPS）という驚異的なスループットを実現し、「人間のペアプログラマー」と同等の応答性を実現しています。興味深いことに、NVIDIAのインフラストラクチャは低レイテンシ性能よりもバッチ処理に重点を置いているため、このモデルをNVIDIAのインフラストラクチャでトレーニングすることは経済的に非効率的です。そのため、Cerebrasは理にかなった選択であることが証明されています。

Cerebras Wafer Scale Engine 3とNVIDIA H100の比較 — 画像クレジット: Cerebras

Cerebrasは推論シナリオにおいて有望な能力を備えているものの、市場では依然としてNVIDIAが優位な立場を維持しています。NVIDIAは最近の発表で、Blackwellアーキテクチャによりトークンコストが最大10分の1に削減されることを示しており、その地位をさらに強固なものにしています。OpenAIのSachin Katti氏はCerebrasが提供する「補完的な機能」に言及しましたが、コンピューティングの激戦区におけるOpenAIの忠誠心は依然として主にNVIDIAに傾いているようです。しかし、Codex-Sparkの登場は、レイテンシにおける重大なボトルネックを浮き彫りにしており、NVIDIAの現在の技術フレームワークは、このボトルネックに対処する上で最適な位置にいない可能性があります。

今後、推論市場はますます競争が激化すると予想されます。NVIDIAは、Cerebrasなどの強力な競合企業に加え、他のASICメーカーやAMDなどのライバル企業の革新的な技術にも直面することになります。こうした動向が今後数年間のNVIDIAの戦略と市場ポジショニングにどのような影響を与えるかは、まだ不透明です。

出典と画像