xAIのGrok 3が「世界で最も賢いAI」と評価される、賭け市場の支持を受ける中、専門家は複雑な反応を示す

xAIのGrok 3が「世界で最も賢いAI」と評価される、賭け市場の支持を受ける中、専門家は複雑な反応を示す

これは投資アドバイスではありません。著者はここで言及されている株式を保有していません。

xAI が Grok 3 LLM を発表: ゲームチェンジャーか、それとも過大評価か?

xAI は月曜日、他でもないイーロン・マスクが司会を務めたライブ ストリームで、Grok 3 言語モデル (LLM) を発表し、大きな話題となった。この AI 企業は Grok 3 を人工知能における比類のない進歩と位置付けているが、業界の専門家数名は、その宣伝されているベンチマークに疑問を投げかけ、顕著な欠点を挙げている。

xAI の投稿によると、Grok 3 モデルは「世界で最も賢い AI」として宣伝されており、さまざまな分野で興味をそそられています。

デモの完全なビデオは、上記のリンク先の投稿でご覧いただけます。さらに、「DeepSeek 効果」と呼ばれる現象を受けて、マスク氏は以前のバージョンである Grok 2 をまもなくオープンソース化し、この技術の開発に関するさらなる洞察を提供すると発表しました。

xAI は、特に数学、科学、プログラミングなどの分野で、Grok 3 が DeepSeek-V3 や GPT-4o などの他の公開されている基礎モデルをすべて上回っていると積極的に主張してきました。LLM は、Arena ベンチマークで 1, 402という印象的なスコアを達成しました。

一方、投機投資の世界では、Grok 3 が最も強力な AI として栄冠を獲得するという Manifold Markets の賭け契約は、「イエス」の結論に傾いています。ただし、その確率は月曜深夜の 91% から現在はわずか 78% へと大幅に低下しています。

Grok 3 に対する批判的なレビューが新たに登場し、限定的ではあるものの、こうした確率の低下に影響を与えている可能性があるようです。

たとえば、DeepSeek の元従業員である Zihan Wang 氏は、ピサの斜塔から異なる高さに吊り下げられた異なるサイズの 2 つの鉄球の画像を提示し、どちらが先に地面に着地するかを尋ねるという物理学の問題を Grok 3 に提示しました。予想される論理的な答えは重い方の鉄球ですが、Grok 3 は両方とも同時に着地すると誤って回答しました。

さらに、FrontierMath、Arc-AGI、HLE などの確立されたベンチマークで Grok 3 のパフォーマンス メトリックを公開しないという xAI の決定をめぐっては、疑問が高まっています。

これらの批判は、Grok 3 の可能性を否定するものではないことに注意することが重要です。Grok 3 は間違いなく優れた AI モデルです。むしろ、xAI の主張する優位性の信憑性について重要な疑問を提起しています。

金融動向と今後の見通し

これとは別に、同様に重要な展開として、ブルームバーグは最近、xAI が最大 100 億ドルの新規資金を調達しており、評価額が 750 億ドルに跳ね上がる可能性があると報じた。このスタートアップは以前、資金調達ラウンドで 60 億ドルを確保し、評価額は 400 億ドルだった。

xAI の Guodong Zhang 氏が、Grok 3 が 10 万個の GPU を使用してトレーニングされたと発表し、リソースと機能の大幅な向上を示したことは注目に値します。この開発は、AI チップの売上が2032 年までに2, 270 億ドルに急増する可能性があるという予測の中で行われました。

さらに詳しい情報や考察については、こちらの 記事全文をご覧ください。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です