
これは投資アドバイスではありません。著者はここで言及されている株式を保有していません。
xAI が Grok 3 LLM を発表: ゲームチェンジャーか、それとも過大評価か?
xAI は月曜日、他でもないイーロン・マスクが司会を務めたライブ ストリームで、Grok 3 言語モデル (LLM) を発表し、大きな話題となった。この AI 企業は Grok 3 を人工知能における比類のない進歩と位置付けているが、業界の専門家数名は、その宣伝されているベンチマークに疑問を投げかけ、顕著な欠点を挙げている。
grok 3は世界で最も賢いAIです
すべてのPremium+加入者に利用可能になりました
— グロク (@grok) 2025年2月18日
xAI の投稿によると、Grok 3 モデルは「世界で最も賢い AI」として宣伝されており、さまざまな分野で興味をそそられています。
GROK 3: 物理学、ゲーム、そして宇宙を解く
xAIの最新モデルの完全なプレゼンテーションとデモ
0:00 xAI のミッション: 宇宙を理解する 1:20 チームプレゼンテーション 2:01 Grok は深く理解することを意味します 2:29 Grok 2 から Grok 3 へ 6:30 Grok 3 ベンチマーク 9:07 Grok 3 は… https://t.co/7qbB6O16Yb pic.twitter.com/BomGwAOa1I
— マリオ・ナウファル (@MarioNawfal) 2025年2月18日
デモの完全なビデオは、上記のリンク先の投稿でご覧いただけます。さらに、「DeepSeek 効果」と呼ばれる現象を受けて、マスク氏は以前のバージョンである Grok 2 をまもなくオープンソース化し、この技術の開発に関するさらなる洞察を提供すると発表しました。
xAI の新しい「Grok 3」モデル (昨夜リリース) は、数学、科学、コーディングのベンチマークにおいて、公開されている他のすべての基礎モデル (DeepSeek-V3 および GPT-4o を含む) を上回りました。pic.twitter.com/ iB6KuDPsdc
— ストックトーク (@stocktalkweekly) 2025年2月18日
xAI は、特に数学、科学、プログラミングなどの分野で、Grok 3 が DeepSeek-V3 や GPT-4o などの他の公開されている基礎モデルをすべて上回っていると積極的に主張してきました。LLM は、Arena ベンチマークで 1, 402という印象的なスコアを達成しました。
xAIは期待を上回る
Grok 3 は世界で最も強力な AI のようですpic.twitter.com/OtO6rGD22e
— マニフォールド(@ManifoldMarkets)2025年2月18日
一方、投機投資の世界では、Grok 3 が最も強力な AI として栄冠を獲得するという Manifold Markets の賭け契約は、「イエス」の結論に傾いています。ただし、その確率は月曜深夜の 91% から現在はわずか 78% へと大幅に低下しています。
Grok 3 に対する批判的なレビューが新たに登場し、限定的ではあるものの、こうした確率の低下に影響を与えている可能性があるようです。
つまり…この種の質問には推論モデルが必要です
— バオ・ブイ (@vqbaobui) 2025年2月18日
たとえば、DeepSeek の元従業員である Zihan Wang 氏は、ピサの斜塔から異なる高さに吊り下げられた異なるサイズの 2 つの鉄球の画像を提示し、どちらが先に地面に着地するかを尋ねるという物理学の問題を Grok 3 に提示しました。予想される論理的な答えは重い方の鉄球ですが、Grok 3 は両方とも同時に着地すると誤って回答しました。
インフルエンサーと実際の人々を見れば、違いが分かります。@Teknium1でさえも指輪にキスをしています。彼らがこれを「最もスマートなモデル」として宣伝しながら、FrontierMath、Arc-AGI、HLE について話さなかったのには理由があります。私の最初のテストは@karpathyと同じ雰囲気です。o1-pro に近づいていますが、o3-mini には遠く及びません。
— relletreknit (@relletreknit) 2025年2月18日
さらに、FrontierMath、Arc-AGI、HLE などの確立されたベンチマークで Grok 3 のパフォーマンス メトリックを公開しないという xAI の決定をめぐっては、疑問が高まっています。
これらの批判は、Grok 3 の可能性を否定するものではないことに注意することが重要です。Grok 3 は間違いなく優れた AI モデルです。むしろ、xAI の主張する優位性の信憑性について重要な疑問を提起しています。
金融動向と今後の見通し
これとは別に、同様に重要な展開として、ブルームバーグは最近、xAI が最大 100 億ドルの新規資金を調達しており、評価額が 750 億ドルに跳ね上がる可能性があると報じた。このスタートアップは以前、資金調達ラウンドで 60 億ドルを確保し、評価額は 400 億ドルだった。
昨年の初めは 10k のトレーニングがほとんどできませんでしたが、Grok3 ではノンストップで 100k のトレーニングを達成しました。とても誇りに思います。今後もさらに頑張ります!
— 張国東 (@Guodzh) 2025年2月18日
xAI の Guodong Zhang 氏が、Grok 3 が 10 万個の GPU を使用してトレーニングされたと発表し、リソースと機能の大幅な向上を示したことは注目に値します。この開発は、AI チップの売上が2032 年までに2, 270 億ドルに急増する可能性があるという予測の中で行われました。
さらに詳しい情報や考察については、こちらの 記事全文をご覧ください。
コメントを残す