
最近、OpenAI はオープンウェイトモデルを発表することで大きな前進を遂げました。これは、主に中国の大手 AI 企業が独占している市場において注目すべき動きです。
OpenAIのオープンウェイトモデルは主要分野で中国の同業他社を上回る
アメリカのテクノロジー企業は、中国の同業他社が長年活用してきた戦略、特にオープンソースフレームワークと大規模言語モデル(LLM)の統合を採用し始めています。この変化は、オープンソースAIモデルの重要性を強調したトランプ前大統領のAI行動計画で示された優先事項と一致しています。その結果、OpenAIはGPT-2以来初のオープンウェイトモデルセットとなるgpt-ossシリーズをリリースしました。gpt-oss-20bとgpt-oss-120bの2つの構成が用意されています。
これらの新モデルの技術仕様を詳しく見てみると、gpt-oss-20bは210億という驚異的なパラメータ数を誇り、Mixture of Experts(MoE)Transformerアーキテクチャを採用しています。また、最大131, 072トークンという十分なコンテキストウィンドウを備え、16GB VRAMプラットフォームと互換性があるため、ほとんどのコンシューマーグレードGPUで効率的に動作可能です。一方、より大型のgpt-oss-120bは1170億という堅牢なパラメータ数を備え、推論タスクに優れていますが、最適なパフォーマンスを得るにはより強力なNVIDIA H100プラットフォームが必要です。

注目すべきは、これらのモデルがApache 2.0ライセンスの下で配布されており、商用利用、改変、再配布が許可されていることです。このオープンソースの性質は、中国のAI企業と同様の位置付けとなっています。OpenAIがこの分野に参入するにあたり、同社は数年にわたりオープンソース・エコシステムを構築してきた中国のAI企業の進歩に戦略的に対応しようとしているようです。MetaのLLaMAを除けば、米国ではこれまで主流のオープンソース・モデルにほとんど動きが見られませんでした。
OpenAIがオープンウェイトモデルに進出したことで、今後のリリースに期待が高まっています。gpt-ossと中国の代替モデルを比較すると、OpenAIは称賛に値する進歩を遂げているものの、中国のモデルは一般的にパラメータ数が多いことがわかります。例えば、DeepSeek V2やQwen 3といった著名なモデルは、パラメータ数がはるかに多いことを誇っています。
カテゴリ | GPT-OSS 120B / 20B | ディープシーク-V2 / R1 | Qwen3 / Qwen2.5 / QwQ |
---|---|---|---|
組織 | オープンAI | ディープシーク(中国) | アリババ(中国) |
モデルタイプ | スパースMoE(専門家の混合) | スパース MoE | 高密度とMoEのハイブリッド |
合計パラメータ | 120B / 20B | 236B / 67B | 235B / 72B / 32B / その他 |
アクティブパラメータ | 約51億 / 約36億 | 約210億 / 約67億 | ~22B (Qwen3-235B) / ~3B (Qwen3-30B-A3B) |
コンテキストウィンドウ | 128Kトークン | 128Kトークン | 128K(Qwen3)、32K(Qwen2.5) |
総パラメータ数とアクティブパラメータ数は重要ですが、モデルの優位性を決定する唯一の要因ではありません。しかしながら、中国のモデルは長年の経験に基づき、大きな優位性を有しています。リアルタイム性能を評価するため、MMLU(Massive Multitask Language Understanding)やAIME Mathなど、様々なベンチマークを比較しました。これらの評価はClarifaiによって実施され、注目すべき知見が得られました。
ベンチマークタスク | GPT-OSS-120B | GLM-4.5 | Qwen-3の思考 | ディープシークR1 | K2のように |
---|---|---|---|---|---|
MMLU-Pro(推論) | 約90.0% | 84.6% | 84.4% | 85.0% | 81.1% |
AIME 数学(ツール付き) | 約96.6~97.9% | 約91% | 約92.3% | 約87.5% | 約49~69% |
GPQA(理学博士) | 約80.9% | 79.1% | 81.1% | 81.0% | 75.1% |
SWEベンチ(コーディング) | 62.4% | 64.2% | — | 約65.8% | 約65.8% |
TAUベンチ(エージェント) | 約67.8% | 79.7% | 約67.8% | 約63.9% | 約70.6% |
BFCL-v3 (関数呼び出し) | 約67~68% | 77.8% | 71.9% | 37% | — |
結果は、gpt-ossが推論と数学的タスクにおいて優れていることを明確に示しており、同業他社の中で強力な競合相手であることを示しています。さらに、多くの高密度モデルと比較してアクティブパラメータのフットプリントが小さいため、ローカルAIソリューションを求めるユーザーにとってより経済的な選択肢となります。しかし、ベンチマークでは、エージェントタスクと多言語機能に関しては、gpt-oss-120bモデルは依然として一部の中国語の代替モデルに遅れをとっているものの、市場における有力な候補であることは変わりません。
オープンウェイトモデルの出現は、より包括的なエコシステムを育むため、AI業界にとって極めて重要です。この取り組みにより、OpenAIは、これまで中国企業が優勢だった分野において、米国のプレゼンスを強化する可能性を秘めています。この画期的な出来事は、サム・アルトマン氏とOpenAIチームにとって、この競争の激しい環境を乗り切る上で大きな満足感をもたらすでしょう。
コメントを残す