マイクロソフトは、先進的で包括的なAI開発のためにヨーロッパの言語と文化を推進しています

マイクロソフトは、先進的で包括的なAI開発のためにヨーロッパの言語と文化を推進しています

AI時代におけるマイクロソフトのヨーロッパ文化遺産への取り組み

パリで行われた画期的な発表において、マイクロソフトは、ヨーロッパの豊かな言語的・文化的遺産を保全するとともに、急速に進化するAI環境におけるヨーロッパの地位を強化することを目的とした、2つの重要なイニシアチブを発表しました。これらの取り組みは、AIとクラウドインフラの拡張、データプライバシーの強化、サイバーレジリエンスの向上、そしてヨーロッパのデジタル競争力の強化に重点を置いた、同社のこれまでの欧州デジタルコミットメントを基盤としています。新たなイニシアチブは、ヨーロッパの言語と文化資産へのオンラインアクセスを向上させ、大規模言語モデル(LLM)において適切に表現されることを目指しています。

ヨーロッパの言語多様性の重要性

ヨーロッパには200以上の言語と数千年にわたる文化史があり、創造的な表現と経済活動の基盤となっています。この言語的多様性は、コミュニケーションを促進するだけでなく、イノベーションと貿易を促進します。しかし、インターネットがますます英語コンテンツに支配され、主にアメリカの視点を反映している中で、現代の法学修士課程の教育データセットにおいて、ヨーロッパの文化的豊かさと商業的利益が軽視されているのではないかという懸念が高まっています。マイクロソフトの副会長兼社長であるブラッド・スミス氏は、この懸念を強調し、次のように述べています。

「ヨーロッパの言語、歴史、価値観を理解しないAIは、ヨーロッパの人々、企業、そして未来に十分貢献することはできません。」

AI言語モデルの格差を浮き彫りにする

この言語的不均衡の顕著な例は、オープンソースモデルであるLlama 3.1のパフォーマンスに見られます。このモデルは、英語と比較してギリシャ語で15ポイント以上、ラトビア語で25ポイント以上のパフォーマンス差を示しています。これは、モデルが英語では優れているものの、あまり代表されていない多くの言語では不十分であるという、大きな乖離を示しています。これは、著名なLLMベンチマークにおいて一貫して見られる問題です。

マイクロソフトの多言語データセット開発戦略

この課題に取り組むため、マイクロソフトはフランスのストラスブールに拠点を置くイノベーションセンターの強化を計画しています。これらのセンターは、Microsoft Azureを活用した多言語データセットの開発とキュレーションに重点的に取り組みます。ヨーロッパ各地の文化機関、学術機関、テクノロジー企業との連携により、エストニア語、アルザス語、スロバキア語、ギリシャ語、マルタ語など、利用頻度の低い10言語のトレーニングデータの利用可能範囲を拡大することを目指します。

さらに、マイクロソフトは、AI開発に最適なデジタルテキスト、トランスクリプト、その他のリソースを収集するための提案募集を開始しました。2025年9月1日より、関心のある応募者は、AI for Good Labウェブサイトを通じて、Azureクレジットに加え、エンジニアリングおよび技術サポートを提供する助成金を申請できます。

Culture AIによる文化遺産の再生

マイクロソフトは今秋、パリの象徴的なノートルダム大聖堂の精巧なデジタルレプリカを製作するという野心的なプロジェクトを、Culture AIプログラムに拡大します。フランス文化省および文化遺産デジタル化の専門企業Iconemと提携し、この取り組みは、862年の歴史を持つこのゴシック様式の歴史的建造物の細部までを緻密に捉えることを目指します。Culture AIはこれまでに、ギリシャの古代オリンピア、フランスのモン・サン・ミシェル、ローマのサン・ピエトロ大聖堂、ノルマンディーの連合軍上陸海岸といった重要な遺跡のデジタル保存に成功しています。

ローカリゼーションによるエンパワーメント

これらの取り組みは、マイクロソフトが40年以上にわたって培ってきたローカリゼーションの豊富な経験に基づいています。現在、Windowsは90以上の言語をサポートしており、これにはEUの公用語すべてに加え、バスク語、カタロニア語、ガリシア語、ルクセンブルク語、バレンシア語といった地域方言も含まれています。さらに、Microsoft 365は30以上のヨーロッパ言語でOfficeインターフェースを提供しています。マイクロソフトは、ヨーロッパの言語と文化遺産をAIおよびクラウドサービスに統合することで、デジタル時代における企業と市民のエンパワーメントを図りながら、大陸の文化遺産を守りたいと考えています。

重要なのは、これらの取り組みは本質的に純粋に支援的なものであり、独自のリソースではなく、オープンなデータ、ツール、専門知識を提供することを目的としていると同社が主張していることです。

出典と画像

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です