
微軟在人工智慧時代對歐洲文化遺產的承諾
微軟在巴黎宣布了一項具有開創性的舉措,推出了兩項重要舉措,旨在保護歐洲豐富的語言和文化遺產,同時提升歐洲大陸在快速發展的人工智慧領域中的地位。這些措施以微軟先前的「歐洲數位承諾」為基礎,該承諾專注於擴展人工智慧和雲端基礎設施、加強資料隱私、提高網路韌性以及增強歐洲的數位競爭力。新舉措旨在使歐洲語言和文化資產更容易在線訪問,並確保它們在大型語言模型(LLM)中得到充分體現。
歐洲語言多樣性的重要性
歐洲擁有超過200種語言和跨越數千年的文化歷史,為創意表達和經濟活動奠定了基礎。這種語言多樣性不僅促進了交流,也推動了創新和貿易。然而,隨著網路日益被英語內容所主導,且主要反映的是美國人的觀點,人們越來越擔心,在培養現代法學碩士(LLM)的數據集中,歐洲的文化豐富性和商業利益正在被忽視。微軟副董事長兼總裁布拉德史密斯強調了這項擔憂,他指出:
“不了解歐洲語言、歷史和價值觀的人工智慧無法充分服務於歐洲人民、企業或未來。”
人工智慧語言模型的差異凸顯
這種語言不平衡的一個鮮明例子是開源模型Llama 3.1的表現。該模型在希臘語和拉脫維亞語的表現與英語相比差距超過15分,在拉脫維亞語方面則落後超過25分。這表明,該模型在英語方面表現出色,但在許多代表性較低的語言方面卻表現不佳——這個問題在重要的LLM基準測試中都存在。
微軟的多語言資料集開發策略
為了應對這項挑戰,微軟計劃增強其位於法國史特拉斯堡的創新中心。這些中心將專注於利用 Microsoft Azure 開發和管理多語言資料集。微軟將與歐洲各地的文化機構、學術合作夥伴和科技公司合作,旨在擴大十種代表性不足的語言(包括愛沙尼亞語、阿爾薩斯語、斯洛伐克語、希臘語和馬耳他語)的訓練資料可用性。
此外,微軟已發起徵集提案活動,旨在收集數位文字、文字記錄和其他適用於人工智慧開發的理想資源。自2025年9月1日起,有興趣的申請人可以透過「AI for Good Lab」網站申請提供Azure積分以及工程和技術支援的資助。
利用文化人工智慧振興文化遺產
今年秋季,微軟還將擴展其文化人工智慧 (Culture AI) 項目,推出一項雄心勃勃的項目,旨在為巴黎標誌性建築巴黎聖母院打造一個精確的數位複製品。該計畫與法國文化部和遺產數位化專家 Iconem 合作,力求精準捕捉這座屹立 862 年的哥德式歷史建築的細節。在此之前,文化人工智慧計畫已成功對希臘古奧林匹亞、法國聖米歇爾山、羅馬聖彼得大教堂以及諾曼第盟軍登陸海灘等重要遺址進行了數位化保存。
透過在地化賦能
這些舉措汲取了微軟四十餘年豐富的在地化經驗。目前,Windows 支援 90 多種語言,涵蓋所有歐盟官方語言以及巴斯克語、加泰羅尼亞語、加利西亞語、盧森堡語和瓦倫西亞語等多種地區方言。此外,Microsoft 365 提供超過 30 種歐洲語言的 Office 介面。透過將歐洲語言和文化資產融入其人工智慧和雲端服務,微軟致力於保護歐洲大陸的文化遺產,同時賦能其企業和公民,使其在數位時代蓬勃發展。
重要的是,該公司聲稱這些努力純粹是支持性的,旨在提供開放資料、工具和專業知識,而不是專有資源。
發佈留言