微软推动欧洲语言和文化发展,促进先进、包容的人工智能发展

微软推动欧洲语言和文化发展,促进先进、包容的人工智能发展

微软在人工智能时代对欧洲文化遗产的承诺

微软在巴黎宣布了一项具有开创性的举措,推出了两项重要举措,旨在保护欧洲丰富的语言和文化遗产,同时提升欧洲大陆在快速发展的人工智能领域中的地位。这些举措以微软此前的“欧洲数字承诺”为基础,该承诺侧重于扩展人工智能和云基础设施、加强数据隐私、提高网络韧性以及增强欧洲的数字竞争力。新举措旨在使欧洲语言和文化资产更容易在线访问,并确保它们在大型语言模型(LLM)中得到充分体现。

欧洲语言多样性的重要性

欧洲拥有超过200种语言和跨越数千年的文化历史,为创造性表达和经济活动奠定了基础。这种语言多样性不仅促进了交流,也推动了创新和贸易。然而,随着互联网日益被英语内容所主导,且主要反映的是美国人的观点,人们越来越担心,在培养现代法学硕士(LLM)的数据集中,欧洲的文化丰富性和商业利益正在被忽视。微软副董事长兼总裁布拉德·史密斯强调了这一担忧,他指出:

“不了解欧洲语言、历史和价值观的人工智能无法充分服务于欧洲人民、企业或未来。”

人工智能语言模型的差异凸显

这种语言不平衡的一个鲜明例子是开源模型Llama 3.1的表现。该模型在希腊语和拉脱维亚语方面的表现与英语相比差距超过15分,在拉脱维亚语方面则落后超过25分。这表明,该模型在英语方面表现出色,但在许多代表性较低的语言方面却表现不佳——这个问题在重要的LLM基准测试中都存在。

微软的多语言数据集开发战略

为了应对这一挑战,微软计划增强其位于法国斯特拉斯堡的创新中心。这些中心将专注于利用 Microsoft Azure 开发和管理多语言数据集。微软将与欧洲各地的文化机构、学术合作伙伴和科技公司合作,旨在扩大十种代表性不足的语言(包括爱沙尼亚语、阿尔萨斯语、斯洛伐克语、希腊语和马耳他语)的训练数据可用性。

此外,微软已发起征集提案活动,旨在收集数字文本、文字记录和其他适用于人工智能开发的理想资源。自2025年9月1日起,感兴趣的申请人可以通过“AI for Good Lab”网站申请提供Azure积分以及工程和技术支持的资助。

利用文化人工智能振兴文化遗产

今年秋季,微软还将扩展其文化人工智能 (Culture AI) 项目,推出一项雄心勃勃的项目,旨在为巴黎标志性建筑巴黎圣母院打造一个精确的数字复制品。该项目与法国文化部和遗产数字化专家 Iconem 合作,力求精准捕捉这座屹立 862 年的哥特式历史建筑的细节。此前,文化人工智能项目已成功对希腊古奥林匹亚、法国圣米歇尔山、罗马圣彼得大教堂以及诺曼底盟军登陆海滩等重要遗址进行了数字化保存。

通过本地化赋能

这些举措汲取了微软四十余年丰富的本地化经验。目前,Windows 支持 90 多种语言,涵盖所有欧盟官方语言以及巴斯克语、加泰罗尼亚语、加利西亚语、卢森堡语和瓦伦西亚语等多种地区方言。此外,Microsoft 365 提供 30 多种欧洲语言的 Office 界面。通过将欧洲语言和文化资产融入其人工智能和云服务,微软致力于保护欧洲大陆的文化遗产,同时赋能其企业和公民,使其在数字时代蓬勃发展。

重要的是,该公司声称这些努力纯粹是支持性的,旨在提供开放数据、工具和专业知识,而不是专有资源。

来源和图片

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注