
AI 시대의 유럽 문화 유산에 대한 Microsoft의 헌신
파리에서 발표된 획기적인 발표를 통해 Microsoft는 유럽의 풍부한 언어 및 문화 유산을 보존하는 동시에 빠르게 진화하는 AI 환경에서 유럽 대륙의 입지를 강화하기 위한 두 가지 중요한 이니셔티브를 도입했습니다.이러한 노력은 AI 및 클라우드 인프라 확장, 데이터 프라이버시 강화, 사이버 복원력 향상, 그리고 유럽의 디지털 경쟁력 강화에 중점을 둔 Microsoft의 기존 유럽 디지털 공약(European Digital Commitments)을 기반으로 합니다.새로운 이니셔티브는 유럽 언어와 문화 자산을 온라인에서 더 쉽게 접근하고 대규모 언어 모델(LLM)에서 효과적으로 표현되도록 하는 데 중점을 두고 있습니다.
유럽의 언어적 다양성의 중요성
유럽은 200개가 넘는 언어와 수천 년에 걸친 문화적 역사를 자랑하며, 창의적인 표현과 경제 활동의 기반이 되어 왔습니다.이러한 언어적 다양성은 소통을 촉진할 뿐만 아니라 혁신과 무역을 촉진합니다.그러나 인터넷이 점점 더 영어 콘텐츠로 가득 차고, 이는 주로 미국의 관점을 반영함에 따라, 현대 LLM을 양성하는 데이터셋에서 유럽의 문화적 풍요로움과 상업적 이익이 간과되고 있다는 우려가 커지고 있습니다.마이크로소프트 부회장 겸 사장인 브래드 스미스는 이러한 우려를 다음과 같이 강조했습니다.
“유럽의 언어, 역사, 가치를 이해하지 못하는 AI는 유럽 국민, 기업, 미래에 온전히 기여할 수 없습니다.”
AI 언어 모델의 차이점 강조
이러한 언어적 불균형의 극명한 예는 오픈소스 모델인 Llama 3.1의 성능에서 확인할 수 있습니다.이 모델은 그리스어에서 15점 이상의 성능 차이를, 라트비아어에서는 영어 대비 25점 이상의 성능 차이를 보입니다.이는 이 모델이 영어에서는 우수하지만, 상대적으로 덜 알려진 여러 언어에서는 부족한 심각한 불균형을 나타냅니다.이는 주요 LLM 벤치마크에서도 일관되게 나타나는 문제입니다.
Microsoft의 다국어 데이터 세트 개발 전략
이러한 과제를 해결하기 위해 Microsoft는 프랑스 스트라스부르에 위치한 혁신 센터를 강화할 계획입니다.이 센터들은 Microsoft Azure를 활용하여 다국어 데이터세트를 개발하고 큐레이션하는 데 중점을 둘 것입니다.유럽 전역의 문화 기관, 학계 파트너, 기술 기업과의 협력을 통해 에스토니아어, 알자스어, 슬로바키아어, 그리스어, 몰타어를 포함한 10개 언어의 학습 데이터 가용성을 확대할 것입니다.
또한, Microsoft는 AI 개발에 적합한 디지털 텍스트, 대본 및 기타 리소스 수집을 위한 제안 모집을 시작했습니다.2025년 9월 1일부터 관심 있는 지원자는 AI for Good Lab 웹사이트를 통해 Azure 크레딧과 엔지니어링 및 기술 지원을 제공하는 보조금을 신청할 수 있습니다.
Culture AI로 문화유산 되살리기
올가을, 마이크로소프트는 파리의 상징적인 노트르담 대성당의 정밀한 디지털 복제본을 제작하는 야심 찬 프로젝트로 Culture AI 프로그램을 확장할 예정입니다.프랑스 문화부 및 문화유산 디지털화 전문 기업인 아이코넴(Iconem)과 협력하여 862년 동안 건립된 이 역사적인 고딕 양식 건축물의 세부 사항을 세밀하게 포착하는 것을 목표로 합니다.이전 Culture AI 프로젝트들은 그리스의 고대 올림피아, 프랑스의 몽생미셸, 로마의 성 베드로 대성당, 그리고 노르망디의 연합군 상륙 해변과 같은 주요 유적지를 성공적으로 디지털 보존했습니다.
현지화를 통한 권한 부여
이러한 이니셔티브는 40년 이상 축적된 Microsoft의 풍부한 현지화 경험을 바탕으로 합니다.현재 Windows는 모든 유럽 연합 공식 언어와 바스크어, 카탈루냐어, 갈리시아어, 룩셈부르크어, 발렌시아어 등 여러 지역 방언을 포함하여 90개 이상의 언어를 지원합니다.또한 Microsoft 365는 30개 이상의 유럽 언어로 Office 인터페이스를 제공합니다. Microsoft는 유럽의 언어와 문화 자산을 AI 및 클라우드 서비스에 통합함으로써 유럽 대륙의 문화 유산을 보호하는 동시에 디지털 시대의 기업과 시민에게 역량을 제공하고자 합니다.
중요한 점은, 이 회사가 이러한 노력이 독점적인 리소스가 아닌 오픈 데이터, 도구 및 전문 지식을 제공하는 것을 목표로 하는 순전히 지원적 성격이라고 주장한다는 것입니다.
답글 남기기