A Microsoft impulsiona as línguas e a cultura europeias para o desenvolvimento de IA avançada e inclusiva

A Microsoft impulsiona as línguas e a cultura europeias para o desenvolvimento de IA avançada e inclusiva

O compromisso da Microsoft com o patrimônio cultural europeu na era da IA

Em um anúncio inovador feito em Paris, a Microsoft lançou duas iniciativas significativas com o objetivo de preservar o rico patrimônio linguístico e cultural da Europa, ao mesmo tempo em que reforça a posição do continente no cenário da IA em rápida evolução. Esses esforços se baseiam nos Compromissos Digitais Europeus anteriores da empresa, que se concentraram na expansão da infraestrutura de IA e nuvem, no fortalecimento da privacidade de dados, na melhoria da resiliência cibernética e no fortalecimento da competitividade digital da Europa. As novas iniciativas visam tornar as línguas e os ativos culturais europeus mais acessíveis online e garantir que sejam bem representados em grandes modelos linguísticos (LLMs).

A importância da diversidade linguística da Europa

A Europa abriga mais de 200 línguas e uma história cultural que abrange milênios, servindo de base para a expressão criativa e as atividades econômicas. Essa diversidade linguística não apenas fomenta a comunicação, mas também impulsiona a inovação e o comércio. No entanto, à medida que a internet se torna cada vez mais dominada por conteúdo em inglês, refletindo amplamente os pontos de vista americanos, há uma preocupação crescente de que a riqueza cultural e os interesses comerciais da Europa estejam sendo negligenciados nos conjuntos de dados que formam os LLMs modernos. O vice-presidente e presidente da Microsoft, Brad Smith, destacou essa preocupação ao declarar:

“Uma IA que não compreende as línguas, as histórias e os valores da Europa não pode servir plenamente o seu povo, os seus negócios ou o seu futuro.”

Destacando a disparidade nos modelos de linguagem da IA

Um exemplo flagrante desse desequilíbrio linguístico pode ser observado no desempenho do Llama 3.1, um modelo de código aberto que apresenta uma diferença de desempenho de mais de 15 pontos em grego e uma deficiência de mais de 25 pontos em letão em comparação com o inglês. Isso indica uma disparidade significativa, na qual o modelo se destaca em inglês, mas fica aquém em muitas línguas menos representadas — um problema consistente em benchmarks notáveis de LLM.

Estratégia da Microsoft para o desenvolvimento de conjuntos de dados multilíngues

Para enfrentar esse desafio, a Microsoft planeja aprimorar seus centros de inovação sediados em Estrasburgo, França. Esses centros se concentrarão no desenvolvimento e na curadoria de conjuntos de dados multilíngues utilizando o Microsoft Azure. Colaborações com instituições culturais, parceiros acadêmicos e empresas de tecnologia em toda a Europa terão como objetivo ampliar a disponibilidade de dados de treinamento para dez idiomas sub-representados, incluindo estoniano, alsaciano, eslovaco, grego e maltês.

Além disso, a Microsoft iniciou uma chamada para propostas para coletar textos digitais, transcrições e outros recursos ideais para fins de desenvolvimento de IA. A partir de 1º de setembro de 2025, os candidatos interessados podem buscar bolsas que ofereçam créditos do Azure, além de suporte técnico e de engenharia, por meio do site do AI for Good Lab.

Revitalizando o Patrimônio Cultural com a Culture AI

Neste outono, a Microsoft também se prepara para expandir seu programa Culture AI com um projeto ambicioso que visa criar uma réplica digital precisa da icônica Catedral de Notre Dame, em Paris. Em parceria com o Ministério da Cultura francês e a Iconem, especialista em digitalização de patrimônio, esta iniciativa busca capturar meticulosamente os detalhes da histórica estrutura gótica, que existe há 862 anos. Iniciativas anteriores do Culture AI preservaram digitalmente com sucesso locais importantes como a Antiga Olímpia, na Grécia, o Monte Saint-Michel, na França, a Basílica de São Pedro, em Roma, e as praias do desembarque dos Aliados na Normandia.

Empoderamento por meio da localização

Essas iniciativas se baseiam na vasta experiência da Microsoft em localização, que se estende por mais de quatro décadas. Atualmente, o Windows oferece suporte a mais de 90 idiomas, incorporando todos os idiomas oficiais da União Europeia e diversos dialetos regionais, como basco, catalão, galego, luxemburguês e valenciano. Além disso, o Microsoft 365 oferece interfaces do Office em mais de 30 idiomas europeus. Por meio da integração dos idiomas e ativos culturais europeus em seus serviços de IA e nuvem, a Microsoft aspira a proteger o patrimônio cultural do continente, ao mesmo tempo em que capacita suas empresas e cidadãos na era digital.

É importante ressaltar que a empresa afirma que esses esforços são de natureza puramente solidária, com o objetivo de fornecer dados abertos, ferramentas e conhecimento especializado, em vez de recursos proprietários.

Fonte e Imagens

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *