
Microsofts Engagement für das europäische Kulturerbe im Zeitalter der KI
In einer bahnbrechenden Ankündigung in Paris hat Microsoft zwei bedeutende Initiativen vorgestellt, die darauf abzielen, Europas reiches sprachliches und kulturelles Erbe zu bewahren und gleichzeitig die Position des Kontinents in der sich rasant entwickelnden KI-Landschaft zu stärken. Diese Bemühungen bauen auf den früheren europäischen digitalen Verpflichtungen des Unternehmens auf, die sich auf den Ausbau der KI- und Cloud-Infrastruktur, die Stärkung des Datenschutzes, die Verbesserung der Cyber-Resilienz und die Stärkung der digitalen Wettbewerbsfähigkeit Europas konzentrierten. Die neuen Initiativen zielen darauf ab, europäische Sprachen und Kulturgüter online zugänglicher zu machen und sicherzustellen, dass sie in großen Sprachmodellen (LLMs) gut repräsentiert sind.
Die Bedeutung der sprachlichen Vielfalt Europas
Europa ist die Heimat von über 200 Sprachen und einer jahrtausendealten Kulturgeschichte, die als Grundlage für kreativen Ausdruck und wirtschaftliche Aktivitäten dient. Diese sprachliche Vielfalt fördert nicht nur die Kommunikation, sondern treibt auch Innovation und Handel voran. Da das Internet jedoch zunehmend von englischsprachigen Inhalten dominiert wird, die weitgehend amerikanische Sichtweisen widerspiegeln, wächst die Sorge, dass Europas kultureller Reichtum und seine kommerziellen Interessen in den Datensätzen, die moderne LLMs ausbilden, vernachlässigt werden. Brad Smith, Vizepräsident und Präsident von Microsoft, betonte diese Besorgnis mit den Worten:
„Eine KI, die die Sprachen, die Geschichte und die Werte Europas nicht versteht, kann weder der Bevölkerung noch den Unternehmen oder der Zukunft Europas in vollem Umfang dienen.“
Hervorhebung der Unterschiede bei KI-Sprachmodellen
Ein deutliches Beispiel für dieses sprachliche Ungleichgewicht ist die Leistung von Llama 3.1, einem Open-Source-Modell, das im Vergleich zu Englisch eine Leistungslücke von über 15 Punkten im Griechischen und von über 25 Punkten im Lettischen aufweist. Dies deutet auf eine erhebliche Diskrepanz hin: Das Modell ist im Englischen hervorragend, schneidet aber in vielen weniger vertretenen Sprachen schlechter ab – ein Problem, das sich durch alle namhaften LLM-Benchmarks zieht.
Microsofts Strategie zur Entwicklung mehrsprachiger Datensätze
Um dieser Herausforderung zu begegnen, plant Microsoft den Ausbau seiner Innovationszentren im französischen Straßburg. Diese Zentren konzentrieren sich auf die Entwicklung und Pflege mehrsprachiger Datensätze mithilfe von Microsoft Azure. Durch die Zusammenarbeit mit Kulturinstitutionen, akademischen Partnern und Technologieunternehmen in ganz Europa soll die Verfügbarkeit von Trainingsdaten für zehn unterrepräsentierte Sprachen, darunter Estnisch, Elsässisch, Slowakisch, Griechisch und Maltesisch, erweitert werden.
Darüber hinaus hat Microsoft eine Ausschreibung für die Sammlung digitaler Texte, Transkripte und anderer Ressourcen gestartet, die sich ideal für die KI-Entwicklung eignen. Ab dem 1. September 2025 können sich interessierte Bewerber über die Website des AI for Good Lab um Zuschüsse bewerben, die Azure-Guthaben sowie technischen Support umfassen.
Revitalisierung des kulturellen Erbes mit Culture AI
In diesem Herbst erweitert Microsoft zudem sein Culture-AI-Programm um ein ehrgeiziges Projekt zur Erstellung einer präzisen digitalen Nachbildung der berühmten Pariser Kathedrale Notre Dame. In Zusammenarbeit mit dem französischen Kulturministerium und dem Experten für Denkmalpflege Iconem sollen die Details des 862 Jahre alten gotischen Bauwerks akribisch erfasst werden. Frühere Culture-AI-Initiativen haben bedeutende Stätten wie das antike Olympia in Griechenland, den Mont-Saint-Michel in Frankreich, den Petersdom in Rom und die Landungsstrände der Alliierten in der Normandie erfolgreich digital konserviert.
Stärkung der Position durch Lokalisierung
Diese Initiativen basieren auf Microsofts umfassender, über vier Jahrzehnte langer Erfahrung in der Lokalisierung. Windows unterstützt derzeit über 90 Sprachen, darunter alle Amtssprachen der Europäischen Union und mehrere regionale Dialekte wie Baskisch, Katalanisch, Galicisch, Luxemburgisch und Valencianisch. Darüber hinaus bietet Microsoft 365 Office-Oberflächen in über 30 europäischen Sprachen. Durch die Integration europäischer Sprachen und Kulturgüter in seine KI- und Cloud-Dienste möchte Microsoft das kulturelle Erbe Europas schützen und gleichzeitig Unternehmen und Bürger im digitalen Zeitalter stärken.
Wichtig ist, dass das Unternehmen betont, dass diese Bemühungen rein unterstützender Natur sind und darauf abzielen, offene Daten, Tools und Fachwissen und nicht proprietäre Ressourcen bereitzustellen.
Schreibe einen Kommentar