Microsoft wspiera rozwój języków i kultury europejskiej na rzecz zaawansowanego i inkluzywnego rozwoju sztucznej inteligencji

Microsoft wspiera rozwój języków i kultury europejskiej na rzecz zaawansowanego i inkluzywnego rozwoju sztucznej inteligencji

Zaangażowanie Microsoftu w ochronę europejskiego dziedzictwa kulturowego w dobie sztucznej inteligencji

W przełomowym ogłoszeniu w Paryżu, Microsoft przedstawił dwie istotne inicjatywy mające na celu zachowanie bogatego dziedzictwa językowego i kulturowego Europy, a jednocześnie wzmocnienie pozycji kontynentu w dynamicznie zmieniającym się krajobrazie sztucznej inteligencji. Działania te opierają się na wcześniejszych Europejskich Zobowiązaniach Cyfrowych firmy, które koncentrowały się na rozbudowie infrastruktury sztucznej inteligencji i chmury obliczeniowej, wzmocnieniu ochrony danych, poprawie cyberodporności oraz wzmocnieniu cyfrowej konkurencyjności Europy. Nowe inicjatywy mają na celu zwiększenie dostępności europejskich języków i zasobów kulturowych online oraz zapewnienie ich dobrej reprezentacji w dużych modelach językowych (LLM).

Znaczenie różnorodności językowej Europy

Europa jest ojczyzną ponad 200 języków i tysiącletniej historii kulturowej, stanowiącej fundament dla twórczej ekspresji i działalności gospodarczej. Ta różnorodność językowa nie tylko sprzyja komunikacji, ale także napędza innowacje i handel. Jednak w miarę jak internet staje się coraz bardziej zdominowany przez treści w języku angielskim, w dużej mierze odzwierciedlające amerykański punkt widzenia, narastają obawy, że bogactwo kulturowe i interesy handlowe Europy są pomijane w zbiorach danych, które służą do kształcenia współczesnych absolwentów studiów magisterskich (LLM).Wiceprezes i prezes Microsoftu, Brad Smith, podkreślił te obawy, stwierdzając:

„Sztuczna inteligencja, która nie rozumie języków, historii i wartości Europy, nie może w pełni służyć jej mieszkańcom, przedsiębiorstwom ani przyszłości”.

Podkreślenie rozbieżności w modelach językowych sztucznej inteligencji

Jaskrawym przykładem tej nierównowagi językowej jest wydajność Llama 3.1, modelu open source, który wykazuje ponad 15-punktową różnicę w wynikach w języku greckim i ponad 25-punktową różnicę w wynikach w języku łotewskim w porównaniu z angielskim. Wskazuje to na znaczną dysproporcję, gdzie model ten osiąga doskonałe wyniki w języku angielskim, ale zawodzi w wielu słabiej reprezentowanych językach – problem ten występuje we wszystkich ważnych testach porównawczych LLM.

Strategia firmy Microsoft dotycząca rozwoju wielojęzycznych zbiorów danych

Aby sprostać temu wyzwaniu, Microsoft planuje rozszerzyć działalność swoich centrów innowacji w Strasburgu we Francji. Centra te będą koncentrować się na tworzeniu i gromadzeniu wielojęzycznych zbiorów danych z wykorzystaniem platformy Microsoft Azure. Współpraca z instytucjami kultury, partnerami akademickimi i firmami technologicznymi w całej Europie będzie miała na celu poszerzenie dostępności danych szkoleniowych dla dziesięciu niedoreprezentowanych języków, w tym estońskiego, alzackiego, słowackiego, greckiego i maltańskiego.

Ponadto firma Microsoft rozpoczęła nabór wniosków w celu zebrania cyfrowych tekstów, transkrypcji i innych zasobów idealnych do celów rozwoju sztucznej inteligencji. Od 1 września 2025 r.zainteresowani wnioskodawcy mogą ubiegać się o granty oferujące kredyty Azure wraz ze wsparciem inżynieryjnym i technicznym za pośrednictwem strony internetowej AI for Good Lab.

Ożywianie dziedzictwa kulturowego za pomocą sztucznej inteligencji w kulturze

Tej jesieni Microsoft planuje również rozszerzyć swój program Culture AI o ambitny projekt, którego celem jest stworzenie precyzyjnej cyfrowej repliki kultowej katedry Notre Dame w Paryżu. Inicjatywa ta, realizowana we współpracy z francuskim Ministerstwem Kultury i firmą Iconem, ekspertem w dziedzinie digitalizacji dziedzictwa kulturowego, ma na celu skrupulatne uchwycenie szczegółów historycznej gotyckiej budowli, która stoi tam od 862 lat. Wcześniejsze inicjatywy Culture AI z powodzeniem zachowały cyfrowo ważne miejsca, takie jak starożytna Olimpia w Grecji, Mont-Saint-Michel we Francji, Bazylika św. Piotra w Rzymie oraz plaże lądowania aliantów w Normandii.

Wzmocnienie poprzez lokalizację

Inicjatywy te opierają się na bogatym doświadczeniu firmy Microsoft w zakresie lokalizacji, sięgającym ponad czterech dekad. Obecnie system Windows obsługuje ponad 90 języków, w tym wszystkie oficjalne języki Unii Europejskiej oraz kilka dialektów regionalnych, takich jak baskijski, kataloński, galicyjski, luksemburski i walencki. Ponadto Microsoft 365 oferuje interfejsy pakietu Office w ponad 30 językach europejskich. Poprzez integrację języków i zasobów kulturowych Europy ze swoimi usługami w chmurze i sztucznej inteligencji, Microsoft dąży do ochrony dziedzictwa kulturowego kontynentu, jednocześnie wspierając swoje firmy i obywateli w erze cyfrowej.

Co ważne, firma podkreśla, że działania te mają charakter czysto pomocniczy i mają na celu udostępnianie otwartych danych, narzędzi i wiedzy specjalistycznej, a nie zasobów zastrzeżonych.

Źródło i obrazy

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *