
Microsoft ulepsza Azure AI Foundry dzięki bezpośredniej optymalizacji preferencji
Firma Microsoft dokonała znaczących postępów w swoim portalu Azure AI Foundry wraz z interfejsami API i zestawami SDK usługi Azure OpenAI. Najnowsza aktualizacja wprowadza Direct Preference Optimization (DPO) zarówno dla GPT-4.1, jak i GPT-4.1-mini. To innowacyjne podejście do precyzyjnego dostrajania umożliwia dostosowanie wag modelu na podstawie preferencji użytkownika, wykorzystując porównanie preferowanych i niepreferowanych odpowiedzi.
Zalety bezpośredniej optymalizacji preferencji
DPO stanowi przekonującą alternatywę dla tradycyjnego Reinforcement Learning from Human Feedback (RLHF).Jedną z jego głównych zalet jest to, że wymaga znacznie mniejszej mocy obliczeniowej i czasu, a jednocześnie skutecznie dopasowuje modele do oczekiwań użytkowników. Organizacje mogą wykorzystać tę metodę do dostrojenia modeli, aby lepiej odzwierciedlały ich konkretną tożsamość marki, standardy bezpieczeństwa i niuanse konwersacyjne.
Globalna ekspansja szkoleń
Oprócz integracji DPO, Microsoft rozszerzył swoje możliwości Azure AI Global Training o dodatkowe dwanaście regionów. To rozszerzenie obejmuje obszary takie jak East US, West Europe, UK South i Switzerland North. Należy jednak zauważyć, że ta inicjatywa pozostaje w fazie publicznej wersji zapoznawczej.
Spojrzenie w przyszłość: nadchodzące funkcje
Microsoft przewiduje nadchodzące funkcje, które ulepszą doświadczenie użytkownika, takie jak możliwość wstrzymywania i wznawiania procesów oraz funkcje obsługujące ciągłe dostrajanie. Ponadto wprowadzenie GPT-4.1-nano do nowo dodanych regionów jest na horyzoncie.
Rozważania na temat suwerenności danych i prywatności
Rozszerzenie Global Training jest szczególnie istotne w odniesieniu do suwerenności danych. W obliczu niedawnych nacisków ze strony Unii Europejskiej na rzecz lokalnego zarządzania danymi w Europie, zapewnienie zwiększonej prywatności i zgodności jest ważniejsze niż kiedykolwiek.
Wprowadzenie do API odpowiedzi
W celu ułatwienia pracy deweloperom Microsoft uruchomił nowe API Responses dostosowane do precyzyjnie dostrojonych modeli. To API zwiększa potencjał integracji w różnych aplikacjach i jest szczególnie korzystne w przypadku przepływów pracy wymagających konwersacji stanowych i wieloetapowych. Według Microsoftu API Responses „automatycznie łączy wszystko w tle”, usprawniając doświadczenie użytkownika.
Główne cechy interfejsu API odpowiedzi
To API oferuje szereg możliwości, w tym:
- Zachowywanie kontekstu w celu zwiększenia spójności konwersacji.
- Przejrzystość rozumowania modelu podczas generowania odpowiedzi.
- Śledzenie postępów użytkownika w miarę formułowania odpowiedzi.
- Obsługa przetwarzania w tle i integracji z narzędziami, takimi jak wyszukiwanie w sieci Web i wyszukiwanie plików.
Więcej informacji na temat tych aktualizacji można znaleźć w oficjalnym wpisie na blogu firmy Microsoft poświęconym usługom Azure AI.
Obraz za pośrednictwem Depositphotos.com
Dodaj komentarz