Apple wykorzystuje innowacyjną technologię do trenowania modeli AI poprzez porównywanie danych syntetycznych z prawdziwymi wiadomościami e-mail, poprawiając jakość wyjściowego tekstu dzięki osadzeniom i narzędziom ochrony prywatności

Pomimo oczekiwań związanych z funkcją Personalized Siri, Apple ogłosiło, że jej debiut zostanie przełożony na przyszły rok, po wprowadzeniu iOS 18.4. Jednak opinie pracowników sugerują optymizm w firmie, że funkcja ta może faktycznie zostać uruchomiona jeszcze w tym roku. Ostatnie spostrzeżenia ujawniają, w jaki sposób Apple udoskonala swoje procesy szkoleniowe AI, w szczególności poprzez rozwój Apple Intelligence.

Innowacyjne metody szkoleniowe: w jaki sposób Apple wykorzystuje dane syntetyczne, dbając jednocześnie o prywatność użytkowników

W świetle opóźnienia Personalized Siri raport Bloomberga rzuca światło na strategię Apple dotyczącą trenowania systemów AI. Raport odwołuje się do bloga Machine Learning Research firmy Apple, który omawia wykorzystanie danych syntetycznych do trenowania modeli AI.

Historycznie krytycy zauważyli, że Apple pozostaje w tyle za swoimi konkurentami w dziedzinie AI. Niekonwencjonalne wykorzystanie przez firmę danych syntetycznych stwarza pewne wyzwania. Na przykład metoda ta ma trudności z efektywną interpretacją trendów niezbędnych dla narzędzi wymagających kompleksowego podsumowania lub jasnej komunikacji, takich jak pisanie długich wiadomości e-mail.

Rozpoznając te wyzwania, Apple wprowadziło innowacyjne podejście, które umożliwia porównanie danych syntetycznych z rzeczywistymi wiadomościami e-mail użytkowników, jednocześnie zapewniając poszanowanie prywatności użytkowników. Ten proces ma na celu zwiększenie skuteczności modeli AI w celu zapewnienia lepszych funkcji komunikacyjnych.

Aby ulepszyć nasze modele, musimy wygenerować zestaw wielu wiadomości e-mail, które obejmują tematy najczęściej występujące w wiadomościach. Aby stworzyć reprezentatywny zestaw syntetycznych wiadomości e-mail, zaczynamy od utworzenia dużego zestawu syntetycznych wiadomości na różne tematy. Na przykład możemy utworzyć syntetyczną wiadomość: „Czy chciałbyś zagrać w tenisa jutro o 11:30 rano?”

Odbywa się to bez wiedzy o indywidualnych e-mailach użytkowników. Następnie wyprowadzamy reprezentację, zwaną osadzeniem, każdej syntetycznej wiadomości, która obejmuje niektóre kluczowe wymiary wiadomości, takie jak język, temat i długość. Te osadzenia są następnie wysyłane do niewielkiej liczby urządzeń użytkowników, które wyraziły zgodę na korzystanie z Device Analytics.

Następnie urządzenia uczestniczące wybierają małą próbkę ostatnich wiadomości e-mail użytkowników i obliczają ich osadzenia. Następnie każde urządzenie decyduje, które z syntetycznych osadzeń jest najbliższe tym próbkom. Korzystając z prywatności różnicowej, Apple może następnie nauczyć się najczęściej wybieranych syntetycznych osadzeń na wszystkich urządzeniach, bez uczenia się, które syntetyczne osadzenia zostały wybrane na danym urządzeniu.

Te najczęściej wybierane syntetyczne osadzenia mogą być następnie wykorzystane do generowania danych treningowych lub testowych, lub możemy uruchomić dodatkowe kroki kuratorskie, aby jeszcze bardziej udoskonalić zbiór danych. Na przykład, jeśli wiadomość o grze w tenisa jest jednym z najlepszych osadzeń, podobna wiadomość zastępująca „tenis” „piłką nożną” lub innym sportem może zostać wygenerowana i dodana do zbioru na potrzeby kolejnej rundy kuratorskiej (patrz Rysunek 1).Ten proces pozwala nam udoskonalić tematy i język naszych syntetycznych wiadomości e-mail, co pomaga nam trenować nasze modele, aby tworzyły lepsze wyniki tekstowe w takich funkcjach, jak podsumowania wiadomości e-mail, jednocześnie chroniąc prywatność.

Chociaż Apple zdaje sobie sprawę z ograniczeń swojego obecnego podejścia, nowa technologia obiecuje lepsze zrozumienie trendów użytkowników bez naruszania praw prywatności lub gromadzenia poufnych informacji. Według Bloomberga ta ulepszona funkcjonalność ma być dostępna w nadchodzących wersjach beta systemów iOS 18.5 i macOS 15.5. Aby uzyskać więcej szczegółów, możesz zapoznać się z kompleksowym postem Apple na ten temat.

Źródło i obrazy