Apple nutzt innovative Technologie zum Trainieren von KI-Modellen durch den Vergleich synthetischer Daten mit echten E-Mails und verbessert die Qualität der Textausgabe durch Einbettungen und Datenschutz-Tools

Apple nutzt innovative Technologie zum Trainieren von KI-Modellen durch den Vergleich synthetischer Daten mit echten E-Mails und verbessert die Qualität der Textausgabe durch Einbettungen und Datenschutz-Tools

Trotz der großen Vorfreude auf die personalisierte Siri-Funktion kündigte Apple an, deren Einführung nach der Veröffentlichung von iOS 18.4 auf nächstes Jahr zu verschieben. Mitarbeiterfeedback deutet jedoch darauf hin, dass das Unternehmen optimistisch ist, dass die Funktion tatsächlich noch in diesem Jahr eingeführt werden könnte. Aktuelle Erkenntnisse zeigen, wie Apple seine KI-Trainingsprozesse verfeinert, insbesondere durch die Entwicklung von Apple Intelligence.

Innovative Trainingsmethoden: Wie Apple synthetische Daten nutzt und gleichzeitig die Privatsphäre der Nutzer schützt

Angesichts der Verzögerung bei der personalisierten Siri beleuchtet ein Bericht von Bloomberg Apples Strategie zum Training seiner KI-Systeme. Der Bericht verweist auf einen Blog von Apples Machine Learning Research, in dem die Verwendung synthetischer Daten zum Training von KI-Modellen diskutiert wird.

Kritiker haben in der Vergangenheit angemerkt, dass Apple im KI-Bereich hinter seinen Konkurrenten zurückgeblieben ist. Der unkonventionelle Einsatz synthetischer Daten durch das Unternehmen brachte gewisse Herausforderungen mit sich. So ist die Methode beispielsweise nicht in der Lage, Trends effektiv zu interpretieren, die für Tools erforderlich sind, die umfassende Zusammenfassungen oder eine klare Kommunikation erfordern, wie etwa das Verfassen langer E-Mails.

Apple hat diese Herausforderungen erkannt und einen innovativen Ansatz eingeführt, der den Vergleich synthetischer Daten mit tatsächlichen Nutzer-E-Mails ermöglicht und gleichzeitig die Privatsphäre der Nutzer schützt. Dieser Prozess soll die Effektivität von KI-Modellen für bessere Kommunikationsfunktionen erhöhen.

Um unsere Modelle zu verbessern, müssen wir eine Reihe von E-Mails zu den häufigsten Themen generieren. Um eine repräsentative Menge synthetischer E-Mails zu erstellen, erstellen wir zunächst eine große Menge synthetischer Nachrichten zu verschiedenen Themen. Beispielsweise könnten wir eine synthetische Nachricht erstellen: „Möchtest du morgen um 11:30 Uhr Tennis spielen?“

Dies geschieht ohne Kenntnis der E-Mails einzelner Nutzer. Anschließend erstellen wir aus jeder synthetischen Nachricht eine Darstellung, ein sogenanntes Embedding, das einige der wichtigsten Aspekte der Nachricht wie Sprache, Thema und Länge erfasst. Diese Embeddings werden dann an eine kleine Anzahl von Nutzergeräten gesendet, die sich für die Geräteanalyse entschieden haben.

Die teilnehmenden Geräte wählen dann eine kleine Stichprobe der letzten E-Mails des Benutzers aus und berechnen deren Einbettungen. Jedes Gerät entscheidet dann, welche der synthetischen Einbettungen diesen Stichproben am nächsten kommt. Mithilfe von Differential Privacy kann Apple dann die am häufigsten ausgewählten synthetischen Einbettungen auf allen Geräten ermitteln, ohne zu erfahren, welche synthetische Einbettung auf einem bestimmten Gerät ausgewählt wurde.

Diese am häufigsten ausgewählten synthetischen Einbettungen können dann zur Generierung von Trainings- oder Testdaten verwendet werden. Alternativ können wir zusätzliche Kurationsschritte durchführen, um den Datensatz weiter zu verfeinern. Wenn beispielsweise die Nachricht über Tennisspielen eine der häufigsten Einbettungen ist, könnte eine ähnliche Nachricht generiert und für die nächste Kurationsrunde hinzugefügt werden, wobei „Tennis“ durch „Fußball“ oder eine andere Sportart ersetzt wird (siehe Abbildung 1).Dieser Prozess ermöglicht es uns, die Themen und die Sprache unserer synthetischen E-Mails zu verbessern. Dies hilft uns, unsere Modelle zu trainieren, um bessere Textausgaben in Funktionen wie E-Mail-Zusammenfassungen zu erstellen und gleichzeitig die Privatsphäre zu schützen.

Obwohl Apple die Grenzen seines aktuellen Ansatzes einräumt, verspricht die neue Technologie ein besseres Verständnis von Nutzertrends, ohne Datenschutzrechte zu verletzen oder sensible Daten zu sammeln. Laut Bloomberg wird diese verbesserte Funktionalität voraussichtlich in den kommenden Betaversionen von iOS 18.5 und macOS 15.5 enthalten sein. Weitere Informationen finden Sie in Apples ausführlichem Beitrag zu diesem Thema.

Quelle & Bilder

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert