
パーソナライズされたSiri機能への期待にもかかわらず、AppleはiOS 18.4のリリース後、同機能の導入を来年まで延期すると発表しました。しかし、従業員からのフィードバックによると、この機能は今年後半にリリースされる可能性があるという楽観的な見方が社内に広がっています。最近の知見から、Appleが特にApple Intelligenceの開発を通じて、AIトレーニングプロセスをどのように改良しているかが明らかになりました。
革新的なトレーニング方法:Appleはユーザーのプライバシーを維持しながら合成データをどのように活用しているのか
パーソナライズされたSiriの遅延を受けて、ブルームバーグのレポートはAppleのAIシステムのトレーニング戦略に光を当てています。このレポートは、Appleの機械学習研究部門のブログ記事を参照しており、AIモデルのトレーニングにおける合成データの活用について議論しています。
これまで批評家たちは、AppleがAI分野で競合他社に遅れをとってきたと指摘してきました。同社の型破りな合成データの使用は、いくつかの課題をもたらしてきました。例えば、長文のメール作成など、包括的な要約や明確なコミュニケーションを必要とするツールに必要な傾向を効果的に解釈することが、Appleの手法では困難です。
Appleはこうした課題を認識し、ユーザーのプライバシーを守りながら、合成データと実際のユーザーのメールアドレスを比較できる革新的なアプローチを導入しました。このプロセスにより、AIモデルの有効性が向上し、コミュニケーション機能が向上することが期待されます。
モデルを改善するには、メッセージで最も頻繁に使用されるトピックを網羅した多数のメールセットを生成する必要があります。代表的な合成メールセットをキュレートするために、まず様々なトピックに関する大規模な合成メッセージセットを作成します。例えば、「明日の午前11時30分にテニスをしませんか?」という合成メッセージを作成するとします。
これは、個々のユーザーのメールアドレスに関する情報を一切必要とせずに行われます。その後、各合成メッセージについて、言語、トピック、長さといったメッセージの主要な要素を捉えた「埋め込み」と呼ばれる表現を導き出します。これらの埋め込みは、デバイスアナリティクスにオプトインした少数のユーザーデバイスに送信されます。
参加デバイスは、最近のユーザーメールの小さなサンプルを選択し、その埋め込みを計算します。各デバイスは、これらのサンプルに最も近い合成埋め込みを決定します。差分プライバシーを利用することで、Appleは特定のデバイスでどの合成埋め込みが選択されたかを把握することなく、すべてのデバイスで最も頻繁に選択された合成埋め込みを学習できます。
これらの最も頻繁に選択された合成埋め込みは、トレーニングデータやテストデータの生成に使用したり、追加のキュレーションステップを実行してデータセットをさらに精緻化したりすることができます。例えば、テニスに関するメッセージが上位の埋め込みの1つである場合、「テニス」を「サッカー」などの他のスポーツに置き換えた同様のメッセージを生成し、次回のキュレーションセットに追加することができます(図1参照)。このプロセスにより、合成メールのトピックと言語を改善できるため、モデルをトレーニングして、メールサマリーなどの機能において、プライバシーを保護しながら、より優れたテキスト出力を作成するのに役立ちます。
Appleは現在のアプローチに限界があることを認めていますが、この新しい技術は、プライバシー権を侵害したり機密情報を収集したりすることなく、ユーザーの動向をより深く理解することを約束しています。Bloombergによると、この改善された機能は、iOS 18.5とmacOS 15.5の次期ベータ版に搭載される予定です。詳細については、Appleのこのトピックに関する包括的な投稿をご覧ください。
コメントを残す ▼