Apple 採用創新技術訓練 AI 模型，透過將合成資料與真實電子郵件進行比較，並透過嵌入和隱私工具提高文字輸出品質

儘管人們對個人化 Siri 功能充滿期待，但蘋果宣布，該功能的推出將推遲到明年，即 iOS 18.4 推出後。然而，員工回饋表明公司內部對該功能可能在今年稍後推出持樂觀態度。最近的見解揭示了蘋果如何改進其人工智慧訓練流程，特別是透過開發 Apple Intelligence。

創新訓練方法：蘋果如何在保護用戶隱私的同時利用合成數據

鑑於個性化 Siri 的延遲，彭博社的一份報告揭示了蘋果訓練其人工智慧系統的策略。該報告引用了蘋果機器學習研究的一篇博客，討論了使用合成資料訓練人工智慧模型。

從歷史上看，批評人士指出，蘋果在人工智慧領域一直落後於競爭對手。該公司對合成數據的非常規使用帶來了一定的挑戰。例如，該方法難以有效地解釋需要全面總結或清晰溝通的工具（如起草長篇電子郵件）所必需的趨勢。

認識到這些挑戰，蘋果推出了一種創新方法，可以將合成數據與實際用戶電子郵件進行比較，同時確保尊重用戶隱私。這個過程旨在提高人工智慧模型的有效性，以實現更好的溝通功能。

為了改進我們的模型，我們需要產生一組涵蓋訊息中最常見的主題的電子郵件。為了整理一組代表性的合成電子郵件，我們首先創建大量有關各種主題的合成訊息。例如，我們可以創建一條合成訊息，“你想在明天上午 11:30 打網球嗎？”

這個過程無需了解任何個人使用者的電子郵件。然後，我們得出每個合成訊息的表示形式（稱為嵌入），它捕捉訊息的一些關鍵維度，如語言、主題和長度。然後將這些嵌入內容傳送到少數選擇加入裝置分析的使用者裝置。

然後，參與的設備選擇最近用戶電子郵件的一小部分樣本併計算其嵌入。然後，每個裝置決定哪個合成嵌入最接近這些樣本。利用差異隱私，Apple 可以了解所有裝置上最常選擇的合成嵌入，而無需了解在任何給定裝置上選擇了哪種合成嵌入。

這些最常選擇的合成嵌入隨後可用於產生訓練或測試數據，或者我們可以執行額外的管理步驟來進一步完善資料集。例如，如果關於打網球的消息是頂級嵌入之一，則可以產生類似的訊息，用“足球”或其他運動替換“網球”，並將其添加到集合中以進行下一輪的整理（見圖 1）。這個過程使我們能夠改進合成電子郵件的主題和語言，這有助於我們訓練模型，以便在電子郵件摘要等功能中創建更好的文字輸出，同時保護隱私。

儘管蘋果承認其當前方法的局限性，但新技術預計將在不侵犯隱私權或收集敏感資訊的情況下更好地了解用戶趨勢。根據彭博社報導，這項改進的功能預計將出現在即將發布的 iOS 18.5 和 macOS 15.5 測試版中。欲了解更多詳細信息，您可以瀏覽 Apple關於此主題的綜合帖子。

來源和圖片