
개인화된 Siri 기능에 대한 기대감에도 불구하고, Apple은 iOS 18.4 출시에 따라 내년으로 출시를 연기한다고 발표했습니다.그러나 직원들의 피드백을 보면 회사 내에서는 이 기능이 올해 말 실제로 출시될 가능성이 있다는 낙관적인 전망이 나오고 있습니다.최근 분석에 따르면 Apple은 특히 Apple Intelligence 개발을 통해 AI 훈련 프로세스를 어떻게 개선하고 있는지 알 수 있습니다.
혁신적인 교육 방법: Apple이 사용자 개인 정보를 보호하면서 합성 데이터를 활용하는 방법
개인 맞춤형 Siri 출시가 지연되는 가운데, 블룸버그 의 한 보고서 는 Apple의 AI 시스템 훈련 전략을 조명합니다.이 보고서는 Apple의 머신러닝 리서치 블로그를 인용하며, 해당 블로그에서는 AI 모델 훈련에 합성 데이터를 활용하는 방법을 논의합니다.
역사적으로 비평가들은 애플이 AI 분야에서 경쟁사들에 뒤처져 왔다고 지적해 왔습니다.애플이 합성 데이터를 파격적으로 사용하는 방식은 몇 가지 어려움을 야기했습니다.예를 들어, 이 방식은 포괄적인 요약이나 장문 이메일 작성처럼 명확한 의사소통을 요구하는 도구에 필요한 추세를 효과적으로 해석하는 데 어려움을 겪습니다.
이러한 과제를 인식한 Apple은 사용자 개인 정보 보호를 보장하는 동시에 합성 데이터와 실제 사용자 이메일을 비교할 수 있는 혁신적인 접근 방식을 도입했습니다.이 프로세스는 더 나은 커뮤니케이션 기능을 위한 AI 모델의 효율성을 향상시킬 것으로 예상됩니다.
모델을 개선하려면 메시지에서 가장 자주 사용되는 주제를 다루는 여러 이메일 세트를 생성해야 합니다.대표적인 합성 이메일 세트를 선별하기 위해 먼저 다양한 주제에 대한 대규모 합성 메시지 세트를 만듭니다.예를 들어, “내일 오전 11시 30분에 테니스를 치시겠습니까?”와 같은 합성 메시지를 만들 수 있습니다.
이 과정은 개별 사용자 이메일에 대한 사전 지식 없이 진행됩니다.그런 다음 언어, 주제, 길이 등 메시지의 주요 특징을 포착하는 각 합성 메시지의 임베딩이라는 표현을 도출합니다.이 임베딩은 기기 분석에 동의한 소수의 사용자 기기로 전송됩니다.
참여 기기는 최근 사용자 이메일의 작은 샘플을 선택하여 임베딩을 계산합니다.각 기기는 합성 임베딩 중 어떤 샘플과 가장 가까운지를 결정합니다.차등 개인정보보호를 통해 Apple은 모든 기기에서 가장 자주 선택된 합성 임베딩을 학습할 수 있으며, 특정 기기에서 어떤 합성 임베딩이 선택되었는지는 알 수 없습니다.
가장 자주 선택된 합성 임베딩을 사용하여 학습 또는 테스트 데이터를 생성하거나, 추가 큐레이션 단계를 수행하여 데이터 세트를 더욱 정교화할 수 있습니다.예를 들어, 테니스에 대한 메시지가 가장 많이 검색되는 임베딩 중 하나라면, “테니스”를 “축구” 또는 다른 스포츠로 대체하는 유사한 메시지를 생성하여 다음 큐레이션을 위해 세트에 추가할 수 있습니다(그림 1 참조).이 과정을 통해 합성 이메일의 주제와 언어를 개선하여 개인 정보를 보호하면서 이메일 요약과 같은 피처에서 더 나은 텍스트 출력을 생성하도록 모델을 학습시킬 수 있습니다.
Apple은 현재 접근 방식의 한계를 인정하지만, 이 새로운 기술은 개인정보 보호권을 침해하거나 민감한 정보를 수집하지 않으면서도 사용자 트렌드를 더 잘 이해할 수 있도록 지원할 것이라고 약속합니다.블룸버그에 따르면, 이 개선된 기능은 곧 출시될 iOS 18.5와 macOS 15.5 베타 버전에 포함될 예정입니다.자세한 내용은 Apple의 이 주제에 대한 종합적인 게시물을 참조하세요.
답글 남기기