애플 연구진, 시리와의 더욱 빠르고 자연스러운 대화를 가능하게 하는 방법 발견

애플은 최근 인공지능의 한계를 극복하기 위해 구글의 제미니 기술을 활용해 왔지만, 쿠퍼티노에 있는 애플 연구팀은 시리의 성능을 향상시키기 위한 혁신적인 전략을 끊임없이 추구하고 있습니다.

최근 애플 연구원들이 발표한 연구 논문은 시리와의 상호작용을 더욱 빠르고 자연스럽게 만드는 것을 목표로 하고 있으며, 이는 디지털 비서 기능을 개선하기 위한 애플의 지속적인 노력에 있어 중요한 진전입니다.

음향 유사성 그룹을 활용하여 더욱 빠른 응답 속도 구현

기존의 AI 음성 모델은 토큰, 즉 수 밀리초에 불과한 짧은 음성 조각을 활용하여 음성을 생성합니다.이러한 모델은 적절한 음성 조각을 선택하기 위해 자기회귀 방식을 사용하는데, 이로 인해 응답에 상당한 지연이 발생하는 경우가 많습니다.또한, 학습에 사용되는 음성 조각의 종류가 제한적이기 때문에 어색한 발음이 나올 수도 있습니다.

애플 연구진은 최근 연구 에서 혁신적인 대안을 제시했습니다.기존의 토큰 매칭 시스템을 음향 유사성 그룹(ASG)으로 대체하는 것입니다. ASG는 소리의 지각적 유사성을 기반으로 음성 토큰을 그룹화하며, 그룹 간에는 일부 중복이 발생합니다.이러한 ASG에 확률적 검색 기법을 통합함으로써 AI 모델은 가장 적합한 음성 토큰을 훨씬 더 빠르게 식별할 수 있습니다.

이 제안이 혁신적인 것은 아닐지라도, 애플이 인공지능 및 머신러닝 역량을 발전시키고자 하는 의지를 보여주는 중요한 사례입니다.또한, 이 계획은 애플이 구글의 제미니와 같은 타사 기술에 의존하지 않고 자사 기기에 완벽하게 통합된 인공지능 솔루션을 구축하려는 의도를 시사합니다.

출처 및 이미지

애플 연구진, 시리와의 더욱 빠르고 자연스러운 대화를 가능하게 하는 방법 발견

음향 유사성 그룹을 활용하여 더욱 빠른 응답 속도 구현

NVIDIA RTX 5060 및 RTX 5070, 최신 스팀 하드웨어 설문조사에서 인기 급상승

에픽게임즈 스토어, 2025년 서드파티 게임 매출 기록 경신하며 PC 사용자 3억 1,700만 명 돌파