Sebbene Apple si sia recentemente affidata alla tecnologia Gemini di Google per risolvere alcuni dei limiti della sua intelligenza artificiale, i team di ricerca dell’azienda a Cupertino stanno perseguendo senza sosta strategie innovative per migliorare le prestazioni di Siri.
Un recente documento di ricerca pubblicato dai ricercatori Apple mira a ottenere interazioni più rapide e naturali con Siri, segnando un passo significativo nel loro continuo impegno per perfezionare l’assistente digitale.
Sbloccare risposte più rapide con gruppi di similarità acustica
Tradizionalmente, i modelli vocali basati sull’intelligenza artificiale generano il parlato utilizzando token, brevi segmenti di suoni fonetici che durano pochi millisecondi. Questi modelli utilizzano un metodo autoregressivo per selezionare il suono fonetico appropriato, il che spesso si traduce in un ritardo notevole nella risposta. Questo approccio può anche portare a pronunce poco chiare a causa della selezione limitata di frammenti fonetici utilizzati per l’addestramento.
Nel loro ultimo studio, i ricercatori Apple propongono un’alternativa innovativa. Suggeriscono di adottare i Gruppi di Somiglianza Acustica (ASG) per sostituire il sistema convenzionale di abbinamento dei token. Gli ASG raggruppano i token vocali in base alle somiglianze percettive nel suono, con una certa sovrapposizione tra i gruppi. Incorporando tecniche di ricerca probabilistica in questi ASG, i modelli di intelligenza artificiale possono identificare il token vocale più adatto molto più rapidamente.
Sebbene questa proposta non sia rivoluzionaria, sottolinea l’impegno di Apple nel migliorare le sue capacità di intelligenza artificiale e apprendimento automatico. Questa iniziativa dimostra ulteriormente l’intenzione di Apple di creare una soluzione di intelligenza artificiale completamente integrata per i suoi dispositivi, abbandonando la dipendenza da tecnologie di terze parti come Gemini di Google.
Lascia un commento