
Microsoft continue d’innover avec ses outils d’IA et a récemment dévoilé Copilot Vision, un puissant utilitaire d’analyse d’écran. Suite à ce lancement, l’entreprise teste actuellement une nouvelle fonctionnalité appelée Copilot Audio Expressions, capable de générer un son réaliste pour vos scripts. Cette technologie d’IA avancée lit le texte à voix haute et peut également l’interpréter de manière créative en fonction de vos saisies.
Les personnes intéressées peuvent tester cet outil sur le site officiel de Copilot Labs, où il propose deux modes distincts : Émotionnel et Histoire. Les utilisateurs ont accès à près d’une douzaine de variations de voix et de style. Une évaluation détaillée réalisée par Windows Latest a souligné l’efficacité de l’outil, notamment en anglais.
Dans leur exploration, Windows Latest a commencé par un script fictif représentant une gare animée. Ils ont saisi le script dans l’outil, en spécifiant le style de voix souhaité. Le choix s’est porté sur l’ option Emote avec la voix Oak et un style de narration.

L’application a rapidement généré un extrait audio lisible via le lecteur web intégré. Le mode Émoticônes permet notamment des extraits audio d’une durée maximale de 59 secondes. On pourrait s’attendre à une voix d’IA récitant le texte sans détour ; le rendu était cependant plus dynamique. L’IA a habilement enrichi le script en y ajoutant des éléments supplémentaires et en le reformulant pour une expérience d’écoute plus captivante.
Une autre fonctionnalité remarquable est la possibilité de télécharger le fichier audio au format MP3 sans compte utilisateur, ce qui facilite la lecture sur différents appareils. Le mode Émoticônes offrait des options de personnalisation impressionnantes, suscitant également la curiosité pour le mode Histoire.
Créer des récits captivants avec le mode Histoire
Pour aller plus loin, Windows Latest est passé au mode Histoire, qui sélectionne automatiquement la voix et le style sans proposer de réglages individuels. En saisissant une invite simple – « racontez l’histoire d’un chat tapi dans l’ombre pour chasser une proie » – l’outil a généré un récit créatif de 90 secondes. Ce récit comprenait la voix d’un narrateur humain, interprétée avec un accent américain, et la voix unique du chat, interprétée avec un accent britannique, offrant une expérience audio divertissante.

Les auditeurs peuvent explorer la qualité de sortie en vérifiant les deux extraits audio produits par l’outil.
Globalement, l’ outil Copilot Audio Expressions se distingue par sa solution de génération audio IA impressionnante, idéale pour créer des clips audio captivants. Si vous souhaitez découvrir cette technologie innovante, n’hésitez pas à visiter le site de Copilot Labs et à l’essayer.
Laisser un commentaire