Qu’est-ce que Stable Audio AI et comment l’utiliser

Qu’est-ce que Stable Audio AI et comment l’utiliser

L’intelligence artificielle est devenue omniprésente et est utilisée à des fins très diverses, notamment la génération d’images, de contenu textuel et même la production sonore et musicale. Et Stable Audio AI est l’un des meilleurs modèles d’IA pour la production audio actuellement disponibles.

Dans ce guide, nous examinerons ce qu’est cette plate-forme d’IA et comment vous pouvez l’utiliser pour créer un son original sans avoir besoin d’instruments de musique.

Qu’est-ce que l’IA audio stable ?

Stable Audio AI est un modèle d’IA développé par Stability AI, surtout connu pour son IA à diffusion stable qui peut générer des images basées sur les invites fournies par l’utilisateur.

Stable Audio utilise des techniques avancées d’intelligence artificielle (en particulier des modèles de diffusion) pour créer de l’audio à partir de descriptions textuelles. Vous tapez le type de musique ou de sons que vous souhaitez et cela les génère en quelques secondes.

Le Stable Audio AI a été créé par Harmonai, le laboratoire de recherche audio de Stability AI, et permet aux utilisateurs de générer de l’audio original à l’aide d’invites.

Ce qui rend ce modèle d’IA de génération audio si impressionnant, c’est qu’il a été formé sur 19 500 heures de données audio provenant de la principale bibliothèque musicale numérique, AudioSparx. Plus de 800 000 fichiers audio ont été utilisés pour l’entraîner, ce qui a permis à l’IA de devenir capable de générer 95 secondes d’audio de qualité stéréo à 44,1 kHz à l’aide d’un GPU Nvidia A100 en moins d’une seconde.

Il y parvient en utilisant une technologie de diffusion latente similaire à l’IA à diffusion stable de l’entreprise pour la génération d’images. Et contrairement aux autres modèles d’IA de génération audio, Stability Audio AI peut être utilisé pour créer des sons de différentes longueurs.

Vous pouvez utiliser Stable Audio AI pour générer des sons d’instruments uniques, des sons ambiants ou même un ensemble complet. Voyons maintenant comment générer de l’audio en l’utilisant.

Commencez avec Stable Audio AI

Vous pouvez essayer gratuitement Stable Audio AI pour générer de l’audio à l’aide de l’intelligence artificielle, mais cela nécessitera la création d’un compte sur le site Web Stable Audio. Le compte gratuit présente également certaines limitations.

  • Lancez votre navigateur et accédez au site Web Stable Audio . Une fois sur place, cliquez sur le bouton bleu en forme de capsule dans le coin supérieur droit qui dit « Essayez-le gratuitement ».
  • En cliquant sur le bouton, vous accéderez à une nouvelle page où vous pourrez créer un compte requis pour utiliser Stable Audio AI. Vous pouvez soit créer un nouveau compte en saisissant votre adresse e-mail et un mot de passe, soit vous connecter via votre compte Google.
  • Si vous choisissez de vous connecter à l’aide de votre compte Google, vous devrez autoriser Google à partager les détails de votre compte avec le site Web. Après avoir entré le nom d’utilisateur et le mot de passe de votre compte Google, cliquez sur le bouton « Continuer » pour fournir l’autorisation requise.
  • Une fois connecté, vous serez accueilli par la page d’accueil de la plateforme Stable Audio AI. Celui-ci contiendra les termes et conditions que vous devrez accepter pour continuer. Vous pouvez également choisir de vous inscrire à la newsletter Stable Audio à partir d’ici. Cliquez sur le bouton à côté de l’endroit où il est indiqué « J’ai lu et accepté les termes et conditions » et, si vous le souhaitez, sur celui ci-dessous pour vous abonner à leur newsletter. Ensuite, cliquez sur le bouton « Suivant » en bas.
  • En acceptant les termes et conditions, vous accéderez au tableau de bord Stable Audio, que vous pourrez utiliser pour générer de l’audio original à l’aide d’invites.

Utiliser l’IA audio stable

La section supérieure gauche de la page sera l’endroit où vous pourrez saisir des invites pour la génération audio.

  • Vous pouvez saisir une invite comme Hard rock, concert promotion, metal, 180 bpmdans la case. Ensuite, cliquez sur le bouton « Générer » en bas pour commencer à créer de l’audio.
  • Une autre façon de générer de l’audio consiste à utiliser des invites prêtes à l’emploi de la « Bibliothèque d’invites » située sous la section d’invite, où vous pouvez accéder à différents styles d’invite audio. Pour ce faire, cliquez sur le bouton en forme de capsule intitulé « Aucun ». Cela ouvrira la bibliothèque, qui contient différents styles parmi lesquels vous pouvez choisir d’ajouter à votre audio.
  • Pour sélectionner l’un des styles d’invite audio de la bibliothèque, cliquez simplement dessus. La section d’invite au-dessus de la bibliothèque vous montrera les invites contenues dans le style. Le style sélectionné acquerra une icône de lecture et l’étiquette du bouton de bibliothèque d’invite changera également pour refléter le style sélectionné.
  • Sous la « Bibliothèque d’invites », vous pouvez voir le modèle d’IA utilisé pour le processus de génération audio. En cliquant sur le nom du modèle, dans ce cas, « Stable-audio-audiosparx-v1-0 », vous afficherez tous les modèles disponibles. Il n’existe actuellement qu’un seul modèle supplémentaire disponible, qui est en version bêta. Vous devrez passer au plan Pro pour utiliser le modèle Beta AI.
  • Vient ensuite la section « Durée », où vous pouvez contrôler la durée de l’audio généré. Cliquer sur la flèche pointant vers le bas diminuera la durée tandis que cliquer sur celle pointant vers le haut l’augmentera. La version gratuite de Stable Audio vous permet de générer un son d’une durée de 45 secondes. Si vous passez à la version Pro, vous pouvez générer un son d’une durée d’une minute et 30 secondes.
  • Le dernier élément sur le côté gauche est l’option « Ajouter des extras » que vous pouvez utiliser pour personnaliser votre audio. Cliquez sur le bouton « + » pour afficher les options disponibles, qui incluent actuellement « Étapes », « Nombre de résultats », « Graine » et « Force de l’invite ».
  • Chacune de ces options supplémentaires possède des paramètres qui peuvent être personnalisés. Par exemple, si vous cliquez sur l’option « Étapes », vous pouvez augmenter le nombre d’étapes prises par l’IA pour générer de l’audio. Par défaut, 50 étapes sont ajoutées et vous pouvez les augmenter jusqu’à 100 en saisissant le nombre d’étapes dans la case prévue à cet effet.
  • Vous pouvez revenir à la valeur par défaut en cliquant sur le bouton « Réinitialiser » en bas. Si vous souhaitez supprimer complètement les extras, cliquez sur le bouton « X » à côté de la case dans laquelle le nombre d’étapes doit être saisi.
  • Une fois que vous avez terminé, cliquez sur le bouton « Générer » et Stable Audio commencera à générer votre audio. Alternativement, vous pouvez supprimer les étapes et utiliser un autre extra, tel que l’option « Seed », qui contrôle le caractère aléatoire de la génération audio. Par défaut, l’option est définie sur « Aléatoire », ce qui signifie que le modèle d’IA utilisera différents arrangements audio pour générer de l’audio. Vous pouvez saisir une valeur différente en cliquant sur l’étiquette « Aléatoire » et en tapant une valeur telle que « 222222 » pour que l’IA utilise le même arrangement à chaque fois.
  • D’autres extras incluent « Nombre de résultats » et « Force de l’invite ». La première est une fonctionnalité Pro qui vous permet de contrôler le nombre de pistes que l’IA renverra pour l’invite (5 maximum) et est inutilisable dans la version gratuite. Cependant, vous pouvez essayer l’option « Intensité de l’invite » en cliquant dessus. Cela fera apparaître un curseur qui contrôle la proximité entre l’audio généré et l’invite fournie. Par défaut, elle est définie sur 80 %, mais vous pouvez faire glisser le curseur vers la gauche ou la droite pour diminuer ou augmenter la force selon vos besoins.
  • Une fois que vous avez ajusté la force de l’invite, cliquez sur le bouton « Générer » pour indiquer à l’IA de commencer à créer l’audio. Le côté supérieur droit de la page Stability Audio AI contient également quelques éléments. Le premier d’entre eux est un symbole de note de musique qui indique le nombre de crédits dont disposent les utilisateurs gratuits. Vous ne pouvez générer de l’audio que tant que vous disposez de crédits, et vous obtenez 20 crédits chaque mois. Ensuite, il y a un bouton qui vous permet de passer à la version Pro, une option pour vérifier les détails de votre compte et un menu hamburger contenant des options supplémentaires.
  • En cliquant sur le bouton « Mettre à niveau vers Pro », vous afficherez les plans tarifaires disponibles. Outre le forfait gratuit, vous pouvez choisir entre les forfaits Pro, Studio et Max qui coûtent respectivement 11,99 $/mois, 29,99 $/mois et 89,99 $/mois. Le plan « Free » permet de générer 20 pistes par mois, tandis que le plan « Pro » autorise 500 pistes. Cela va jusqu’à 1 350 avec le plan « Studio » et 4 500 avec le plan « Max ». De plus, alors que la durée de la piste dans le plan « Gratuit » est de 45 secondes, elle est de 90 secondes dans tous les autres plans. Le plan « Gratuit » est livré avec une licence personnelle, tandis que vous obtenez une licence Créateur avec les autres options.
  • L’option à côté du bouton de mise à niveau affiche les détails de votre compte sur la plateforme Stable Audio AI. En cliquant dessus, vous connaîtrez votre forfait actuel et tout ce qu’il offre.

Affiner vos invites

En affinant vos invites, vous pouvez affiner la sortie fournie par Stability Audio. Lorsque vous travaillez avec l’IA générative, plus vos invites sont bonnes, meilleur sera le résultat. Voici quelques façons d’améliorer vos invites.

  • Si la sortie semble trop électronique ou numérique, envisagez d’utiliser des mots comme « Band » ou « Live » à l’invite.
  • Vous pourrez peut-être améliorer la qualité de la sortie générée en incluant des mots tels que « 44,1 kHz », « haute qualité » et « stéréo » dans l’invite.
  • Utilisez le mot « Solo » après le nom de l’instrument principal de la piste pour améliorer le résultat. Par exemple, si l’instrument principal est un violon, vous pouvez utiliser « Solo Violin » dans l’invite.

Avec Stability Audio AI, vous pouvez facilement générer des pistes audio impressionnantes simplement en utilisant des invites. Si vous êtes débutant, le forfait gratuit est un excellent moyen d’essayer le modèle, tandis que les musiciens professionnels peuvent passer aux forfaits payants et découvrir les fonctionnalités plus avancées offertes par la plateforme.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *