Cos’è l’intelligenza artificiale audio stabile e come utilizzarla

L’intelligenza artificiale è diventata onnipervasiva e viene utilizzata per un’ampia gamma di scopi, tra cui la generazione di immagini, contenuti basati su testo e persino la produzione di suoni e musica. E Stable Audio AI è uno dei migliori modelli di intelligenza artificiale per la produzione audio attualmente disponibili.

In questa guida vedremo cos’è questa piattaforma AI e come puoi utilizzarla per creare audio originale senza bisogno di strumenti musicali.

Cos’è l’intelligenza artificiale audio stabile?

Stable Audio AI è un modello di intelligenza artificiale sviluppato da Stability AI, meglio conosciuto per la sua Stable Diffusion AI in grado di generare immagini in base alle istruzioni fornite dall’utente.

Stable Audio utilizza tecniche avanzate di intelligenza artificiale (in particolare modelli di diffusione) per creare audio da descrizioni di testo. Digiti il tipo di musica o suoni che desideri e li genera in pochi secondi.

Stable Audio AI è stato creato da Harmonai, il laboratorio di ricerca audio di Stability AI, e consente agli utenti di generare audio originale utilizzando i prompt.

Ciò che rende questo modello AI di generazione audio così impressionante è che è stato addestrato su 19.500 ore di dati audio dalla principale libreria di musica digitale, AudioSparx. Per addestrarlo sono stati utilizzati oltre 800.000 file audio, il che ha consentito all’intelligenza artificiale di diventare in grado di generare 95 secondi di audio di qualità stereo a 44,1 kHz utilizzando una GPU Nvidia A100 in meno di un secondo.

Riesce a farlo utilizzando una tecnologia di diffusione latente simile all’AI Stable Diffusion dell’azienda per la generazione di immagini. E a differenza di altri modelli AI di generazione audio, Stability Audio AI può essere utilizzato per creare suoni di diverse lunghezze.

Puoi utilizzare Stable Audio AI per generare suoni di singoli strumenti, suoni ambientali o persino un intero ensemble. Ora capiamo come generare audio utilizzandolo.

Inizia con l’intelligenza artificiale audio stabile

Puoi provare Stable Audio AI per generare audio utilizzando l’intelligenza artificiale gratuitamente, ma ciò richiederà la creazione di un account sul sito Web Stable Audio. L’account gratuito presenta anche alcune limitazioni.

Avvia il browser e vai al sito web Stable Audio . Una volta lì, fai clic sul pulsante blu a forma di capsula nell’angolo in alto a destra che dice “Provalo gratuitamente”.

Facendo clic sul pulsante si accederà a una nuova pagina in cui è possibile creare un account necessario per utilizzare Stable Audio AI. Puoi impostare un nuovo account inserendo il tuo indirizzo email e una password oppure accedere tramite il tuo account Google.

Se scegli di accedere utilizzando il tuo account Google, dovrai fornire l’autorizzazione a Google per condividere i dettagli del tuo account con il sito web. Dopo aver inserito il nome utente e la password del tuo account Google, fai clic sul pulsante “Continua” per fornire l’autorizzazione richiesta.

Una volta effettuato l’accesso, verrai accolto dalla home page della piattaforma Stable Audio AI. Questo conterrà i termini e le condizioni che dovrai accettare per procedere. Puoi anche scegliere di iscriverti alla newsletter Stable Audio da qui. Clicca sul pulsante accanto alla scritta ‘Ho letto e accetto i termini e le condizioni’ e, se vuoi, quello qui sotto per iscriverti alla loro newsletter. Quindi, fai clic sul pulsante “Avanti” in basso.

Accettando i termini e le condizioni verrai indirizzato al dashboard Stable Audio, che potrai utilizzare per generare audio originale utilizzando le istruzioni.

Utilizzo dell’intelligenza artificiale audio stabile

La sezione in alto a sinistra della pagina sarà dove potrai inserire le richieste per la generazione dell’audio.

Puoi inserire un messaggio come Hard rock, concert promotion, metal, 180 bpmnella casella. Quindi, fai clic sul pulsante “Genera” in basso per iniziare a creare l’audio.

Un altro modo per generare audio è utilizzare i prompt già pronti dalla “Libreria dei prompt” situata sotto la sezione dei prompt, dove è possibile accedere a diversi stili di prompt audio. Per fare ciò, fare clic sul pulsante a forma di capsula etichettato “Nessuno”. Si aprirà la libreria, che contiene vari stili tra cui puoi scegliere da aggiungere al tuo audio.

Per selezionare uno qualsiasi degli stili di prompt audio dalla libreria, è sufficiente fare clic su di esso. La sezione dei prompt sopra la libreria mostrerà i prompt contenuti nello stile. Lo stile selezionato acquisirà un’icona di riproduzione e anche l’etichetta sul pulsante della libreria dei prompt cambierà per riflettere lo stile selezionato.

Sotto la “Libreria dei prompt”, puoi vedere il modello AI utilizzato per il processo di generazione dell’audio. Facendo clic sul nome del modello, in questo caso “Stable-audio-audiosparx-v1-0”, verranno visualizzati tutti i modelli disponibili. Al momento è disponibile solo un modello aggiuntivo, che è in versione Beta. Dovrai passare al piano Pro per utilizzare il modello Beta AI.

La prossima è la sezione “Durata”, dove puoi controllare la durata dell’audio generato. Facendo clic sulla freccia rivolta verso il basso la durata diminuirà, mentre facendo clic su quella rivolta verso l’alto la aumenterà. La versione gratuita di Stable Audio ti consente di generare audio della durata di 45 secondi. Se esegui l’aggiornamento alla versione Pro, puoi generare audio della durata di un minuto e 30 secondi.

L’ultimo elemento sul lato sinistro è l’opzione “Aggiungi extra” che puoi utilizzare per personalizzare il tuo audio. Fare clic sul pulsante “+” per visualizzare le opzioni disponibili, che attualmente includono “Passi”, “Numero di risultati”, “Seme” e “Intensità del prompt”.

Ognuna di queste opzioni extra ha impostazioni che possono essere personalizzate. Ad esempio, se fai clic sull’opzione “Passi”, puoi aumentare il numero di passaggi eseguiti dall’intelligenza artificiale per generare audio. Per impostazione predefinita, vengono aggiunti 50 passaggi ed è possibile aumentarli fino a 100 digitando il numero di passaggi nell’apposita casella.

Puoi tornare al valore predefinito facendo clic sul pulsante “Ripristina” in basso. Se desideri rimuovere del tutto gli extra, fai clic sul pulsante “X” accanto alla casella in cui deve essere inserito il numero di passaggi.

Una volta terminato, fai clic sul pulsante “Genera” e Stable Audio inizierà a generare il tuo audio. In alternativa, puoi rimuovere i passaggi e utilizzare un altro degli extra, come l’opzione “Seed”, che controlla la casualità della generazione dell’audio. Per impostazione predefinita, l’opzione è impostata su “Casuale”, il che significa che il modello AI utilizzerà diverse disposizioni audio per generare l’audio. Puoi inserire un valore diverso facendo clic sull’etichetta “Casuale” e digitando un valore come “222222” per fare in modo che l’IA utilizzi ogni volta la stessa disposizione.

Altri extra includono “Numero di risultati” e “Forza del prompt”. La prima è una funzionalità Pro che ti consente di controllare il numero di tracce che l’IA restituirà al prompt (massimo 5) ed è inutilizzabile nella versione gratuita. Tuttavia, puoi provare l’opzione “Intensità richiesta” facendo clic su di essa. Verrà visualizzato un dispositivo di scorrimento che controlla quanto l’audio generato sarà vicino al prompt fornito. Per impostazione predefinita, è impostato sull’80%, ma puoi trascinare il cursore verso sinistra o destra per diminuire o aumentare l’intensità secondo necessità.

Dopo aver regolato l’intensità del messaggio, fai clic sul pulsante “Genera” per dire all’IA di iniziare a creare l’audio. Anche il lato in alto a destra della pagina Stability Audio AI contiene alcuni elementi. Il primo di questi è il simbolo di una nota musicale che indica il numero di crediti di cui dispongono gli utenti gratuiti. Puoi generare audio solo finché hai crediti e ricevi 20 crediti ogni mese. Poi c’è un pulsante che ti permette di passare alla versione Pro, un’opzione per controllare i dettagli del tuo account e un menu hamburger contenente opzioni aggiuntive.

Facendo clic sul pulsante “Aggiorna a Pro” verranno visualizzati i piani tariffari disponibili. Oltre al piano gratuito, puoi scegliere tra i piani Pro, Studio e Max che costano rispettivamente $ 11,99 al mese, $ 29,99 al mese e $ 89,99 al mese. Il piano “Gratuito” consente di generare 20 tracce al mese, mentre il piano “Pro” consente 500 tracce. Questo sale a 1.350 con il piano “Studio” e 4.500 con il piano “Max”. Inoltre, mentre la durata della traccia nel piano “Gratuito” è di 45 secondi, è di 90 secondi in tutti gli altri piani. Il piano “Gratuito” viene fornito con una licenza personale, mentre ottieni una licenza Creator con le altre opzioni.

L’opzione accanto al pulsante di aggiornamento mostra i dettagli del tuo account sulla piattaforma Stable Audio AI. Facendo clic ti verrà comunicato il tuo piano attuale e tutto ciò che offre.

Perfezionamento dei tuoi suggerimenti

Perfezionando i tuoi suggerimenti, puoi ottimizzare l’output fornito da Stability Audio. Quando si lavora con l’intelligenza artificiale generativa, migliori sono i suggerimenti, migliore sarà l’output. Ecco alcuni modi in cui puoi migliorare i tuoi suggerimenti.

Se l’output sembra troppo elettronico o digitale, considera l’utilizzo di parole come “Band” o “Live” al prompt.
Potresti riuscire a migliorare la qualità dell’output generato includendo parole come “44,1kHz”, “alta qualità” e “stereo” nel prompt.
Usa la parola “Solo” dopo il nome dello strumento principale nella traccia per migliorare l’output. Ad esempio, se lo strumento principale è un violino, puoi utilizzare “Violino solista” nel prompt.

Con Stability Audio AI, puoi generare facilmente tracce audio straordinarie semplicemente utilizzando le istruzioni. Se sei un principiante, il piano gratuito è un ottimo modo per provare il modello, mentre i musicisti professionisti possono passare ai piani a pagamento e provare le funzionalità più avanzate offerte dalla piattaforma.

Cos’è l’intelligenza artificiale audio stabile e come utilizzarla

Cos’è l’intelligenza artificiale audio stabile?

Inizia con l’intelligenza artificiale audio stabile

Utilizzo dell’intelligenza artificiale audio stabile

Perfezionamento dei tuoi suggerimenti

Articoli correlati:

L'ultimo leak di Nothing Phone 2a ci fornisce finalmente uno sguardo adeguato su come apparirà il presunto re del budget

Il creatore di Devil May Cry vorrebbe rifare il primo capitolo della serie, Viewtiful Joe e Bayonetta

Lascia un commento Annulla risposta