Presentazione di Whisk: il nuovo strumento di generazione di immagini di Google
Google, rinomato per le sue innovazioni nella tecnologia di ricerca, ha lanciato un’altra aggiunta impressionante alle sue offerte di intelligenza artificiale generativa: Whisk . Attualmente in fase sperimentale, questo strumento rivoluzionario consente agli utenti di creare immagini immettendo elementi visivi esistenti anziché richiedere prompt testuali dettagliati.
Come funziona Whisk
Whisk consente agli utenti di caricare più immagini che possono servire a vari scopi, tra cui definire il soggetto, lo stile e la scena complessiva dell’output desiderato. In background, lo strumento utilizza Gemini di Google per generare una descrizione di testo, che viene poi elaborata dal modello avanzato di generazione di immagini, Imagen 3 .
Uno sguardo più da vicino a Imagen 3
Lanciato all’inizio di quest’anno, Imagen 3 è pubblicizzato da Google come il modello di immagine più raffinato dell’azienda fino ad oggi. Secondo Google, produce immagini con dettagli superiori, illuminazione migliorata e riduce al minimo gli artefatti di distrazione, il che lo rende un miglioramento significativo rispetto alle iterazioni precedenti.
Catturare l’essenza non repliche esatte
In un post di blog pubblicato di recente , Google ha spiegato in dettaglio come Whisk cattura l'”essenza” delle immagini di input senza necessariamente fornire una riproduzione esatta. Ciò significa che l’immagine risultante potrebbe differire sotto diversi aspetti, come il tono della pelle, l’altezza o l’acconciatura.
Personalizzazione dell’immagine generata
Per risolvere potenziali discrepanze nelle immagini generate, Whisk include un’opzione per gli utenti di modificare i prompt di testo sottostanti. Google riconosce che alcune funzionalità possono essere vitali per progetti specifici, quindi ha garantito agli utenti la flessibilità di modificare questi prompt in qualsiasi fase del processo creativo.
Più di un semplice editor di immagini
Sebbene Whisk incorpori funzionalità che ricordano i tradizionali strumenti di editing delle immagini, Google sottolinea che è fondamentalmente uno “strumento creativo”. Mira a facilitare l’esplorazione sperimentale e la creatività dinamica piuttosto che funzionare semplicemente come un editor convenzionale. Inoltre, gli utenti hanno la possibilità di scaricare le immagini generate per uso personale o professionale.
Disponibilità di Whisk
Attualmente, Whisk è disponibile per gli utenti negli Stati Uniti che si sono iscritti al programma Google Labs, che fornisce accesso a una gamma di funzionalità sperimentali di intelligenza artificiale generativa. Se sei interessato a provare Whisk, puoi accedervi tramite questo link .
Lascia un commento