
Google presenta il modello di immagine Flash all’avanguardia Gemini 2.5
Con una svolta significativa, Google ha introdotto Gemini 2.5 Flash Image, un modello rivoluzionario per la generazione e l’editing di immagini, internamente soprannominato “nano-banana”.Questo strumento avanzato è progettato per produrre e modificare immagini garantendo la coerenza dei caratteri e unendo perfettamente diverse immagini in un risultato finale coerente.
Elevare gli standard nell’editing delle immagini
Come riportato da LMArena, Gemini 2.5 Flash Image ha rapidamente raggiunto l’apice dei modelli di editing delle immagini, surclassando concorrenti come GPT Image 1 di OpenAI e Flux.1 Kontext. Storicamente, le precedenti iterazioni dei modelli di generazione di immagini eccellevano nell’estetica visiva, ma spesso non erano in grado di interpretare accuratamente la semantica del mondo reale. Il modello Gemini 2.5 sfrutta una vasta conoscenza del mondo per migliorare sia il realismo che l’accuratezza dei suoi output di immagini.
Accessibilità per creativi e sviluppatori
Questo ultimo modello è facilmente accessibile sia ai consumatori che agli sviluppatori. Per gli sviluppatori, Gemini 2.5 Flash Image può essere utilizzato tramite diverse piattaforme, tra cui Gemini API, Google AI Studio e Vertex AI, per soddisfare le esigenze aziendali. Il prezzo è fissato a 30, 00 dollari per ogni milione di token in uscita, con una media di circa 0, 039 dollari per immagine prodotta.
I consumatori possono sperimentare le potenzialità di questo modello innovativo tramite le applicazioni web e mobile di Gemini. Google ha evidenziato una serie di casi d’uso trasformativi che gli utenti possono esplorare tramite l’app Gemini:
- Miglioramenti di costumi e ambientazioni : gli utenti possono caricare le proprie foto, che siano di loro stessi o dei loro animali domestici, e inserirle senza sforzo in nuove ambientazioni dinamiche, mantenendone l’aspetto originale.
- Fusione di foto : il modello consente di unire più immagini per creare nuove scene. Ad esempio, è possibile combinare il proprio ritratto con quello del proprio cane, creando un affascinante momento condiviso sul campo da basket.
- Modifica iterativa : gli utenti possono cimentarsi in una modifica multi-turn, iniziando da una stanza vuota e aggiungendo progressivamente elementi come colori delle pareti, librerie o mobili per creare gli spazi immaginati.
- Design Fusion : gli utenti possono applicare in modo creativo l’estetica di un’immagine (come motivi floreali) agli oggetti di un’altra immagine (come un paio di stivali da pioggia), fondendo senza sforzo diverse ispirazioni di design.
Impegno per la privacy dell’utente e l’integrità dell’immagine
In termini di privacy degli utenti, Google ha assicurato che le immagini caricate sulla piattaforma non vengono utilizzate per scopi di formazione nei propri sistemi di apprendimento automatico generativo, a meno che non vengano fornite come feedback. Inoltre, tutte le immagini generate o modificate tramite l’app Gemini riceveranno una filigrana visibile e una filigrana digitale invisibile SynthID per preservarne l’autenticità e l’integrità del copyright.
Per maggiori informazioni sull’immagine Flash Gemini 2.5, visita l’annuncio completo su Neowin.
Lascia un commento