Il panorama competitivo dell’IA generativa si sta riscaldando mentre le aziende si sforzano di affermare il loro predominio ed esplorare capacità innovative. OpenAI continua ad ampliare i suoi orizzonti lanciando aggiornamenti alla sua tecnologia, ma il suo attesissimo modello di intelligenza per la produzione video, noto come Sora, non è ancora disponibile per gli utenti. Nel frattempo, Google sta facendo passi da gigante nella creazione di contenuti con la presentazione pubblica del suo modello di IA generativa, Veo, attualmente in anteprima privata.
Google prende il comando con Veo nell’anteprima privata
Sebbene OpenAI sia stata la pioniera nell’introdurre un modello video AI generativo con Sora a febbraio, mostrando la sua capacità di generare video di 60 secondi da input testuali, Google ha ora catturato la ribalta. Il gigante della tecnologia ha lanciato formalmente Veo in anteprima privata tramite la sua piattaforma Vertex AI, segnando un progresso fondamentale nella tecnologia video generativa.
Questa release arriva solo pochi mesi dopo la dimostrazione di Sora da parte di OpenAI, avvenuta durante la loro conferenza per sviluppatori I/O. Google ha decantato le ampie funzionalità di Veo, affermando che può produrre video di alta qualità di durata superiore a un minuto. Agli utenti viene fornita una varietà di stili visivi e cinematografici tra cui scegliere, sebbene i dettagli riguardanti le lunghezze specifiche dei video generati siano ancora scarsi. I campioni iniziali rivelano che il contenuto appena prodotto è sorprendentemente realistico, spesso indistinguibile dai filmati autentici se non esaminato attentamente.
Oltre a Veo, Google è pronta a lanciare Imagen 3, un generatore avanzato di intelligenza artificiale da testo a immagine, ai clienti di Google Cloud come parte delle sue prossime funzionalità. Questo lancio, programmato per la prossima settimana, sarà inizialmente disponibile per utenti selezionati nella lista consentita, offrendo una varietà di opzioni di personalizzazione, tra cui l’editing fotografico basato su prompt e la possibilità di modificare loghi e altri elementi nelle immagini generate.
Google sottolinea che sia Veo che Imagen 3 sono dotati di robuste protezioni integrate per mitigare la violazione dei contenuti ed eliminare output inappropriati. Tuttavia, test preliminari suggeriscono che queste protezioni non sono del tutto infallibili. Il contenuto generato contiene una filigrana digitale invisibile creata con la tecnologia SynthID di DeepMind, che facilita l’identificazione dei materiali generati dall’intelligenza artificiale.
Dopo il lancio di Veo, OpenAI si trova ad affrontare una pressione crescente per rilasciare Sora, attesa con ansia dagli utenti sin dal suo annuncio e la cui distribuzione è prevista verso la fine del 2024.
Lascia un commento