El panorama competitivo de la IA generativa se está intensificando a medida que las empresas se esfuerzan por afirmar su dominio y explorar capacidades innovadoras. OpenAI continúa expandiendo su horizonte mediante el lanzamiento de actualizaciones a su tecnología, pero su esperado modelo de inteligencia para la producción de video, conocido como Sora, aún no está disponible para los usuarios. Mientras tanto, Google está dando pasos importantes en la creación de contenido con la presentación pública de su modelo de IA generativa, Veo, actualmente en vista previa privada.
Google toma la delantera con Veo en la vista previa privada
Aunque OpenAI fue el pionero en introducir un modelo de video generativo de IA con Sora en febrero, mostrando su capacidad para generar videos de 60 segundos a partir de entradas de texto, Google ahora ha captado la atención. El gigante tecnológico ha lanzado formalmente Veo en vista previa privada a través de su plataforma Vertex AI, lo que marca un avance crítico en la tecnología de video generativo.
Este lanzamiento llega apenas unos meses después de la demostración de Sora por parte de OpenAI, que tuvo lugar durante su conferencia para desarrolladores I/O. Google ha promocionado las amplias funcionalidades de Veo, afirmando que puede producir vídeos de alta calidad de más de un minuto de duración. Los usuarios tienen a su disposición una variedad de estilos visuales y cinematográficos para elegir, aunque los detalles sobre la duración específica de los vídeos generados aún son escasos. Las muestras iniciales revelan que el contenido recién producido es sorprendentemente realista, a menudo indistinguible del metraje auténtico a menos que se examine de cerca.
Además de Veo, Google tiene previsto lanzar Imagen 3, un generador avanzado de texto a imagen con inteligencia artificial, para los clientes de Google Cloud como parte de sus próximas funciones. Este lanzamiento, programado para la próxima semana, estará disponible inicialmente para usuarios seleccionados en la lista de permitidos y ofrecerá una variedad de opciones de personalización, incluida la edición de fotos basada en indicaciones y la capacidad de modificar logotipos y otros elementos en las imágenes generadas.
Google destaca que tanto Veo como Imagen 3 están equipados con sólidas protecciones integradas para mitigar la infracción de contenido y eliminar los resultados inapropiados. Sin embargo, las pruebas preliminares sugieren que estas protecciones no son completamente infalibles. El contenido generado contiene una marca de agua digital invisible creada con la tecnología SynthID de DeepMind, lo que facilita la identificación de materiales generados por IA.
Tras el lanzamiento de Veo, OpenAI se enfrenta a una presión cada vez mayor para lanzar Sora, que los usuarios han esperado ansiosamente desde su anuncio y cuya entrega está prevista para fines de 2024.
Deja una respuesta