Google stellt Veo und Imagen 3 vor: Eine neue Ära der KI-gestützten Inhaltserstellung
Im Mai stellte Google Veo vor, sein bahnbrechendes Videogenerierungsmodell, das für die Produktion hochwertiger 1080p-Videos in verschiedenen Kinostilen entwickelt wurde. Dieses innovative Modell ist in der Lage, den emotionalen Ton von Textaufforderungen zu interpretieren und Details selbst bei langen Beschreibungen sorgfältig wiederzugeben.
Seit heute hat Google die private Vorschau von Veo für seine Vertex AI- Kunden offiziell gestartet. Mit dieser neuen Funktion können Benutzer mühelos Videos aus einfachen Text- oder Bildaufforderungen erstellen, was den Prototyping- und Iterationsprozess für Videoinhalte erheblich beschleunigt. Mit dieser Entwicklung ist Google Cloud der erste große Cloud-Anbieter, der ein für externe Kunden zugängliches Bild-zu-Video-Modell anbietet.
Einführung von Imagen 3 erweitert KI-Funktionen
Im Zusammenhang mit der Veo-Vorschau kündigte Google auch die allgemeine Verfügbarkeit von Imagen 3 an, seinem neuesten Text-zu-Bild-Modell. Imagen 3 wird für seine Fähigkeit gepriesen, hochdetaillierte, fotorealistische Bilder zu erzeugen, und weist im Vergleich zu seinem Vorgänger Imagen 2 Verbesserungen auf, die störende visuelle Artefakte reduzieren.
Neue Funktionen für verbesserte Anpassung
Das Imagen 3-Modell wird nächste Woche für Google Cloud-Kunden auf Vertex AI verfügbar sein. Google führt mehrere Funktionen ein, die die Bildanpassung verbessern sollen:
- Bearbeitungsfunktionen: Benutzer können Bilder mit einfachen Textaufforderungen verfeinern und anpassen, einschließlich der Option, bestimmte Bereiche wie Produkthintergründe zu ändern.
- Anpassungsoptionen: Kunden können das Modell anleiten, Bilder zu erstellen, die ihre einzigartigen Markenelemente, Stile, Logos und Produkteigenschaften widerspiegeln.
Engagement für verantwortungsvolle KI
Google unterstreicht mit den Modellen Veo und Imagen 3 sein Engagement für Sicherheit, indem es sicherstellt, dass die Generierung schädlicher Inhalte verhindert wird und die Responsible AI Principles von Google strikt eingehalten werden. Darüber hinaus enthält jedes von diesen Modellen erzeugte Bild und Videobild unsichtbare SynthID-Wasserzeichen für zusätzliche Sicherheit und Rückverfolgbarkeit.
Der Maßstab für KI bei der Inhaltserstellung
Die Einführung von Veo und Imagen 3 stellt einen wichtigen Meilenstein für Google Cloud dar, da das Unternehmen seine Position als führender Anbieter von KI-gestützter Inhaltserstellung im Wettbewerbsumfeld der Hyperscaler festigt.
Schreibe einen Kommentar