Wir stellen Whisk vor: Googles neues Tool zur Bildgenerierung
Google, bekannt für seine Innovationen in der Suchtechnologie, hat eine weitere beeindruckende Ergänzung seines Angebots an generativer KI auf den Markt gebracht: Whisk . Dieses bahnbrechende Tool befindet sich derzeit in der experimentellen Phase und ermöglicht es Benutzern, Bilder zu erstellen, indem sie vorhandene visuelle Elemente eingeben, anstatt detaillierte Texteingaben zu benötigen.
So funktioniert Whisk
Whisk ermöglicht es Benutzern, mehrere Bilder hochzuladen, die verschiedenen Zwecken dienen können, einschließlich der Definition des Motivs, des Stils und der Gesamtszene der gewünschten Ausgabe. Im Hintergrund verwendet das Tool Google Gemini, um eine Textbeschreibung zu generieren, die dann vom fortschrittlichen Bildgenerierungsmodell Imagen 3 verarbeitet wird .
Ein genauerer Blick auf Bild 3
Imagen 3 wurde Anfang des Jahres auf den Markt gebracht und wird von Google als das bisher ausgereifteste Bildmodell des Unternehmens angepriesen. Laut Google erzeugt es Bilder mit überragender Detailtreue, verbesserter Beleuchtung und minimiert störende Artefakte, was es zu einer deutlichen Verbesserung gegenüber früheren Versionen macht.
Das Wesentliche erfassen, keine exakten Repliken
In einem kürzlich veröffentlichten Blogbeitrag erläuterte Google, wie Whisk die „Essenz“ der Eingabebilder erfasst, ohne notwendigerweise eine exakte Reproduktion zu liefern. Dies bedeutet, dass das resultierende Bild in mehreren Punkten abweichen kann, beispielsweise in Bezug auf Hautfarbe, Größe oder Frisur.
Anpassen des generierten Bilds
Um mögliche Unstimmigkeiten in den generierten Bildern zu beheben, bietet Whisk eine Option, mit der Benutzer die zugrunde liegenden Textaufforderungen anpassen können. Google erkennt an, dass bestimmte Funktionen für bestimmte Projekte von entscheidender Bedeutung sein können. Daher hat das Unternehmen sichergestellt, dass Benutzer die Flexibilität haben, diese Eingabeaufforderungen in jeder Phase des kreativen Prozesses zu bearbeiten.
Mehr als nur ein Bildeditor
Obwohl Whisk Funktionen enthält, die an traditionelle Bildbearbeitungstools erinnern, betont Google, dass es sich grundsätzlich um ein „kreatives Tool“ handelt. Es zielt darauf ab, experimentelle Erkundung und dynamische Kreativität zu ermöglichen, anstatt einfach nur als herkömmlicher Editor zu funktionieren. Darüber hinaus haben Benutzer die Möglichkeit, ihre generierten Bilder für den persönlichen oder professionellen Gebrauch herunterzuladen.
Verfügbarkeit von Whisk
Derzeit ist Whisk für Benutzer in den USA verfügbar, die sich für das Google Labs-Programm angemeldet haben, das Zugriff auf eine Reihe experimenteller generativer KI-Funktionen bietet. Wenn Sie Whisk ausprobieren möchten, können Sie über diesen Link darauf zugreifen .
Schreibe einen Kommentar