Outbyte PC Repair

Googles neues KI-Tool „Whisk“ ermöglicht bildbasierte Eingabeaufforderungen für interaktiven Spaß

Googles neues KI-Tool „Whisk“ ermöglicht bildbasierte Eingabeaufforderungen für interaktiven Spaß

Wir stellen Whisk vor: Googles neues Tool zur Bildgenerierung

Google, bekannt für seine Innovationen in der Suchtechnologie, hat eine weitere beeindruckende Ergänzung seines Angebots an generativer KI auf den Markt gebracht: Whisk . Dieses bahnbrechende Tool befindet sich derzeit in der experimentellen Phase und ermöglicht es Benutzern, Bilder zu erstellen, indem sie vorhandene visuelle Elemente eingeben, anstatt detaillierte Texteingaben zu benötigen.

So funktioniert Whisk

Whisk ermöglicht es Benutzern, mehrere Bilder hochzuladen, die verschiedenen Zwecken dienen können, einschließlich der Definition des Motivs, des Stils und der Gesamtszene der gewünschten Ausgabe. Im Hintergrund verwendet das Tool Google Gemini, um eine Textbeschreibung zu generieren, die dann vom fortschrittlichen Bildgenerierungsmodell Imagen 3 verarbeitet wird .

Ein genauerer Blick auf Bild 3

Imagen 3 wurde Anfang des Jahres auf den Markt gebracht und wird von Google als das bisher ausgereifteste Bildmodell des Unternehmens angepriesen. Laut Google erzeugt es Bilder mit überragender Detailtreue, verbesserter Beleuchtung und minimiert störende Artefakte, was es zu einer deutlichen Verbesserung gegenüber früheren Versionen macht.

Das Wesentliche erfassen, keine exakten Repliken

In einem kürzlich veröffentlichten Blogbeitrag erläuterte Google, wie Whisk die „Essenz“ der Eingabebilder erfasst, ohne notwendigerweise eine exakte Reproduktion zu liefern. Dies bedeutet, dass das resultierende Bild in mehreren Punkten abweichen kann, beispielsweise in Bezug auf Hautfarbe, Größe oder Frisur.

Anpassen des generierten Bilds

Um mögliche Unstimmigkeiten in den generierten Bildern zu beheben, bietet Whisk eine Option, mit der Benutzer die zugrunde liegenden Textaufforderungen anpassen können. Google erkennt an, dass bestimmte Funktionen für bestimmte Projekte von entscheidender Bedeutung sein können. Daher hat das Unternehmen sichergestellt, dass Benutzer die Flexibilität haben, diese Eingabeaufforderungen in jeder Phase des kreativen Prozesses zu bearbeiten.

Mehr als nur ein Bildeditor

Obwohl Whisk Funktionen enthält, die an traditionelle Bildbearbeitungstools erinnern, betont Google, dass es sich grundsätzlich um ein „kreatives Tool“ handelt. Es zielt darauf ab, experimentelle Erkundung und dynamische Kreativität zu ermöglichen, anstatt einfach nur als herkömmlicher Editor zu funktionieren. Darüber hinaus haben Benutzer die Möglichkeit, ihre generierten Bilder für den persönlichen oder professionellen Gebrauch herunterzuladen.

Verfügbarkeit von Whisk

Derzeit ist Whisk für Benutzer in den USA verfügbar, die sich für das Google Labs-Programm angemeldet haben, das Zugriff auf eine Reihe experimenteller generativer KI-Funktionen bietet. Wenn Sie Whisk ausprobieren möchten, können Sie über diesen Link darauf zugreifen .

Quelle und Bilder

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert