Przedstawiamy Whisk: nowe narzędzie Google do generowania obrazów
Google, znany ze swoich innowacji w technologii wyszukiwania, wprowadził kolejny imponujący dodatek do swojej oferty generatywnej AI: Whisk . To przełomowe narzędzie, będące obecnie w fazie eksperymentalnej, pozwala użytkownikom tworzyć obrazy poprzez wprowadzanie istniejących elementów wizualnych, zamiast wymagać szczegółowych podpowiedzi tekstowych.
Jak działa trzepaczka
Whisk umożliwia użytkownikom przesyłanie wielu obrazów, które mogą służyć różnym celom, w tym definiowaniu tematu, stylu i ogólnej sceny pożądanego wyniku. W tle narzędzie wykorzystuje Gemini firmy Google do generowania opisu tekstowego, który jest następnie przetwarzany przez zaawansowany model generowania obrazów, Imagen 3 .
Bliższe spojrzenie na Imagen 3
Wprowadzony na rynek na początku tego roku, Imagen 3 jest reklamowany przez Google jako najbardziej dopracowany model obrazu firmy do tej pory. Według Google, tworzy obrazy o wyższej szczegółowości, ulepszonym oświetleniu i minimalizuje rozpraszające artefakty, co czyni go znaczącym ulepszeniem w stosunku do poprzednich iteracji.
Uchwycenie esencji, a nie dokładnych replik
W niedawno opublikowanym wpisie na blogu Google rozwinęło temat tego, jak Whisk uchwyca „esencję” obrazów wejściowych, niekoniecznie zapewniając dokładną reprodukcję. Oznacza to, że wynikowy obraz może różnić się pod wieloma względami, takimi jak odcień skóry, wzrost lub fryzura.
Dostosowywanie wygenerowanego obrazu
Aby rozwiązać potencjalne rozbieżności w generowanych obrazach, Whisk zawiera opcję umożliwiającą użytkownikom dostosowanie podpowiedzi tekstowych. Google uznaje, że niektóre funkcje mogą być kluczowe dla konkretnych projektów, dlatego zapewnili użytkownikom elastyczność w zakresie edycji tych podpowiedzi na dowolnym etapie procesu twórczego.
Więcej niż tylko edytor obrazów
Podczas gdy Whisk zawiera funkcje przypominające tradycyjne narzędzia do edycji obrazów, Google podkreśla, że jest to zasadniczo „narzędzie kreatywne”. Jego celem jest ułatwienie eksperymentalnej eksploracji i dynamicznej kreatywności, a nie po prostu funkcjonował jako konwencjonalny edytor. Ponadto użytkownicy mają możliwość pobrania wygenerowanych przez siebie obrazów do użytku osobistego lub zawodowego.
Dostępność Whisk
Obecnie Whisk jest dostępny dla użytkowników w Stanach Zjednoczonych, którzy zapisali się do programu Google Labs, który zapewnia dostęp do szeregu eksperymentalnych funkcji generatywnej AI. Jeśli chcesz wypróbować Whisk, możesz uzyskać do niego dostęp za pośrednictwem tego łącza .
Dodaj komentarz