Outbyte PC Repair

Nowe narzędzie AI firmy Google „Whisk” umożliwia wyświetlanie podpowiedzi na podstawie obrazów, co zapewnia interaktywną zabawę

Nowe narzędzie AI firmy Google „Whisk” umożliwia wyświetlanie podpowiedzi na podstawie obrazów, co zapewnia interaktywną zabawę

Przedstawiamy Whisk: nowe narzędzie Google do generowania obrazów

Google, znany ze swoich innowacji w technologii wyszukiwania, wprowadził kolejny imponujący dodatek do swojej oferty generatywnej AI: Whisk . To przełomowe narzędzie, będące obecnie w fazie eksperymentalnej, pozwala użytkownikom tworzyć obrazy poprzez wprowadzanie istniejących elementów wizualnych, zamiast wymagać szczegółowych podpowiedzi tekstowych.

Jak działa trzepaczka

Whisk umożliwia użytkownikom przesyłanie wielu obrazów, które mogą służyć różnym celom, w tym definiowaniu tematu, stylu i ogólnej sceny pożądanego wyniku. W tle narzędzie wykorzystuje Gemini firmy Google do generowania opisu tekstowego, który jest następnie przetwarzany przez zaawansowany model generowania obrazów, Imagen 3 .

Bliższe spojrzenie na Imagen 3

Wprowadzony na rynek na początku tego roku, Imagen 3 jest reklamowany przez Google jako najbardziej dopracowany model obrazu firmy do tej pory. Według Google, tworzy obrazy o wyższej szczegółowości, ulepszonym oświetleniu i minimalizuje rozpraszające artefakty, co czyni go znaczącym ulepszeniem w stosunku do poprzednich iteracji.

Uchwycenie esencji, a nie dokładnych replik

W niedawno opublikowanym wpisie na blogu Google rozwinęło temat tego, jak Whisk uchwyca „esencję” obrazów wejściowych, niekoniecznie zapewniając dokładną reprodukcję. Oznacza to, że wynikowy obraz może różnić się pod wieloma względami, takimi jak odcień skóry, wzrost lub fryzura.

Dostosowywanie wygenerowanego obrazu

Aby rozwiązać potencjalne rozbieżności w generowanych obrazach, Whisk zawiera opcję umożliwiającą użytkownikom dostosowanie podpowiedzi tekstowych. Google uznaje, że niektóre funkcje mogą być kluczowe dla konkretnych projektów, dlatego zapewnili użytkownikom elastyczność w zakresie edycji tych podpowiedzi na dowolnym etapie procesu twórczego.

Więcej niż tylko edytor obrazów

Podczas gdy Whisk zawiera funkcje przypominające tradycyjne narzędzia do edycji obrazów, Google podkreśla, że ​​jest to zasadniczo „narzędzie kreatywne”. Jego celem jest ułatwienie eksperymentalnej eksploracji i dynamicznej kreatywności, a nie po prostu funkcjonował jako konwencjonalny edytor. Ponadto użytkownicy mają możliwość pobrania wygenerowanych przez siebie obrazów do użytku osobistego lub zawodowego.

Dostępność Whisk

Obecnie Whisk jest dostępny dla użytkowników w Stanach Zjednoczonych, którzy zapisali się do programu Google Labs, który zapewnia dostęp do szeregu eksperymentalnych funkcji generatywnej AI. Jeśli chcesz wypróbować Whisk, możesz uzyskać do niego dostęp za pośrednictwem tego łącza .

Źródło i obrazy

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *