
Google prezentuje najnowocześniejszy model obrazu Flash Gemini 2.5
Google dokonało przełomu, wprowadzając Gemini 2.5 Flash Image – rewolucyjny model generowania i edycji obrazów, który został wewnętrznie nazwany „nano-banana”.To zaawansowane narzędzie zostało zaprojektowane do tworzenia i edycji obrazów, zapewniając jednocześnie spójność znaków i płynne łączenie różnych obrazów w spójny efekt końcowy.
Podnoszenie standardów w edycji obrazów
Jak donosi LMArena, Gemini 2.5 Flash Image szybko wspiął się na szczyt modeli do edycji obrazu, przyćmiewając konkurencję, taką jak GPT Image 1 firmy OpenAI i Flux.1 Kontext. Wcześniejsze wersje modeli generowania obrazu wyróżniały się estetyką wizualną, ale często nie potrafiły precyzyjnie interpretować rzeczywistej semantyki. Model Gemini 2.5 wykorzystuje rozległą wiedzę o świecie, aby zwiększyć realizm i dokładność generowanych obrazów.
Dostępność dla twórców i programistów
Najnowszy model jest łatwo dostępny zarówno dla konsumentów, jak i deweloperów. Deweloperzy mogą korzystać z Gemini 2.5 Flash Image za pośrednictwem różnych platform, w tym Gemini API, Google AI Studio i Vertex AI, zaspokajając potrzeby przedsiębiorstw. Cena wynosi 30, 00 USD za każdy milion tokenów wyjściowych, co daje średnio około 0, 039 USD za wygenerowany obraz.
Konsumenci mogą przekonać się o możliwościach tego innowacyjnego modelu za pośrednictwem aplikacji internetowej i mobilnej Gemini. Google wyróżniło szereg przełomowych zastosowań, które użytkownicy mogą poznać za pośrednictwem aplikacji Gemini:
- Ulepszenia kostiumów i lokalizacji : Użytkownicy mogą przesyłać swoje zdjęcia, zarówno te przedstawiające ich samych, jak i ich zwierzęta, i łatwo umieszczać je w nowych, dynamicznych ustawieniach, zachowując jednocześnie ich oryginalny wygląd.
- Łączenie zdjęć : Ten model pozwala na łączenie wielu obrazów w celu tworzenia nowych scen. Na przykład, można połączyć swój portret z portretem psa, tworząc uroczą wspólną chwilę na boisku do koszykówki.
- Edycja iteracyjna : Użytkownicy mogą brać udział w edycji wieloetapowej, zaczynając od pustego pokoju i stopniowo dodając elementy, takie jak kolory ścian, regały na książki czy meble, aby stworzyć wyobrażoną przez siebie przestrzeń.
- Design Fusion : Użytkownicy mogą kreatywnie stosować estetykę jednego obrazu (na przykład wzory kwiatowe) do obiektów na innym obrazie (na przykład pary kaloszy), bez trudu łącząc różne inspiracje projektowe.
Zaangażowanie w ochronę prywatności użytkowników i integralności wizerunku
W trosce o prywatność użytkowników, Google zapewniło, że obrazy przesyłane na platformę nie będą wykorzystywane do celów szkoleniowych w ich generatywnych systemach uczenia maszynowego, chyba że zostaną przekazane jako informacja zwrotna. Ponadto wszystkie obrazy wygenerowane lub zmodyfikowane za pośrednictwem aplikacji Gemini będą oznaczone widocznym znakiem wodnym oraz niewidocznym cyfrowym znakiem wodnym SynthID, co zapewni autentyczność i integralność praw autorskich.
Więcej informacji na temat Gemini 2.5 Flash Image można znaleźć w pełnym ogłoszeniu na Neowin.
Dodaj komentarz