
W godnym uwagi wydarzeniu, które miało miejsce zaledwie kilka dni po ogłoszeniu Material 3 Expressive, Google ma zamiar ujawnić fascynującą funkcję w ramach swojej inicjatywy AI znanej jako Illuminate. Stało się to tuż po wczesnym przecieku, który skłonił użytkowników do żartobliwego określenia projektu jako „kobiecego”.

Najnowsze spostrzeżenia udostępnione przez TestingCatalog ujawniają, że Google rozszerza możliwości Illuminate. Najnowsza aktualizacja wprowadza stronę główną z streszczeniami audio opartymi na sztucznej inteligencji, obejmującymi klasyczną literaturę, taką jak Frankenstein i Wielki Gatsby. Wśród zestawu nowych narzędzi znajdują się eksperymentalne funkcjonalności, w tym przycisk Edytuj i możliwość generowania obrazów okładek. Jednak wyróżniającą się funkcją jest „Sparks”, zaprojektowana do tworzenia krótkich filmów wyjaśniających w stylu TikTok na podstawie wskazówek użytkownika.

Opis Sparks podkreśla, że filmy są „generowane w 100% przez sztuczną inteligencję”, co sugeruje, że za generowanie obrazu i dźwięku na podstawie komunikatu odpowiada jeden model.
Według TestingCatalog, próbki pionowych filmów, trwających od jednej do trzech minut, są dostępne, chociaż narzędzie do generowania tych filmów wydaje się być na razie ograniczone do wewnętrznego dostępu w Google. Oto przykład, jak wyglądają te filmy (uwaga: zmniejsz głośność przed odtworzeniem):
Więcej próbek można znaleźć w tym wątku X autorstwa TestingCatalog. Jakość tych przykładowych filmów wywołała spekulacje dotyczące technologii, z potencjalnymi odniesieniami do modelu Veo 3 firmy Google lub wariantu potężnego modelu multimodalnego Gemini.
Ponadto rośnie ciekawość dotycząca połączenia z NotebookLM, inną usługą, która wraz z Illuminate, podnosi pytania o liczbę „eksperymentalnych” generatywnych narzędzi AI, które Google bada. Google potwierdziło zamiar zintegrowania funkcji przeglądu wideo z hostami AI w NotebookLM, umożliwiając użytkownikom otrzymywanie opracowanych przez AI wyjaśnień wideo dla ich przesłanych dokumentów.
TestingCatalog zauważa ponadto, że biorąc pod uwagę podobne formaty konwersacji, jest wysoce prawdopodobne, że technologie stojące za funkcją Sparks w Illuminate i funkcjami wideo w NotebookLM mają podobne podstawy.
Dodaj komentarz