
Rozwój tworzenia treści wideo przy użyciu sztucznej inteligencji
W ostatnich miesiącach popularność treści generowanych przez AI gwałtownie wzrosła, co zmieniło sposób, w jaki podchodzimy do produkcji wideo. Niedawne wprowadzenie przez OpenAI Sora , modelu text-to-video, jest przykładem tego trendu, umożliwiając użytkownikom tworzenie krótkich, wciągających klipów, które uchwycą wyobraźnię w niezwykłych szczegółach. Jednak oferta Sora jest obecnie ograniczona do maksymalnego czasu trwania zaledwie 20 sekund, z wyjściem wysokiej rozdzielczości 1080p.
Przedstawiamy Veo 2 firmy Google
Aby nie być gorszym, DeepMind firmy Google wkroczył w światło reflektorów, wprowadzając Veo 2 , potężnego następcę oryginalnego modelu Veo. To najnowocześniejsze narzędzie może produkować oszałamiające filmy 4K, które rozciągają się do 2 minut. Użytkownicy chcący poznać tę innowacyjną platformę mogą uzyskać do niej dostęp za pośrednictwem VideoFX , chociaż będą musieli zapisać się na listę oczekujących , która obiecuje wkrótce rozszerzony dostęp.
Tworzenie sztuki poprzez szczegółowe wskazówki
Przekonujący przykład możliwości Veo 2 zaprezentowany na stronie internetowej DeepMind ilustruje jego skuteczność. Film powstał na podstawie skomplikowanego polecenia, które mistrzowsko opisuje renesansowy pałac, pełen bogatych faktur i żywej atmosfery. Żywo zawiera elementy takie jak aksamitne zasłony i eleganckie żyrandole, oddając istotę królewskiego otoczenia.
Bliższe spojrzenie na kreatywne polecenie
Monit, który wygenerował tę hipnotyzującą scenę, jest następujący:
Kamera porusza się w powolnym ujęciu dolly, odsłaniając przepych renesansowej komnaty pałacowej ozdobionej meblami inkrustowanymi złotem, aksamitnymi zasłonami i żyrandolami rzucającymi miękkie, migoczące światło. Królowa siedzi nieruchomo przy pozłacanym biurku, jej szkarłatna jedwabna suknia spływa kaskadą na podłogę jak przelana krew. Na biurku leży niepodpisany list, którego krawędzie są podwinięte ze starości. Kamera ujmuje ją od tyłu, chwytając odbicie jej stoickiej twarzy w masywnym, ozdobnym lustrze. W tle dworzanie mruczą, ich sylwetki tańczą jak duchy w świetle świec. Nakręcono na filmie 70 mm dla bogatej faktury, przywołującej wspaniałość historycznych arcydzieł.
Rozpoznawanie ograniczeń
Choć te przykłady są niewątpliwie imponujące, kluczowe jest, aby podejść do nich z wyczuciem. DeepMind prawdopodobnie przygotował te pokazy, aby podkreślić szczyt możliwości Veo 2. Niemniej jednak wyzwania pozostają; model nadal ma problemy z generowaniem skomplikowanych scen lub płynnym ruchem.
Dodaj komentarz