KulturaSztukaVideo

Przyszłość filmów AI: Apokalipsa wyreżyserowana przez Josha, czyli Neural Viz

Twórca filmowy miał problem. Tiggy, obślizgły brązowy kosmita, nie chciał współpracować. Siedząc na miejscu pasażera w policyjnym radiowozie, uparcie odmawiał spojrzenia w obiektyw. Początkowo tylko nieznacznie odwracał wzrok, potem patrzył w złą stronę, a w końcu jego skóra zaczęła przypominać przejrzały owoc. Reżyser nie był na planie filmowym ani na Marsie. Siedział w swoim domu w Los Angeles, korzystając z oprogramowania AI o nazwie FLUX Kontext, generując i regenerując obrazy kosmity, czekając na idealne ujęcie.

Do stworzenia pierwszej wizualizacji Tiggy’ego użył Midjourney (prompt: „gruby kosmita z maleńkimi ustami”), ElevenLabs do wygenerowania barwy głosu (głos reżysera nałożony na syntetyczny, a następnie podniesiony o kilka oktaw) oraz Runway do określenia, jak ma wyglądać ujęcie: „zbliżenie małego kosmity jadącego na siedzeniu pasażera, mała głębia ostrości”. Sztuczna inteligencja ciągle się myliła. W jednym ujęciu Tiggy był przesadnie muskularny, w innym – jego plecy były zbyt suche. Kiedy reżyser polecił oprogramowaniu, aby tył głowy Tiggy’ego miał „żabią skórę”, to nałożyło na nią całą żabią twarz. Algorytm opierał się przed pokazaniem Tiggy’ego nago, mimo że kosmita nie nosi ubrań. Gdy reżyser poprosił o „niskiego kosmitę bez koszulki”, otrzymał komunikat o błędzie, prawdopodobnie z powodu zabezpieczeń narzędzia. – Pewnie przez słowo 'bez koszulki’ – domyślił się.

Monoverse: Gdy AI staje się narzędziem w rękach wizjonera

Narracje o AI często oscylują między katastroficznymi wizjami a przesadnym optymizmem. Obserwowanie twórcy filmowego pracującego z oprogramowaniem AI jest zaskakująco przyziemne. Narzędzia ignorują polecenia, podejmują dziwne decyzje lub zbaczają z kursu. Jednak z troską i cierpliwością udaje mu się nad nimi zapanować, wyciskając z nich osiem minut gęsto napisanego, oryginalnego serialu. Te osiem minut stanowi najnowszy odcinek uniwersum science-fiction, które reżyser stworzył pod nazwą Neural Viz. Projekt rozpoczął się w 2024 roku od mockumentalnej serii internetowej „Nierozwiązane Dziwactwa”, programu telewizyjnego z przyszłości, w której Ziemię zamieszkują stworzenia zwane gluronami, spekulujące o swoich ludzkich poprzednikach. Każdy odcinek zgłębia inny aspekt cywilizacji „hoomanów”, taki jak Ameryka, ćwiczenia fizyczne czy NFL. Wydawało się to zabawnym, zamkniętym w sobie żartem, ale wszechświat, znany jako Monoverse, zaczął się rozszerzać. Neural Viz wyprodukował odcinki różnych seriali z tej samej sieci telewizyjnej Gluronów, Monovision: serial dokumentalny o policjantach, program w stylu UFC o walczących owadach. Potem pojawiły się podcasty, wywiady uliczne. Między filmami zaczęły wyłaniać się wątki poboczne, romanse, kulty religijne czające się w tle i ziarniste nagrania archiwalne o prawdziwych okolicznościach, które zniszczyły ludzkość. Wkrótce reżyser zbudował cały świat z własnym językiem, postaciami i historią, a wszystko to za pomocą AI.

Neural Viz: przełom w świecie filmów AI

Neural Viz stał się kultowym hitem – ulubieńcem użytkowników Reddita i fanów AI na Twitterze – a następnie hitem z prawdziwego zdarzenia, z pojedynczymi filmami osiągającymi setki tysięcy wyświetleń na YouTube i miliony na TikToku i Instagramie. Ale poza popularnością, Neural Viz to historyczne osiągnięcie: jeden z pierwszych filmów AI, który naprawdę broni się jakością. Słowa „wideo AI” przywołują skojarzenia z najgorszymi możliwymi scenariuszami: hipopotamy na trampolinach, niemowlęta pilotujące samoloty, Will Smith jedzący spaghetti, Trump i Barack Obama całujący się. Innymi słowy – tandeta. Reputacja tego medium jest negatywna, zarówno z powodów estetycznych, jak i politycznych. Argument brzmi: boty zrujnują Hollywood i zniszczą miejsca pracy, pogrążając odbiorców w algorytmicznym osłupieniu.

AI jako maska: Nowy rozdział w twórczości filmowej

Neural Viz pokazuje inną drogę. W świecie najgorszych, tworzonych bez wysiłku produkcji AI, twórca kanału tworzy oryginalne dzieło, realizując wizję tak specyficzną i starannie wyobrażoną, jak każdy inny serial. Co ważne, twórca Neural Viz pisze scenariusze w tradycyjny sposób. Sam wciela się we wszystkie postacie, nosząc AI jako maskę. Gdy ma już wszystkie ujęcia, używa narzędzia Runway do przechwytywania ruchu twarzy, aby ożywić Tiggy’ego, odgrywając kwestie kosmity – jak Andy Serkis grający Golluma, nie wstając z krzesła obrotowego.

Podobnie jak Trey Parker i Matt Stone zrewolucjonizowali kreskówki, sięgając po najtańsze narzędzia, tak twórca Neural Viz bierze technologię, którą wielu uważa za coś gorszego, i wykorzystuje ją do pchnięcia medium w nowym kierunku. Może być pierwszym autorem AI.

Kim jest Josh Wallace Kerrigan?

Przez długi czas pozostawał anonimowy. Josh Wallace Kerrigan dorastał w małym miasteczku pod Wichita Falls w Teksasie, oglądając filmy takie jak „Tremors” i „Park Jurajski”. W wieku 9 lub 10 lat wraz z przyjacielem użył kamery w swoim komputerze stacjonarnym, aby nakręcić krótki film o baseballowym seryjnym mordercy. Studiował film na Minnesota State University Moorhead, a po ukończeniu studiów w 2012 roku Kerrigan przeniósł się do Los Angeles.

Przez następną dekadę podążał ścieżką aspirującego komediopisarza z Los Angeles. Podejmował różne prace dorywcze, m.in. jako barista w Starbucks wewnątrz Targetu, asystent reżysera, który współtworzył komedię „Sąsiedzi” oraz producent filmów zza kulis i promocyjnych do filmów takich jak „Mufasa: Król Lew” i komedia z Johnem Ceną i Akwafiną „Jackpot!”. Założył grupę kabaretową o nazwie Hush Money i przez rok co tydzień tworzył filmiki, które pojawiały się na kanale Funny or Die na YouTube. Grupa specjalizowała się w satyrach gatunkowych, w tym parodii „Piły”, która zyskała uznanie reżysera Jamesa Wana. W 2021 roku wyreżyserował niskobudżetowy horror i sprzedał pilot serialu Disneyowi.

Nagromadził ogromne doświadczenie, ale miał trudności z uzyskaniem trwałej popularności. Pandemia i jej następstwa zrujnowały tradycyjną ścieżkę hollywoodzkiego scenarzysty. Bańka streamingowa pękła, a zespoły scenarzystów skurczyły się. Strajki scenarzystów i aktorów zamroziły pracę na wiele miesięcy, a podpisane kontrakty odzwierciedlały malejący tort, a także obawę przed wkroczeniem AI.

Ograniczenia AI jako źródło inspiracji

W 2023 roku Kerrigan zaczął eksperymentować z oprogramowaniem do modelowania 3D, takim jak Blender i Unreal Engine. Interesowała go animacja, chciał budować postacie i scenografie, do których mógłby wracać w dowolnym momencie. Wkrótce dowiedział się o nowych aplikacjach generatywnych AI, takich jak Midjourney i Hedra, i odkrył, że automatyzują i przyspieszają one najtrudniejsze części modelowania 3D.

Kerrigan przyjrzał się ograniczeniom AI i je ominął. Zauważył, że narzędzia te słabo radzą sobie z sekwencjami akcji, ale dobrze z gadającymi głowami, więc postanowił stworzyć coś w stylu dokumentalnym. Chciał uniknąć efektu doliny niesamowitości symulowanych ludzi, więc wybrał bulwiaste stworzenia. Aby zamaskować niedoskonałości renderingów, skłonił się ku ziarnistemu wyglądowi telewizji z lat 80. i 90. Stąd „Nierozwiązane Dziwactwa”, których parodia programu NBC „Unsolved Mysteries” jest niezaprzeczalna.

Wczesne odcinki Kerrigana wyglądają nieco topornie, ale szybko ustanawiają szalony głos komediowy i ambitną wizję serialu. Ustanawiają również niektóre z podstawowych elementów i konfliktów Monoverse: autokratycznego, boskiego Monolitu, który rządzi planetą, „Ruchu Oporu”, który próbuje go obalić, oraz gadatliwego teoretyka spiskowego Tiggy’ego Skibblesa, który uważa, że „hoomanie” nie istnieją – a następnie w tajemniczy sposób znika.

Odkrycie generatywnych aplikacji AI było dla Kerrigana jak odblokowanie nowych mocy. – Za pierwszym razem, gdy widzisz te dziwne stworzenia mówiące i tak dalej, to jest to oszałamiające – mówi. Czuł się jak mem z facetem stojącym w kącie na imprezie, obserwującym tańczących i myślącym do siebie: Oni nie wiedzą.

Od Reddit do Hollywood: droga Neural Viz

Użytkownicy Reddita byli pod wrażeniem tego, że Neural Viz wykorzystuje idiosynkrazje, a nawet wady AI. Kerrigan zyskał uznanie innych twórców, którzy spekulowali na temat tożsamości artysty stojącego za kanałem. – Myślałam, że to Mike Judge ukrywający się pod pseudonimem – mówi Zack London, który tworzy filmy AI pod pseudonimem Gossip Goblin i ma ponad milion obserwujących na Instagramie.

Zachęcony początkowym odzewem, Kerrigan postanowił nakręcić więcej odcinków, ale nie miał pojęcia, dokąd to zmierza. – Nie było żadnego planu – mówi, więc postanowił zachować swoją tożsamość w tajemnicy. Eksperymentował z nowymi formatami, kierując się smykałką do satyry gatunkowej i chęcią utrzymania zainteresowania. Stworzył „The Cop Files”, serial spin-off „Archiwum X” i „Cops”, w którym detektyw bada zaginięcie Tiggy’ego; później powstał „Human Hunters”, parodia „Łowców duchów”.

Serial ewoluował wraz z technologią. Wraz z nowymi aplikacjami generatywnymi AI Kerrigan chciał wypróbować jak najwięcej z nich. (Wczesne korzystanie z nowego oprogramowania może pomóc w przyciągnięciu widzów ciekawych technologii). Na początku nagrywał fragmenty dialogów – to znaczy odczytywał kwestie do mikrofonu – a AI w przybliżeniu dopasowywała ruchy ust postaci do wypowiadanych słów, dodając podstawowe ruchy twarzy. Dawało mu to pewną kontrolę nad występami, ale nie dużą. Następnie, w październiku, Runway uruchomił narzędzie do przechwytywania ruchu, Act-One. Teraz mógł odgrywać kwestie przed kamerą swojego komputera, a oprogramowanie mapowało jego grę – zarówno głos, jak i ruchy twarzy – na model postaci. To dało mu znacznie większą kontrolę nad wyglądem i zachowaniem postaci. Sprawiło również, że treść była bardziej „jego” niż kiedykolwiek wcześniej. (Z drugiej strony, postacie zaczęły wydawać się bardziej jednolicie „jego”, przynajmniej w moim odczuciu. Kerrigan mówi, że chciałby zatrudnić innych aktorów, aby urozmaicić występy, ale na razie łatwiej jest mu odgrywać wszystkie role samodzielnie).

Czasami nowe narzędzie otwierało możliwości opowiadania historii. Gdy generator wideo Google Veo 2 stał się dostępny, Kerrigan nakręcił film pokazujący „flashback” do momentu, w którym Monolit zniszczył ludzkość – pierwszą sekwencję narracyjną serialu. „The Cop Files” również stało się bardziej narracyjne; zamiast mówić bezpośrednio do kamery, postacie poruszały się, wchodziły ze sobą w interakcje i wyruszały na wyprawy.

Zmiany technologiczne wpłynęły nawet na historię serialu. W jednym z odcinków wydanych w kwietniu skóra Tiggy’ego jest zauważalnie gładsza niż zwykle, ponieważ narzędzie do generowania wideo, którego Kerrigan używał w tym czasie, zwane Sora, miało trudności z zachowaniem spójności postaci. Aby ukryć tę wadę, Kerrigan kazał Tiggy’emu wyjaśnić, że „przechodzi metamorfozę”, ponieważ nie stać go już na „inhibitory morfin”. Pasowało to do teorii – wysuwanej przez niektóre postacie w serialu – że Gluroni są zmutowanymi wersjami ludzi. Od tego czasu „inhibitory morfin” stały się powracającym żartem.

Błędy maszyn często dostarczały inspiracji. Hodowca noży imieniem Reester Pruckett – wiele postaci Neural Viz to wersje mieszkańców południa Ameryki, wśród których Kerrigan dorastał – ma dziwny tik polegający na rozpoczynaniu zdań od bardzo długiej samogłoski, np. „Iiiiiiiiiiiiiiiiiiiiiii przyszedłem tutaj, żeby poćwiczyć moim scyzorykiem”. Zaczęło się to jako usterka w oprogramowaniu, ale było tak zachwycające, że Kerrigan postanowił zachować je jako znak rozpoznawczy Prucketta.

Przyszłość w zasięgu ręki: Kariera Kerrigana

Pod koniec 2024 roku dyrektorzy z Hollywood zaczęli wysyłać Kerriganowi wiadomości na portalach społecznościowych. Rozmawiał z „prawie wszystkimi dużymi studiami”, jak mi powiedział, a także z producentami i twórcami, którzy chcieli porozmawiać o współpracy. Wielu komentatorów na YouTube mówiło Kerriganowi, że jego filmy powinny być emitowane na Adult Swim. Ale kiedy spotkał się z producentami powiązanymi z Adult Swim, jeden z nich zasugerował, że może ich nie potrzebować; że władza przesunęła się na twórców. – To uczucie pojawiało się wielokrotnie na spotkaniach z różnymi innymi studiami – powiedział Kerrigan.

Spotkania zaowocowały dwoma ofertami pracy. Jedna polegała na pracy w studiu, koncentrując się na projektach AI. Kerrigan odrzucił ją na rzecz stworzenia własnego pilota serialu (nie związanego z Monoverse) z niezależnym producentem. Planował również zadebiutować nie-AI filmem krótkometrażowym, który współreżyserował, na SXSW wiosną 2025 roku. Dzięki nowemu kontraktowi na pilota serialu i przychodom, które Neural Viz generował na YouTube i TikToku, Kerrigan miał teraz wystarczająco dużo pieniędzy na życie. Więc w styczniu, po raz pierwszy od przeprowadzki do Los Angeles, rzucił swoją pracę.

AI Film Festival: Czy filmy AI mają duszę?

W czerwcu uczestniczyłem w AI Film Festival w Nowym Jorku, wydarzeniu zorganizowanym przez firmę Runway zajmującą się oprogramowaniem AI. Setki uczestników wypełniły Alice Tully Hall w Lincoln Center, aby obejrzeć 10 najlepszych filmów krótkometrażowych AI wyselekcjonowanych spośród 6000 zgłoszeń.

Uważam to za przygnębiające. Filmy były oszałamiające wizualnie, ale słabe pod względem koncepcyjnym i narracyjnym. Wydarzenie, w którym odbyła się sesja pytań i odpowiedzi z artystą muzycznym Flying Lotusem i częściowo generowany przez AI teledysk do piosenki J Balvina, wydawało się laboratoryjnie stworzone, aby wzmocnić argument sceptyków, którzy twierdzą, że sztuka AI to tylko powierzchnia bez serca. (Wyjątkiem był film „Total Pixel Space”, który zdobył główną nagrodę).

Paradoksem sceny filmowej AI jest to, że pomimo szybkości i wyrafinowania tych narzędzi liczba twórców wytwarzających zapadające w pamięć dzieła jest niewielka. Wspominałem już o Zacku Londonie, znanym jako Gossip Goblin, który tworzy złowieszcze, impresjonistyczne filmy o przyszłości opanowanej przez komputery. Muzyk Aze Alter tworzy upiorne, horrory. Duet komediowy piszący teksty, który wydaje filmy pod nazwą TalkBoys Studio (i który przyjaźni się z Kerriganem), tworzy animowane filmy krótkometrażowe z gadającymi zwierzętami i dinozaurami.

Znacznie częstsze są filmy AI typu prompt-and-play, zaprojektowane tak, aby stać się viralem. Kiedy w maju zadebiutował Veo 3 firmy Google, dzięki czemu generowanie filmów multimodalnych było równie proste, jak wpisanie zapytania do pola, media społecznościowe zalały – z powodów znanych tylko algorytmowi – vlogi Bigfoot rozmawiającego z kamerą. Jeden z influencerów pochwalił się nawet stworzeniem zautomatyzowanego potoku od LLM do wideo, który generował klip z Bigfoot co godzinę i wrzucał go na TikToka. Premiera Sory 2 firmy OpenAI pod koniec września, która pozwala użytkownikom skanować własne twarze i umieszczać je w filmach, tylko przyspieszyła tę falę.

Tradycyjne metody warsztatu w świecie AI

Jednym z powodów, dla których Neural Viz przebił się przez szum, jest to, że Kerrigan przyjmuje tradycyjne podejście do tak wielu elementów rzemiosła. Zawsze zaczyna od pisania – słów kluczowych, linii akcji, dialogów, ruchów kamery. Następnie tworzy storyboard każdego ujęcia odcinka; do każdego panelu tworzy zdjęcie za pomocą generatora obrazów, takiego jak Flux, Runway lub czasem ChatGPT. Dba o spójność oświetlenia. Podczas scen dialogowych utrzymuje linie wzroku. Dba o to, aby tła były czytelne – narzędzia AI mają tendencję do rozmazywania obiektów – i ustala nastrój sceny. Aby uzyskać efekt kamery z ręki, filmuje swój monitor za pomocą iPhone’a, a następnie odwzorowuje ten naturalny ruch na nagraniu AI: trik, który łączy prawdziwą i wirtualną kinematografię. – Wszystko, co robię w tych narzędziach, to zestaw umiejętności, który budowałem przez ponad dekadę – mówi. – Nie wierzę, że jest wielu ludzi, którzy mogliby zrobić tę konkretną rzecz.

Kerrigan nie uważa się za część ruchu i argumentuje, że AI jest narzędziem jak każde inne. Oprócz projektów AI pracuje nad tradycyjnym horrorem opartym na filmie krótkometrażowym, który współreżyserował i który zdobył nagrodę publiczności na SXSW.

McLees z TalkBoys Studio mówią, że początkowa reakcja na ich pracę z AI była różna. – Nasi przyjaciele, którzy są autorami sitcomów, scenariuszy, mówili: 'To nie jest warte twojego czasu, to zabije miejsca pracy’ – mówi McLees. – Odpowiedzieliśmy: 'miejsca pracy już zniknęły, studia je zabiły’. Porównał tę zmianę do wcześniejszych zakłóceń w przemyśle filmowym, w tym do przejścia od animacji rysunkowej do animacji 3D. – Chcieliśmy być przy stole, a nie w menu – mówi.

AI w Hollywood: rewolucja czy ewolucja?

Tymczasem Hollywood przygotowuje się na trzęsienie ziemi. Studia integrują AI ze swoimi procesami pracy. James Cameron dołączył do rady dyrektorów firmy zajmującej się AI, a Darren Aronofsky założył studio skupiające się na AI, które współpracuje z Google DeepMind. Podczas ostatnich negocjacji umowy związki scenarzystów i aktorów walczyły o ochronę miejsc pracy związaną z AI.

Kerrigan mówi, że spotkał się z pewną krytyką online za korzystanie z AI, i przyznaje, że technologia ta może zakłócić modele pracy Hollywood. Ale większym, istniejącym już problemem, mówi, jest to, że studia kontrolują treść narracyjną. Podczas gdy Disney kupił i teraz posiada pilota, którego zrobił w 2021 roku, AI pozwala mu tworzyć i posiadać dzieła samodzielnie. – Istnieje wersja tych narzędzi, która pozwala ludziom stać się bardziej niezależnymi od systemu i myślę, że to prawdopodobnie dobra rzecz – powiedział. Jednym z minusów jest obawa przed wypaleniem zawodowym.

Dotychczas wydaje się, że przegranymi w wizualnej wojnie AI będą rzemieślnicy – ci, którzy są niezwykle dobrzy w wykonywaniu jednego zadania technicznego. Zwycięzcami będą ludzie z pomysłami: pisarze, reżyserzy, gawędziarze. Ludzie z pomysłami, którzy potrafią również posługiwać się narzędziami? Będą bogami.

Podczas gdy niektóre nowe narzędzia AI ułatwiają podejście typu prompt-and-play, inne zapewniają więcej dźwigni do ręcznego dostrajania. Kiedy Kerrigan wznowił kręcenie odcinka Cop Files przy użyciu oprogramowania Act-Two, udało mu się uchwycić niuanse jego występów jeszcze lepiej niż w Act-One. W jednym z ujęć, gdy Tiggy wypowiada emocjonalną kwestię, drży mu warga.

Trwającą tajemnicą w lore Monoverse jest to, jak wyginęła ludzkość. Jedna z postaci mówi, że powszechnie uważa się, że zostali zabici przez ruchome schody, wciągnięci do ruchomych szczelin jeden po drugim, „usunięci przez własny głupi wynalazek”. To brzmi jak odniesienie do AI. W jednym z odcinków reporter omawia zagrożenie ruchomymi schodami, stojąc przed nimi w centrum handlowym. Podczas projektowania tego ujęcia Kerrigan mógł pozostawić puste miejsce wokół ruchomych schodów. Zamiast tego wstawił bieg schodów i postać nonszalancko podchodzącą po nich do góry.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *