KulturaR & DSztuka

Przyszłość symulacji: Runway AI wykracza poza film, dążąc do budowania światów

W 1874 roku „Pierwsza Wystawa Impresjonistów” spotkała się z niedowierzaniem i ostrą krytyką. Dzieła Moneta czy Renoira uznano za „niedokończone” i „bazy”. Mimo to, dekadę później Georges Seurat, inspirując się impresjonizmem, stworzył „Niedzielne popołudnie na wyspie Grande Jatte” – dzieło, które w swej istocie składało się z milionów punktów, pikseli analogowej epoki. Ta analogia, łącząca impresjonistów z Seuratem, stanowi zaskakującą paralelę do fenomenu „Total Pixel Space”, zwycięskiego filmu tegorocznego Festiwalu Filmowego Runway AIFF.

„Piksele są budulcem cyfrowych obrazów, malutkimi kafelkami tworzącymi mozaikę” – głosi aksamitny głos narratora w filmie „Total Pixel Space”. Kontynuuje: „Każdy piksel jest zdefiniowany przez liczby reprezentujące kolor i pozycję. Zatem każdy obraz cyfrowy może być reprezentowany jako sekwencja liczb… tym samym, każde zdjęcie, które kiedykolwiek mogło zostać wykonane, istnieje jako współrzędne. Każda klatka każdego możliwego filmu istnieje jako współrzędne. Każda twarz, którą kiedykolwiek można było zobaczyć, istnieje jako współrzędne. Zaprzeczenie temu byłoby zaprzeczeniem istnienia samych liczb.”

Filozofia pikseli i światów

Jacob Adler, twórca „Total Pixel Space”, jest klasycznie wykształconym muzykiem i kompozytorem. Stał się filmowcem dzięki postępom w sztucznej inteligencji. Pracował nad filmem ponad rok, generując dziesiątki tysięcy obrazów, czerpiąc inspirację z opowiadania Jorge Luisa Borgesa „Biblioteka Babel” i idei nadawania sensu losowemu, rozległemu światu. „Zafascynował mnie sam akt generowania tych obrazów, co zaowocowało wieloma pytaniami filozoficznymi” – powiedział Adler. „W tej rozległej przestrzeni kombinatorycznej języka, przytłaczająca większość kombinacji liter jest bełkotem i nonsensem. Zastosujmy to do obrazowania cyfrowego: Ile obrazów może w ogóle istnieć? I ile z tych obrazów to niezrozumiały szum? Próbowałem wyrazić ten pomysł w innych mediach, ale to się po prostu nie udało. Jednak jako krótki film AI, to się złożyło w całość.”

Runway, wyceniany na 3 miliardy dolarów startup, organizuje AIFF od 2023 roku, aby promować krótkie filmy stworzone z wykorzystaniem AI. Tegoroczny festiwal, w którym triumfował „Total Pixel Space”, stanowił znaczący krok naprzód: od 300 zgłoszeń w małych nowojorskich teatrach w 2023 roku, do wyprzedanego pokazu w Lincoln Center z 6000 zgłoszeń, przyciągając międzynarodową publiczność. Runway nie wybierał zwycięzcy; decyzję podjęło jury, w skład którego weszli reżyserzy Harmony Korine i Gaspar Noe. Jednak „Total Pixel Space” odzwierciedla sposób, w jaki Runway myśli o własnej przyszłości: doświadczeniach generowanych przez AI, które nie tylko opowiadają historie, ale także budują światy.

„Będziemy mieli wszystkie te nowe formy mediów, które wykraczają poza film i gry, które istnieją we wszystkich przestrzeniach pomiędzy” – powiedział Anastasis Germanidis, CTO i współzałożyciel Runway. „Część z nich może przypominać bardziej immersyjne produkcje teatralne, gdzie jest ustalona fabuła, ale można się poruszać, doświadczając jej z różnych perspektyw.” Germanidis dodał: „Wyobraź sobie, że te modele stają się naprawdę dobre w generowaniu realistycznych przedstawień rzeczywistości, i masz świat, w którym możesz zasadniczo symulować większość tego, na czym nam zależy, poruszając się po świecie. To będzie bardzo ważna część rozwiązywania problemów.”

Od narracji do symulacji

Germanidis myśli o symulacji świata przede wszystkim jako o zasadzie; takiej, która mogłaby być zastosowana nie tylko do historii, ale także do biologii, robotyki i fizyki. Celem jest znalezienie sposobów na naśladowanie nie tylko ludzi, ale także praw fizyki i biologii. „Chcemy być w stanie symulować praktycznie każde polecenie, które masz w świecie fizycznym” – powiedział Cristóbal Valenzuela, CEO i współzałożyciel Runway. „Wiemy, że to nadchodzi… laboratoria AI były bardzo zafascynowane symulowaniem ludzkiego umysłu. Ale myślę, że to może być błędne podejście w dłuższej perspektywie. To, co chcesz zrobić, to nie symulować, jak działa człowiek, ale jak działa świat.”

Początki tej strategii widoczne są w planach Runway, które obejmują wprowadzenie interaktywnej gry, co oznacza wejście na rynek gier. Obecnie produkt koncentruje się na generowaniu tekstu i obrazów, ale oczekuje się, że z czasem stanie się coraz bardziej wizualny. To, w jaki sposób wszystko to ostatecznie doprowadzi do zastosowań w budowaniu światów, jest obecnie niejasne – i w tym tkwi sedno. „Jeśli masz z góry określoną drogę, to jest za późno i jest to oczywiste” – powiedział Valenzuela. „Dla mnie to wraca do tego, jak twórcze jest coś… Jeśli nie jesteś zaangażowany w akty twórcze, to nie rozumiesz. Większość ludzi, którzy mają jakąkolwiek formę twórczej ekspresji w swojej pracy, wie, że kiedy zaczynają, nie wiedzą dokładnie, dokąd zmierzają. Stawiasz się w bardzo wrażliwej pozycji, aby po prostu wszystko odkrywać. Wtedy, ostatecznie, z doświadczenia dowiesz się, że będziesz musiał gdzieś wylądować.”

Konkurencja i „Pobudka” AI

Runway nie narzeka na brak konkurencji w generowaniu wideo AI – w tym między innymi OpenAI Sora, Stability AI, Moonvalley i Pika Labs. Runway jest w sytuacji, w której musi stale się wyróżniać, aby konkurować. Firma zebrała do tej pory ponad 500 milionów dolarów od inwestorów takich jak General Atlantic, SoftBank, Nvidia, Salesforce Ventures, Felicis i Coatue. Podobno Meta próbowała przejąć Runway, zanim wydała miliardy na Scale AI tego lata.

Historia sztuki to historia przełomów technologicznych, od wynalezienia prasy drukarskiej po nadejście „filmów dźwiękowych” w latach 20. XX wieku. Utrata miejsc pracy jest oczywiście częścią tej historii – i zawsze tak było. „Przed wynalezieniem prasy drukarskiej, to byli mnisi i ludzie, którzy wiedzieli, jak dzielić się konkretnymi historiami” – powiedział Valenzuela. „Potem, wraz z prasą drukarską, więcej ludzi mogło czytać i pisać, co było traktowane jako apokaliptyczne wydarzenie.” To prawda: Kiedy prasa drukarska została wynaleziona w 1440 roku, a technologia rozprzestrzeniła się, władze religijne obawiały się utraty kontroli, a gildie skrybów zostały wyparte. Ale świat ludzi mógł teraz czytać, a historie mogły się skalować. Valenzuela podaje kolejny przykład, przesiąknięty komicznie suchym humorem: „Zanim wynaleziono budziki, wynajmowałeś człowieka, który przychodził pod twoje drzwi, o wyznaczonej godzinie, i rzucał kamieniem w twoje okno” – powiedział Valenzuela. „To była praca. Co byś innego zrobił, gdybyś nie miał rodziny w pobliżu i musiał się obudzić?” W XIX-wiecznej Wielkiej Brytanii i Irlandii, tych ludzi nazywano „knocker-uppers”. Pukali w okna długimi kijami lub strzelali grochem w okna, aby obudzić robotników na zmiany. Kiedy wynaleziono budziki, naturalnym stało się, że ludzie po prostu ich używali.

Gdy AI puka do hollywoodzkich okien, trend, w który Valenzuela jest bezpośrednio zaangażowany, reakcja przemysłu jest napięta – nawet jeśli ludzie potajemnie z niej korzystają. „To był trochę brudny sekret, bo zarówno Runway, jak i… ma trochę konkurencji” – powiedział Michael Burns, wiceprezes Lionsgate na scenie AIFF, wskazując na Valenzuelę. „Uważamy, że to narzędzie jest używane przez wszystkich, którzy nie mówią o tym, że go używają.” Germanidis z Runway twierdzi, że istnieją trzy fazy ewolucji sztuki technologicznej: doprowadzenie technologii do działania, imitowanie istniejących form sztuki, a następnie tworzenie unikalnych form. Dopiero zaczynamy wkraczać w tę trzecią fazę z modelami generatywnymi. Nie oznacza to oczywiście, że wszystko powinno być AI – jak twierdzi Adler, artysta, którego praktyka fundamentalnie rozszerzyła się dzięki AI – niektóre rzeczy (jak surrealistyczne obrazy i koncepcje filozoficzne) nadają się do AI, podczas gdy inny materiał (jak złożone interakcje międzyludzkie) nie. „Patrzę na [AI] jak na narzędzie, ale jeszcze nie wiem, czy jestem przekonany, że to nowy gatunek” – powiedział Adler. „Są rzeczy, które mogę produkować za pomocą kamer, które są niemożliwe z AI i vice versa – rzeczy, które mogę robić z AI, które są niemożliwe z kamerami.” To samo w sobie jest niezwykłym zjawiskiem, które świadczy o ekscytacji i strachu, które Runway i jego rywale w dziedzinie wideo AI już wywołują w świecie sztuki, mediów i rozrywki. Dla założycieli Runway jednak prawdziwa korzyść z ich wizji AI, jeśli uda im się ją zrealizować, wyjdzie daleko poza ekran, będąc czymś spektakularnym, immersyjnym – i prawdopodobnie nierozpoznawalnym.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *