Odyssey prezentuje interaktywne wideo napędzane AI: Czy to przyszłość rozrywki i symulacji?
Londyńskie laboratorium AI Odyssey, założone przez pionierów w dziedzinie pojazdów autonomicznych, Olivera Camerona i Jeffa Hawke’a, wkracza na nieznane dotąd obszary rozrywki. Firma zaprezentowała model sztucznej inteligencji zdolny do przekształcania strumieniowanego wideo w interaktywne światy. To innowacyjne rozwiązanie może zrewolucjonizować sposób, w jaki doświadczamy filmów i gier, otwierając drzwi do zupełnie nowych form angażowania widza.
Sercem tej przełomowej technologii jest zaawansowany algorytm AI, który generuje realistycznie wyglądające klatki wideo co zaledwie 40 milisekund. Dzięki temu reakcja na działania użytkownika jest niemal natychmiastowa, tworząc iluzję bezpośredniej kontroli nad tym, co widzimy na ekranie. Użytkownicy mogą wchodzić w interakcje z wirtualnym światem za pomocą klawiatury, telefonu, kontrolera, a nawet komend głosowych. Twórcy Odyssey określają to jako „wczesną wersję Holodeck” – idei znanej z kultowej serii Star Trek, gdzie wirtualne środowiska stają się niemal realne. Jak opisują to przedstawiciele firmy, obecne doświadczenie „przypomina eksplorację niestabilnego snu – surowe, niestabilne, ale niezaprzeczalnie nowe”. Nie mamy tu jeszcze do czynienia z odpolerowanymi, wysokiej jakości wizualnie produkcjami klasy AAA, ale początki są obiecujące.
Podstawą tej technologii jest nowatorski „model świata”, który wyróżnia się zdolnością do generowania realistycznych pikseli, utrzymywania spójności przestrzennej, uczenia się działań na podstawie materiału wideo oraz dostarczania spójnych strumieni wideo przez pięć minut lub dłużej. To znaczący krok w kierunku stworzenia w pełni immersyjnych, cyfrowych środowisk.
Modele świata: Obiecująca przyszłość i obawy branży kreatywnej
Koncepcja „modeli świata” to obecnie gorący temat w branży AI, który przyciąga uwagę zarówno startupów, jak i technologicznych gigantów, takich jak DeepMind, World Labs (projekt Fei-Fei Li), Microsoft czy Decart. Wizja przyszłości zakłada, że te modele będą fundamentem dla interaktywnych mediów, takich jak gry i filmy, a także umożliwią tworzenie realistycznych symulacji, np. środowisk szkoleniowych dla robotów. Potencjał jest ogromny.
Jednakże, perspektywy rozwoju tej technologii budzą mieszane uczucia w środowiskach kreatywnych. Niedawne dochodzenie magazynu „Wired” ujawniło, że studia gier, w tym Activision Blizzard, pomimo masowych zwolnień, coraz częściej wykorzystują AI do optymalizacji kosztów i walki z rotacją kadr. Co więcej, badanie z 2024 roku, zlecone przez Animation Guild (związek zawodowy reprezentujący animatorów i rysowników z Hollywood), prognozuje, że w najbliższych miesiącach ponad 100 000 miejsc pracy w amerykańskiej branży filmowej, telewizyjnej i animacyjnej może zostać zmienionych lub zagrożonych przez sztuczną inteligencję.
Odyssey, zdając sobie sprawę z tych obaw, deklaruje chęć współpracy z profesjonalistami kreatywnymi, a nie ich zastępowania. „Interaktywne wideo otwiera drzwi do zupełnie nowych form rozrywki, gdzie historie mogą być generowane i eksplorowane na żądanie, bez ograniczeń i kosztów tradycyjnej produkcji” – podkreśla firma w swoim wpisie blogowym. „Z czasem wierzymy, że wszystko, co dziś jest wideo – rozrywka, reklamy, edukacja, szkolenia, podróże i wiele innych – ewoluuje w interaktywne wideo, a wszystko to będzie napędzane przez technologię Odyssey.”
Wyzwania i plany rozwoju
Obecne demo Odyssey, jak przyznaje sama firma, jest jeszcze w fazie rozwoju i posiada pewne niedociągnięcia. Generowane środowiska bywają rozmyte i zniekształcone, a ich struktura nie zawsze pozostaje stabilna – dalsze poruszanie się lub obracanie może nagle zmienić otoczenie. To naturalne wyzwania dla nowatorskiej technologii.
Niemniej jednak, Odyssey obiecuje dynamiczny rozwój modelu. Obecnie może on transmitować wideo z prędkością do 30 klatek na sekundę, korzystając z klastrów procesorów graficznych Nvidia H100. Koszt takiej „godziny użytkownika” waha się od 1 do 2 dolarów. „Patrząc w przyszłość, badamy bogatsze reprezentacje świata, które znacznie wierniej oddadzą dynamikę, jednocześnie zwiększając stabilność czasową i trwały stan” – zapowiada Odyssey. „Równolegle rozszerzamy przestrzeń akcji z ruchu na interakcję ze światem, ucząc się otwartych akcji z wielkoskalowego wideo.”
Odyssey wyróżnia się również od wielu innych laboratoriów AI w obszarze modelowania świata poprzez swoje unikalne podejście do pozyskiwania danych. Firma zaprojektowała własny, 360-stopniowy system kamer montowanych na plecaku, aby przechwytywać krajobrazy z rzeczywistego świata. Wierzą, że te dane posłużą jako podstawa do tworzenia modeli wyższej jakości niż te, które są szkolone wyłącznie na ogólnodostępnych zbiorach danych. Do tej pory Odyssey pozyskało 27 milionów dolarów od inwestorów, takich jak EQT Ventures, GV i Air Street Capital. W zarządzie startupu zasiada nawet Ed Catmull, jeden ze współzałożycieli Pixara i były prezes Walt Disney Animation Studios, co świadczy o wysokim zaufaniu do projektu.
Już w grudniu ubiegłego roku Odyssey informowało o pracach nad oprogramowaniem, które umożliwi twórcom ładowanie scen generowanych przez ich modele do popularnych narzędzi, takich jak Unreal Engine, Blender czy Adobe After Effects, co pozwoli na dalszą, ręczną edycję. To pokazuje, że firma dąży do synergii z istniejącymi procesami twórczymi, a nie ich całkowitego wykluczenia.
