Surrealistyczny las z ekranami wideo, portalem i ścieżką, symbolizujący interaktywne możliwości przyszłości gier.

Czy Veo 3 zapowiada nadejście grywalnych modeli świata od Google?

2025-07-03 AI Sight

W środowisku sztucznej inteligencji, gdzie konwergencja technologii zdaje się przyspieszać z każdym miesiącem, pojawiła się intrygująca sugestia. Demis Hassabis, dyrektor generalny DeepMind, jednostki badawczej Google zajmującej się AI, subtelnie zasugerował, że Veo 3 – najnowszy model generujący wideo od Google – mógłby znaleźć zastosowanie w grach wideo.

Impulsem dla tej dyskusji była luźna wymiana zdań na platformie X. W odpowiedzi na post nawołujący Google do umożliwienia „grania w gry wideo z moich filmów z Veo 3” i pytający o „grywalne modele świata”, Hassabis odparł: „to byłoby coś”. Następnego dnia Logan Kilpatrick, odpowiedzialny za produkt w Google AI Studio i Gemini API, dolał oliwy do ognia, publikując wymowną serię emoji z zaszytymi ustami. Chociaż wypowiedzi te, jak podkreśla rzecznik Google, mają charakter nieformalny, to sama idea budowania grywalnych modeli świata nie wykracza poza kompetencje giganta technologicznego.

Kluczowe w tej dyskusji jest rozróżnienie między modelem świata a modelem generującym wideo. Model świata symuluje dynamikę środowiska rzeczywistego, co pozwala algorytmom przewidywać, jak świat będzie reagował na ich działania. Modele generujące wideo natomiast syntetyzują realistyczne sekwencje wideo. Google ma już plany przekształcenia swojego multimodalnego modelu fundacyjnego, Gemini 2.5 Pro, w model świata symulujący aspekty ludzkiego mózgu. W grudniu DeepMind zaprezentował Genie 2, zdolny do generowania „nieskończonej” różnorodności światów grywalnych. To jasno wskazuje na strategiczne zainteresowanie Google symulacją rzeczywistości.

Nie tylko Google pracuje nad budową modeli świata. Pionierka AI, Fei-Fei Li, w ubiegłym roku zaprezentowała World Labs – startup, który stworzył system AI generujący trójwymiarowe, przypominające gry wideo sceny z pojedynczego obrazu. Technologia ta podkreśla rosnące zainteresowanie branży możliwościami symulacji i interakcji.

Veo 3, obecnie w publicznej wersji beta, potrafi generować zarówno wideo, jak i towarzyszący mu dźwięk – od mowy po ścieżki dźwiękowe. Choć model ten realistycznie symuluje fizykę świata rzeczywistego, nie jest jeszcze pełnoprawnym modelem świata. Jego potencjał na ten moment leży raczej w zastosowaniach kinowych w grach, takich jak przerywniki filmowe, zwiastuny czy prototypowanie narracyjne. Aby stać się interaktywnym symulatorem, Veo 3 – lub jego przyszłe generacje – musiałby ewoluować z „pasywnego wyjścia” w aktywny, interaktywny i predykcyjny system.

Prawdziwym wyzwaniem w produkcji gier wideo nie jest wyłącznie imponująca oprawa wizualna, lecz przede wszystkim spójna, kontrolowalna symulacja w czasie rzeczywistym. Dlatego też Google, dążąc do rozwoju gier wideo lub grywalnych światów, może rozważać podejście hybrydowe, łączące możliwości Veo i Genie. Na polu bitwy o prymat w generowaniu wideo i modeli świata, Google może zderzyć się z Microsoftem, Scenario, Runway, Pika, a w przyszłości także z modelem Sora OpenAI. Biorąc pod uwagę zaplanowane działania Google w obszarze modeli świata i jego reputację w wykorzystywaniu zasobów do dominacji nad konkurencją, rywale powinni zachować czujność.

Udostępnij:

Zobacz również

Google udostępnia Gemini Embedding-001: rewolucja w wielojęzycznych embeddingach tekstu

SoftBank rozważa bilionowy projekt AI i robotyki w Arizonie – co z TSMC?

DeepMind i fuzja termojądrowa: Google stawia na sztuczną inteligencję w reaktorach przyszłości

Dodaj komentarz Anuluj pisanie odpowiedzi