Google udostępnia Project Genie: subskrybenci Gemini przetestują generatywne światy w czasie rzeczywistym
Wirtualne piaskownice na żądanie
Google DeepMind wykonało znaczący krok w stronę komercjalizacji swoich najbardziej zaawansowanych modeli bazowych. Project Genie, prototypowy system generowania światów („world model”), stał się dostępny dla amerykańskich subskrybentów planu Google AI Ultra. Oparta na architekturze Genie 3 technologia pozwala na budowanie interaktywnych przestrzeni w czasie rzeczywistym, wykorzystując do tego proste komendy tekstowe lub statyczne obrazy.
Użytkownicy otrzymali do dyspozycji trzy kluczowe funkcjonalności: World Sketching, umożliwiający projektowanie fundamentów świata przy wsparciu Gemini, World Exploration służącą do swobodnej nawigacji po wygenerowanej przestrzeni oraz World Remixing. Ta ostatnia funkcja jest szczególnie ciekawa, gdyż pozwala na modyfikowanie i przekształcanie już istniejących struktur, co daje przedsmak tego, jak w przyszłości może wyglądać proces tworzenia treści w grach wideo czy symulacjach.
Między innowacją a ograniczeniami technicznymi
Mimo imponujących założeń Google zachowuje powściągliwość w ocenie gotowości narzędzia do profesjonalnych zastosowań. Gigant z Mountain View uczciwie komunikuje obecne deficyty systemu: generowane obrazy bywają dalekie od realizmu, interakcje z postaciami cierpią na zauważalne opóźnienia, a każda sesja jest sztywno ograniczona do zaledwie 60 sekund. Co więcej, niektóre z zapowiadanych w sierpniu funkcji, takie jak programowalne zdarzenia wyzwalane promptami, wciąż nie trafiły do publicznej wersji testowej.
Kluczem do zrozumienia wagi Project Genie nie jest jednak wyłącznie rozrywka. Długofalowa wizja DeepMind zakłada, że tego typu modele staną się poligonem doświadczalnym dla autonomicznych agentów AI. Zamiast polegać wyłącznie na statycznych bazach danych, sztuczna inteligencja będzie mogła uczyć się poprzez „doświadczanie” i interakcję w kontrolowanych, dynamicznie generowanych symulacjach. Obecna premiera w USA to dopiero początek drogi, a Google zapowiada stopniowe rozszerzanie dostępności usługi na inne regiony.
