Neonowe miasto przyszłości przechodzące w taśmę filmową, odbicie dolara, wysoka cena generowania wideo AI.

Google Veo 3 debiutuje w API Gemini z wysoką ceną

2025-07-18 AI Sight

Google udostępnił swój model generowania wideo Veo 3 deweloperom poprzez API Gemini. To posunięcie otwiera nowe możliwości w tworzeniu treści wizualnych, jednocześnie sygnalizując strategię rynkową, która stawia na jakość i zaawansowane funkcje kosztem wyraźnie wyższej ceny.

Veo 3 to pierwszy model Google zdolny do jednoczesnego generowania wysokiej rozdzielczości obrazu oraz zsynchronizowanego dźwięku – dialogów, muzyki i efektów – na podstawie pojedynczego zapytania tekstowego. Integracja z API Gemini jest obecnie ograniczona do funkcji tekst-wideo, choć obsługa obraz-wideo, dostępna już w aplikacji Gemini, ma zostać wkrótce zintegrowana z API. Jest to znaczący krok naprzód w możliwościach automatycznego tworzenia materiałów multimedialnych, eliminujący potrzebę postprodukcyjnej synchronizacji ścieżek audio i wizualnych.

Cena za sekundę

Dostęp do Veo 3 poprzez API Gemini jest możliwy wyłącznie w ramach płatnej warstwy Google Cloud. Cena wynosi 0,75 dolara za sekundę wideo w rozdzielczości 720p i 24 klatkach na sekundę, z dźwiękiem w formacie 16:9. W porównaniu do Veo 2, które kosztowało 0,50 dolara za sekundę i nie zawierało dźwięku, podwyżka jest znacząca i związana z dodaniem kompleksowej ścieżki audio. Google zapowiedziało również tryb „Veo 3 Fast”, który ma być szybszy i tańszy, ale na razie nie jest dostępny w API.

Kalkulacja kosztów szybko ujawnia potencjalne wyzwania. Ośmiosekundowe wideo to wydatek 6 dolarów, a pięciominutowy klip to już 225 dolarów. Z uwagi na to, że osiągnięcie zamierzonego rezultatu często wymaga wielokrotnych prób, koszty mogą drastycznie wzrosnąć. Przykładowo, stworzenie pięciu minut użytecznego materiału, wymagającego dziesięciokrotnie większej ilości wygenerowanych treści, może kosztować 2250 dolarów. Google najwyraźniej zakłada, że w niektórych zastosowaniach, szczególnie specjalistycznych, takie rozwiązanie może być bardziej opłacalne niż tradycyjna produkcja wideo.

Zastosowania w praktyce

Google wskazuje na kilka przykładów użycia Veo 3, które mają uzasadniać jego cenę i funkcjonalność. Firma Cartwheel wykorzystuje Veo 3 do transformacji dwuwymiarowych nagrań wideo w realistyczne animacje postaci 3D, mapując wygenerowane ruchy na przygotowane modele. Studio gier Volley natomiast adaptuje Veo 3 do tworzenia przerywników filmowych (cutscen) w swojej grze RPG „Wit’s End”, co pozwala na szybkie prototypowanie nowych koncepcji fabularnych i wizualnych.

Obecnie udostępnione przykłady wskazują na dość specyficzne zastosowania. Może to sugerować, że Google planuje dopiero szersze integracje, bądź też niektóre firmy korzystają z Veo 3 w ukryciu, nie będąc jeszcze gotowymi do publicznego ogłoszenia. Z perspektywy deweloperskiej, Google AI Studio oferuje szablon SDK i aplikację startową, ułatwiające szybkie prototypowanie. Wymagany jest jednak aktywny projekt Google Cloud z włączonym rozliczaniem.

Decyzja o wprowadzeniu Veo 3 z taką strukturą cenową odzwierciedla ambicje Google w segmencie generowania wideo AI. Pozostaje jednak pytanie, czy rynek zaakceptuje te koszty, zwłaszcza biorąc pod uwagę rosnącą konkurencję i szeroką dostępność alternatywnych, często tańszych rozwiązań.

Cena za sekundę

Zastosowania w praktyce

Udostępnij:

Zobacz również

Google udostępnia Veo 3 w aplikacji Gemini. Model generowania wideo staje się bardziej dostępny.

Asystent AI Google wykonujący połączenia telefoniczne budzi zarówno entuzjazm, jak i obawy

Cursor 2.2: Nowa generacja debugowania wspierana przez AI

Dodaj komentarz Anuluj pisanie odpowiedzi