Google udostępnia Imagen 4 i Imagen 4 Ultra: Czy nowe modele wygenerują rewolucję w obrazie?
Wraz z nowymi modelami Imagen 4 i Imagen 4 Ultra, Google otwiera kolejny rozdział w generowaniu obrazów za pomocą sztucznej inteligencji. Oba rozwiązania, dostępne już w Gemini API i Google AI Studio jako płatna wersja próbna, stanowią ewolucję poprzednich generacji, wprowadzając udoskonalenia w jakości i szybkości.
Imagen 4 umożliwia generowanie do czterech obrazów o rozdzielczości 1024 × 1024 pikseli na jedno wywołanie, akceptując prompty o długości do 480 tokenów. Koszt generacji jednego obrazu to około 0,04 dolara. W przypadku bardziej zaawansowanej wersji, Imagen 4 Ultra, cena wzrasta do około 0,06 dolara za obraz, oferując jednocześnie lepsze dopasowanie do promptów i możliwość eksportu w rozdzielczości 2K za pośrednictwem Vertex AI.
Kluczowym elementem wyróżniającym nowe modele jest integracja znaków wodnych SynthID oraz niemal natychmiastowe generowanie obrazów. Wczesne testy przeprowadzone przez użytkowników platformy X (dawniej Twitter) wskazują na wyraźną poprawę w ostrości tekstu i redukcję artefaktów w porównaniu do Imagen 3, co sugeruje realny postęp technologiczny. To szczególnie istotne w kontekście rosnących wymagań dotyczących wierności i użyteczności generowanej grafiki.
Dla deweloperów, dostęp do nowych modeli jest ułatwiony poprzez wykorzystanie tego samego punktu końcowego /generate, co w przypadku modeli Gemini. W okresie podglądu istnieje możliwość wnioskowania o zwiększenie domyślnego limitu 20 zapytań na minutę na projekt, co może ułatwić intensywniejsze testowanie i wdrażanie rozwiązań na większą skalę. Strategia ta ma na celu zachęcenie zarówno deweloperów indywidualnych, jak i dużych przedsiębiorstw do integracji nowych narzędzi Google w swoich ekosystemach.
Premiera Imagen 4 i Imagen 4 Ultra wzbogaca ekosystem kreatywnych rozwiązań Google DeepMind, uzupełniając rodzinę modeli Imagen, Veo i Gemini. Oferując elastyczne plany cenowe w Google Cloud, oparte na modelu pay-as-you-go oraz hojne darmowe warstwy, Google wyraźnie stawia na demokratyzację dostępu do zaawansowanych narzędzi generatywnych. Jednakże, czy te innowacje faktycznie przełożą się na dominację na rynku i zredefinicjują standardy w dziedzinie text-to-image, pozostaje kwestią otwartą. Konkurencja w sektorze AI jest zacięta, a rzeczywista wartość nowych modeli Google zostanie zweryfikowana przez ich praktyczne zastosowanie i przyjęcie przez szerokie grono użytkowników.
