Google udostępnia Gemini 2.5 Flash Image – model do generowania i edycji obrazów
Google ogłosił powszechną dostępność Gemini 2.5 Flash Image, modelu sztucznej inteligencji, który ma zrewolucjonizować sposób tworzenia i edycji obrazów. Nowe narzędzie jest już dostępne poprzez Gemini API, Google AI Studio oraz Vertex AI, co otwiera drzwi zarówno dla indywidualnych twórców, jak i dużych przedsiębiorstw poszukujących skalowalnych rozwiązań wizualnych.
Model Gemini 2.5 Flash Image wyróżnia się szeregiem innowacyjnych funkcji. Obsługuje aż 10 różnych proporcji obrazu (w tym formaty panoramiczne, portretowe i kwadratowe, a także formaty elastyczne). Użytkownicy mogą swobodnie mieszać ze sobą różne obrazy, zachowując przy tym spójność postaci – co jest szczególnie ważne w przypadku projektów narracyjnych. Model umożliwia także precyzyjną edycję za pomocą naturalnego języka, wykorzystując rozległą wiedzę Gemini.
W porównaniu do poprzednich generacji, Gemini 2.5 Flash Image radzi sobie znacznie lepiej z odwzorowaniem postaci z różnych perspektyw. Utrzymuje wysoką wierność szczegółów otoczenia i realistyczne pozy, eliminując problemy, z którymi borykały się inne platformy. Co więcej, system charakteryzuje się niskim opóźnieniem – czas generowania obrazu zwykle nie przekracza 10 sekund, co umożliwia wykorzystanie go w aplikacjach działających w czasie rzeczywistym.
Google udostępnił również model Nano Banana, oferujący wsparcie dla jeszcze szerszego zakresu proporcji obrazu. Jest on już dostępny w AI Studio.
Deweloperzy i firmy z całego świata już teraz integrują Gemini 2.5 Flash Image w różnorodne projekty – od narzędzi kreatywnych, przez aplikacje edukacyjne, po interaktywne doświadczenia na żywo. Google ustalił konkurencyjną cenę za korzystanie z modelu: 0,039 USD za wygenerowany obraz i 30 USD za milion tokenów wyjściowych.
Wraz z udostępnieniem Gemini 2.5 Flash Image, Google umacnia swoją pozycję lidera w dziedzinie generatywnej sztucznej inteligencji, oferując narzędzie, które ma potencjał, aby znacząco wpłynąć na sposób tworzenia i przetwarzania obrazów.
