Nano Banana: Google rozszerza zasięg AI w edycji obrazów
Google zintensyfikowało swoją obecność w obszarze sztucznej inteligencji, ogłaszając szerokie wdrożenie modelu Nano Banana. Ta inicjatywa ma na celu głębszą integrację zaawansowanych narzędzi do edycji i generowania obrazów z flagowymi produktami firmy, co stanowi kontynuację działań po wprowadzeniu funkcji opartych na modelu Gemini.
Według Google, Nano Banana, które zadebiutowało w sierpniu, już wygenerowało ponad 5 miliardów obrazów. Rozszerzenie dostępności tego zaawansowanego modelu AI, bazującego na technologii Gemini 2.5 Flash Image, sprawia, że trafia on z aplikacji Gemini do Google Search poprzez Google Lens oraz do NotebookLM. W najbliższych tygodniach funkcjonalność ta ma zostać również zintegrowana z Google Photos.
Kreator obrazów w Google Search i NotebookLM
W Google Search użytkownicy zyskują dostęp do nowego trybu „Create” w Google Lens, symbolizowanego ikoną żółtego banana. Funkcja ta umożliwia natychmiastową transformację zdjęć – zarówno tych wykonanych, jak i wybranych z galerii – za pomocą prostych poleceń tekstowych. Przykładowo, można poprosić o „zdjęcie z fotobudki” lub opisać konkretne zmiany wizualne. System pozwala również na tworzenie zupełnie nowych obrazów od podstaw w trybie AI Mode oraz na kontynuowanie dialogu z AI w celu eksploracji dalszych pomysłów stylistycznych.
W przypadku NotebookLM, Nano Banana wzbogaca funkcję Video Overviews o sześć nowych stylów wizualnych, takich jak akwarela, anime, retro print czy whiteboard. System automatycznie generuje kontekstowe ilustracje na podstawie dostarczonych źródeł. Dodatkowo wprowadzono format „Brief” dla krótkich podsumowań, uzupełniający istniejący „Explainer”, który oferuje szczegółowe omówienia.
Zaawansowane możliwości i spójność wizualna
Nano Banana wyróżnia się zdolnością do utrzymywania spójności postaci i obiektów w różnych scenariuszach, co jest kluczowym krokiem naprzód w porównaniu do wcześniejszych rozwiązań Google w tej dziedzinie. Model umożliwia tworzenie i edycję zdjęć za pomocą instrukcji w języku naturalnym, a także łączenie wielu obrazów w spójną kompozycję.
Cennik modelu kształtuje się na poziomie 0,039 dolara za wygenerowany obraz w standardowej rozdzielczości 1024×1024 pikseli.
Wdrożenie Nano Banana wpisuje się w szerszy trend udoskonalania generowania obrazów przez Google, widoczny już wcześniej w modelu Imagen 3, który powrócił do Gemini z ulepszeniami w zakresie tworzenia bardziej szczegółowych i zgodnych z wytycznymi grafik. Nano Banana kontynuuje tę ścieżkę, oferując jeszcze precyzyjniejszą kontrolę nad procesem tworzenia obrazów, jednocześnie zachowując prostotę obsługi poprzez tekstowe komendy.
