Google udostępnia Search Live: aparat telefonu interfejsem dla modelu Gemini
Google ogłosiło globalną dostępność funkcji Search Live w ponad 200 krajach. To istotny krok w stronę odejścia od tradycyjnego wpisywania zapytań w okno przeglądarki na rzecz multimodalnej komunikacji. Rozwiązanie to integruje aparat fotograficzny z Answer Engine, pozwalając na zadawanie pytań o obiekty znajdujące się bezpośrednio przed obiektywem.
Szybkość reakcji dzięki Gemini 1.5 Flash
Sercem nowej usługi jest model Gemini 1.5 Flash (w wersji Live), zoptymalizowany pod kątem niskich opóźnień i wielojęzyczności. Google stawia na naturalność konwersacji – użytkownik może przerwać odpowiedź asystenta, dopytać o szczegóły lub poprosić o doprecyzowanie instrukcji w trakcie wykonywania czynności. Przykładem zastosowania, który promuje gigant z Mountain View, jest wspólne składanie mebli: kierując kamerę na instrukcję lub części półki, możemy na bieżąco otrzymywać wskazówki głosowe wspierane linkami do źródeł internetowych.
Multimodalność w praktyce
Funkcja Search Live to nie tylko nakładka na Google Lens, lecz głęboka integracja wewnątrz aplikacji Google na systemy Android oraz iOS. Choć technologia opiera się na analizie obrazu w czasie rzeczywistym, jej kluczowym elementem jest warstwa audio. Synteza mowy i rozpoznawanie głosu mają na celu zatarcie granicy między interfejsem cyfrowym a fizyczną rzeczywistością. Dla branży technologicznej to jasny sygnał: AI przestaje być tylko generatorem tekstu, a staje się aktywnym obserwatorem naszego otoczenia, gotowym do merytorycznego wsparcia w codziennych zadaniach.
