Google wprowadza Gemini 2.5 Flash-Lite – najszybszy i najbardziej opłacalny model w linii Gemini
Google ogłosił wprowadzenie stabilnych wersji modeli Gemini 2.5 Flash i Pro, które są teraz gotowe do użycia produkcyjnego po udanej fazie testów. Wraz z tymi premierami, firma zaprezentowała również nowy model – Gemini 2.5 Flash-Lite, który jest dostępny w wersji preview.
Według Google, Gemini 2.5 Flash-Lite przewyższa swojego poprzednika (2.0 Flash-Lite) w benchmarkach dotyczących programowania, matematyki, nauk ścisłych, logicznego rozumowania oraz zadań multimodalnych. Model ten osiąga wyższe wyniki w testach takich jak GPQA (nauki ścisłe), AIME (matematyka) i LiveCodeBench (generowanie kodu).
Cena i wydajność
Cena za korzystanie z Gemini 2.5 Flash-Lite jest taka sama dla trybu standardowego i „Thinking”: 0,10 USD za milion tokenów wejściowych i 0,40 USD za milion tokenów wyjściowych. Jednak w trybie „Thinking” generowane są znacznie większe ilości tokenów, co może znacznie zwiększyć koszty użytkowania.
Google twierdzi, że Gemini 2.5 Flash-Lite jest szczególnie odpowiedni do zadań wymagających dużej liczby żądań i minimalnego opóźnienia, takich jak tłumaczenie i klasyfikacja. Wyniki benchmarków potwierdzają te zapewnienia, z wynikami 86,8% w FACTS Grounding i 84,5% w Multilingual MMLU.
Możliwości modelu
Gemini 2.5 Flash-Lite, podobnie jak inne modele z rodziny Gemini 2.5, obsługuje dane multimodalne, integrację z narzędziami takimi jak Google Search oraz okna kontekstowe o długości do miliona tokenów. Cała rodzina modeli Gemini 2.5 została zaprojektowana z myślą o hybrydowym rozumowaniu, balansując między wysoką wydajnością a niskim kosztem i opóźnieniem.
