Gen AILLMNarzędziaR & D

Google wprowadza Gemini 2.5 Flash-Lite – najszybszy i najbardziej opłacalny model w linii Gemini

Google ogłosił wprowadzenie stabilnych wersji modeli Gemini 2.5 Flash i Pro, które są teraz gotowe do użycia produkcyjnego po udanej fazie testów. Wraz z tymi premierami, firma zaprezentowała również nowy model – Gemini 2.5 Flash-Lite, który jest dostępny w wersji preview.

Według Google, Gemini 2.5 Flash-Lite przewyższa swojego poprzednika (2.0 Flash-Lite) w benchmarkach dotyczących programowania, matematyki, nauk ścisłych, logicznego rozumowania oraz zadań multimodalnych. Model ten osiąga wyższe wyniki w testach takich jak GPQA (nauki ścisłe), AIME (matematyka) i LiveCodeBench (generowanie kodu).

Cena i wydajność

Cena za korzystanie z Gemini 2.5 Flash-Lite jest taka sama dla trybu standardowego i „Thinking”: 0,10 USD za milion tokenów wejściowych i 0,40 USD za milion tokenów wyjściowych. Jednak w trybie „Thinking” generowane są znacznie większe ilości tokenów, co może znacznie zwiększyć koszty użytkowania.

Google twierdzi, że Gemini 2.5 Flash-Lite jest szczególnie odpowiedni do zadań wymagających dużej liczby żądań i minimalnego opóźnienia, takich jak tłumaczenie i klasyfikacja. Wyniki benchmarków potwierdzają te zapewnienia, z wynikami 86,8% w FACTS Grounding i 84,5% w Multilingual MMLU.

Możliwości modelu

Gemini 2.5 Flash-Lite, podobnie jak inne modele z rodziny Gemini 2.5, obsługuje dane multimodalne, integrację z narzędziami takimi jak Google Search oraz okna kontekstowe o długości do miliona tokenów. Cała rodzina modeli Gemini 2.5 została zaprojektowana z myślą o hybrydowym rozumowaniu, balansując między wysoką wydajnością a niskim kosztem i opóźnieniem.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *