Programowanie

Mistral rzuca rękawicę. Devstral 2 to nowa generacja AI dla programistów

Mistral AI, europejska firma konkurująca z gigantami takimi jak OpenAI czy Anthropic, zaprezentowała swoje najnowsze narzędzia skierowane bezpośrednio do programistów. Devstral 2 to rodzina modeli AI zaprojektowanych od podstaw z myślą o złożonych zadaniach inżynierii oprogramowania. To ruch, który sygnalizuje przejście od uniwersalnych chatbotów do wyspecjalizowanych, autonomicznych asystentów, określanych mianem „agentów”.

Dwa modele, jedno zadanie: zrozumieć kod

Nowa rodzina składa się z dwóch modeli. Pierwszy, Devstral 2, to gęsta sieć transformatorowa o 123 miliardach parametrów i imponującym oknie kontekstowym mieszczącym 256 tysięcy tokenów. W teście SWE-bench Verified, który mierzy zdolność do rozwiązywania realnych problemów z repozytoriów GitHuba, model osiągnął wynik 72,2%. To stawia go w ścisłej czołówce modeli typu open weights (z publicznie dostępnymi wagami) przeznaczonych do pracy z kodem. Model udostępniono na zmodyfikowanej licencji MIT, a obecnie można z niego korzystać bezpłatnie przez API firmy.

Jego mniejszym bratem jest Devstral Small 2, posiadający 24 miliardy parametrów i identyczne okno kontekstowe. Jego wynik w tym samym teście to 68,0%, co jest rezultatem porównywalnym z modelami nawet pięciokrotnie większymi. Co istotne, udostępniono go na licencji Apache 2.0, która jest standardem w zastosowaniach komercyjnych i znacznie ułatwia jego produkcyjne wdrożenie. Ten model wyróżnia się również multimodalnością – potrafi przetwarzać nie tylko kod, ale również obrazy, co pozwala mu analizować diagramy architektoniczne czy zrzuty ekranu z błędami.

Więcej niż uzupełnianie kodu

Mistral podkreśla, że celem Devstral 2 nie jest jedynie pisanie pojedynczych funkcji. Modele te zostały zoptymalizowane pod kątem zadań „agencyjnych”, co w praktyce oznacza zdolność do samodzielnego działania w obrębie całych repozytoriów. Potrafią eksplorować strukturę projektu, śledzić zależności między plikami i koordynować zmiany w wielu miejscach jednocześnie, zachowując przy tym kontekst na poziomie architektury. Według twórców, model jest w stanie wykrywać własne błędy, ponawiać próby z poprawkami i wspierać programistów w tak złożonych zadaniach jak naprawa błędów czy modernizacja przestarzałych systemów.

Firma twierdzi, że Devstral 2 jest nawet siedmiokrotnie bardziej efektywny kosztowo od modelu Claude Sonnet przy podobnej jakości w realnych zadaniach programistycznych. Chociaż takie deklaracje marketingowe należy traktować z rezerwą, Mistral przedstawił również wyniki oceny ludzkiej, w której Devstral 2 w parze z narzędziem agentowym Cline wyraźnie pokonał konkurencyjny model DeepSeek V3.2, wygrywając 42,8% porównań i przegrywając jedynie 28,6%.

Mistral Vibe CLI: agent w wierszu poleceń

Uzupełnieniem modeli jest Mistral Vibe CLI – napisany w Pythonie asystent programistyczny działający z poziomu terminala lub zintegrowanych środowisk programistycznych (IDE) obsługujących Agent Communication Protocol. Narzędzie, dostępne na licencji Apache 2.0, pozwala na interakcję z modelami Devstral za pomocą języka naturalnego.

Vibe CLI to coś więcej niż prosty interfejs czatu. Narzędzie skanuje strukturę plików i status Git, aby zbudować świadomość całego projektu. Obsługuje inteligentne odwołania (np. autouzupełnianie plików po wpisaniu znaku @) oraz potrafi koordynować zmiany w wielu plikach, co ma na celu skrócenie cyklu wprowadzania zmian (pull request). Konfiguracja jest prosta i pozwala na podłączenie zarówno modeli z API Mistrala, jak i innych, w tym działających lokalnie.

Strategiczny ruch na rynku AI

Premiera Devstral 2 i Vibe CLI to strategiczne posunięcie Mistrala. Firma nie konkuruje już tylko na polu surowej wydajności modeli ogólnego przeznaczenia, ale buduje wyspecjalizowany ekosystem dla deweloperów. Połączenie wydajnych, otwartych modeli z praktycznym, otwartym narzędziem stanowi atrakcyjną alternatywę dla zamkniętych rozwiązań konkurencji. Szczególnie Devstral Small 2, dzięki swoim rozmiarom, liberalnej licencji i zdolnościom multimodalnym, ma szansę stać się popularnym wyborem do zastosowań lokalnych i wewnątrzfirmowych, gdzie prywatność danych jest kluczowa.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *