Mistral AI wprowadza Devstral 2507: nowe modele językowe dla programistów
Mistral AI, działając w partnerstwie z All Hands AI, wprowadza na rynek zaktualizowane wersje swoich modeli językowych dla deweloperów, oznaczonych jako Devstral 2507. W ramach tej premiery dostępne są dwa rozwiązania: Devstral Small 1.1 oraz Devstral Medium 2507. Ich celem jest usprawnienie procesów rozumowania agentowego w kontekście kodu, syntezy programów oraz realizacji złożonych zadań w obrębie dużych repozytoriów oprogramowania. Kluczowe aspekty tych modeli to optymalizacja wydajności i kosztów, co ma przełożyć się na ich praktyczne zastosowanie w narzędziach dla programistów oraz systemach automatyzacji kodu.
Devstral Small 1.1: Otwarty Model dla Lokalnych Wdrożeń
Model Devstral Small 1.1 (znany również jako devstral-small-2507) bazuje na architekturze Mistral-Small-3.1 i zawiera około 24 miliardy parametrów. Jego zdolność do obsługi okna kontekstowego o długości 128 tysięcy tokenów pozwala na przetwarzanie rozbudowanych danych wejściowych, takich jak wielo-plikowe projekty kodu, oraz długich zapytań, typowych dla inżynierii oprogramowania.
Devstral Small 1.1 został precyzyjnie dostrojony do generowania ustrukturyzowanych danych wyjściowych, obejmujących formaty XML oraz wywoływanie funkcji. Dzięki temu model jest kompatybilny z popularnymi frameworkami agentowymi, takimi jak OpenHands, co czyni go użytecznym w zadaniach nawigacji po kodzie, złożonych edycji czy wyszukiwania fragmentów kodu. Model udostępniany jest na licencji Apache 2.0, co umożliwia jego wykorzystanie zarówno w projektach badawczych, jak i komercyjnych.
Wydajność na tle Konkurencji
W benchmarku SWE-Bench Verified, oceniającym zdolność modeli do generowania poprawnych poprawek dla rzeczywistych problemów na platformie GitHub, Devstral Small 1.1 osiągnął wynik 53.6%. Jest to znacząca poprawa w stosunku do poprzedniej wersji (1.0) i plasuje go przed innymi otwartymi modelami o porównywalnej wielkości. Wyniki zostały uzyskane przy użyciu środowiska OpenHands, które zapewnia standardowe warunki testowe dla agentów kodowych.
Mimo że Devstral Small 1.1 nie dorównuje największym proprietarnym modelom, jego twórcy podkreślają, że model oferuje wyważony kompromis między rozmiarem, kosztem wnioskowania a wydajnością rozumowania. To czyni go praktycznym rozwiązaniem dla wielu zadań programistycznych, gdzie nie zawsze wymagana jest najwyższa możliwa precyzja kosztem zasobów.
Dostępność i Wdrożenie
Devstral Small 1.1 dostępny jest w wielu formatach, w tym w kwantyzowanych wersjach GGUF, co umożliwia jego uruchomienie z wykorzystaniem bibliotek takich jak llama.cpp, vLLM czy LM Studio. Dzięki temu deweloperzy mogą lokalnie uruchamiać wnioskowanie na kartach graficznych z dużą ilością pamięci (np. RTX 4090) lub na komputerach Apple Silicon z co najmniej 32 GB RAM. Jest to istotna przewaga dla zespołów, które preferują niezależność od hostowanych API.
Mistral AI udostępnia model również za pośrednictwem swojego API, oferując ceny na poziomie 0.10 USD za milion tokenów wejściowych i 0.30 USD za milion tokenów wyjściowych, co jest zgodne z cennikiem dla innych modeli z linii Mistral-Small.
Devstral Medium 2507: Większa Precyzja, Dostęp Tylko przez API
W przeciwieństwie do wersji Small, Devstral Medium 2507 nie jest modelem o otwartym kodzie źródłowym i jest dostępny wyłącznie za pośrednictwem API Mistral lub w ramach umów wdrożeniowych dla przedsiębiorstw. Oferuje tę samą długość kontekstu 128 tysięcy tokenów, co wersja Small, lecz charakteryzuje się znacznie wyższą wydajnością.
Devstral Medium 2507 osiągnął wynik 61.6% w benchmarku SWE-Bench Verified, wyprzedzając w tym samym środowisku oceny kilka znaczących modeli komercyjnych, w tym Gemini 2.5 Pro i GPT-4. Wzmocniona zdolność rozumowania w długich kontekstach sprawia, że jest to poważny konkurent dla agentów kodowych operujących w dużych repozytoriach lub tam, gdzie występują złożone zależności między plikami. Ceny API wynoszą 0.40 USD za milion tokenów wejściowych i 2 USD za milion tokenów wyjściowych. Dodatkowo, klienci korporacyjni mogą skorzystać z opcji dostrajania modelu poprzez platformę Mistral.
Integracja z Narzędziami i Agentami: Synergia i Wybór
Oba modele, Devstral Small i Devstral Medium, zostały zaprojektowane z myślą o integracji z frameworkami agentów kodowych, takimi jak OpenHands. Wsparcie dla ustrukturyzowanych wywołań funkcji i formatów wyjściowych XML umożliwia ich włączenie do zautomatyzowanych procesów generowania testów, refaktoryzacji oraz naprawy błędów. Ta elastyczność ułatwia połączenie modeli Devstral z wtyczkami IDE, botami do kontroli wersji oraz wewnętrznymi potokami CI/CD.
Deweloperzy mogą wykorzystać Devstral Small do prototypowania lokalnych procesów pracy, podczas gdy Devstral Medium znajdzie zastosowanie w usługach produkcyjnych, które automatyzują aplikowanie poprawek lub triażowanie żądań pull opierając się na sugestiach modelu.
Premiera Devstral 2507 stanowi strategiczne posunięcie Mistral AI, dostarczając developerom ukierunkowane narzędzia do pracy z kodem. Wyraźny kompromis między kosztami wnioskowania a precyzją wykonania zadania pozwala użytkownikom na świadomy wybór modelu odpowiedniego dla ich konkretnych potrzeb. Devstral Small stanowi otwartą i przystępną opcję o wystarczającej wydajności dla wielu zastosowań, natomiast Devstral Medium celuje w aplikacje, gdzie kluczowa jest niezawodność i precyzja.
