Abstrakcyjna wizualizacja uczenia wzmacnianego w inżynierii oprogramowania, z kodem splecionym z neuronową strukturą.

DeepSWE: Rewolucja w Inżynierii Oprogramowania dzięki Uczeniu Wzmacnianemu

2025-07-04 AI Sight

Firma Together AI zaprezentowała DeepSWE, agenta inżynierii oprogramowania, który wyróżnia się pełną otwartością kodu źródłowego oraz nowatorskim podejściem do treningu. Zbudowany na fundamencie modelu językowego Qwen3-32B, DeepSWE osiągnął imponujące 59% skuteczności w rygorystycznym benchmarku SWEBench-Verified oraz 42.2% w metryce Pass@1, wyprzedzając tym samym inne otwarte modele w tej kategorii. To osiągnięcie sygnalizuje istotną zmianę strategiczną dla Together AI, która odchodzi od konwencjonalnych rurociągów wstępnego szkolenia na rzecz rozwoju autonomicznych agentów językowych, zdolnych do ciągłego uczenia się i doskonalenia na podstawie rzeczywistych danych zwrotnych.

Kluczowym elementem wyróżniającym DeepSWE jest zastosowanie uczenia wzmacnianego (RL – Reinforcement Learning) w procesie post-treningu. Model Qwen3-32B został dostrojony z wykorzystaniem rLLM, modułowego frameworka uczenia wzmacnianego od Agentica, zaprojektowanego specjalnie dla agentów językowych. W przeciwieństwie do tradycyjnych metod nadzorowanego dostrajania, rLLM pozwala agentom na adaptację do rzeczywistych przepływów pracy poprzez doświadczenie. DeepSWE został wyszkolony do rozwiązywania złożonych zadań inżynierii oprogramowania w pętli opartej na informacji zwrotnej, a nie na statycznych zbiorach danych. Proces treningowy wykorzystuje zbiór danych R2EGym od Agentica – benchmark inżynierii oprogramowania stworzony z myślą o rozwoju agentów w stylu RL.

Framework skupia się na szkoleniu modeli językowych z celami zorientowanymi na działanie, takimi jak naprawianie błędów, uzupełnianie funkcji czy edytowanie kodu, zamiast jedynie przewidywania rozkładu kolejnych tokenów. Takie podejście zbliża DeepSWE do sposobu, w jaki ludzcy inżynierowie iterują i uczą się z wyników, co znacząco zwiększa jego użyteczność w praktycznych zastosowaniach.

Wydajność i możliwości DeepSWE

Na SWEBench-Verified, najbardziej wymagającej platformie testowej dla agentów inżynierii oprogramowania, DeepSWE uzyskał wynik 59% z zastosowaniem skalowania w czasie testu. Wynik ten znacznie przewyższa osiągnięcia poprzednich otwartych modeli. W ewaluacjach Pass@1, które mierzą prawdopodobieństwo, że agent poprawnie rozwiąże problem już przy pierwszej próbie, DeepSWE osiąga imponujące 42.2%. Wyniki te podkreślają siłę treningu opartego na RL w wzmacnianiu zachowań agentowych, szczególnie w dziedzinach wymagających iteracyjnego rozumowania i precyzyjnych wyników, takich jak synteza kodu. Architektura modelu, odziedziczona z Qwen3-32B, umożliwia efektywne skalowanie przy jednoczesnym zachowaniu przydatności dla rzeczywistych zastosowań.

Otwartość kodu źródłowego

Jedną z kluczowych cech tej premiery jest pełna transparentność projektu. Together AI i Agentica nie tylko udostępniły model DeepSWE w otwartym kodzie źródłowym, ale także całą recepturę treningową, w tym framework rLLM, zbiór danych R2EGym oraz skrypty konfiguracji treningu. To promowanie otwartości sprzyja odtwarzalności badań oraz zachęca szerszą społeczność badawczą i deweloperską do rozszerzania lub budowania na bazie DeepSWE bez ograniczeń.

Deweloperzy mogą uzyskać dostęp do DeepSWE i rLLM poprzez zasoby udostępnione na Hugging Face oraz GitHub.

Premiera DeepSWE oznacza fundamentalne przejście od modeli językowych skoncentrowanych na rozumowaniu, do agentów językowych zdolnych do nauki poprzez interakcję. Tradycyjne modele LLM wykazywały silne zdolności rozumowania, często jednak brakowało im umiejętności adaptacji do informacji zwrotnych czy poprawy wraz z użytkowaniem. Uczenie wzmacniane pozwala tym modelom nie tylko dobrze funkcjonować od momentu wdrożenia, ale także doskonalić się w czasie, adaptując się do nowych dystrybucji problemów i dziedzin. Takie podejście otwiera również drzwi do lokalnego wdrożenia. Dzięki pełnej otwartości kodu źródłowego i modułowości DeepSWE, model może być rozszerzany i ponownie trenowany do specyficznych zastosowań w organizacjach. Programiści i badacze mogą budować własnych agentów na bazie DeepSWE, wykorzystując rLLM do obsługi różnorodnych dziedzin, takich jak nawigacja w sieci, robotyka czy autonomiczna pomoc badawcza.

DeepSWE stanowi kamień milowy w ewolucji generatywnej sztucznej inteligencji dla inżynierii oprogramowania. Poprzez zastosowanie uczenia wzmacnianego do dużych modeli językowych, takich jak Qwen3-32B, oraz udostępnienie całej infrastruktury treningowej, Together AI otwiera drogę do przyszłości, w której agenci nie tylko są wstępnie trenowani i wdrażani, ale także są stale szkoleni i doskonaleni. Ten skok od rozumienia języka do działania ukierunkowanego na agencję ma znaczące implikacje w dziedzinie programowania, automatyzacji i projektowania inteligentnych systemów, redefiniując możliwości sztucznej inteligencji w rozwiązywaniu złożonych problemów inżynierskich.

Wydajność i możliwości DeepSWE

Otwartość kodu źródłowego

Udostępnij:

Zobacz również

Google prezentuje Gemini 2.5 Komputer Use: Sztuczna inteligencja przejmuje kontrolę nad interfejsami użytkownika

Bugbot Cursora: Kontrola jakości kodu w erze AI

Nowy paradygmat rekrutacji: inżynier AI jako dyrygent kodu

Dodaj komentarz Anuluj pisanie odpowiedzi