Abstrakcyjna rzeka kodu generowanego przez model Mercury, pulsująca światłem na tle obwodów drukowanych.

Innowacyjny Mercury: Model dyfuzyjny przyspiesza generowanie kodu

2025-06-28 AI Sight

Branża oprogramowania, mimo postępów dzięki sztucznej inteligencji, wciąż zmaga się z wyzwaniami dotyczącymi szybkości generowania kodu. Dominujące modele autoregresywne, takie jak popularne GPT-4o czy Claude 3.5 Haiku, choć imponujące w dokładności, cierpią na fundamentalne ograniczenie: generowanie token po tokenie. Taka sekwencyjna natura tworzy wąskie gardła i opóźnienia, co jest szczególnie problematyczne w dynamicznych środowiskach programistycznych, gdzie wymagane są natychmiastowe odpowiedzi. Standardowo, modele te osiągają przepustowość rzędu 50-200 tokenów na sekundę, co w kontekście interaktywnych zadań jest często niewystarczające.

Odpowiedzią na te bolączki jest Mercury, innowacyjne rozwiązanie od Inception Labs. Model ten, będący rodziną językowych modeli dyfuzyjnych (LLM), został zaprojektowany specjalnie z myślą o programowaniu. Kluczową innowacją jest odejście od generowania sekwencyjnego na rzecz podejścia dyfuzyjnego, które umożliwia równoległe generowanie tokenów, co ma przekładać się na diametralnie większą efektywność obliczeniową i przepustowość.

Nowe podejście do generowania kodu

Modele Mercury, w tym Mercury Coder Mini i Mercury Coder Small, wykorzystują mechanizmy dyfuzyjne, gdzie wyjścia są iteracyjnie udoskonalane z początkowego szumu do spójnych danych. W przeciwieństwie do tradycyjnych modeli, które przewidują tokeny jeden po drugim, Mercury jest w stanie jednocześnie udoskonalać wiele tokenów w każdej iteracji. To podejście maksymalizuje wykorzystanie jednostek GPU, co istotnie wpływa na przyspieszenie procesu generowania kodu.

Niewątpliwie, dane treningowe odgrywają kluczową rolę w rozwoju każdego zaawansowanego modelu. W przypadku Mercury, modele były trenowane na bilionach tokenów, pochodzących nie tylko z obszernych przeszukiwań internetowych, ale także z danych syntetycznych i zastrzeżonych baz. Protokół treningu dyfuzyjnego obejmuje proces dodawania szumu do czystych danych oraz proces odwrotny, polegający na iteracyjnym usuwaniu tego szumu. Dzięki zastosowaniu tzw. „denoising diffusion loss”, Mercury może jednocześnie dostosowywać tokeny, co wzmacnia równoległość.

Przepustowość i dokładność, czyli co na to testy?

Niezależne oceny, przeprowadzone przez Artificial Analysis, wskazują, że modele Mercury Coder osiągają imponującą wydajność. Mercury Coder Mini uzyskał przepustowość rzędu 1109 tokenów na sekundę, co plasuje go wielokrotnie wyżej niż typowe modele autoregresywne. Mercury Coder Small, osiągając 737 tokenów na sekundę, oferuje z kolei solidny kompromis między szybkością a dokładnością generowanego kodu.

Nie tylko szybkość jest imponująca. Mercury Coder Small wykazał się 90% dokładnością w teście HumanEval, będącym standardowym benchmarkiem dla kodu Pythona, oraz 76.2% w MultiPL-E, wielojęzycznym benchmarku obejmującym C++, Javę, JavaScript, PHP, Bash i TypeScript. Mercury Coder Mini również zaprezentował solidne wyniki, z 88% w HumanEval i 74.1% w MultiPL-E. Szczególnie interesujące są osiągnięcia w zadaniach „fill-in-the-middle”, kluczowych dla autouzupełniania kodu, gdzie Mercury Coder Small przewyższył nawet specjalizowane modele, osiągając średnią dokładność 84.8%.

Co więcej, w realnych testach użytkowników na platformie Copilot Arena, Mercury Coder Mini zajął drugie miejsce pod względem preferencji, wyprzedzając nawet renomowane modele takie jak GPT-4o Mini czy Gemini 1.5 Flash. Model ten wyróżnił się także najniższym średnim opóźnieniem, wynoszącym zaledwie 25 milisekund.

Integracja i perspektywy

Modele Mercury zachowują kompatybilność z ugruntowanymi technikami promptowania, w tym z uczeniem zero-shot i few-shot, co pozwala na bezproblemową integrację z istniejącymi przepływami pracy programistów. To kluczowe, aby nowe rozwiązania nie wymagały gruntownych zmian w nawykach użytkowników.

Choć modele autoregresywne wciąż dominują, innowacje takie jak Mercury pokazują drogę do przyszłości, w której szybkość i wydajność generowania kodu nie będą już barierą. Potencjał tkwi nie tylko w samych liczbach przepustowości, ale także w zdolności do wspierania programistów w czasie rzeczywistym, co może znacząco przyspieszyć proces tworzenia oprogramowania i podnieść komfort pracy.

Nowe podejście do generowania kodu

Przepustowość i dokładność, czyli co na to testy?

Integracja i perspektywy

Udostępnij:

Zobacz również

Psychologiczne sztuczki łamią zabezpieczenia LLM. Badanie Wharton pokazuje skalę problemu

Wertykalne modele językowe: Nowy paradygmat w erze sztucznej inteligencji

Zhipu AI udostępnia GLM-4.6V – nową generację multimodalnych modeli językowych

Dodaj komentarz Anuluj pisanie odpowiedzi