Agenci AI

Microsoft rzuca wyzwanie Perplexity: Agenci badawczy i wzajemna autokorekta modeli w Copilot Wave 3

Sztuczna inteligencja jako autonomiczny współpracownik

Microsoft ogłosił szerszą dostępność funkcji Copilot Cowork, która stanowi wyraźną ewolucję od prostych chatbotów w stronę zaawansowanych agentów wykonawczych. Usługa, będąca częścią programu Frontier, pozwala systemowi nie tylko na generowanie odpowiedzi, ale na samodzielne zarządzanie wieloetapowymi procesami. Cowork potrafi operować na plikach, planować harmonogramy w kalendarzu i przygotowywać codzienne briefy, co zbliża AI do roli cyfrowego asystenta zdolnego do podejmowania decyzji operacyjnych.

Metoda krytyki: Kiedy jeden model sprawdza drugi

Najciekawszym elementem aktualizacji Wave 3 dla Microsoft 365 Copilot jest jednak narzędzie „Researcher”. Microsoft wprowadza w nim funkcję „Critique”, implementując unikalne podejście do weryfikacji danych. Proces polega na tym, że jeden model AI przygotowuje wstępny projekt badań, a drugi – niezależny – poddaje go rygorystycznej recenzji. System wykorzystuje przy tym zróżnicowane zaplecze technologiczne, opierając się na modelach od Anthropic oraz OpenAI.

Według deklaracji Microsoftu, tak skonstruowany model przewyższa Perplexity (wykorzystujące Claude Opus 4.6) o 7 punktów w testach wydajności głębokiego researchu. Należy jednak zachować pewną dozę sceptycyzmu – przedstawione benchmarki nie obejmują bowiem bezpośredniego starcia z najnowszym systemem Deep Research od OpenAI opartym na GPT-5, co może rzucać cień na bezwzględność ogłoszonych sukcesów.

Większa kontrola użytkownika dzięki Model Council

Dla osób poszukujących najwyższej precyzji przygotowano funkcję „Model Council”. Pozwala ona na zestawienie odpowiedzi z różnych modeli sztucznej inteligencji obok siebie. Dzięki temu użytkownik może na własne oczy zobaczyć punkty sporne oraz obszary, w których algorytmy są zgodne, co drastycznie ułatwia wyłapywanie potencjalnych halucynacji AI. To pragmatyczne podejście do technologii, które zamiast ukrywać procesy decyzyjne maszyny, poddaje je pod ocenę profesjonalisty.