Claude Opus 4.7: potwór wydajności z apetytem na twoje tokeny
Powrót króla czy tylko naprawa błędów?
Anthropic nie bawi się w dyplomację. Podczas gdy użytkownicy wersji 4.6 skarżyli się na „AI shrinkflation” i odczuwalny spadek jakości, firma odpowiedziała premierą Claude Opus 4.7. To model, który nie tylko naprawia błędy poprzednika, ale w wielu aspektach po prostu miażdży konkurencję, w tym najnowsze iteracje GPT-5.4.
Opus 4.7 stał się domyślnym wyborem dla tych, którzy chcą delegować najtrudniejsze zadania programistyczne bez ciągłego nadzorowania modelu.
Liczby, które nie kłamią
Wskaźniki wydajności pokazują przepaść, jaka dzieli nową wersję od reszty stawki. W benchmarku SWE-bench Multilingual, mierzącym realne umiejętności kodowania, Opus 4.7 osiągnął wynik 80,5%. Dla porównania, chwalony wcześniej Gemini 3.1 Pro czy GPT-5.4 w testach logicznych OfficeQA Pro zostają daleko w tyle, tracąc do Claude’a nawet kilkanaście punktów procentowych.
To nie jest ewolucja krocząca. To brutalne przejęcie pozycji lidera w kategorii „użytecznej inteligencji”.
Maszyna do pożerania budżetu
Jest jednak haczyk, i to wyjątkowo dotkliwy dla portfela. Opus 4.7 to tokenowy żarłok. Nowy tokenizer mapuje ten sam wkład na 35% więcej tokenów niż wersja 4.6. W naszych testach redakcyjnych model potrafił dwukrotnie przepisać cały kod gry od zera tylko po to, by wprowadzić drobne poprawki, błyskawicznie zerując limity sesji.
Użytkownicy API muszą przygotować się na wyższe rachunki. Choć cena za milion tokenów pozostała bez zmian (5 USD wejście / 25 USD wyjście), realne koszty operacyjne rosną przez specyficzny sposób pracy modelu.
Transparentność zamiast czarnych skrzynek
Najciekawszą zmianą wizualną i merytoryczną jest Chain-of-Thought. W przeciwieństwie do poprzednich wersji, które ukrywały swoje „myśli” w osobnych kontenerach, Opus 4.7 wykłada kawę na ławę. Proces rozumowania jest integralną częścią wyjścia tekstowego.
To potężne narzędzie diagnostyczne, choć potęguje problem zużycia tokenów.
Cień Mythos: co Anthropic trzyma w sejfie?
Mimo imponujących osiągów Opus 4.7 to wciąż tylko „wersja cywilna”. W cieniu pozostaje Claude Mythos – mityczny wręcz model dostępny tylko dla wybranych partnerów i agencji bezpieczeństwa. Podczas gdy Opus jest celowo ograniczany w zakresie cyberbezpieczeństwa, Mythos bez trudu przechodzi testy „The Last Ones”, symulujące wieloetapowe ataki na sieci korporacyjne.
Opus 4.7 to poligon doświadczalny dla systemów bezpieczeństwa, które Anthropic musi przetestować przed wypuszczeniem czegokolwiek potężniejszego na wolny rynek.
Werdykt tech-edytora
- Wydajność: Bezkonkurencyjna w kodowaniu i analizie dokumentów.
- Koszty: Ekstremalnie wysokie przez nadmiarowość generowanych treści.
- Dostępność: Claude.ai, AWS Bedrock oraz Google Cloud Vertex AI.
Jeśli twoim priorytetem jest jakość kodu i logiczna spójność, Opus 4.7 nie ma obecnie konkurencji. Ale jeśli liczysz każdą złotówkę wydaną na API – miej się na baczności. Ten model nie zna słowa oszczędność.
