Audio

Cohere rzuca wyzwanie gigantom transkrypcji z modelem Transcribe

Rynek automatycznego rozpoznawania mowy (ASR) zyskał właśnie poważnego gracza. Cohere, firma kojarzona dotychczas głównie z zaawansowanymi modelami językowymi dla biznesu, zaprezentowała Transcribe – swój pierwszy model dedykowany wyłącznie transkrypcji. To strategiczny ruch, który wpisuje się w rosnącą popularność aplikacji do dyktowania i automatycznego protokołowania spotkań.

Lekka waga, ciężki kaliber wyników

Transcribe opiera się na architekturze o skromnej, jak na obecne standardy, liczbie 2 miliardów parametrów. Mimo to model ten zdołał wspiąć się na szczyt rankingu Hugging Face Open ASR, osiągając średni współczynnik błędów (WER) na poziomie 5,42. To wynik, który pozwala mu wyprzedzić konkurentów takich jak Zoom Scribe v1 czy propozycje od IBM i ElevenLabs. Cohere postawiło na efektywność: model potrafi przetworzyć aż 525 minut nagrania w zaledwie 60 sekund.

Przewaga w testach ludzkich i bariery językowe

Choć cyfrowe benchmarki są istotne, Cohere kładzie duży nacisk na subiektywną ocenę jakości. W testach przeprowadzonych przez ludzi, Transcribe został uznany za lepszy od rywali w 61% przypadków pod kątem spójności i użyteczności. Warto jednak zachować pewną dozę sceptycyzmu – model wspiera 14 języków, w tym polski, ale wciąż wykazuje pewne braki w starciu z konkurencją przy przetwarzaniu języka portugalskiego, niemieckiego oraz hiszpańskiego.

Demokratyzacja sprzętu i integracja systemowa

Niewielki rozmiar modelu nie jest przypadkowy. Cohere celuje w użytkowników, którzy chcą hostować rozwiązanie lokalnie na standardowych, konsumenckich kartach graficznych, co jest kluczowe dla firm dbających o prywatność danych. Nowy model nie jest tylko osobnym narzędziem; zostanie on zintegrowany z platformą North – autorskim systemem orkiestracji agentów Cohere. Co istotne dla deweloperów, firma udostępnia model za darmo poprzez swoje API.

Biznesowy krajobraz Cohere

Debiut Transcribe przypada na moment intensywnego wzrostu finansowego startupu. Według doniesień, Aidan Gomez, dyrektor generalny firmy, celuje w roczny powtarzalny przychód na poziomie 240 milionów dolarów w 2025 roku. Przy rosnących spekulacjach o rychłym debiucie giełdowym, wprowadzenie solidnego modelu ASR może być sygnałem dla inwestorów, że Cohere buduje kompletny ekosystem narzędzi gotowych na każde wyzwanie współczesnego przedsiębiorstwa.