Neuronowa sieć w kształcie ucha słucha języka, symbolizując AI Speechify w Chrome.

Speechify rozszerza funkcjonalność Chrome o dyktowanie głosem i asystenta AI

2025-12-01 AI Sight

W odpowiedzi na rosnące zapotrzebowanie na narzędzia oparte na zaawansowanych modelach rozpoznawania mowy, Speechify, platforma specjalizująca się w konwersji tekstu na mowę, wzbogaca swoje rozszerzenie do przeglądarki Chrome o funkcje sterowane głosem. Użytkownicy będą mieli teraz dostęp do dyktowania oraz konwersacyjnego asystenta AI, co stanowi znaczące rozszerzenie dotychczasowych możliwości narzędzia.

Dyktowanie głosem: usprawnienie codziennej pracy

Nowa funkcja dyktowania, dostępna początkowo w języku angielskim, ma na celu usprawnienie procesu tworzenia treści. Podobnie jak inne tego typu rozwiązania, narzędzie Speechify koryguje błędy gramatyczne i stylistyczne, a także eliminuje zbędne słowa i tak zwane „zapychacze”.

Wstępne testy dziennikarskie wykazały, że choć narzędzie sprawnie współpracuje z aplikacjami takimi jak Gmail czy Google Docs, to jego efektywność na platformach typu WordPress wymaga dopracowania. Firma zapowiedziała jednak stopniową optymalizację pod kątem popularnych stron internetowych.

Analiza dokładności, mierzona wskaźnikiem błędów słownych (word error rate), plasuje Speechify nieco poniżej konkurencji, takiej jak Wispr Flow, Willow czy Monologue. Przedstawiciele firmy podkreślają, że model uczenia maszynowego doskonali się wraz z intensywnością użytkowania, co ma skutkować systematycznym obniżaniem współczynnika błędów.

Asystent głosowy: AI na bocznym panelu przeglądarki

Równolegle Speechify wprowadza konwersacyjnego asystenta głosowego, który będzie dostępny na panelu bocznym przeglądarki. Użytkownicy będą mogli zadawać mu pytania dotyczące aktualnie przeglądanej strony, na przykład „jakie są trzy kluczowe idee?” lub „wyjaśnij to w prostszych słowach”.

Firma argumentuje, że choć giganci tacy jak ChatGPT czy Gemini oferują tryby konwersacyjne, funkcja głosowa jest w nich często traktowana jako dodatek, a nie podstawowy interfejs. Rohan Pavuluri, dyrektor ds. biznesu w Speechify, podkreśla, że „czat zawsze będzie domyślnym doświadczeniem użytkownika w ChatGPT i Gemini, gdy otworzy się aplikacje. Głos będzie zawsze drugorzędny – i w wielu przypadkach, będzie po prostu dodatkiem. Wiemy z kilku lat budowania Speechify, że duża część rynku chce głosu jako podstawowego, domyślnego ustawienia za każdym razem, gdy otwierają aplikację i rozmawiają z AI”.

Warto odnotować, że asystent Speechify nie współpracuje obecnie z przeglądarkami wyposażonymi we własne boczne panele asystentów, takimi jak OpenAI Atlas, Perplexity Comet czy Dia. Firma nie postrzega tego jednak jako istotnej przeszkody, koncentrując się na obsłudze szerokiej bazy użytkowników przeglądarki Chrome.

Przyszłość Speechify: agenci autonomiczni

Speechify ujawniło również plany stopniowego wdrożenia funkcji dyktowania i asystenta głosowego we wszystkich swoich aplikacjach mobilnych i desktopowych. Długofalowa wizja startupu obejmuje rozwój agentów AI, którzy będą w stanie wykonywać zadania w imieniu użytkownika. Jako przykład podano umawianie spotkań telefonicznych czy oczekiwanie na połączenie z obsługą klienta. Ambicje te wpisują się w trend rynkowy, którym podążają również inne firmy, takie jak Truecaller czy Cloaked.

Dyktowanie głosem: usprawnienie codziennej pracy

Asystent głosowy: AI na bocznym panelu przeglądarki

Przyszłość Speechify: agenci autonomiczni

Udostępnij:

Zobacz również

Koniec z ręcznym notowaniem. HypeScribe stawia na inteligentną syntezę audio dzięki GPT-5.2

Gemini przejmuje kontrolę nad Android Auto: rewolucja w interakcji z samochodem

Cohere Transcribe rzuca wyzwanie gigantom. Nowy model open-source dominuje w rankingach ASR

Dodaj komentarz Anuluj pisanie odpowiedzi