Audio

Google testuje klonowanie głosu: Gemini 3 Flash zyska przełomową funkcję audio

Personalizacja audio nowym standardem w AI Studio

Deweloperzy korzystający z ekosystemu Google mogą szykować się na istotną zmianę w sposobie generowania mowy. Odnalezione w AI Studio ukryte menu „Create Your Voice” wskazuje na to, że firma z Mountain View intensywnie pracuje nad natywnym klonowaniem głosu. Funkcjonalność ta pojawia się w kontekście modelu oznaczonego jako Flash Native Audio Preview, co z dużym prawdopodobieństwem zwiastuje premierę Gemini 3 Flash.

Choć interfejs pozwalający na nagrywanie i przesyłanie próbek dźwiękowych nie jest jeszcze w pełni operacyjny, sam fakt jego istnienia rzuca światło na strategię Google. Firma odchodzi od syntetycznych, generycznych lektorów na rzecz personalizacji. To naturalna ewolucja po grudniowych aktualizacjach Gemini 2.5 Flash, które znacząco poprawiły klarowność mowy i precyzję w wykonywaniu poleceń głosowych.

Próg wejścia dla deweloperów znacząco spadnie

Możliwość stworzenia sztucznego głosu na podstawie krótkiej próbki to potężne narzędzie dla twórców aplikacji, gier i interaktywnych asystentów. Zamiast polegać na gotowych bibliotekach, programiści będą mogli wdrożyć unikalne brzmienie pasujące do charakteru danej usługi. Nie jest to jednak jedyna nowość, która czeka użytkowników AI Studio. Google testuje również głębszą integrację z bazami kodu, umożliwiając importowanie całych repozytoriów bezpośrednio z GitHub, co ma przyspieszyć proces analizy i debugowania projektów.

Odświeżony interfejs i analityka

Zmiany dotkną także warstwy wizualnej platformy. Planowana przebudowa strony głównej zakłada wyraźne rozdzielenie historii aktywności od statystyk użycia zasobów. Dla profesjonalistów oznacza to lepszą kontrolę nad limitami API i kosztami operacyjnymi w czasie rzeczywistym. Choć Google oficjalnie nie potwierdziło daty debiutu Gemini 3 Flash, obecność tak zaawansowanych funkcji w fazie testowej sugeruje, że premiera nowej generacji modeli jest bliżej, niż zakładały dotychczasowe prognozy.