Video

Kling AI rozszerza możliwości: zapowiedziano model 2.6 z natywnym dźwiękiem

Branża sztucznej inteligencji tworzącej wideo dynamicznie się rozwija, a firma Kling AI zapowiada istotny krok naprzód. Zbliża się premiera modelu Kling 2.6, który będzie oferował natywną obsługę dźwięku bezpośrednio w procesie generowania wideo. Ta innowacja obejmuje wsparcie dla mowy, śpiewu oraz efektów dźwiękowych, co sygnalizuje hasło: „Zobacz dźwięk, usłysz obraz”.

Integracja audio na tak głębokim poziomie, gdzie ścieżka dźwiękowa jest generowana równolegle z warstwą wizualną, ma kluczowe znaczenie. Pozwoli to twórcom na odejście od konieczności używania oddzielnych narzędzi czy skomplikowanej postprodukcji dźwięku, co znacząco usprawni proces twórczy.

Ten ruch Kling AI stawia model 2.6 Pro w bezpośredniej konkurencji z wiodącymi rozwiązaniami na rynku, takimi jak Sora 2 czy Veo 3.1. Dzięki pełnemu wielomodalnemu przepływowi pracy – obejmującemu wideo, audio i tworzenie wideo z obrazu – oraz globalnej obsłudze dźwięku, platforma ma szansę wyróżnić się wysoką jakością produkcji.

Dotychczasowa ewolucja rodziny Kling, od wersji 1.6 do 2.5 (w wariantach Turbo, Pro i Master), koncentrowała się na doskonaleniu wierności wizualnej i kontroli nad materiałem. Wprowadzenie wsparcia dla wbudowanego audio w językach angielskim i chińskim w Kling 2.6 Pro jest odpowiedzią na lukę, która istniała w porównaniu do konkurentów, którzy już oferowali zintegrowane możliwości mowy i dźwięków otoczenia. Bazuje to również na wcześniejszych pracach nad generowaniem dźwięku w czasie rzeczywistym w ekosystemie Kling.

Termin premiery Kling 2.6 wydaje się być dobrze przemyślany i zbiega się z „Kling Omni Launch Week”, podczas którego firma, należąca do chińskiego giganta krótkich filmów Kuaishou, zapowiedziała pięć dni nowości, począwszy od 1 grudnia. Spodziewana data premiery, 3 grudnia, wpisuje się w ten harmonogram. Biorąc pod uwagę pozycjonowanie Kling O1 jako multimodalnego centrum do tworzenia tekstu, obrazu i wideo, aktualizacja 2.6 do audio idealnie wpasowuje się jako warstwa dźwiękowa tego stosu. Prawdopodobnie początkowo będzie dostępna w narzędziach internetowych Kling i poprzez integracje partnerskie, a szersza dostępność będzie zależała od przebiegu tego tygodnia premier.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *