AudioR & DVideo

Cicha rewolucja AI wideo ma głos. Niemiecki startup Mirelo pozyskał 41 mln dolarów od czołowych inwestorów

Generatory wideo oparte na sztucznej inteligencji, takie jak Sora, Kling czy Luma, otworzyły puszkę Pandory kreatywności, ale jej zawartość jest w dużej mierze niema. W tej ciszy szansę dostrzegł berliński startup Mirelo, który właśnie zabezpieczył 41 milionów dolarów finansowania od gigantów Doliny Krzemowej – funduszy Index Ventures i Andreessen Horowitz. Cel: rozwiązać problem braku dźwięku w erze wideo tworzonego przez AI.

Mirelo rozwija modele sztucznej inteligencji zdolne do analizy materiału wideo i automatycznego generowania zsynchronizowanej z nim ścieżki dźwiękowej. Firma ma już na koncie produkt Mirelo SFX v1.5, który dodaje do klipów efekty dźwiękowe dopasowane do akcji na ekranie. To właśnie ta technologia przykuła uwagę inwestorów, którzy szykują się na kolejny etap rewolucji generatywnej AI, tym razem w branży gier i produkcji wideo.

Wyścig zbrojeń na nowym froncie

Pozyskany kapitał ma pozwolić dwuletniej firmie na skuteczniejszą rywalizację na zatłoczonym już rynku. Nawet gdy Mirelo działało w trybie ukrytym, więksi gracze, tacy jak Sony czy Tencent, zaprezentowali własne modele konwertujące wideo na efekty dźwiękowe. Do wyścigu dołączyły także chiński Kling (należący do Kuaishou) oraz znany z syntezy mowy ElevenLabs, również wspierany przez a16z. Nawet Google integruje już ścieżki audio w swoim generatorze wideo Gemini, wykorzystując do tego model Veo 3.1 od DeepMind.

CJ Simon-Gabriel, CEO i współzałożyciel Mirelo, nie wydaje się tym zrażony. Porównuje obecną sytuację do przełomu, jakim było pojawienie się filmów dźwiękowych. „Nagle ludzie zdali sobie sprawę, że może warto dodać dźwięk. Oczywiście, że warto! To różnica jak między niemym kinem a filmem dźwiękowym” – komentuje.

Nisza jako strategiczna przewaga

Strategią obronną Mirelo ma być specjalizacja. Firma świadomie skupia się na efektach dźwiękowych, dziedzinie, która według jej założycieli jest mniej zagospodarowana przez badaczy AI niż np. generowanie muzyki. „Łatwiej jest tu zbudować realną przewagę konkurencyjną, a następnie ją skapitalizować” – zauważa Simon-Gabriel. On i drugi współzałożyciel, Florian Wenzel, są nie tylko badaczami AI, ale również muzykami, co dodaje projektowi autentyczności. Generowanie muzyki znajduje się w planach firmy, jednak obecnie największe zapotrzebowanie rynkowe dotyczy efektów SFX.

Zebrane fundusze zostaną przeznaczone na potężne wzmocnienie zespołu – z 10 osób ma on urosnąć dwu-, a nawet trzykrotnie do końca przyszłego roku. Nowi pracownicy zasilą działy badań i rozwoju oraz wesprą komercjalizację produktu. W krótkim terminie głównym źródłem przychodów ma być udostępnianie modeli przez API na platformach takich jak Fal.ai i Replicate. Równolegle firma rozwija Mirelo Studio – kompleksowe narzędzie dla twórców.

Etyka i dane w centrum uwagi

Kwestia danych treningowych, która kładzie się cieniem na wielu projektach generatywnej AI, w przypadku Mirelo ma być rozwiązana systemowo. Firma podkreśla, że jej modele trenowane są na publicznych i zakupionych bibliotekach dźwięków. Co więcej, Mirelo nawiązuje partnerstwa z artystami oparte na podziale przychodów, co ma zapewnić poszanowanie ich praw. To podejście, które może stać się kluczowe w budowaniu zaufania na rynku.

Model biznesowy opiera się na strategii freemium, z planem dla twórców wycenionym na 20 euro miesięcznie. Na razie firma celuje głównie w amatorów i prosumentów. Jak podsumowuje Simon-Gabriel, cytując George’a Lucasa: „Dźwięk to 50% filmowego doświadczenia. To nie jest przesada. Te same obrazy z inną ścieżką dźwiękową mogą wywołać zupełnie inne emocje”. Wygląda na to, że niema era AI wideo właśnie dobiega końca.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *