Sztuczna inteligencja wizualizuje modę: Krytyczna analiza potencjału AI w projektowaniu
Współczesny przemysł mody, zawsze poszukujący innowacji, coraz śmielej spogląda w stronę sztucznej inteligencji. Obietnice szybszego wprowadzania produktów na rynek i nieograniczonego poszerzania kreatywności zdają się w zasięgu ręki, gdy mowa o generatywnych modelach AI. Jednak czy obecne rozwiązania są w stanie sprostać złożoności świata mody?
Najnowsze badania przeprowadzone przez profesor Yoon Kyung Lee i magistrantkę Chaehi Ryu z Uniwersytetu Narodowego w Pusan w Korei Południowej rzucają światło na praktyczne zastosowanie generatywnej AI w wizualizacji sezonowych trendów. Ich praca, opublikowana w „Clothing and Textiles Research Journal”, skupia się na inżynierii promptów jako kluczowym elemencie w generowaniu realistycznych obrazów kolekcji modowych.
Potencjał LLM i generatorów obrazów
Duże modele językowe (LLM), takie jak ChatGPT, oraz generatory obrazów AI, jak DALL-E, zaczęły już rewolucjonizować szereg branż. W modzie, LLM-y mogą teoretycznie pomagać projektantom, a nawet osobom bez głębszej wiedzy, interpretować historyczne style i przewidywać przyszłe tendencje. Te analizy mają następnie służyć jako podstawa do tworzenia promptów dla generatorów obrazów, co ma w efekcie przekładać się na konkretne kolekcje.
Profesor Lee podkreśla, że efektywne wykorzystanie AI w modzie wymaga dogłębnego zrozumienia jej charakterystyki i precyzyjnego określenia zakresu jej zastosowań. To klucz do świadomego wdrożenia tych technologii, a nie ślepego podążania za nowinkami.
Metodologia i wyniki eksperymentu
W ramach badania, duet z Pusan wykorzystał ChatGPT-3.5 i ChatGPT-4 do analizy męskich trendów modowych, bazując na danych historycznych do września 2021 roku. Na tej podstawie, ChatGPT został użyty do prognozowania męskich trendów na jesień/zimę 2024. Wyodrębnione elementy projektowe sklasyfikowano jako „kody początkowe”.
Dodatkowo, badaczki włączyły elementy z danych trendów mody męskiej Vogue Fall/Winter 2024 („kody zmodyfikowane”) oraz z literatury dotyczącej koncepcji projektowania mody („kody z literatury”). Wszystkie te elementy zostały następnie przeanalizowane i pogrupowane w sześć finalnych kategorii: trendy, elementy sylwetki, materiały, kluczowe elementy (key items), detale odzieży oraz zdobienia.
Z tych kodów powstało 35 promptów dla DALL-E 3, każdy opisujący unikatowy strój. Wykorzystano spójny szablon, przedstawiający męskiego modela na wybiegu podczas pokazu mody jesień/zima 2024, z możliwością dostosowania detali takich jak proporcje obrazu, rodzaj wydarzenia, kąty kamery, wygląd i wzrost modela, projekt wybiegu, tło, publiczność i nastrój. Każdy prompt został uruchomiony trzykrotnie, generując łącznie 105 obrazów.
Ograniczenia i wnioski z perspektywy praktyka
DALL-E 3 okazał się w stanie perfekcyjnie zaimplementować prompty w 67,6% przypadków. Prompty zawierające przymiotniki charakteryzowały się szczególnie wysokim wskaźnikiem implementacji. Co ciekawe, niektóre wygenerowane obrazy były bardzo podobne do rzeczywistych męskich kolekcji na jesień/zimę 2024.
Jednak, jak to często bywa w przypadku technologii AI, pojawiły się istotne błędy i ograniczenia. Większość wygenerowanych obrazów skłaniała się ku modzie ready-to-wear, a DALL-E miał trudności z uwzględnieniem tak subtelnych elementów trendów, jak płynność płciowa. Same słowa kluczowe dotyczące trendów okazały się niewystarczające do generowania precyzyjnych wyników, co sugeruje potrzebę dalszego „uczenia się” modeli.
Profesor Lee trafnie zauważa: „Nasze wyniki pokazują, że precyzyjnie sformułowane prompty są niezbędne do dokładnej implementacji projektów mody przez generatywną AI, co podkreśla ważną rolę ekspertów mody.” To kluczowy wniosek — technologia jest narzędziem, a nie zastępstwem dla ludzkiej intuicji i wiedzy branżowej. Mimo postępów, AI nie jest jeszcze w stanie w pełni uchwycić niuansów, subtelności i artystycznej wizji, które są podstawą innowacji w modzie.
Badanie to wskazuje, że generatywna AI może stać się potężnym narzędziem wspierającym, zarówno dla profesjonalistów, jak i dla szerokiej publiczności. Jednak bez ludzkiej ekspertyzy, która potrafi odpowiednio ukierunkować i ocenić rezultaty, jej potencjał pozostanie niewykorzystany lub, co gorsza, doprowadzi do generowania wizualizacji pozbawionych realnego znaczenia w kontekście modowym. Droga do pełnej integracji AI w kreatywne procesy projektowe jest jeszcze długa i wymaga nieustannej kalibracji ze strony człowieka.
