Zhipu AI udostępnia GLM-4.6V – nową generację multimodalnych modeli językowych
Zhipu AI, chiński deweloper systemów sztucznej inteligencji, udostępnił publicznie nową serię multimodalnych dużych modeli językowych – GLM-4.6V. Premiera obejmuje dwie wersje: GLM-4.6V (106B), przeznaczoną do zastosowań w chmurze i wysoko wydajnych środowiskach klastrowych, oraz GLM-4.6V-Flash (9B), zoptymalizowaną pod kątem lokalnego wdrożenia i aplikacji wymagających niskich opóźnień.
Dostępność tych modeli, z wagami udostępnionymi na platformach HuggingFace i ModelScope, otwiera nowe możliwości dla deweloperów i przedsiębiorstw. Co więcej, integracja z istniejącymi aplikacjami została ułatwiona dzięki kompatybilności API z interfejsem OpenAI. Użytkownicy mogą również interaktywnie korzystać z GLM-4.6V za pośrednictwem platformy Z.ai oraz aplikacji Zhipu Qingyan.
Przełomowe możliwości przetwarzania i rozumienia
Modele GLM-4.6V wyróżniają się zdolnością przetwarzania aż 128 000 tokenów w pojedynczym oknie kontekstowym, co pozwala na analizę obszernych dokumentów, obrazów i materiałów wideo. Kluczowe funkcje obejmują natywne wywoływanie funkcji, multimodalne wykorzystanie narzędzi oraz kontekstowe rozumowanie, które integruje dane tekstowe i wizualne. Systemy te obsługują bezpośrednie wprowadzanie obrazów, zrzutów ekranu i dokumentów, a także generują ustrukturyzowane treści bogate w elementy wizualne. W przeciwieństwie do poprzednich iteracji, GLM-4.6V integruje percepcję z działaniem, umożliwiając natywne wywoływanie narzędzi i wykorzystując obszerny zbiór danych treningowych, co przekłada się na szeroką wiedzę o świecie.
Zastosowania i wydajność
Z początkowych doniesień użytkowników wynika, że modele GLM-4.6V wykazują znaczną skuteczność w takich obszarach jak rozumienie dokumentów, generowanie kodu na podstawie projektów oraz streszczanie materiałów wideo. Te możliwości plasują GLM-4.6V wśród wiodących otwartych modeli do multimodalnego rozumowania, stanowiąc realną konkurencję dla rozwiązań od globalnych gigantów technologicznych. Zhipu AI, znane z wkładu w rozwój otwartych modeli językowych w Chinach, kieruje serię GLM-4.6V do środowisk biznesowych, badawczych i deweloperskich, poszukujących zaawansowanych rozwiązań AI, które łączą możliwości z elastycznością wdrażania.
