ObrazR & D

Mistral AI prezentuje OCR 3: precyzja w digitalizacji dokumentów

Mistral AI, firma znana z innowacyjnych osiągnięć w dziedzinie sztucznej inteligencji, przedstawiła nową wersję swojego modelu optycznego rozpoznawania znaków – Mistral OCR 3. Jak podaje producent, narzędzie to charakteryzuje się znaczącym wzrostem precyzji w ekstrakcji informacji z formularzy, zeskanowanych dokumentów, złożonych tabel oraz treści pisanych odręcznie, osiągając 74% przewagi nad poprzednią iteracją, Mistral OCR 2.

Nowa technologia została zintegrowana z Document AI Playground w ramach Mistral AI Studio, umożliwiając użytkownikom konwersję plików PDF i obrazów na ustrukturyzowany tekst lub format JSON metodą „przeciągnij i upuść”. Dostawcy udostępniają także API dla deweloperów, wspierające wyjście w formacie Markdown z rekonstrukcją tabel opartą na HTML. Usługa jest wyceniona na 2 dolary za 1000 stron, z 50% zniżką przy przetwarzaniu wsadowym.

Mistral OCR 3 jest dostępny globalnie zarówno dla deweloperów, jak i przedsiębiorstw za pośrednictwem interfejsu Mistral AI Studio oraz API. Model ten jest adresowany do organizacji wymagających przetwarzania dużych wolumenów dokumentów z wysoką dokładnością, takich jak faktury, formularze zgodności, raporty naukowe czy archiwizacja treści pisanych odręcznie.

Wśród kluczowych ulepszeń technicznych wymienia się udoskonalone radzenie sobie z niską jakością skanów, gęstymi układami graficznymi oraz złożonymi adnotacjami odręcznymi. Mistral AI podkreśla, że ich rozwiązanie oferuje wyższą dokładność i mniejszy rozmiar modelu w porównaniu do wiodących korporacyjnych i natywnych rozwiązań OCR opartych na AI, co przekłada się na niższe koszty operacyjne.

Wczesne wdrożenia pokazują, że narzędzie jest wykorzystywane do szeroko zakrojonej digitalizacji i ekstrakcji informacji, a analitycy branżowi wskazują na jego potencjał w zwiększaniu wartości danych. Mistral AI kontynuuje rozbudowę swojej oferty, dążąc do bezproblemowej integracji z istniejącymi systemami korporacyjnymi, co ma na celu efektywne rozwiązywanie wyzwań związanych z przetwarzaniem dokumentów biznesowych.