Data ScienceR & DWiedza

Wyzwania wykorzystania danych firmowych przez generatywną AI – perspektywa IBM

Współczesne przedsiębiorstwa dysponują olbrzymimi wolumenami danych, jednak tylko niewielka ich część jest efektywnie wykorzystywana, zwłaszcza w kontekście dynamicznie rozwijającej się sztucznej inteligencji. Jak podkreśla Henrique Lemes, Lider Platform Danych w IBM na region obu Ameryk, problemem jest nie tylko ilość, ale przede wszystkim złożoność i fragmentaryzacja tych zasobów, szczególnie na styku danych ustrukturyzowanych i nieustrukturyzowanych.

Lemes zwraca uwagę, że obecne podejście do danych korporacyjnych jest często zbyt uproszczone. Powiedzenie, że firmie brakuje „danych”, jest nieprecyzyjne, gdyż różnorodność formatów i jakość informacji są kluczowe. Dane ustrukturyzowane, takie jak te w bazach relacyjnych, są łatwo przetwarzalne i analizowalne. Z kolei dane nieustrukturyzowane – e-maile, posty w mediach społecznościowych, nagrania audio, obrazy czy dokumenty – stanowią ogromne, choć trudne do przetworzenia źródło wartościowych spostrzeżeń.

Problem ukrytej wartości

„Obecnie mniej niż 1% danych korporacyjnych jest wykorzystywanych przez generatywną sztuczną inteligencję, a ponad 90% tych danych to dane nieustrukturyzowane, co bezpośrednio wpływa na zaufanie i jakość” – wskazuje Henrique Lemes. Ta niewielka penetracja wynika przede wszystkim z wyzwań związanych z przetwarzaniem i uwierzytelnianiem danych nieustrukturyzowanych na dużą skalę. Firmy często ignorują lub marginalizują te zasoby ze względu na złożoność ich integracji i weryfikacji zgodności z regulacjami.

Zaufanie do danych jest fundamentem podejmowania trafnych decyzji biznesowych. Dostęp do pełnych, rzetelnych i poprawnie pozyskanych informacji jest kluczowy. Niestety, badania wskazują, że mniej niż połowa danych dostępnych przedsiębiorstwom jest używana do celów AI. Osiągnięcie pełnego potencjału wymaga przekształcenia „strumienia” łatwo przyswajalnych informacji w „potok” kompleksowych danych.

Trzy filary efektywnego zarządzania danymi dla AI

Według Lemesa, proces efektywnego wykorzystania danych w przedsiębiorstwie opiera się na trzech kluczowych filarach:

  1. Automatyzacja pozyskiwania danych na masową skalę: Pełna automatyzacja tego procesu jest niezbędna.
  2. Kuratela i zarządzanie danymi: Niezależnie od struktury danych, muszą zostać zastosowane odpowiednie zasady ładu korporacyjnego i polityki danych.
  3. Udostępnianie danych dla generatywnej AI: Pozwala to osiągnąć znaczny zwrot z inwestycji, przewyższający konwencjonalne podejścia do RAG (Retrieval Augmented Generation) o ponad 40%.

IBM oferuje zintegrowaną strategię, łączącą głębokie zrozumienie potrzeb AI w przedsiębiorstwach z zaawansowanymi rozwiązaniami software’owymi i ekspercką wiedzą dziedzinową. Dzięki temu firmy mogą efektywnie i bezpiecznie transformować zarówno dane ustrukturyzowane, jak i nieustrukturyzowane w zasoby gotowe do zastosowań AI, przy jednoczesnym zachowaniu ram zarządczych i zgodności z przepisami.

Skalowalność i zgodność jako wyzwania

Wraz ze wzrostem i transformacją przedsiębiorstw, wzrasta również złożoność i wolumen danych. Procesy pozyskiwania danych dla AI muszą być elastyczne i skalowalne. Lemes zauważa, że firmy napotykają trudności przy skalowaniu, ponieważ ich początkowe rozwiązania AI były często budowane pod kątem specyficznych zadań. Próba rozszerzenia zakresu działania często prowadzi do komplikacji w potokach danych i zwiększa zapotrzebowanie na efektywne zarządzanie danymi nieustrukturyzowanymi.

Podejście IBM koncentruje się na szczegółowym zrozumieniu ścieżki adopcji AI u każdego klienta, co pozwala na stworzenie jasnej mapy drogowej do osiągnięcia zwrotu z inwestycji. Priorytetem jest dokładność danych, niezależnie od ich struktury, a także pozyskiwanie, proweniencja, zarządzanie, zgodność z regulacjami branżowymi oraz niezbędna spójność. Te możliwości pozwalają klientom skalować rozwiązania AI w wielu przypadkach użycia i w pełni wykorzystać wartość swoich danych.

Wdrożenie odpowiednich procesów technologicznych i narzędzi, zwłaszcza w obszarze AI, wymaga czasu i wizji ewolucji rozwiązań. IBM, dzięki swojej pozycji wśród międzynarodowych banków, instytucji finansowych i globalnych korporacji, oferuje narzędzia i opcje umożliwiające działanie obciążeń AI nawet w najbardziej regulowanych branżach i w dowolnej skali. Transformacja danych w aktywa gotowe na AI to złożone przedsięwzięcie, jednak korzyści płynące z efektywnego wykorzystania potencjału danych są niekwestionowane.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *