Zdaniem menedżerów odpowiedzialnych za dane na radarze każdego lidera powinno znaleźć się pięć newralgicznych kwestii.
Sztuczna inteligencja (AI) i danologia (data science) to dziedziny, które zdominowały pierwsze strony gazet w 2023 roku. Czynnikiem, który spowodował radykalny wzrost widoczności tej problematyki, jest, rzecz jasna, rozwój generatywnej AI. Jakie więc trendy mogą sprawić w 2024 roku, że obie te dziedziny pozostaną jednymi z głównych tematów doniesień w mediach biznesowych? I jaki będzie faktyczny wpływ tych trendów na działalność przedsiębiorstw?
W trakcie ostatnich kilku miesięcy przeprowadziliśmy trzy ankiety wśród liderów odpowiedzialnych za dane i technologie. W dwóch ankietach wzięli udział dyrektor do spraw danych w MIT i uczestnicy sympozjum poświęconego jakości informacji. Sponsorem jednej ankiety była firma Amazon Web Services (AWS), a drugiej – firma doradcza Thoughtworks (wyniki tej ankiety nie zostały jeszcze opublikowane). Za trzecią ankietę odpowiadała firma Wavestone, dawniej New Vantage Partners, o której dorocznych ankietach niegdyś pisaliśmy. Ogółem w naszych ankietach wzięło udział ponad 500 menedżerów wyższego szczebla, przy czym uczestnictwo mogło się w pewnej mierze dublować.
Ankiety nie przewidują przyszłości, ale z pewnością wskazują na to, co myślą i robią ludzie najmocniej związani ze strategiami i przedsięwzięciami firm w obszarze nauki o danych i AI. Według tych menedżerów na baczną uwagę zasługuje pięć nabierających na znaczeniu kwestii.
1. Generatywna AI przyciąga uwagę swoim blaskiem, ale jej zadaniem jest kreować wartość.1 Generatywna AI przyciąga uwagę swoim blaskiem, ale jej zadaniem jest kreować wartość.1 Generatywna AI przyciąga uwagę swoim blaskiem, ale jej zadaniem jest kreować wartość.
Jak już wspomnieliśmy, generatywna AI przyciąga uwagę ogromnej rzeszy firm i konsumentów. Czy jest ona jednak źródłem realnej wartości ekonomicznej dla firm, które ją wdrażają? Wyniki ankiet dowodzą, że chociaż generatywna AI wywołuje ogromną ekscytację, to nie spełnia jeszcze oczekiwań pod względem kreowania wartości. Duży odsetek respondentów ankiet uważa, że generatywna AI ma potencjał transformacyjny; 80% uczestników ankiety AWS spodziewa się, że przekształci ona ich firmy, a 64% respondentów ankiety Wavestone stwierdziło, że jest ona najbardziej transformacyjną technologią swojej generacji. Poza tym zdecydowana większość respondentów zwiększa swoje inwestycje w nową technologię. Gros firm jest jednak nadal na etapie eksperymentów – albo na poziomie poszczególnych osób, albo na poziomie działów. W zaledwie 6% firm reprezentowanych w ankiecie AWS generatywna AI wytwarza produkty, a tylko 5% firm z ankiety Wavestone wdrożyło na odpowiednią skalę produkcyjne rozwiązania AI.
Wdrożenie produkcyjnych zastosowań generatywnej AI będzie oczywiście wymagało większych inwestycji i zmian organizacyjnych, a nie tylko eksperymentów. Zaistnieje konieczność przeprojektowania procesów biznesowych, a pracownicy będą musieli się przekwalifikować (mogą także, choć przypuszczalnie tylko w pojedynczych przypadkach, zostać zastąpieni przez systemy generatywnej AI). Nowe zdolności AI będą wymagały integracji z istniejącą infrastrukturą.
Być może najważniejsza zmiana będzie dotyczyła danych – selekcji nieuporządkowanych treści, poprawy jakości informacji i integracji różnorodnych źródeł. W ankiecie AWS 93% respondentów zgodziło się ze stwierdzeniem, że strategia w tych obszarach ma krytyczne znaczenie dla przysparzania wartości przez generatywną AI, ale 57% nie poczyniło do tej pory żadnych zmian w swoich danych.
Chociaż generatywna AI wywołuje ogromną ekscytację, to nie spełnia jeszcze oczekiwań pod względem kreowania wartości. Firmy zwiększają inwestycje w nowe technologie, ale gros z nich jest nadal na etapie eksperymentów.
2. Nauka o danych zmienia swój charakter – z rzemieślniczego na przemysłowy.
Firmy odczuwają potrzebę przyspieszenia procesów tworzenia modeli danologicznych. To, co niegdyś było działalnością rzemieślniczą, dziś jest bardziej uprzemysłowione. Firmy inwestują w platformy, procesy i metodologie, centralne repozytoria danych (feature stores), systemy operacji uczenia maszynowego (machine learning operations – MLOps) i inne narzędzia do zwiększenia wskaźników produktywności i wdrażania. Systemy MLOps monitorują status modeli uczenia maszynowego i wykrywają, czy modele te potrafią cały czas trafnie przewidywać. Jeśli nie, może zachodzić konieczność ich ponownego wytrenowania – przy użyciu nowych danych.
Większość tych zdolności pochodzi od zewnętrznych dostawców, ale niektóre organizacje zaczynają tworzyć własne platformy. Wprawdzie automatyzacja (w tym narzędzia do zautomatyzowanego uczenia maszynowego, o których piszemy poniżej) pomaga zwiększyć produktywność i umożliwia szersze wykorzystanie nauki o danych, ale największym bodźcem dla produktywności danologii jest prawdopodobne ponowne użycie istniejących zbiorów, cech, zmiennych, a nawet całych modeli danych.
3. Na rynku będą dominować dwie wersje produktów wykorzystujących dane.
W ankiecie firmy Thoughtworks 80% liderów w dziedzinie danych i technologii oświadczyło, że ich firmy stosują produkty wykorzystujące dane (data products) i metody zarządzania lub rozważają ich wdrożenie. Przez termin „produkt danowy” rozumiemy pakiet danych, analityki i AI w formie oferty produktu software’owego, przeznaczonego dla wewnętrznych i zewnętrznych klientów. Takimi produktami zarządzają od fazy koncepcyjnej po fazę wdrożeniową (i późniejsze ulepszanie) menedżerowie ds. data products. Przykładami produktów wykorzystujących dane mogą być systemy rekomendacji, które podpowiadają klientom, jaki powinien być ich kolejny zakup, i systemy optymalizacji cen przeznaczone dla zespołów sprzedażowych. Organizacje postrzegają jednak produkty tego typu na dwa różne sposoby. Nieco mniej niż połowa respondentów (48%) stwierdziła, że w ich koncepcji data product mieści się analityka i AI. Niecałe 30% traktuje analitykę i AI oddzielnie od produktów danowych i prawdopodobnie rezerwuje ten termin wyłącznie dla aktywów danowych wielokrotnego użytku (reusable data assets). Dokładnie 16% respondentów oświadczyło, że w kontekście produktów danowych w ogóle nie myśli o analityce i AI.
Bardziej użyteczne wydaje się ta definicja produktu wykorzystującego dane, która obejmuje analitykę i sztuczną inteligencję, ponieważ to dzięki nim dane stają się użyteczne. Naprawdę istotne jest jednak to, aby firma była konsekwentna w tym, jak definiuje i omawia dane. Jeśli organizacja preferuje definicję kombinowaną, złożoną z „produktów danowych” i „analityki i produktów AI”, takie podejście również może się sprawdzać, ponieważ ta definicja zachowuje wiele pozytywnych aspektów zarządzania danymi. Bez jasnej definicji firmy mogłyby jednak nie wiedzieć, co dokładnie mają im dostarczać twórcy produktów (product developers).
4. Specjaliści zajmujący się danymi stracą na znaczeniu.
Eksperci ds. danych – których nazywano „jednorożcami” i wykonawcami „najatrakcyjniejszego zawodu w XXI wieku”, ponieważ potrafili zadbać o każdy aspekt projektów polegających na przetwarzaniu dużych ilości danych – widzą, jak ich gwiazda gaśnie. Szereg zmian w danologii owocuje alternatywnymi podejściami do zarządzania ważnymi częściami składowymi pracy danologa. Jedną z takich zmian jest rozprzestrzenianie się pokrewnych ról, odpowiedzialnych za poszczególne aspekty problemów danologicznych. Stale powiększający się zbiór takich fachowców obejmuje: inżynierów danych, którzy porządkują dane; inżynierów uczenia maszynowego odpowiedzialnych za skalowanie i integrowanie modeli; tłumaczy danych (data translators) i łączników, współpracujących z interesariuszami firmy, a także menedżerów ds. data products, którzy nadzorują całe projekty.
Eksperci ds. danych – których nazywano „jednorożcami” i wykonawcami „najatrakcyjniejszego zawodu w XXI wieku”, ponieważ potrafili zadbać o każdy aspekt projektów polegających na przetwarzaniu dużych ilości danych – widzą, jak ich gwiazda gaśnie.
Innym czynnikiem redukującym zapotrzebowanie na zawodowych ekspertów ds. danych jest rozwój danologii obywatelskiej (citizen data science), w ramach której obeznani z liczbami ludzie biznesu sami tworzą modele lub algorytmy. Ludzie ci wykonują dużą część najcięższych zadań przy użyciu AutoML, czyli narzędzi do zautomatyzowanego uczenia maszynowego. Jeszcze bardziej przydatna jest dla obywateli funkcja modelowania, Advanced Data Analysis, którą zawiera ChatGPT. Po wydaniu bardzo małej liczby poleceń i wgraniu zbioru danych funkcja ta radzi sobie z praktycznie każdym etapem procesu tworzenia modelu i objaśnia swoje działania.
Nadal, rzecz jasna, istnieje wiele aspektów danologii, którymi muszą zajmować się danolodzy. Takie zadania jak stworzenie zupełnie nowego algorytmu lub zinterpretowanie, jak funkcjonują złożone modele, nie zniknęły. Danolodzy będą nadal niezbędni, choć prawdopodobnie w mniejszym wymiarze niż dotąd. Mniejszy będzie także zakres ich władzy i splendor towarzyszący ich funkcji.
5. Liderzy w dziedzinie danych, analityki i AI tracą częściowo swoją niezależność.
W mijającym roku zaczęliśmy dostrzegać wzrost liczby firm, które ograniczają wysyp „szefów” do spraw danych i technologii, w tym dyrektorów do spraw danych i analityki (a niekiedy dyrektorów do spraw AI). Wprawdzie te stanowiska (CDO i CDAO) stają się coraz bardziej powszechne, ale od dawna cechują je krótkie kadencje i zamieszanie dotyczące zakresów obowiązków. Funkcje sprawowane przez liderów odpowiedzialnych za dane i analitykę nie odchodzą w przeszłość, ale stają się w coraz częściej częścią szerszego zbioru funkcji związanych z technologią, danymi i cyfrową transformacją, którym zarządza „technologiczny superlider”, podlegający zazwyczaj prezesowi firmy. Do nazw stanowisk odpowiadających tej funkcji należą: dyrektor do spraw informacji (chief information officer), dyrektor do spraw informacji i technologii (chief information and technology officer) i dyrektor do spraw cyfryzacji i technologii (chief digital and technology officer). W realnym świecie funkcje te pełnią między innymi Sastry Durvasula w firmie TIAA, Sean McCormack w First Group i Mojgan Lefebvre w Travelers.
Ta ewolucja w zakresie funkcji współtworzących zarządy firm była głównym tematem ankiety Thoughtworks. Ogromna większość (87%) jej respondentów (głównie liderów w dziedzinie danych, ale byli wśród nich również liderzy technologiczni) przyznała, że pracownicy ich firm są całkowicie, w dużym stopniu lub nieco zdezorientowani, jeśli chodzi o to, do kogo zwrócić się w kwestii usług i problemów związanych z danymi i technologią. Wielu członków zarządów stwierdziło, że współpraca z innymi zorientowanymi technologicznie liderami z ich firm wygląda stosunkowo słabo, a 79% przyznało, że brak współpracy hamował w przeszłości działalność ich organizacji.
Sądzimy, że w 2024 roku będziemy mieli do czynienia z większą liczbą panujących nad wszystkim liderów technologicznych, którzy mają wszelkie możliwości, aby kreować wartość z efektów pracy podlegających im fachowców w dziedzinie danych i technologii. Liderzy technologiczni będą musieli nadal kłaść nacisk na analitykę i AI, ponieważ to dzięki tym dziedzinom firmy wychwytują sens danych i kreują na ich podstawie wartość dla pracowników i klientów. Najważniejsze jest to, że ci liderzy będą musieli: być w dużym stopniu zorientowani na działalność biznesową, umiejętnie spierać się o strategię z innymi menedżerami wysokiego szczebla i wykazywać się intuicją i zdolnością tworzenia systemów, za sprawą których ta strategia stanie się rzeczywistością.