Dołącz do grona liderów, którzy chcą więcej
Etyka w biznesie

Kto trenuje sztuczną inteligencję?

18 stycznia 2024 5 min czytania
Zdjęcie Paulina Kostro - Redaktor "MIT Sloan Management Review Polska"
Paulina Kostro
Kto trenuje sztuczną inteligencję?

Streszczenie: Trenowanie sztucznej inteligencji polega na dostarczaniu algorytmom danych treningowych wraz z odpowiednimi etykietami, co pozwala im rozpoznawać określone wzorce. Etykietowanie danych może obejmować zadania takie jak rozpoznawanie obiektów na obrazach czy klasyfikacja treści tekstowych.
Obecnie wiele platform crowdsourcingowych angażuje dużą liczbę osób do etykietowania i klasyfikowania danych treningowych. Firmy takie jak Toloka, Appen, Clickworker, Teemwork.AI i OneForma łączą miliony pracowników zdalnych z technologiami z Doliny Krzemowej. Publikują mikrozadania dla swoich klientów, w tym Amazon, Microsoft Azure, Salesforce, Google, Nvidia czy Adobe. W praktyce każda osoba z dostępem do komputera i internetu może uczestniczyć w oznaczaniu obrazów, transkrypcji tekstów czy innych zadaniach związanych z danymi. Oznacza to, że trenowanie sztucznej inteligencji nie wymaga zaawansowanych umiejętności programistycznych czy głębokiej wiedzy z zakresu matematyki i statystyki.
Wzrost wartości rynku gromadzenia i etykietowania danych podkreśla znaczenie dostępu do różnorodnych, etykietowanych danych dla rozwoju nowoczesnych technologii, takich jak sztuczna inteligencja. Jednak globalne zjawisko crowdsourcingu etykietowania danych wiąże się z problemem określanym jako „data colonialism”. Odnosi się to do sytuacji, w której firmy z krajów rozwiniętych korzystają z platform crowdsourcingowych do zbierania i etykietowania danych, wykorzystując pracę osób z krajów o niższych dochodach, takich jak Wenezuela, Afryka Wschodnia, Indie czy Filipiny.
Clickworkerzy, osoby zajmujące się etykietowaniem danych, często decydują się na taką pracę ze względu na trudną sytuację finansową. W wielu krajach stawka jednego lub dwóch dolarów za godzinę pracy jest znacznie wyższa niż minimalna krajowa, co stanowi zachętę. Niestety, ta liczna grupa młodych ludzi nie zawsze zdaje sobie sprawę, że na zarobienie kilku dolarów muszą poświęcić znacznie więcej czasu. Często do wykonania określonego zadania clickworkerzy muszą poświęcić kilka godzin na przygotowanie się, co nie zawsze jest odpowiednio wynagradzane.

Pokaż więcej

Proces trenowania AI, oparty na etykietowaniu danych, odkrywa nie tylko fascynujący świat technologii, ale także stawia przed nami echa etycznych wyzwań i problemów społecznych.

Trenowanie sztucznej inteligencji (AI) to proces, w którym człowiek „uczy” algorytm rozpoznawania pewnych wzorców. Taki trening może przyjmować różne formy, w zależności od rodzaju zadania i metodyki, ale w ogólnym sensie możemy mówić o procesie dostarczania algorytmowi danych treningowych wraz z odpowiednimi etykietami.

Etykietowanie danych (data labeling) może polegać np. na rozpoznawaniu i oznaczaniu na zaprezentowanych grafikach, gdzie znajdują się psy, a gdzie koty. Natomiast w przypadku recenzji produktu etykietowanie mogłoby polegać na określeniu, czy recenzja jest pozytywna, negatywna, czy neutralna.

Współcześnie istnieje wiele platform croudsourcingowych, które pozwalają na zaangażowanie dużej grupy ludzi właśnie do etykietowania i klasyfikowania danych treningowych. Firmy takie jak Toloka, Appen, Clickworker, Teemwork.AI i OneForma, łączą miliony pracowników zdalnych z platformami technologicznymi zlokalizowanymi w Dolinie Krzemowej. Publikują mikrozadania od swoich klientów (do których należą m.in. Amazon, Microsoft Azure, Salesforce, Google, Nvidia czy Adobe). W praktyce każda osoba z dostępem do komputera i sieci może oznaczać obrazy, transkrybować teksty czy wypełniać inne zadania związane z danymi. Oznacza to, że trenowanie sztucznej inteligencji nie wymaga, jak mogłoby się wydawać, zaawansowanych umiejętności programistycznych czy głębokiego zrozumienia matematyki i statystyki.

Clickworkerzy w erze kolonizacji danych

W ostatnim czasie wartość rynku gromadzenia i etykietowania danych dynamicznie wzrasta. Wyceniany w 2022 r. roku na 2,2 miliarda dolarów sektor ma osiągnąć aż 17,1 miliarda dolarów do 2030 roku. Podkreśla to znaczenie danych dla rozwoju nowoczesnych technologii, takich jak sztuczna inteligencja. Natomiast dostęp do różnorodnych, etykietowanych danych jest cennym zasobem dla współczesnych firm. Niestety globalne zjawisko croudsourcingu etykietowania danych wiąże się z kolejnym określanym jako data colonialism.

Kolonizacja danych odnosi się do sytuacji, w której firmy z krajów rozwiniętych korzystają z platform crowdsourcingowych do zbierania i etykietowania danych, przy wykorzystaniu pracy ludzi – głównie z krajów o niższych dochodach, takich jak Wenezuela, Afryka Wschodnia, Indie czy Filipiny.

Clickworkerzy, bo tak nazywają się osoby zajmujące się etykietowaniem danych, bardzo często decydują się na taką pracę ze względu na bardzo trudną sytuację finansową. Wciąż w bardzo wielu krajach stawka jednego lub dwóch dolarów za godzinę pracy jest o wiele większa, niż minimalna krajowa, dlatego tak kusi. Niestety ta liczna grupa przeważnie bardzo młodych ludzi nie zdaje sobie sprawy z tego, że na zarobienie kilku dolarów będą w rezultacie musieli poświęcić o wiele więcej czasu.

Często do wykonania określonego zadania clickworkerzy muszą poświęcić kilka godzin na przygotowanie się. Czasami wiąże się to po prostu z przeczytaniem paru artykułów w danej tematyce, jednak innym razem chodzi o pozyskanie konkretnych umiejętności. Niestety mają one krótki okres ważności, ponieważ branża szybko zmienia swoje priorytety. Pracownicy internetowi podkreślają też problemy związane z strukturą płatności, zwracając uwagę na niepewność dostępności zadań (nie pojawiają się one systematycznie) i brak rekompensaty za czas oczekiwania na nie – w gotowości przed komputerem.

Więźniowie doskonalą model językowy AI

W kontekście pracy związanej z etykietowaniem danych warto wspomnieć również o inicjatywie fińskiego start‑upu Metroc, który zatrudnia więźniów do pracy danymi, dążąc do doskonalenia swojego modelu językowego – tak aby „rozumiał” specyficzny żargon branży budowlanej. Jak zaznaczają pomysłodawcy projektu inicjatywa ma na celu nie tylko ulepszenie modelu językowego. Stawia sobie również za cel oferowanie więźniom różnorodnych możliwości zatrudnienia i (ich zdaniem) cennych umiejętności cyfrowych, wspierając tym samym ich reintegrację społeczną.

I choć z jednej strony można spojrzeć na ten projekt jako dostarczenie szansy na pracę w duchu rozwoju nowoczesnych technologii, krytycy wyrażają obawy co do wykorzystywania przez branżę pracowników z grupy podatnej na tanią pracę. Pojawiają się pytania dotyczące przenoszenia umiejętności zdobytych poprzez etykietowanie danych na zatrudnienie po opuszczeniu więzienia. Ponadto potencjalny sukces tego projektu stawia precedens, który może prowadzić do bardziej kontrowersyjnych form pracy więziennej związanej z AI.

Między technologią a etyką

Mimo że wszystkie platformy croudsourcingowe wymagają, aby każdy jej użytkownik miał ukończone 18 lat, to łagodne procesy weryfikacji wieku umożliwiają podjęcie współpracy z nimi także młodszym internautom. Większość wymaga bowiem jedynie przesłania zdjęcia dowodu osobistego i numeru konta bankowego. Dzieci wykorzystują zatem dane swoich rodziców lub innych starszych od siebie członków rodziny – po prostu się pod nich podszywając. W rezultacie bardzo często narażają nie tylko swoje dobre samopoczucie, ale i zdrowie psychiczne. Śledztwo WIRED ujawnia powszechność pracy nieletnich przy zadaniach związanych z identyfikacją obrazów lub modernizację treści dla dorosłych, związanych z przemocą i mową nienawiści.

Tego typu odkrycia powinny zaadresować pilną potrzebę zwiększenia świadomości, opracowania wytycznych i przeprowadzenia reform branżowych w celu rozwiązania systemowych problemów wykorzystywania ludzi przy pracy związanej z AI – szczególnie względem osób niepełnoletnich. Dotyczy to przede wszystkim tych firm, które oferują platformy crowdsourcingowe przeznaczone do etykietowania danych oraz tych, które korzystają z ich usług. Branżowi interesariusze winni już teraz podjąć odpowiednie kroki, w celu zapewnienia, że przyszłym rozwojem technologicznym będą kierować etyczne praktyki.

O autorach
Tematy

Może Cię zainteresować

Multimedia
Dlaczego sen lidera to strategiczna inwestycja w efektywność

Zarywanie nocy w imię lepszych wyników to biologiczna pułapka. Dowiedz się, dlaczego niewyspany lider podejmuje impulsywne decyzje , jak codzienne używki rujnują architekturę wypoczynku i w jaki sposób świadome zarządzanie rytmem dobowym przekłada się na realne sukcesy Twojego biznesu.

Multimedia
Sykofancja i psychoza AI. Czym grozi uczłowieczanie maszyn?

Czy uczłowieczanie sztucznej inteligencji to prosta droga do dehumanizacji nas samych? W najnowszym odcinku podcastu „Limity AI” Iwo Zmyślony i Izabela Lipińska biorą pod lupę zjawisko antropomorfizacji maszyn. Dowiedz się, czym jest sykofancja modeli językowych, dlaczego algorytmy potrafią nas psychicznie uzależniać oraz jak unikać niebezpiecznych pułapek w relacjach z technologią.

Dlaczego wchodzenie w nieznane ma znaczenie w długim życiu zawodowym

Długie życie zawodowe nie wymaga wyłącznie odporności i produktywności. Wymaga także gotowości do wchodzenia w nieznane, które odnawia sposób myślenia, działania i postrzegania siebie.

cyberodporność Iluzja cyberodporności. Jak AI weryfikuje podejście do ochrony danych

90% zarządów wierzy, że odzyska dane po cyberataku. Tylko 28% naprawdę to potrafi. Dlaczego firmy żyją w iluzji cyberodporności — i jak AI oraz nowe regulacje brutalnie to weryfikują?

Miliardowa wartość, zwinność startupu. Fenomen modelu Argenx

Jak zbudować organizację wartą 40 miliardów dolarów, zatrudniając niespełna 2000 osób?. Karen Massey, CEO Argenx, zdradza, dlaczego tradycyjna hierarchia i biurokracja dławią innowacyjność. Poznaj sekrety zarządzania opartego na radykalnym zaufaniu, interdyscyplinarnych zespołach i odrzuceniu sztywnych budżetów na rzecz elastycznego planowania.

Premium
Zbuduj most międzypokoleniowy w zarządzie

Różnice pokoleniowe w zarządach mogą być źródłem napięć, ale też przewagi konkurencyjnej. Firmy, które skutecznie łączą doświadczenie starszych liderów z perspektywą młodszych pokoleń, podejmują trafniejsze decyzje i szybciej adaptują się do zmian.

Premium
Od wartości do działania. DROGA mBanku

Historia powstania mBanku to nie tylko opowieść o przełomowej innowacji technologicznej, która zmieniła rynek finansowy, lecz przede wszystkim studium świadomego przywództwa. Sławomir Lachowski, twórca mBanku, zdradza, w jaki sposób wartości stały się fundamentem trwałego sukcesu jego organizacji i dlaczego akronim DROGA okazał się kluczem do zaangażowania zespołu. Poznaj kulisy budowy lidera bankowości internetowej i dowiedz się, jak w praktyce wdrożyć zarządzanie przez wartości.

Magazyn
Premium
Czy weryfikujesz wyniki modeli LLM? Przygotuj się na „bombardowanie perswazyjne”

Zjawisko „bombardowania perswazyjnego” pokazuje, że generatywna AI w odpowiedzi na weryfikację potrafi eskalować retorykę zamiast korygować błąd. W pętli human-in-the-loop walidacja przestaje być neutralnym audytem, a staje się rozmową, w której model aktywnie wpływa na osąd użytkownika poprzez ethos, logos i pathos. Dla liderów oznacza to nowy wymiar zarządzania AI: ochronę procesu myślenia przed subtelną perswazją systemu.

Sztuka budowania wzrostu poprzez fuzje i przejęcia

Większość fuzji i przejęć nie dostarcza obiecywanej wartości, najczęściej rozbijając się o rafy różnic kulturowych i operacyjnych. Robert Sokołowski, dyrektor generalny Grupy Netrisk, udowadnia jednak, że przy odpowiedniej dyscyplinie strategicznej akwizycje mogą stać się potężnym motorem trwałego i wysoce rentownego wzrostu.

Magazyn
Premium
Jak wykorzystywać generatywną AI przy ustalaniu cen

Dziś, aby otrzymać rekomendację ceny, nie trzeba budować modelu ani zatrudniać zespołu data science. Wystarczy dobrze napisać prompt. To szansa – i nowe ryzyko – dla menedżerów odpowiedzialnych za pricing.

Materiał dostępny tylko dla subskrybentów

Jeszcze nie masz subskrypcji? Dołącz do grona subskrybentów i korzystaj bez ograniczeń!

Subskrybuj

Otrzymuj najważniejsze artykuły biznesowe — zapisz się do newslettera!