Dane z wyszukiwarki Google mówią prawdę, którą ukrywamy w ankietach. Jak wielka prawda o big data rewolucjonizuje myślenie o zachowaniu konsumentów?
Na czym polega fenomen Facebooka?
„Być może na niemiłej ludzkiej tajemnicy, którą Zuckerberg odkrył w czasie studiów na Harvardzie. W pierwszym semestrze drugiego roku nauki stworzył portal o nazwie Facemash. Wzorowany na portalu pod nazwą Am I Hot or Not, Facemash przedstawiał zdjęcia dwóch studentów lub studentek Harvardu, po czym prosił kolegów i koleżanki o opinię, który albo która z nich jest przystojniejszy/ładniejsza.
Portal młodego studenta wzbudził oburzenie. „Harvard Crimson” zarzucił Zuckerbergowi we wstępniaku, że odwołuje się do najgorszych stron natury ludzkiej, a Latynosi i Afroamerykanie oskarżyli go seksizm i rasizm. Ale zanim harwardzcy administratorzy odcięli Zuckerbergowi dostęp do internetu – zaledwie kilka godzin po otwarciu portalu – Facemasha odwiedziło czterysta pięćdziesiąt osób i oddało dwadzieścia dwa tysiące głosów na różne zdjęcia. W ten sposób Zuckerberg odkrył ważną tajemnicę: ludzie mogą twierdzić, że są wściekli, mogą coś potępiać i mówić, że to niesmaczne, ale będą klikać.
Dowiedział się też jeszcze jednej rzeczy: że chociaż internauci, w tym nawet studenci Harvardu, utrzymują, że są poważni, odpowiedzialni i szanują cudzą prywatność, to bardzo chętnie oceniają innych. Jego wniosek wynikał z liczby odsłon i oddanych głosów. Później, ponieważ Facemash okazał się nazbyt kontrowersyjny, Zuckerberg, zorientowawszy się już, jak bardzo ciekawią nas trywialne wiadomości na temat osób, które rzekomo znamy, uczynił to odkrycie podwaliną jednego z największych przedsiębiorstw współczesności”.
Historię tę przytacza w swojej książce Wszyscy kłamią Seth Stephens‑Davidowitz.
Cały świat jest laboratorium
Podtytuł książki – Big data, nowe dane i wszystko, co internet może nam powiedzieć o tym, kim naprawdę jesteśmy – mówi wszystko. Dane, te ukryte, którymi dzielimy się w poczuciu anonimowości w sieci, mówią o nas dużo więcej niż deklaracje, ankiety i sondaże. Stephens‑Davidowitz, analityk danych, były pracownik Google’a i felietonista „New York Timesa”, a także doktor ekonomii na Harvardzie, pisze wprost: big data, wielki zbiór danych zbudowany na podstawie wyszukiwań internetowych i innych działań online, pozwala nam zajrzeć w głąb ludzkiej duszy głębiej niż kiedykolwiek.
W opinii autora książki internetowa aktywność wciąż nie jest mierzona w odpowiedni sposób, a wiele firm traktuje analizę danych bez należytej staranności. Tymczasem – dowodzi Stephens‑Davidowitz – z racji, że każda aktywność w sieci pozostawia swój ślad, to cały (internetowy) świat jest laboratorium.
Śmierć ankietom
Dlaczego analiza wyszukiwania w Google’u jest pewniejsza niż badanie ankietowe? Roger Tourangeau, profesor psychologii z University of Michigan, twierdzi, że ważną część problemu stanowi nasza słabość do „niewinnych kłamstw”.
W sondażach, czy nawet badaniach preferencji konsumenckich, najczęściej ukrywa się swoje wstydliwe zachowania i myśli. Takie zachowanie zdarza się wszystkim, ale jest szczególnie widoczne u osób, które pozbawione są wewnętrznej autonomii. Taką postawę określa się mianem „pragnienia atrakcyjności społecznej” [social desirability bias].
Można by przypuszczać, że kłamiemy w przypadku ulicznych sondaży, ponieważ to drugi człowiek nakręca w nas owe pragnienie atrakcyjności społecznej. W rzeczywistości – jak twierdzi prof. Tourangeau – kłamiemy także w anonimowych ankietach. Także jeśli mowa o internetowych sondażach, chcemy podnosić swoją atrakcyjność i przedstawiamy się lepiej.
„Na co dzień mniej więcej jedna trzecia tego, co mówimy, to kłamstwa. I przenosimy te swoje przyzwyczajenia na sondaże” – komentuje badacz.
Na pytanie kelnera, czy podane danie smakowało, niemal zawsze odpowiadamy, że tak. Według badań prof. Tourangeau, ponad 90% z nas nie mówi prawdy w przypadku niesmacznego posiłku, ponieważ nie chce urazić usługującego kelnera.
Co mówi milczenie?
Dlaczego więc mówimy prawdę w przypadku poszukiwania w Google’u? Według badań Setha Stephensa‑Davidowitza, poprzez wyszukiwarkę poszukujemy podpowiedzi, rozwiązań problemów, sugestii, jednym słowem: ujawniamy swoje realne potrzeby, a nie kreacje. Siła Google’a nie polega na tym, że można się dowiedzieć, że dana fraza cieszy się popularnością. To mogłaby pokazać ankieta właśnie. Kluczowe jest, że Google mówi to, o czym milczą ankietowani.
Jednym z obszarów, które badał autor Wszyscy kłamiemy, są relacje dotyczące aktywności seksualnej. Stephens‑Davidowitz zestawił deklaracje na temat zwyczajów żywieniowych Amerykanów z danymi ze sprzedaży z sieci sklepów Walmart i narracją, jaką prezentowały wyszukiwania w Google’u. Okazało się, że według ankiety spożycie słodyczy były dużo mniejsze, niż wskazywały na to badania sieci sklepów i wyniki wyszukiwania.
Błąd marketingowców
Jakie może mieć to znaczenie dla biznesu? Okazuje się, że tworzenie planów sprzedaży czy kampanii marketingowych na podstawie badań opinii, czy ankiet może być dużym błędem. Dotyczy to szczególnie zachowań wstydliwych, wrażliwych, intymnych. Zdaniem profesora Rogera Tourangeau „im bardziej wstydliwy temat, produkt czy usługa, tym większa pewność, że badanie ankietowe nie powie nam prawdy”. W opinii badacza firmy produkujące akcesoria seksualne, przekąski, alkohole i używki, ale także zdrową żywność czy drogie kosmetyki, powinni postawić na bardziej zaawansowaną analizę danych w miejsce tradycyjnych badań konsumenckich.
W swojej książce Stephens‑Davidowitz przyznaje, że firmy, które skwapliwie analizują realne dane z wyszukiwarek, mają bardziej zrównoważony budżet (średnio o 15%) i bardziej optymalny przekaz (lepiej stargetowana grupa docelowa) niż firmy działające intuicyjnie czy kierujące się tylko wizją dyrektora kreatywnego.
Analiza danych to żaden kamień filozoficzny
Nie można jednak traktować danych bezkrytycznie. Przede wszystkim nie w każdej branży, nie w każdej dziedzinie, nie w każdym biznesie analiza danych przynosi takie same korzyści. Zazwyczaj nowe dane najczęściej przynoszą większe korzyści tam, gdzie nauka osiąga na razie słabe wyniki albo gdzie – jak wspomniałem wyżej – mamy do czynienia z produktami wrażliwymi.
Drugim poważnym problemem jest klątwa wymiarowości. Big data daje nam wiele danych, wykładniczo dużo więcej niż tradycyjne źródła, ale wciąż są to dane fragmentaryczne i nieostateczne. Tak, dane to nigdy prawda objawiona.
Trzecia kwestia to kwestia ilości danych. Żyjemy w epoce zarówno ilościowej, jak i jakościowej eksplozji danych ze wszystkich możliwych dziedzin. Zbyt wielu współczesnych analityków gromadzi olbrzymie zbiory informacji po to, żeby powiedzieć nam coś bardzo mało ważnego. Problemem coraz bardziej nie jest gromadzenie danych, ale ich analiza. Oprócz analityków danych firmy potrzebują więc także skutecznych interpretatorów: psychologów, kulturoznawców, socjologów czy etnografów. Dochodzimy tutaj do kluczowej kwestii big data. Wielkie dane pozostają chaosem, jeśli poza technologicznym kluczem nie zaangażuje się osób, które z liczb wyciągną postawy, myśli, zachowania.
Igła w stogu (cyfrowego) siana
Najważniejsze jest to, że aby wycisnąć z big data coś ciekawego, należy zadawać odpowiednie pytania. Przeszukiwanie danych może przypominać niekiedy poszukiwanie igły w stogu siana. Przerzucanie widłami suchej trawy jest mniej skuteczne niż użycie super czułego magnesu. Pomocą mogą być tutaj sposoby działania znane z analogowego świata: humanistyczna metodologia (wywiad socjologiczny, psychologiczny) i tradycyjne modele badawcze.
Prawda jest, że aby ogromny zbiór danych działał optymalnie, trzeba podlać go specjalnym sosem: ludzką oceną i niewielkim sondażem, czymś, co moglibyśmy nazwać „small data”.
Nic, co ludzkie, nie może być obce
Z big data jest jak ze starą góralską maksymą: jest prawda, tyż prawda i gó**o prawda. Oczywiście dane z wyszukiwań mogą powiedzieć nam więcej o kliencie niż ankiety czy badania konsumenckie. Mogą też potwierdzić to, co już wiemy. Albo po prostu nic nie powiedzieć. Dlaczego?
Wyjaśnili to m.in. dwaj laureaci ekonomicznej Nagrody Nobla – prof. Daniel Kahneman i prof. Richard Thaler – zajmujący się szeroko pojętą ekonomią behawioralną. Okazuje się, że uczestnik gospodarki wcale nie jest zawsze racjonalny i samolubny, a jego upodobania nie są stałe. Homo economicus to mit, zachowania konsumenckie często nie przystają do teorii i twardych danych.
Danych do big data dostarcza w końcu człowiek, a jego myślenie opiera się na heurystykach i zniekształceniach. Te zaś powielamy w aktywności w sieci. Big data mogą być serum prawdy, ale może niekiedy być to właśnie tischnerowska prawda.