Streszczenie: W wywiadzie dla „Me, Myself, and AI” Vishal Gupta z Reddit omawia ewolucję systemów AI platformy, od prostej filtracji kolaboratywnej po zaawansowane modele głębokiego uczenia i multimodalne LLM.
W ekosystemie mediów społecznościowych, gdzie liczba treści rośnie wykładniczo, kluczem do utrzymania uwagi staje się trafność. Reddit, platforma agregująca ponad 100 000 aktywnych społeczności i miliard postów, stoi przed wyjątkowym wyzwaniem: jak połączyć użytkowników z niszowymi zainteresowaniami, jednocześnie budując zrównoważony model reklamowy. Odpowiedzią jest zaawansowana sztuczna inteligencja.
Podczas podcastu „Me, Myself, and AI„, Vishal Gupta, menedżer ds. inżynierii uczenia maszynowego w Reddit , wyjaśnił, w jaki sposób platforma wykorzystuje AI do napędzania personalizacji i poprawy trafności reklam. To ewolucja od prostych rekomendacji do złożonych systemów opartych na głębokim uczeniu i modelach multimodalnych.
Łączenie użytkowników ze społecznościami
Podstawowym zastosowaniem AI na Reddit jest pomoc użytkownikom w odnalezieniu właściwych treści i społeczności, z którymi mogą się identyfikować. Przy setkach tysięcy społeczności, ręczne przeszukiwanie jest nieefektywne. AI nie tylko pomaga nowym użytkownikom znaleźć popularne tematy zgodne z ich wstępnymi zainteresowaniami , ale przede wszystkim kieruje ich do niszowych grup, w których mogą „naprawdę poczuć przynależność”.
„AI napędza to wszystko” – podkreśla Gupta, odnosząc się do głównego feedu użytkownika (układ postów, zdjęć, filmów, na profilu w mediach społecznościowych). Celem jest, aby feed był angażujący, trafny i zaspokajał potrzeby informacyjne użytkownika w danym momencie. Działa to w oparciu o wyrafinowane systemy rekomendacyjne. Systemy te muszą rozumieć zarówno długoterminowe zainteresowania (np. „Władca Pierścieni” lub krykiet ) oraz krótkoterminowe, natychmiastowe potrzeby (np. zapytanie o zakup blendera ).
Ewolucja rekomendacji: Trzy fale rozwoju AI
Gupta, który pracuje nad systemami rekomendacji od 2015 roku, opisuje ich ewolucję w trzech głównych falach:
- Systemy „starej szkoły” (ok. 2015): Oparte na prostej filtracji kolaboratywnej. Systemy te wykorzystywały jawne zaangażowanie użytkowników i faktoryzację macierzy do generowania rekomendacji, podobnie jak w słynnym konkursie Netflixa.
- Druga fala (ok. 2018-2019): Przejście w kierunku głębokiego uczenia. Zamiast tylko dopasowywać zainteresowania, modele zaczęły przewidywać prawdopodobieństwo zaangażowania, używając m.in. modeli „dwóch wież” (two-tower models) i zaawansowanych modeli rankingowych.
- Trzecia fala (obecnie): Wykorzystanie dużych modeli językowych (LLM) i zdolności multimodalnych. Nowoczesne AI potrafi rozumieć treść zarówno wizualnie, jak i tekstowo. Te „potężne reprezentacje” są następnie wprowadzane do modeli rekomendacyjnych, co pozwala na osiągnięcie „hiperpersonalizowanych rekomendacji”.
Między eksploracją a eksploatacją
Jednym z kluczowych wyzwań, o których wspomina Gupta, jest znalezienie równowagi. Sama optymalizacja pod kątem wcześniejszych zachowań użytkownika jest niewystarczająca. Prowadzi to do zamykania użytkowników w „króliczych norach” (rabbit holes), gdzie widzą tylko treści podobne do tych, które już znają. Dlatego nowoczesne systemy AI muszą równoważyć eksploatację (dostarczanie treści, o których wiemy, że użytkownik lubi) z eksploracją (oferowanie nowych treści, które mogą go zainteresować). Jest to kluczowe dla utrzymania świeżości platformy i długoterminowego zaangażowania, a do osiągnięcia tej równowagi wykorzystuje się m.in. uczenie przez wzmacnianie.
Reklamy jako „piękny problem” AI
Ta sama zasada równowagi dotyczy drugiego filaru AI na Reddit: reklam. Gupta nazywa systemy reklamowe „jednym z najpiękniejszych problemów” , ponieważ nie jest to czysty system rekomendacji, ale połączenie rekomendacji z rynkiem aukcyjnym. Wyzwanie polega na znalezieniu balansu między celami reklamodawców (którzy licytują, by dotrzeć do użytkownika) a doświadczeniem użytkownika. Reklama musi być trafna, aby nie frustrować odbiorcy.
Aby osiągnąć tę trafność w sposób chroniący prywatność, Reddit skupia się na dwóch rodzajach sygnałów:
- Trafność ogólna: Bazująca na zainteresowaniach użytkownika wywnioskowanych z jego organicznej aktywności na platformie (first-party engagement).
- Trafność kontekstowa: Przechwytywanie zachowania użytkownika „w ostatnich kilku minutach, kilku godzinach, w ramach sesji”, aby pokazać reklamę adekwatną do jego aktualnych potrzeb.
W dyskusji pojawia się również aspekt filozoficzny: czy treści generowane przez AI zastąpią autentyczne ludzkie rozmowy? Gupta i Reddit mocno wierzą, że jest odwrotnie – autentyczna ludzka konwersacja staje się jeszcze ważniejsza.
Powód jest prosty: modele LLM, które generują treści, są trenowane na danych stworzonych przez ludzi. W miarę jak przybywa treści syntetycznych, „dane generowane przez ludzi staną się coraz cenniejsze”.
Gupta pozostaje optymistą: „Ludzie uwielbiają rozmawiać o swoich zainteresowaniach. Są pełni pasji. (…) treści tworzone przez ludzi nie znikną, a Reddit jest jednym z miejsc, gdzie ludzie będą nadal pisać i angażować się w treści”. Dla biznesu lekcja płynąca z podejścia Reddit jest jasna: AI nie jest już tylko narzędziem do optymalizacji, ale fundamentem skalowalnej personalizacji. Jednocześnie, w świecie zdominowanym przez AI, największą wartość strategiczną zyskuje to, co najbardziej ludzkie: autentyczne dane, pasje i rozmowy.

