Uczenie maszynowe i algorytmy. Kod źródłowy programu na rozmytym ekranie komputera, z różnokolorowymi liniami tekstu.

Czy wiedziałeś, że to AI? Netflix, Allegro i Spotify nie rekomendują rzeczy przez przypadek (część 2)

7 minut czytania
Komentarze

Czy zdarzyło Ci się kiedyś, używając Netflixa, że pomyślałeś „jak to możliwe, że tak dobrze mnie zna”? To zasługa systemów rekomendacji… pod którymi kryją się algorytmy sztucznej inteligencji. W kolejnych akapitach omówimy, jak to AI dokładnie działa.

Czy wiedziałeś, że to AI? Algorytmy Netfliksa, Allegro i innych – spis treści

Autor: dr Jan Kwapisz (Dijkstra Enterprise)

Systemy rekomendacyjne to narzędzia wykorzystywane przez wiele platform internetowych, takich jak sklepy internetowe, strony z treściami medialnymi czy usługi streamingowe. Ich celem jest dostarczanie użytkownikom spersonalizowanych rekomendacji, które mają na celu zwiększenie ich zaangażowania i satysfakcji. Istnieje wiele rodzajów systemów rekomendacyjnych, ale w tym artykule skupimy się na dwóch popularnych podejściach: content-based marketingu (marketing oparty na treści) i collaborative filtering (współfiltrowanie).

Dostajesz, co chcesz

Marketing oparty na treści opiera się na analizie treści, którą użytkownik wyraził wcześniej swoje zainteresowanie. Na podstawie tych informacji system rekomendacyjny próbuje przewidzieć preferencje użytkownika i sugeruje mu treści o podobnej tematyce. Na przykład, jeśli użytkownik często słucha muzyki rockowej, system rekomendacyjny może zaproponować mu nowe albumy lub utwory z tego gatunku. W przypadku sklepów internetowych, content-based marketing może sugerować produkty, które odpowiadają wcześniejszym zakupom użytkownika. To dlatego szukając czegoś na Allegro czy w sklepie dowolnego elektromarketu, zawsze zalewają nas propozycje „czegoś, co może nas zainteresować”.

Fot oryginał Pixabay Autor Pexels

Algorytmy takie opierają się na tym, że każdy produkt lub usługa jest opisana poprzez tagi, czyli zestaw cech produktu. Przykładowo zabawka mały traktor byłby opisany jako lista: [zabawka, traktor, pojazd-zabawka, dzieci, chłopczyk*, …]. Dane też mogłyby przedstawione w postaci słownika: {przeznaczenie: zabawka, typ: traktor, adresat: [dzieci, rodzice, chłopczyk], …}. Następnie, wasze preferencje mogą być przedstawione jako prawdopodobieństwo kliknięcia produktu danej kategorii, na przykład:

  • zabawka 10%
  • dzieci: 20%
  • traktor: 15%
  • etc.

Następnie dla innych produktów takie prawdopodobieństwo jest akumulowane i produkt z najwyższym prawdopodobieństwem jest Wam rekomendowany. System rekomendacyjny może też zbierać Wasze dane, które udostępniacie w sieci, lub w Waszych aplikacjach.

*Algorytm sam z siebie nie “zna” czegoś takiego jak płeć, rasa, czy religia, a jedynie ma wiernie przewidzieć przyszłość na podstawie otrzymanych danych. Dla algorytmów kategorie takie jak płeć czy religia nie są w żaden sposób specjalne i będzie traktował kategorię biały / czarny jak nie przymierzając kategorię kebab / pizza. O ile ta druga jest nam obojętna moralnie, o tyle ta pierwsza jest dla nas nie jest obojętna moralnie i może prowadzić do rekomendacji, które uznalibyśmy za rasistowskie. Nie jest to wina algorytmów, lecz danych, którymi są karmione. Dlatego przy treningu algorytmów tak ważne są dane i ich odpowiedni dobór, aby nie dyskryminowały osób.

Zaletą tego podejścia jest fakt, że rekomendacje są oparte na konkretnych preferencjach użytkownika, co może prowadzić do trafniejszych rekomendacji. Jeśli kiedyś system po wyszukiwaniu pralki przez trzy dni wyświetla Wam sprzęt ADG to jest to właśnie “wina” content-based marketingu. Jednakże jedną z wad marketingu  opartego na treści jest to, że może nigdy nie zasugerować użytkownikowi nowych treści, ponieważ nigdy ich nie wyszukiwał. 

Odkrywamy nowe horyzonty

Podejściem, które umie zasugerować nowe, niewyszukiwane treści jest współfiltrowanie. Ten rodzaj systemu rekomendacyjnego analizuje zachowanie wielu użytkowników, aby znaleźć wzorce podobieństw w ich preferencjach. Na podstawie tych wzorców system rekomendacyjny sugeruje nowemu użytkownikowi treści lub produkty, które inni użytkownicy o podobnych upodobaniach wyszukiwali. Na przykład, jeśli użytkownik A i B często słuchają tego samego rodzaju muzyki, to system rekomendacyjny może sugerować użytkownikowi A albumy, których użytkownik B słuchał. 

NEtflix
Obraz Pixabay

Współfiltrowanie ma zaletę, że jest w stanie odkryć nowe treści i produkty, których użytkownik wcześniej nie był świadomy. Jednakże, jedną z wad tego podejścia jest tzw. „problem zimnego startu”, który występuje, gdy system nie ma wystarczająco dużo danych o nowym użytkowniku, aby dokonać trafnych rekomendacji. Dlatego często, kiedy zapisujesz się do nowej aplikacji, jesteś pytany o preferencje. 

Przykładem platformy wykorzystującej systemy rekomendacyjne oparte na obu podejściach, czyli na marketingu bazującym na treści oraz współfiltrowaniu, jest Netflix. Netflix korzysta z algorytmów analizujących preferencje użytkownika oraz preferencje użytkowników podobnych, takie jak gatunek filmów czy serii, które oglądał wcześniej, a następnie sugeruje mu nowe treści, które mogą go zainteresować. 

Netflix przewidując konieczność rozwoju takich systemów ogłosił już w 2006 roku konkurs Netflix Prize. Celem konkursu było stworzenie lepszego algorytmu rekomendacyjnego, który mógłby przewyższyć dotychczasowe rozwiązania używane przez Netflix, pomagające w wyselekcjonowaniu tego, co oglądać na platformie.

Nagroda główna w konkursie wynosiła aż milion dolarów, co przyciągnęło uwagę wielu naukowców, badaczy i programistów z całego świata. Zadaniem uczestników było stworzenie modelu rekomendacyjnego, który na podstawie udostępnionego zbioru danych o ocenach filmów, przewidywałby oceny, które użytkownicy przyznaliby innym filmom.

Nagroda za przewidywania

Netflix Prize wprowadził nowe spojrzenie na problem rekomendacji, skupiając się na wykorzystaniu zaawansowanych technik i algorytmów uczenia maszynowego. Jednakże, konkurs Netflix Prize nie był pozbawiony kontrowersji. Wśród głównych problemów pojawiły się kwestie prywatności danych użytkowników oraz ryzyko narażenia ich na ataki manipulacyjne. Ponadto, po pewnym czasie Netflix zrezygnował z kontynuowania konkursu z powodów prawnych i zamiast tego skoncentrował się na wewnętrznym rozwoju swoich algorytmów rekomendacyjnych.

Fot. Depositphotos autor Kamachi

Mimo to, Netflix Prize przyczynił się do znacznego postępu w dziedzinie systemów rekomendacyjnych i przyczynił się do zwiększenia świadomości na temat znaczenia precyzyjnych i skutecznych algorytmów rekomendacyjnych w branży mediów i rozrywki.

Dzięki temu użytkownicy Netflix mogą odkrywać nowe filmy i seriale zgodne z ich gustem, co przyczynia się do zwiększenia ich zaangażowania i czasu spędzonego na platformie, a zatem i większego prawdopodobieństwa przedłużenia subskrypcji. Content-based marketing w przypadku Netflix działa na podstawie analizy treści, takich jak gatunek, aktorzy czy reżyserowie, a także na podstawie ocen użytkowników.  

W to mi graj

Innym przykładem platformy wykorzystującej systemy rekomendacyjne jest Spotify, popularna usługa streamingowa muzyczna. Spotify (wersja za darmo jak i ta płatna działają tak samo) używa zarówno marketingu opartego na treści, jak i współfiltrowania, aby dostarczać użytkownikom spersonalizowanych rekomendacji muzycznych. Na podstawie analizy preferencji muzycznych, takich jak gatunek, artysta czy album, Spotify sugeruje użytkownikom utwory, które mogą ich zainteresować. Ponadto, Spotify wykorzystuje współfiltrowanie, analizując preferencje innych użytkowników o podobnych gustach, aby polecić nowe utwory czy playlisty.

Ponadto algorytmy tych systemów mogą być stale doskonalone i aktualizowane w oparciu o nowe dane i informacje zwrotne od użytkowników. Proces douczania polega na analizie nowych preferencji i ocen użytkowników, które są wykorzystywane do ulepszania ocen podobieństwa i trafności rekomendacji. Dzięki douczaniu systemy rekomendacyjne stają się coraz bardziej precyzyjne i dostosowane do zmieniających się preferencji i gustów użytkowników, co przyczynia się do zwiększenia satysfakcji i zaangażowania. Przykładowo algorytmy Netflixa są stale doskonalone i uwzględniają również informacje zwrotne od użytkowników, takie jak oceny i historię oglądania, w celu dostarczania coraz bardziej precyzyjnych rekomendacji.

fot. Depositphotos/moubystudio

Platformy takie jak Netflix i Spotify wykorzystują różne kombinacje tych podejść, aby dostarczać użytkownikom jak najbardziej trafne i spersonalizowane rekomendacje. Systemy rekomendacyjne stanowią istotny element w dzisiejszym marketingu i usługach internetowych, pomagając użytkownikom odkrywać nowe treści i produkty, które odpowiadają ich zainteresowaniom. Dlatego kiedy następnym razem kiedy zostawisz łapkę w górę albo ocenę pamiętaj TY też trenujesz algorytmy uczenia maszynowego!

O autorze:

Autor jest doktorem fizyki teoretycznej, w pracy zajmuje się przetwarzaniem języka przy użyciu sieci neuronowych. Jest Head of Product w Dijkstra Enterprise i przygotował kurs Dijkstra: Podstawy Pythona. Jest certyfikowanym Instruktorem NVIDIA Deep Learning Institute oraz nauczycielem akademickim na Uniwersytecie Warszawskim.

fot. Depositphotos/Maximusdn

Motyw