Introduzione al Recommender System

“Stiamo lasciando l’era dell’informazione ed entrando nell’era della raccomandazione.”

Come molte tecniche di apprendimento automatico, un recommender system fa previsioni basate sui comportamenti storici degli utenti. In particolare, si tratta di prevedere la preferenza dell’utente per un insieme di articoli in base all’esperienza passata. Per costruire un sistema di raccomandazione, i due approcci più popolari sono Content-based e Collaborative Filtering.

L’approccio basato sul contenuto richiede una buona quantità di informazioni sulle caratteristiche degli articoli, piuttosto che usare le interazioni e i feedback degli utenti. Per esempio, possono essere gli attributi dei film come il genere, l’anno, il regista, l’attore ecc. o il contenuto testuale degli articoli che possono essere estratti applicando il Natural Language Processing. Il Collaborative Filtering, d’altra parte, non ha bisogno di nient’altro se non delle preferenze storiche degli utenti su un insieme di articoli. Poiché si basa su dati storici, il presupposto fondamentale qui è che gli utenti che hanno concordato in passato tendono a concordare anche in futuro. In termini di preferenza dell’utente, di solito è espressa da due categorie. Valutazione esplicita, è un tasso dato da un utente ad un elemento su una scala scorrevole, come 5 stelle per Titanic. Questo è il feedback più diretto da parte degli utenti per mostrare quanto gli piace un elemento. La valutazione implicita, suggerisce la preferenza degli utenti indirettamente, come le visualizzazioni della pagina, i clic, i record di acquisto, se ascoltare o meno un brano musicale, e così via. In questo articolo, darò uno sguardo da vicino al filtraggio collaborativo che è uno strumento tradizionale e potente per i sistemi di raccomandazione.

Il metodo standard di filtraggio collaborativo è noto come algoritmo Neighborhood. Ci sono CF basati sugli utenti e CF basati sugli elementi. Guardiamo prima il CF basato sull’utente. Abbiamo una matrice n × m di valutazioni, con utente uᵢ, i = 1, …n e articolo pⱼ, j=1, …m. Ora vogliamo predire il rating rᵢⱼ se l’utente target i non ha guardato/valutato un elemento j. Il processo è quello di calcolare le somiglianze tra l’utente target i e tutti gli altri utenti, selezionare i primi X utenti simili, e prendere la media ponderata dei rating da questi X utenti con le somiglianze come pesi.

Fonte: https://dzone.com/articles/recommendation-engine-models

Mentre persone diverse possono avere basi diverse quando danno valutazioni, alcune persone tendono a dare punteggi alti in generale, altre sono piuttosto severe anche se sono soddisfatte degli articoli. Per evitare questa distorsione, possiamo sottrarre la valutazione media di ogni utente di tutti gli articoli quando si calcola la media ponderata, e aggiungerla di nuovo per l’utente target, come mostrato di seguito.

Fonte: https://medium.com/tiket-com-dev-team/build-recommendation-engine-using-graph-cbd6d8732e46

Arquidia Mantina

Arquidia Mantina

Introduzione al Recommender System

Fattorizzazione della matrice

Ottimizzazione

Alcuni pensieri

Lascia un commento Annulla risposta