personalized tv recommender systems - marko krstic

36
Marko Krstić, IT Advisor at RATEL [email protected] Personalized TV Recommender Systems

Upload: institute-of-contemporary-sciences

Post on 13-Jan-2017

19 views

Category:

Data & Analytics


3 download

TRANSCRIPT

Page 1: Personalized TV recommender systems - Marko Krstic

Marko Krstić, IT Advisor at RATEL [email protected]

Personalized TV Recommender Systems

Page 2: Personalized TV recommender systems - Marko Krstic

Sistemi za pružanje preporuka

Sistemi za pružanje preporuka (recommender systems) su softverski agenti koji pomažu korisnicima da izaberu objekte od interesa u okruženjima u kojima broj raspoloživih objekata nadmašuje sposobnost korisnika da ih pojedinačno pregledaju u razumnom vremenu.

Page 3: Personalized TV recommender systems - Marko Krstic

Tipičan primer - Televizija

Page 4: Personalized TV recommender systems - Marko Krstic

HBB TV(Hybrid Broadcast Broadband TV)

Page 5: Personalized TV recommender systems - Marko Krstic

Podela sistema• Filtriranje sadržaja (content filtering, content

based)

• Kolaborativno filtriranje (collaborative filtering)

• Hibridni (hybrid)

Page 6: Personalized TV recommender systems - Marko Krstic

Razlozi za korišćenje filtriranja sadržaja

• Tradicionalna TV difuzija

• Zaštita privatnosti korisnika

• Diferencijacija proizvođača opreme na tržištu

Page 7: Personalized TV recommender systems - Marko Krstic

Sistemi na bazi neuralnih mreža

Page 8: Personalized TV recommender systems - Marko Krstic

O čemu se mora voditi računa pri izboru algoritma učenja?

• Ograničeni resursi korisničkih uređaja (procesorska snaga, memorija, baterija)

• Karakteristike prikupljenih podataka o korisničkim interesovanjima

Page 9: Personalized TV recommender systems - Marko Krstic

Extreme Learning Machine (ELM) metodologija

• Nova metodologija za treniranje neuralnih mreža sa jednim skrivenim slojem kod koje se podešavaju samo izlazne težine neuralne mreže

• Obezbeđuje odlične performanse u realnom vremenu (s, ms, μs) uz minimalna podešavanja od strane projektanta sistema.

Page 10: Personalized TV recommender systems - Marko Krstic

ELM algoritam (1)• Kada se ulazne težine neuralne mreže

slučajno izaberu, neuralne mreža se može smatrati linearnim sistemom opisanim sa:

gde su

- izlazne težine neuralne mreže, - očekivani izlazi neuralne mreže

Hβ Z

),,,,,( 111 PKK bb xxwwH

1 1 1 1

1 1

( ) ( ),

( ) ( )

K K

P K P K

f b f b

f b f b

w x w x

w x w x

βZ

Page 11: Personalized TV recommender systems - Marko Krstic

ELM algoritam (2)

Rešenje sistema dato je sa:

gde je H+ generalizovana inverzna matrica matrice H,

u Moore-Penroseovom smislu

ZHβ ˆ

Page 12: Personalized TV recommender systems - Marko Krstic

Sposobnost univerzalne aproksimacije

• Ukoliko je za aktivacionu funkciju skrivenih čvorova mreže izabrana bilo koja nekonstantna deo po deo kontinualna funkcija, neuralna mreža kod koje su ulazne težine slučajno izabrane po bilo kojoj kontinualnoj raspodeli i čiji broj skrivenih čvorova teži beskonačnosti, sa verovatnoćom jedan može aproksimirati bilo koju kontinualnu funkciju.

Page 13: Personalized TV recommender systems - Marko Krstic

Sposobnost klasifikacije

• Neuralna mreža sa jednim skrivenim slojem kod koje su ulazne težine slučajno izabrane može u posmatranom prostoru razdvojiti proizvoljno raspoređene regione bilo kojeg oblika.

Page 14: Personalized TV recommender systems - Marko Krstic

Sposobnost generalizacije• Kod neuralne mreže trenirane ELM

algoritmom pored male trening greške postiže se i najmanja norma težina neuralne mreže pa se na osnovu Bartlett-ove teorije očekuje da ovakva mreža ima odličnu sposobnost generalizacije.

β

Page 15: Personalized TV recommender systems - Marko Krstic

Poređenje performansi sa tradicionalnim algoritmima učenja• Algoritmi

Resilient backpropagation (RP),

Scaled conjugate gradient (SCG),

Levenberg – marquardt (LM).

• Mere performansi

Tačnost pružanja preporuka (Accuracy)

Vreme treniranja neuralne mreže

TP TNAccuracyTP FP TN FN

Page 16: Personalized TV recommender systems - Marko Krstic

Tačnost pružanja preporuka (Accuracy)

Page 17: Personalized TV recommender systems - Marko Krstic

Vreme treniranja neuralne mreže

• AMD Athlon(tm) 64 Processor 3500+ 2.21GHz, 2GB RAM

Broj skrivenih čvorova

Algoritmi učenja

ELM RPROP SCG LM

1 0.0022s 0.3628s 0.4009s 0.4055s

2 0.0022s 0.3614s 0.4206s 0.4155s

Page 18: Personalized TV recommender systems - Marko Krstic

Karakteristike prikupljenih podataka

• Izražena tendencija korisnika da češće pružaju informacije o TV sadržajima koji im se sviđaju nego o onima koji im se ne sviđaju.

• Znatno veći broj interakcija u jednoj klasi u odnosu na drugu (Class Imbalance).

Page 19: Personalized TV recommender systems - Marko Krstic

Class Imbalance utiče na:

• Izbor mera performansi

• Izbor algoritma učenja

Page 20: Personalized TV recommender systems - Marko Krstic

Izbor mera performansi

• Kada postoji Class Imbalance problem tačnost pružanja preporuka (Accuracy) nije adekvatna mera performansi.

• G-mean

• Receiver Operating Characteristics (ROC) graph

TP TNG meanTP FN TN FP

Page 21: Personalized TV recommender systems - Marko Krstic

ROC Graph

_#TPTP rateP

_#FPFP rateN

Page 22: Personalized TV recommender systems - Marko Krstic

Izbor algoritma učenjaWeighted ELM (WELM)

1

1

1 , kada je broj trening sekvenci manji od broja skrivenih čvorovaˆ

1 , kada je broj trening sekvenci veći od broja skrivenih čvorova

T T

T T

R

R

H I BHH BZβ H Z

I H BH H BZ

1 , za trening sekvence iz pozitivne klase #WS1: 1 , za trening sekvence iz negativne klase

#

ppPB

N

1 , za trening sekvence iz pozitivne klase#WS2:

0.618 , za trening sekvence iz negativne klase#

ppPB

N

- dijagonalna matrica težinskih koeficijenataB - regularizacioni parametarR

Page 23: Personalized TV recommender systems - Marko Krstic

G-mean za optimalan izbor parametara

Page 24: Personalized TV recommender systems - Marko Krstic

ROC graph za optimalan izbor parametara

Page 25: Personalized TV recommender systems - Marko Krstic

Zavisnost G-mean performansi od parametara

WS2

Page 26: Personalized TV recommender systems - Marko Krstic

Šta ako sistem nema informacije o sadržajima koje korisnik ne voli?

• One-class klasifikatori koji mogu da prepoznaju koji se TV sadržaji korisniku sviđaju a koji ne, samo na osnovu informacija o klasi sadržaja koje korisnik voli da gleda.

Page 27: Personalized TV recommender systems - Marko Krstic

Autoencoder neuralna mreža

Page 28: Personalized TV recommender systems - Marko Krstic

ELM verzije autoencoder neuralne mreže

• ELM autoencoder

• ELM sparse autoencoder

Page 29: Personalized TV recommender systems - Marko Krstic

ELM autoencoder• Regularized ELM (RELM) algoritam

• L2 regularizacija

• Ortogonalizacija vektora ulaznih težina radi poboljšanja generalizacionih sposobnosti mreže

ZHHHIZHβ TT

R

11ˆ

Page 30: Personalized TV recommender systems - Marko Krstic

ELM sparse autoencoder

• FISTA (Fast Iterative Shrinkage-Thresholding Algorithm)

• L1 regularizacija

• Brza globalna konvergencija O(1/i2)

Page 31: Personalized TV recommender systems - Marko Krstic

Kako izabrati parametre sistema ako postoje samo informacije o jednoj klasi?

• Consistency-Based Model Selection

• Bira model sa najvećom kompleksnošću (najbolje aproksimira trening sekvence) koji je i dalje pouzdan (ima dobru sposobnost generalizacije)

2 (1 )v e v e ep p N p p

- procenat validacionih sekvenci koje je sistem greškom dodelio klasi sadržaja koji korisnik ne želi da gledavp - procenat trening sekvenci koje je sistem greškom dodelio klasi sadržaja koji korisnik ne želi da gledaep

- broj validacionih sekvenci u validacionom skupuvN

Page 32: Personalized TV recommender systems - Marko Krstic

G-mean za optimalan izbor parametara

Page 33: Personalized TV recommender systems - Marko Krstic

Vreme treniranja neuralne mreže• Rezultati mereni na

laptopu sa dva jezgra, 2900MHz CPU i 4GB RAM.

• Eksperimentalno određeno da ih treba skalirati sa faktorom od 1.8 do 2.2 da bi se dobilo vreme treniranja na Texas InstrumentsAM3351 Starter Kit

Page 34: Personalized TV recommender systems - Marko Krstic

Uticaj informacija o drugoj klasi na performanse sistema

Page 35: Personalized TV recommender systems - Marko Krstic

Zaključak• Uz pomoć algoritama baziranih na ELM

metodologiji moguće je koristiti mašinsko učenje u primenama koje zahtevaju učenje u realnom vremenu čak i na uređajima sa ograničenim resursima.

• Karakteristike prikupljenih podataka su veoma važne i moraju se uzeti u obzir pri projektovanju sistema baziranih na mašinskom učenju.

Page 36: Personalized TV recommender systems - Marko Krstic

HVALA NA PAŽNJI!

Marko Krstić

IT Advisor at RATEL

[email protected]