recomendación+basadaen...

34
Recomendación Basada en Grafos Denis Parra IIC 3633 3 de Noviembre de 2015

Upload: others

Post on 20-Jun-2020

15 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Recomendación+Basadaen Grafos+dparra.sitios.ing.uc.cl/classes/recsys-2015-2/clase17_graphBasedRe… · Problemade+ Recomendación+ • Nuevamente+revisitamosel problemade+ recomendación+

Recomendación  Basada  en  Grafos  

Denis  Parra  IIC  3633  

3  de  Noviembre  de  2015    

Page 2: Recomendación+Basadaen Grafos+dparra.sitios.ing.uc.cl/classes/recsys-2015-2/clase17_graphBasedRe… · Problemade+ Recomendación+ • Nuevamente+revisitamosel problemade+ recomendación+

Agenda  Semestral  

Page 3: Recomendación+Basadaen Grafos+dparra.sitios.ing.uc.cl/classes/recsys-2015-2/clase17_graphBasedRe… · Problemade+ Recomendación+ • Nuevamente+revisitamosel problemade+ recomendación+

Problema  de  Recomendación  

•  Nuevamente  revisitamos  el  problema  de  recomendación  

•  Una  alternaFva  válida  a  los  métodos  vistos  hasta  ahora  es  explotar  las  relaciones  entre  items  en  la  forma  de  grafos.  

Page 4: Recomendación+Basadaen Grafos+dparra.sitios.ing.uc.cl/classes/recsys-2015-2/clase17_graphBasedRe… · Problemade+ Recomendación+ • Nuevamente+revisitamosel problemade+ recomendación+

Hoy  

•  AssociaFve  retrieval  techniques  to  alleviate  the  sparsity  problem  in  CF  (Huang  et  al.  2004)  

•  The  link  PredicFon  Problem  for  Social  Networks  (Liben-­‐Nowel,  Kleinberg,  2002)  

Page 5: Recomendación+Basadaen Grafos+dparra.sitios.ing.uc.cl/classes/recsys-2015-2/clase17_graphBasedRe… · Problemade+ Recomendación+ • Nuevamente+revisitamosel problemade+ recomendación+

Paper  1  

•  Zan  Huang,  Hsinchun  Chen,  and  Daniel  Zeng.  2004.  Applying  associaFve  retrieval  techniques  to  alleviate  the  sparsity  problem  in  collaboraFve  filtering.  ACM  Trans.  Inf.  Syst.  22,  1  (January  2004),  116-­‐142.    

Page 6: Recomendación+Basadaen Grafos+dparra.sitios.ing.uc.cl/classes/recsys-2015-2/clase17_graphBasedRe… · Problemade+ Recomendación+ • Nuevamente+revisitamosel problemade+ recomendación+

Resumen  

•  Lidiar  con  el  problema  de  escasez  de  evaluaciones  del  usuario  (raFngs)  

•  Filtrado  ColaboraFvo  es  estudiado  como  un  grafo  bi-­‐parFto.  

•  Técnicas  de  recuperación  asociaFva  son  uFlizadas  sobre  el  grafo  (Spreading  AcFvaFon)  

•  RESULTADO:  Cuando  hay  escasez  de  raFngs,  estas  técnicas  basadas  en  grafos  mejoran  los  resultado  del  filtrado  colaboraFvo  

Page 7: Recomendación+Basadaen Grafos+dparra.sitios.ing.uc.cl/classes/recsys-2015-2/clase17_graphBasedRe… · Problemade+ Recomendación+ • Nuevamente+revisitamosel problemade+ recomendación+

El  Problema  de  Escasez  (Sparsity)  

•  Al  2004,  los  problemas  cold-­‐start  y  new-­‐item  se  habían  atacado  usando:  –  Item-­‐Base  CF  (Sarwar  2001)  – Reducción  de  Dimensionalidad  (Golderg  2001)  – Híbridos  (Balanovic  2002,  Basu  1998,  Condliff  1999,  etc.)  

•  Ninguno  de  los  métodos  mencionados  había  tenido  consenso  absoluto  de  su  éxito  

Page 8: Recomendación+Basadaen Grafos+dparra.sitios.ing.uc.cl/classes/recsys-2015-2/clase17_graphBasedRe… · Problemade+ Recomendación+ • Nuevamente+revisitamosel problemade+ recomendación+

CF  como  Recuperación  AsociaFva  

•  Idea  básica:  construir  un  grafo  entre  usuarios  e  items  y  explorar  asociaciones  transiFvas  entre  ellos.  

Page 9: Recomendación+Basadaen Grafos+dparra.sitios.ing.uc.cl/classes/recsys-2015-2/clase17_graphBasedRe… · Problemade+ Recomendación+ • Nuevamente+revisitamosel problemade+ recomendación+

CF  como  Recuperación  AsociaFva  

•  Idea  básica:  construir  un  grafo  entre  usuarios  e  items  y  explorar  asociaciones  transiFvas  entre  ellos.  

3  hops   3  hops   5  hops  

Page 10: Recomendación+Basadaen Grafos+dparra.sitios.ing.uc.cl/classes/recsys-2015-2/clase17_graphBasedRe… · Problemade+ Recomendación+ • Nuevamente+revisitamosel problemade+ recomendación+

Notación  Matricial  

•  Consideremos  la  matriz  consumidor/producto  A  

•  Parámetros:  M:  hops,  α=  decaimiento  (peso  asociado  al  enlace  

Page 11: Recomendación+Basadaen Grafos+dparra.sitios.ing.uc.cl/classes/recsys-2015-2/clase17_graphBasedRe… · Problemade+ Recomendación+ • Nuevamente+revisitamosel problemade+ recomendación+

Ejemplo  

•  Dado  A    •  Luego,  para  M  =  3,  α=  0.5  

•   Luego,  para  M  =  5,  α=  0.5  

Page 12: Recomendación+Basadaen Grafos+dparra.sitios.ing.uc.cl/classes/recsys-2015-2/clase17_graphBasedRe… · Problemade+ Recomendación+ • Nuevamente+revisitamosel problemade+ recomendación+

Supuesto  de  la  InvesFgación  

•  Los  métodos  de  Spreading  AcFvaFon  funcionarán  mejor  cuando  la  red  Fene  muy  baja  densidad,  en  caso  contrario  puede  ocurrir  sobre-­‐acFvación.  

Page 13: Recomendación+Basadaen Grafos+dparra.sitios.ing.uc.cl/classes/recsys-2015-2/clase17_graphBasedRe… · Problemade+ Recomendación+ • Nuevamente+revisitamosel problemade+ recomendación+

Modelos  

•  Constrained  Leaky  Capacitor  Model  (LCM)  •  Branch-­‐and-­‐Bound  •  Hopfield  Net  

Page 14: Recomendación+Basadaen Grafos+dparra.sitios.ing.uc.cl/classes/recsys-2015-2/clase17_graphBasedRe… · Problemade+ Recomendación+ • Nuevamente+revisitamosel problemade+ recomendación+

LCM  

•  Propuesto  por  Anderson  (1983)    •  Pasos:  –  IdenFficar  nodo-­‐vector  inicial  V,  setear  D(0)    – Cálculo  de  nivel  de  acFvación  

Donde  (1-­‐γ):  speed  of  decay  (0.8),  α:  efficiency  (0.8)  –   Condición  de  detención:  en  el  paper  =  10,  top  50    

Page 15: Recomendación+Basadaen Grafos+dparra.sitios.ing.uc.cl/classes/recsys-2015-2/clase17_graphBasedRe… · Problemade+ Recomendación+ • Nuevamente+revisitamosel problemade+ recomendación+

Branch-­‐and-­‐Bound  •  Implementación  basada  en  (Chen  &  Ng  1995)  •  Paso  1,  Inicialización:  Nodo  correspondiente  al  usuario  es  acFvado  (1),  los  otros  =  0.  Cola  Qpriority  se  inicializa  con  nodo  usuario  acFvo.  

•  Paso  2,  Cálculo  de  acFvación:  Sacar  nodos  de  Qpriority,  por  cada  nodo  vecino  calcular  

y  agregar/actualizar  nodo  acFvado  a  Qoutput  

•  Paso  3,  detención:  determinada  empiricamente  (70)  

Page 16: Recomendación+Basadaen Grafos+dparra.sitios.ing.uc.cl/classes/recsys-2015-2/clase17_graphBasedRe… · Problemade+ Recomendación+ • Nuevamente+revisitamosel problemade+ recomendación+

Holpfield  Net  

•  Paralelo  con  red  neuronal.  Usuarios  e  items  son  neuronas.  Sinapsis  son  las  acFvaciones.  

•  Inicialización:  igual  que  las  anteriores  •  Calculo  de  acFvación:    •  Condición  de  detención:  

Page 17: Recomendación+Basadaen Grafos+dparra.sitios.ing.uc.cl/classes/recsys-2015-2/clase17_graphBasedRe… · Problemade+ Recomendación+ • Nuevamente+revisitamosel problemade+ recomendación+

Estudio  Experimental  

•  Tienda  de  libros  en  linea  de  China  9,695  libros  /  2,000  usuarios  /  18,771  transacciones  •  Métricas  de  evaluación:    Precision,  Recall,  F-­‐1  

•  Y  uFlity  rank      

Page 18: Recomendación+Basadaen Grafos+dparra.sitios.ing.uc.cl/classes/recsys-2015-2/clase17_graphBasedRe… · Problemade+ Recomendación+ • Nuevamente+revisitamosel problemade+ recomendación+

Resultados  

H1:  Comparación  de  algoritmos  bajo  condiciones  normales  

H1:  Comparación  de  algoritmos  con  usuarios  sparse  

Page 19: Recomendación+Basadaen Grafos+dparra.sitios.ing.uc.cl/classes/recsys-2015-2/clase17_graphBasedRe… · Problemade+ Recomendación+ • Nuevamente+revisitamosel problemade+ recomendación+

Resultados  2  

Page 20: Recomendación+Basadaen Grafos+dparra.sitios.ing.uc.cl/classes/recsys-2015-2/clase17_graphBasedRe… · Problemade+ Recomendación+ • Nuevamente+revisitamosel problemade+ recomendación+

Lecciones  

•  H1,  H2  y  H3  se  demuestran  •  Sensibilidad  de  los  parámetros:  – LCM:  no  es  muy  sensible  (alfa,  gama  e  iteraciones)  – BNB:  diferencia  en  70  y  100  iteraciones  es  baja,  sobre  100  baja  drásFcamente  

– Hopfield  Net:  poca  diferencia  entre  parámetros  

Page 21: Recomendación+Basadaen Grafos+dparra.sitios.ing.uc.cl/classes/recsys-2015-2/clase17_graphBasedRe… · Problemade+ Recomendación+ • Nuevamente+revisitamosel problemade+ recomendación+

Paper  2  

•  Liben-­‐Nowell,  D.,  &  Kleinberg,  J.  (2007).  The  link-­‐predicFon  problem  for  social  networks.  Journal  of  the  American  society  for  informaFon  science  and  technology,  58(7),  1019-­‐1031.  

Page 22: Recomendación+Basadaen Grafos+dparra.sitios.ing.uc.cl/classes/recsys-2015-2/clase17_graphBasedRe… · Problemade+ Recomendación+ • Nuevamente+revisitamosel problemade+ recomendación+

El  Problema  

Page 23: Recomendación+Basadaen Grafos+dparra.sitios.ing.uc.cl/classes/recsys-2015-2/clase17_graphBasedRe… · Problemade+ Recomendación+ • Nuevamente+revisitamosel problemade+ recomendación+

Definiciones  

Imagen  desde  hqp://be.amazd.com/link-­‐predicFon/  

Page 24: Recomendación+Basadaen Grafos+dparra.sitios.ing.uc.cl/classes/recsys-2015-2/clase17_graphBasedRe… · Problemade+ Recomendación+ • Nuevamente+revisitamosel problemade+ recomendación+

Notación  para  arXiv  de  Física  

Page 25: Recomendación+Basadaen Grafos+dparra.sitios.ing.uc.cl/classes/recsys-2015-2/clase17_graphBasedRe… · Problemade+ Recomendación+ • Nuevamente+revisitamosel problemade+ recomendación+

Métricas  1:  distancia  en  el  grafo  

Imagen  desde  hqp://be.amazd.com/link-­‐predicFon/  

Page 26: Recomendación+Basadaen Grafos+dparra.sitios.ing.uc.cl/classes/recsys-2015-2/clase17_graphBasedRe… · Problemade+ Recomendación+ • Nuevamente+revisitamosel problemade+ recomendación+

Vecinos  en  Común  

Imagen  desde  hqp://be.amazd.com/link-­‐predicFon/  

Page 27: Recomendación+Basadaen Grafos+dparra.sitios.ing.uc.cl/classes/recsys-2015-2/clase17_graphBasedRe… · Problemade+ Recomendación+ • Nuevamente+revisitamosel problemade+ recomendación+

Jaccard  

Imagen  desde  hqp://be.amazd.com/link-­‐predicFon/  

Page 28: Recomendación+Basadaen Grafos+dparra.sitios.ing.uc.cl/classes/recsys-2015-2/clase17_graphBasedRe… · Problemade+ Recomendación+ • Nuevamente+revisitamosel problemade+ recomendación+

Adamic-­‐Adar  

Page 29: Recomendación+Basadaen Grafos+dparra.sitios.ing.uc.cl/classes/recsys-2015-2/clase17_graphBasedRe… · Problemade+ Recomendación+ • Nuevamente+revisitamosel problemade+ recomendación+

PreferenFal  Aqachment  

Imagen  desde  hqp://be.amazd.com/link-­‐predicFon/  

Page 30: Recomendación+Basadaen Grafos+dparra.sitios.ing.uc.cl/classes/recsys-2015-2/clase17_graphBasedRe… · Problemade+ Recomendación+ • Nuevamente+revisitamosel problemade+ recomendación+

Katz  

Page 31: Recomendación+Basadaen Grafos+dparra.sitios.ing.uc.cl/classes/recsys-2015-2/clase17_graphBasedRe… · Problemade+ Recomendación+ • Nuevamente+revisitamosel problemade+ recomendación+

Espectrales/Random  Walk  

•  Hiung  Time  

 •  Rooted  Page  Rank  

•  SimRank  

 

Page 32: Recomendación+Basadaen Grafos+dparra.sitios.ing.uc.cl/classes/recsys-2015-2/clase17_graphBasedRe… · Problemade+ Recomendación+ • Nuevamente+revisitamosel problemade+ recomendación+

Resultados  

Page 33: Recomendación+Basadaen Grafos+dparra.sitios.ing.uc.cl/classes/recsys-2015-2/clase17_graphBasedRe… · Problemade+ Recomendación+ • Nuevamente+revisitamosel problemade+ recomendación+

Resultados  2  

Page 34: Recomendación+Basadaen Grafos+dparra.sitios.ing.uc.cl/classes/recsys-2015-2/clase17_graphBasedRe… · Problemade+ Recomendación+ • Nuevamente+revisitamosel problemade+ recomendación+

Referencias  •  Zan  Huang,  Hsinchun  Chen,  and  Daniel  Zeng.  2004.  Applying  associaFve  

retrieval  techniques  to  alleviate  the  sparsity  problem  in  collaboraFve  filtering.  ACM  Trans.  Inf.  Syst.  22,  1  (January  2004),  116-­‐142.    

•  Liben-­‐Nowell,  D.,  &  Kleinberg,  J.  (2007).  The  link-­‐predicFon  problem  for  social  networks.  Journal  of  the  American  society  for  informaFon  science  and  technology,  58(7),  1019-­‐1031.  

•  G.  Jeh  and  J.  Widom.  SimRank:  A  measure  of  structural-­‐context  similarity.  In  Proceedings  of  the  Eighth  ACM  SIGKDD  InternaFonal  Conference  on  Knowledge  Discovery  and  Data  Mining,  Edmonton,  Alberta,  Canada,July  2002.  

•  Nguyen,  P.,  Tomeo,  P.,  Di  Noia,  T.,  &  Di  Sciascio,  E.  (2015,  May).  An  evaluaFon  of  SimRank  and  Personalized  PageRank  to  build  a  recommender  system  for  the  Web  of  Data.  In  Proceedings  of  the  24th  InternaFonal  Conference  on  World  Wide  Web  Companion  (pp.  1477-­‐1482).  InternaFonal  World  Wide  Web  Conferences  Steering  Commiqee.