recommanding sequences in a multidimensional space

135
HAL Id: tel-03248061 https://hal.univ-lorraine.fr/tel-03248061 Submitted on 3 Jun 2021 HAL is a multi-disciplinary open access archive for the deposit and dissemination of sci- entific research documents, whether they are pub- lished or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L’archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d’enseignement et de recherche français ou étrangers, des laboratoires publics ou privés. Recommanding sequences in a multidimensional space Pierre-Edouard Osche To cite this version: Pierre-Edouard Osche. Recommanding sequences in a multidimensional space. Computer Science [cs]. Université de Lorraine, 2021. English. NNT : 2021LORR0070. tel-03248061

Upload: others

Post on 08-Nov-2021

2 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Recommanding sequences in a multidimensional space

HAL Id tel-03248061httpshaluniv-lorrainefrtel-03248061

Submitted on 3 Jun 2021

HAL is a multi-disciplinary open accessarchive for the deposit and dissemination of sci-entific research documents whether they are pub-lished or not The documents may come fromteaching and research institutions in France orabroad or from public or private research centers

Lrsquoarchive ouverte pluridisciplinaire HAL estdestineacutee au deacutepocirct et agrave la diffusion de documentsscientifiques de niveau recherche publieacutes ou noneacutemanant des eacutetablissements drsquoenseignement et derecherche franccedilais ou eacutetrangers des laboratoirespublics ou priveacutes

Recommanding sequences in a multidimensional spacePierre-Edouard Osche

To cite this versionPierre-Edouard Osche Recommanding sequences in a multidimensional space Computer Science [cs]Universiteacute de Lorraine 2021 English NNT 2021LORR0070 tel-03248061

AVERTISSEMENT

Ce document est le fruit dun long travail approuveacute par le jury de soutenance et mis agrave disposition de lensemble de la communauteacute universitaire eacutelargie Il est soumis agrave la proprieacuteteacute intellectuelle de lauteur Ceci implique une obligation de citation et de reacutefeacuterencement lors de lrsquoutilisation de ce document Dautre part toute contrefaccedilon plagiat reproduction illicite encourt une poursuite peacutenale Contact ddoc-theses-contactuniv-lorrainefr

LIENS Code de la Proprieacuteteacute Intellectuelle articles L 122 4 Code de la Proprieacuteteacute Intellectuelle articles L 3352- L 33510 httpwwwcfcopiescomV2legleg_droiphp httpwwwculturegouvfrcultureinfos-pratiquesdroitsprotectionhtm

Ecole doctorale IAEM Lorraine

Recommandations en sequences dansun espace multidimensions

THESE

presentee et soutenue publiquement le 26 fevrier 2021

pour lrsquoobtention du

Doctorat de lrsquoUniversite de Lorraine

(mention informatique)

par

Pierre-Edouard Osche

Composition du jury

President Laurent Vigneron Professeur Universite de Lorraine

Rapporteurs Sylvie Calabretto Professeur INSA de LyonLaurent Vercouter Professeur INSA de Rouen

Directrice Anne Boyer Professeur Universite de Lorraine

Co-Directeur Sylvain Castagnos Maıtre de Conferences Universite de Lorraine

Laboratoire Lorrain de Recherche en Informatique et ses Applications mdash UMR 7503

Mis en page avec la classe thesul

Remerciements

Ce manuscrit de thegravese est le fruit dun long travail de recherche qui a eacuteteacute riche en enseigne-ments Durant ces anneacutees jai beaucoup appris tant du point de vue professionnel que personnelplus que je naurais imagineacute avant de commencer cette thegravese Pour tout cela je souhaite remer-cier les personnes qui mont entoureacute durant cette peacuteriode

Je tiens tout dabord agrave particuliegraverement remercier ma directrice Anne Boyer et mon co-directeur Sylvain Castagnos avec qui jai eu la chance de pouvoir travailler durant toute cettethegravese Anne ma apporteacute son expeacuterience et son recul dans le domaine de la recherche et Sylvainma guideacute et soutenu dans chacune des eacutetapes de ce travail Jai beaucoup appreacutecieacute travailleravec vous et je vous remercie encore une fois ici pour vos conseils aviseacutes votre patience votrebonne humeur et pour tout ce que jai pu apprendre agrave vos cocircteacutes

Je remercie Sylvie Calabretto et Laurent Vercouter qui ont rapporteacute ma thegravese et qui ontaccepteacute de faire partie du jury de thegravese Leurs remarques pertinentes mont donneacute un recul etune conance nouvelle en mon travail Je remercie Laurent Vigneron qui a apporteacute un regardexteacuterieur et bienveillant sur mon travail pendant ces anneacutees de thegravese et qui a eacutegalement accepteacutede faire partie du jury comme examinateur

Je remercie aussi leacutequipe KIWI dans son ensemble De nombreuses ideacutees de ce travail sont lefruit de discussions avec les membres de leacutequipe dont certains sont devenus pour moi des amisproches

Je remercie enn ma famille et mes amis leur soutien ma donneacute la motivation de terminerce travail dans cette peacuteriode dicile de pandeacutemie et disolation sociale Tout particuliegraverementje remercie Rose et Ragnar pour leur douce preacutesence quotidienne

i

ii

Sommaire

Chapitre 1

Introduction 1

11 Introduction 1

12 Preacuteambule 4

13 Contributions 8

131 SP1 les facteurs agrave prendre en compte pour satisfaire les utilisateurs 9

132 SP2 la conception de seacutequences de recommandations en accord avec les

facteurs seacutelectionneacutes 9

133 SP3 et SP4 la creacuteation dun modegravele geacuteneacuterique prenant en compte plusieurs

meacutetriques et produisant des seacutequences 9

14 Plan de la thegravese 10

Chapitre 2

Eacutetat de lart 11

21 Les systegravemes de recommandation 12

211 Le ltrage par contenu 12

212 Le ltrage collaboratif 13

213 Les actions des utilisateurs 13

214 Discussion et limites des systegravemes classiques 14

22 Les facteurs humains agrave prendre en compte dans la recommandation 15

221 La similariteacute 17

222 La diversiteacute 19

223 La nouveauteacute 20

224 Discussion 21

23 La recommandation en seacutequence 22

231 Deacutenition et geacuteneacuteraliteacutes sur les seacutequences 22

232 Domaines dapplication des modegraveles seacutequentiels 26

233 Discussion 30

iii

Sommaire

24 Les systegravemes multi-agents 31

241 Deacutenition 31

242 Preacutesentation de deux systegravemes multi-agents reacuteactifs 33

243 Ant Colony System 38

244 Discussion sur le modegravele ACS 40

25 Utilisation et eacutevolution reacutecentes des algorithmes de colonies de fourmis 43

251 Les algorithmes de colonies de fourmis dans les systegravemes de recommandation 43

252 Les algorithmes de colonies de fourmis multi-objectifs 47

253 Discussion sur lutilisation de loptimum de Pareto 50

26 Discussion geacuteneacuterale 50

Chapitre 3

Notre modegravele de recommandation multi-objectifs AntRS 53

31 Introduction 54

32 Fonctionnement geacuteneacuteral du modegravele 54

33 Graphe 55

34 Objectifs 60

341 Similariteacute 63

342 Diversiteacute 64

343 Nouveauteacute 64

344 Preacutefeacuterences 66

345 Progressiviteacute 67

35 Tactiques de fusion 70

351 Colonie de fusion 71

352 Fusion de seacutequences 72

353 Conclusion 72

Chapitre 4

Expeacuterimentations et reacutesultats 73

41 Introduction 74

42 Expeacuterimentations preacuteliminaires portant sur le modegravele ACS initial 74

421 Preacutesentation et inteacuterecircts de ces premiegraveres expeacuterimentations 74

422 Expeacuterimentations preacuteliminaires sur le modegraveles ACS 78

423 Conclusion 84

43 Expeacuterimentations sur le modegravele AntRS 84

431 Base de donneacutees utiliseacutee 84

432 AntRS mono-objectif expeacuterimentations sur chaque colonie isoleacutee 89

iv

433 AntRS multi-objectifs expeacuterimentations sur lensemble des colonies si-

multaneacutement et sur les tactiques de fusion 93

434 Optimisation des meacutetavariables de AntRS 99

44 Conclusion 103

Chapitre 5

Conclusion et perspectives 105

51 Conclusion 105

52 Perspectives 106

Bibliographie 109

v

Sommaire

vi

Table des gures

21 Preacutesentation scheacutematiseacutee du calcul de la preacutecision et du rappel en fonction desressources trouveacutees par rapport agrave lensemble des ressources disponibles (creacuteditimage Datamok UserWalber) 15

22 Vue densemble du fonctionnement dun systegraveme de recommandation sensible auxseacutequences (source [Quadrana et al 2018]) 25

23 Scheacutema repreacutesentant linteraction entre un agent et lenvironnement dans lequel ileacutevolue [Russell and Norvig 2016] 32

24 Simulation de boids ougrave lon peut voir les agents se deacuteplaccedilant dans la mecircme di-rection agrave une certaine distance les uns des autres dans un environnement simuleacute[Reynolds 1987] 35

25 Illustration dun chemin creacuteeacute par des fourmis appartenant agrave lespegravece des fourmisleacutegionnaires (creacutedit photo Mehmet Karatay) 36

26 Exemple de descente de gradient ougrave lon peut voir lexploration au deacutebut avec undeacuteplacement rapide puis lexploitation ensuite vers la solution trouveacutee ( creacuteditimage Joris Gillis 41

27 Illustration de lexpeacuterience des ponts binaires par Jean-Louis Deneubourg (a)Apregraves un certain temps les fourmis choisissent majoritairement une des deuxvoies possibles (b) [Deneubourg et al 1990] 41

28 Scheacutema du dispositif expeacuterimental utiliseacute pour veacuterier si les fourmis sont biencapables demprunter rapidement la voie la plus courte lorsque leur sont preacutesenteacutesdes choix qualitativement dieacuterents [Goss et al 1989] 42

29 Front de Pareto dun problegraveme de minimisation de deux variables f1 et f2 Toutesles solutions sur cette frontiegravere sont optimales (source Wikipedia) 48

31 Graphe repreacutesentant leacutevolution exponentielle du nombre darecirctes selon le nombrede sommets existants dans un graphe complet 57

32 Graphe repreacutesentant leacutevolution lineacuteaire du nombre darecirctes selon le nombre desommets voulus dans un graphe creacuteeacute avec dieacuterentes valeurs de d 60

41 Diagramme de ux repreacutesentant le deacuteroulement de lalgorithme ACS proposeacute par[Schlunz 2011] 76

42 Deux exemples de congurations expeacuterimentales dieacuterentes permettant chacune detester la capaciteacute des fourmis agrave trouver le plus court chemin dans un evironnement[Goss et al 1989] 77

43 Illustration de lexpeacuterience des ponts binaires par Jean-Louis Deneubourg (a)Apregraves un certain temps les fourmis choisissent majoritairement une des deuxvoies possibles (b) [Deneubourg et al 1990] 78

vii

Table des gures

44 Repreacutesentation graphique de lExpeacuterimentation 11 meneacutee sur le modegravele ACS gracircceagrave la bibliothegraveque Java GraphStream Le ndivideud repreacutesenteacute par un carreacute rouge cor-respond au deacutepart le ndivideud repreacutesenteacute par un carreacute bleu repreacutesente larriveacutee lesndivideuds ronds noirs repreacutesentent des points de passage possible les nombres noirsaccoleacutes aux arecirctes repreacutesentent la distance pour parcourir larecircte les nombresviolets repreacutesentent le taux de pheacuteromones deacuteposeacutees sur larecircte 79

45 Reacutesultats obtenus apregraves 30 iteacuterations sur lExpeacuterimentation 11 Agrave gauche laconguration nale du graphe agrave droite le pourcentage dagents fourmis ayantemprunteacutes les deux chemins 80

46 Reacutesultats obtenus apregraves 30 iteacuterations sur lExpeacuterimentation 12 Comme les agentsse basent principalement sur lheuristique qui est partout eacutegale ils oscillent entreles deux chemins sans en privileacutegier un 81

47 Reacutesultats obtenus apregraves 30 iteacuterations sur lExpeacuterimentation 13 Les agents ex-ploitent ici les arecirctes ayant le plus de pheacuteromones Tregraves rapidement tous les agentsutilisent le mecircme chemin 82

48 Conguration nale du graphe pour lExpeacuterimentation 2 apregraves 30 iteacuterations Lesagents ont en majoriteacute bien seacutelectionneacute le chemin le plus court lt 0 1 3 4 9 gt 82

49 Exemple de graphe de lExpeacuterimentation 3 agrave la n des 50 iteacuterations Ces graphessont geacuteneacutereacutes aleacuteatoirement 83

410 Exemple de deacutetection de sessions dans la base de donneacutees Lheure agrave laquelleest lanceacutee chaque musique (ici en bas dans le scheacutema) ainsi que sa dureacutee sontenregistreacutees Si lutilisateur ne relance pas de musique pendant 15 minutes apregravesla n de sa derniegravere eacutecoute alors la session en cours est termineacutee et une nouvellesession est commenceacutee agrave la prochaine musique lanceacutee 87

411 Inuence du nombre dagents et diteacuterations sur la preacutecision moyenne obtenue parnotre modegravele 100

viii

Chapitre 1

Introduction

11 Introduction

Les systegravemes de recommandation existent depuis maintenant plus de deux deacutecennies[Resnick et al 1994] et ont pris leur essor avec la deacutemocratisation dInternet et de laccegraves agravelinformation Le but dun systegraveme de recommandation est comme son nom lindique de recom-mander des ressources agrave lutilisateur pour laiguiller parmi la masse dinformations disponibles Leterme de ressource peut faire reacutefeacuterence agrave un produit une information un lm une musique etcCes ressources doivent correspondre agrave ce quattend lutilisateur pour reacutepondre agrave ses attentesLagrave ougrave dautres meacutethodes daide agrave lutilisateur comme les moteurs de recherche proposerontune liste de sites Internet relatifs agrave une question geacuteneacuterale (ex la requecircte lms super-heacuterosreacutesultera en une liste des lms de super-heacuteros les plus connus etou reacutecents) un systegraveme derecommandation proposera quant agrave lui une reacuteponse plus speacutecique agrave un besoin plus preacutecis (ex un systegraveme recommandera agrave un utilisateur de voir le dernier lm de super-heacuteros du studio Marvelcar ce dernier a appreacutecieacute tous les lms reacutealiseacutes par ce studio speacutecique ces derniegraveres anneacutees) Uneautre speacuteciciteacute majeure des systegravemes de recommandation reacuteside dans le fait que ces derniersreacutepondent agrave un besoin de lutilisateur qui naura pas forceacutement eacuteteacute exprimeacute en amont par cedernier Contrairement aux moteurs de recherche qui se contentent de reacutepondre agrave une requecircte delutilisateur les systegravemes de recommandation proposent quant agrave eux des informations de maniegraverepro-active au moment le plus opportun Un des deacutes majeurs des systegravemes de recommandationen plus de proposer des recommandations au bon moment est de reacuteussir agrave modeacuteliser ce quelutilisateur souhaite reacuteellement alors que les seules donneacutees disponibles proviennent des traceslaisseacutees par les utilisateurs lors des preacuteceacutedentes interactions avec le systegraveme (consultation depages achat de produits visionnage de lms etc) Les systegravemes de recommandation apportentune reacuteelle plus-value par rapport agrave dautres meacutethodes (comme les moteurs de recherche) carlaide proposeacutee se veut tregraves personnaliseacutee selon les preacutefeacuterences de chaque utilisateur Cet objectifde personnalisation entraicircne cependant une complexication du problegraveme car il est neacutecessaire dedeacutenir et de prendre en compte les facteurs humains sous-jacents agrave la satisfaction de lutilisateurlors de la recherche dinformation Nous allons maintenant nous inteacuteresser plus particuliegraverementaux dieacuterentes techniques employeacutees par les systegravemes de recommandation

Les systegravemes de recommandation existent depuis plus de deux deacutecennies et mecircme si les tech-niques ont eacutevolueacute le principe fondamental reste le mecircme identier les besoins et les preacutefeacuterencesdun utilisateur pour lui proposer des ressources adapteacutees Pour ce faire la premiegravere eacutetape estde reacutecolter des informations agrave propos de lutilisateur dans le but didentier ses preacutefeacuterences

1

Chapitre 1 Introduction

Les informations reacutecolteacutees sont deacutependantes du domaine dans lequel est deacuteployeacute le systegraveme derecommandation Sur un site de-commerce le systegraveme pourra par exemple utiliser les produitsconsulteacutes par lutilisateur ainsi que les eacuteventuelles notes sur les produits quil a acheteacute Un sitedeacutecoute de musique exploitera quant agrave lui les titres eacutecouteacutes par lutilisateur ainsi que son com-portement durant leacutecoute (est-ce quil a eacutecouteacute le titre jusquau bout etc)

Durant ces deux deacutecennies dexistence les systegravemes de recommandation ont changeacute pouraccompagner leacutevolution des usages dInternet Les premiegraveres geacuteneacuterations de systegravemes eacutetaientnaturellement adapteacutees aux ressources peu nombreuses et complexes typiques du deacutebut de legraveredInternet Cest agrave cette eacutepoque que les deux grandes cateacutegories de systegravemes de recommandationse sont dieacuterencieacutees agrave savoir le ltrage collaboratif [Resnick et al 1994] et le ltrage par contenu[Belkin and Croft 1992] Dans le ltrage collaboratif les preacutefeacuterences des utilisateurs du systegravemesont utiliseacutees (eg pour un site de recommandation de lms les notes donneacutees par les utilisa-teurs du site sur les lms quils ont vu) Ainsi le systegraveme proposera agrave lutilisateur souhaitant desrecommandations les ressources appreacutecieacutees des autres utilisateurs qui lui sont similaires suivantlhypothegravese selon laquelle les preacutefeacuterences dun ensemble dutilisateurs similaires sont coheacuterentesentre elles Dans le ltrage par contenu les caracteacuteristiques des ressources sont utiliseacutees (egpour un site de recommandation de lms genre acteurs anneacutee de sortie ) Ainsi le systegravemeproposera agrave lutilisateur les ressources similaires agrave celles quil a appreacutecieacutees preacuteceacutedemment Pen-dant longtemps ces deux techniques ont eacuteteacute eacutevalueacutees sur la mesure de preacutecision Pour calculercette mesure les preacutedictions du systegraveme de recommandation sont directement confronteacutees auxdonneacutees reacuteelles recueillies avec de vrais utilisateurs Par exemple un systegraveme calcule quun uti-lisateur pourrait donner agrave un lm une note de 4 sur 5 indiquant quil pourrait eectivementappreacutecier ce lm et quil serait inteacuteressant de lui recommander Cette note calculeacutee de 45 estensuite compareacutee avec la note reacuteelle que cet utilisateur a donneacute agrave ce lm speacutecique note quiavait auparavant eacuteteacute cacheacutee au systegraveme de recommandation pendant les calculs Plus la note preacute-dite et la note reacuteelle sont proches et plus le systegraveme va ecirctre jugeacute preacutecis [Konstan et al 1998]Cette preacutecision peut se mesurer via dieacuterentes meacutetriques comme par exemple lerreur moyenneabsolue qui calcule la deacuteviation entre ce qua preacutedit le systegraveme et les preacutefeacuterences reacuteelles de luti-lisateur [Sammut and Webb 2010] Cette meacutethode bien quintuitive a tendance agrave enfermer lesutilisateurs dans leurs preacutefeacuterences deacutejagrave eacutetablies puisque cest preacuteciseacutement de cette maniegravere queles performances du systegraveme sont jugeacutees Ainsi dans le cas du ltrage par contenu si lutilisateuravait appreacutecieacute par le passeacute un type de ressources particulier le systegraveme tendait agrave lui recomman-der plus de ressources de ce type

Un autre problegraveme provenant de leacutevolution des usages peut ecirctre souleveacute ici Agrave lorigineles systegravemes de recommandation se concentraient dans quelques domaines particuliers commepar exemple les lms ou les produits de sites commerciaux Les recommandations eacutetaient alorspreacutesenteacutees agrave lutilisateur sous forme de ressources uniques ou de liste de ressources similairesCette maniegravere de preacutesenter les recommandations est encore tregraves courante aujourdhui alors queles usages ont eacutevolueacute et que les systegravemes de recommandation sont preacutesents dans un nombre deplus en plus grand de domaines ougrave recevoir une liste de ressources nest pas forceacutement adapteacutePour conclure sur cette partie il est clair que les systegravemes de recommandation ont eacutevolueacute depuisleur creacuteation Cependant des problegravemes demeurent quant agrave leacutevaluation de leurs performances etla satisfaction de lutilisateur nal ainsi que pour la preacutesentation des reacutesultats agrave lutilisateur nal

Prenons maintenant deux exemples qui vont servir agrave illustrer ce propos dans le chapitre Lepremier exemple se concentre sur le problegraveme de leacutevaluation par la preacutecision dans le domaine de

2

11 Introduction

le-commerce Consideacuterons un utilisateur qui consulte depuis quelques temps des appareils photo-graphiques sur un site de vente en ligne Le systegraveme de recommandation deacutetecte ce comportementet calcule les produits les plus similaires disponibles sur le site agrave savoir dautres appareils pho-tographiques Apregraves secirctre deacutecideacute lutilisateur achegravete son appareil et satisfait le reccediloit chez luiquelques jours plus tard Lors de ses prochaines connexions au site de vente en ligne le sys-tegraveme de recommandation proposera encore agrave lutilisateur des appareils photographiques car cesont eectivement toujours ces produits qui correspondent le plus agrave ses preacutefeacuterences mecircme silutilisateur nen a maintenant plus besoin Ce premier exemple montre le problegraveme relatif agrave lasur-utilisation de la preacutecision comme mesure de la performance Si les premiegraveres recommanda-tions baseacutees sur la preacutecision pouvaient ecirctre utiles pour lutilisateur on voit bien quune fois lachateectueacute cette mesure nest plus adapteacutee Des recommandations sur des nouveaux produits pour-raient par exemple ici se reacuteveacuteler inteacuteressantes pour lutilisateur Une autre ameacutelioration possiblepourrait ecirctre la prise en compte de la temporaliteacute Des recommandations dappareils photogra-phiques pourraient ecirctre utiles agrave lutilisateur mais peut-ecirctre dans plusieurs mois ou anneacutees et nonpas directement apregraves son achatOn voit bien ici que le systegraveme de recommandation ne peut passe contenter de la seule mesure de preacutecision et pourrait beacuteneacutecier de lutilisation dautres mesures

Prenons maintenant un deuxiegraveme exemple dans le domaine de le-education pour illustrer lesproblegravemes que peut apporter la preacutesentation des recommandations sous forme de liste agrave lutili-sateur nal Un utilisateur sest inscrit reacutecemment sur un site proposant des cours en ligne caril souhaite apprendre la programmation en Java Il consulte ainsi un cours sur les bases de laprogrammation en Java et le termine avec succegraves Le systegraveme de recommandation du site calculeun certain nombre de ressources eacuteducatives similaires au cours quil vient de suivre et les pro-pose sous forme de liste Lutilisateur se voit donc proposer en tecircte de liste dautres cours pourdeacutebutants en Java ainsi que quelques cours pour deacutebutants dans dautres langages de program-mation dans le reste de la liste Lutilisateur aurait davantage proteacute dune recommandation deplusieurs ressources eacuteducatives sadaptant agrave son niveau et proposant une augmentation de ladiculteacute pour quil poursuive son apprentissage illustrant linteacuterecirct de ne pas uniquement pro-poser des recommandations sous forme de liste On remarque une nouvelle fois que la prise encompte dautres mesures auraient ameacutelioreacute la qualiteacute des recommandations temporaliteacute priseen compte du niveau de lutilisateur diversiteacute des cours proposeacutes etc

Ces deux exemples mettent en exergue la complexiteacute du domaine de la recommandation tantles besoins des utilisateurs peuvent ecirctre varieacutes et complexes agrave satisfaire La satisfaction de lutili-sateur nal est lobjectif central de tout systegraveme de recommandation tout en eacutetant un problegravemeouvert et complexe En eet la satisfaction dun utilisateur nest pas binaire mais continue (unutilisateur nest pas soit satisfait soit non satisfait mais sera plutocirct satisfait de la recommanda-tion agrave un certain degreacute) Nous proposons donc ici daborder ce problegraveme sous un autre angle comment ameacuteliorer la qualiteacute des recommandations fournies agrave lutilisateur dans le but dobtenirde lutilisateur nal une plus haute satisfaction Les deux exemples ci-dessus illustrent leetpotentiellement neacutefaste de proposer des recommandations innaproprieacutees cest-agrave-dire qui ne sa-tisfont pas les besoins de lutilisateur au moment ougrave celui-ci les reccediloit En eet un utilisateur agravequi lon propose de maniegravere reacutecurrente des recommandations innaproprieacutees sera de plus en plusmeacuteant quant agrave la capaciteacute du systegraveme de produire des recommandations adapteacutees agrave ses besoinsau moment t De la mecircme maniegravere un mauvais systegraveme de recommandation ne sera pas utileagrave lutilisateur pour satisfaire ses besoins Il a eacuteteacute prouveacute que ces deux notions de conance etdutiliteacute diminuent chez lutilisateur face agrave un systegraveme de recommandation ne les satisfaisant pas[Benbasat and Wang 2005] Agrave terme ce genre de recommandations peut amener lutilisateur agrave

3

Chapitre 1 Introduction

ne plus utiliser le systegraveme sil ne perccediloit pas la valeur ajouteacutee de celui-ci Les exemples preacuteceacute-dents donnent aussi quelques pistes sur la maniegravere dameacuteliorer la qualiteacute des recommandationsEn eet on peut remarquer que mecircme si les propositions eacutetaient satisfaisantes du point de vueinterne du systegraveme elles ne leacutetaient pas du point de vue externe de lutilisateur Cette contra-diction peut sexpliquer par le fait que le systegraveme ne prend simplement pas assez en compte lesfacteurs deacuteterminant les besoins de lutilisateur Un systegraveme reacuteussissant agrave mieux modeacuteliser unutilisateur et prenant en compte les facteurs les plus importants pour ce dernier dans le processusde recommandation permettrait de mieux satisfaire ses besoins La probleacutematique scientiqueprincipale de cette thegravese peut donc se formuler ainsi

SP0 Comment ameacuteliorer la qualiteacute des recommandations faites aux utili-sateurs

Sinteacuteresser agrave la qualiteacute des recommandations implique de sinteacuteresser agrave leacutevaluation de cesderniegraveres Dans la prochaine section nous deacutetaillerons les deacutes et enjeux de cette probleacutematiqueet son lien avec leacutevaluation puis nous deacutenirons plusieurs sous-probleacutematiques permettant dyapporter des reacuteponses

12 Preacuteambule

Lameacutelioration de la qualiteacute des recommandations des utilisateurs est un vaste sujet auquelil est possible de reacutepondre de multiples faccedilons Il est dabord neacutecessaire de se demander ce quesignie ameacuteliorer la qualiteacute dans cette question Nous avons vu jusquagrave maintenant quun sys-tegraveme de recommandation mesure classiquement la qualiteacute de ses reacutesultats selon une meacutetrique lapreacutecision Cependant la satisfaction de lutilisateur nest pas forceacutement en accord avec cette me-sure comme cela a eacuteteacute illustreacute dans lexemple des appareils photographiques ougrave malgreacute un scorede preacutecision potentiellement tregraves haut lutilisateur peut ne pas ecirctre satisfait des propositionsdu systegraveme La satisfaction de lutilisateur nal peut ecirctre eacutevalueacutee de deux maniegraveres dieacuterentesPremiegraverement elle peut ecirctre mesureacutee directement via un systegraveme deacutevaluation des recommanda-tions ougrave lon demande par exemple agrave lutilisateur de noter la recommandation qui vient de luiecirctre proposeacutee Deuxiegravemement elle peut ecirctre mesureacutee indirectement en observant le comporte-ment de lutilisateur apregraves lui avoir fourni la recommandation [Shani and Gunawardana 2011]Si ce dernier consulte ou consomme la ressource recommandeacutee plutocirct quune autre il est raison-nable de faire lhypothegravese quil est satisfait par cette recommandation cest ce quon appellele taux dacception des recommandations dun systegraveme par rapport agrave un utilisateur Ces deuxmeacutethodes deacutevaluation permettent davoir une ideacutee de la correacutelation entre les meacutetriques internesdu systegraveme et la satisfaction reacuteelle de lutilisateur Il est plus simple de se baser sur des me-sures internes pour eacutevaluer un systegraveme comme la preacutecision plutocirct que sur des mesures externescomme par exemple la satisfaction reacuteelle de lutilisateur eacutetant donneacute que celle-ci demande demettre le systegraveme en ligne et de leacutevaluer apregraves un certain temps dutilisation Leacutevaluation surles seules performances du systegraveme est appeleacutee eacutevaluation hors ligne tandis que leacutevaluation enconditions reacuteelles est appeleacutee eacutevaluation en ligne [Shani and Gunawardana 2011] Leacutevaluationhors ligne mecircme si potentiellement moins apte agrave juger de la satisfaction de lutilisateur oretout de mecircme de nombreux avantages Elle permet premiegraverement de reacutealiser des expeacuteriencesrapidement et agrave bas coucircts eacutetant donneacute quil ny a pas besoin dattendre que les utilisateurs seservent du systegraveme Elle permet ensuite dutiliser des bases de donneacutees deacutejagrave creacuteeacutees permettantaux chercheurs de se concentrer uniquement sur la conception du systegraveme de recommandation(comme par exemple la tregraves connue base de donneacutees MovieLens qui rassemble un grand nombre

4

12 Preacuteambule

deacutevaluations de lms par des utilisateurs sous la forme de notes [Resnick et al 1994]) Ennelle permet de comparer les performances de dieacuterentes techniques de maniegravere objective en lesappliquant agrave un mecircme jeu de donneacutees Autrement dit leacutevaluation en ligne permet dobtenirdes reacutesultats provenant directement dutilisateurs dans un contexte reacuteel mais est tregraves couteuseen temps et en ressource Leacutevaluation hors ligne est quant agrave elle peu couteuse en temps et enressources et permet de reacutealiser autant dexpeacuterimentations que neacutecessaire Dans le contexte decette thegravese ougrave la question de la qualiteacute des recommandations est centrale ces deux meacutethodesdeacutevaluations possegravedent chacune des avantages et des inconveacutenients et seront discuteacutees dans lechapitre deacutedieacutee aux expeacuterimentations du manuscrit

Lameacutelioration de la qualiteacute des recommandations est un point crucial de nos jours tant lessystegravemes de recommandation sont omnipreacutesents dans notre monde Presque tous les grands sitescommerciaux sont deacutesormais doteacutes dun systegraveme de ce genre dans le but de garder lutilisateurplus longtemps sur leur site (Youtube 1 Deezer 2 Netix 3) de le satisfaire pour quil revienne agraveson prochain achat voire mecircme de susciter chez lui de nouvelles envies gracircce agrave la caracteacuteristiquede ces systegravemes decirctre force de proposition (Amazon 4) Les entreprises commerciales ne sontpas les seules agrave exploiter le potentiel des systegravemes de recommandations Les eacutecoles et universiteacutescommencent elles aussi agrave se doter de systegravemes de recommandation permettant aux eacutetudiants desauto-former en utilisant les vastes ressources eacuteducatives mises agrave disposition par celles-ci [Drachs-ler et al 2015] [Boyer et al 2015] De la mecircme maniegravere le domaine de lheacuteritage culturel etdu tourisme seacutequipe petit agrave petit dapplications smartphone permettant aux touristes perdusdevant les possibiliteacutes oertes par certains lieux de culture une aide automatiseacutee et personnaliseacutee[Borragraves et al 2014]

Devant lexplosion de la populariteacute des systegravemes de recommandation devant la complexiteacutegrandissante des ressources agrave recommander et devant laugmentation du nombre dutilisateurs deces systegravemes un constat a eacuteteacute fait proposer constamment des ressources similaires par rapportaux preacutefeacuterences de lutilisateur nest plus susant [McNee et al 2006] De nouvelles eacutetudes etexpeacuterimentations ont montreacute que proposer des recommandations selon dautres modaliteacutes que lapreacutecision pouvait ecirctre beacuteneacuteque Citons ici la mesure de diversiteacute qui a eacuteteacute deacutenie par [Smythand McClave 2001] comme eacutetant linverse de la similariteacute entre deux ressources Ainsi plus deuxressources sont similaires entre elles et moins elles seront diverses et vice versa Proposer desrecommandations plus diversieacutees permet deacuteviter aux utilisateurs de recevoir toujours les mecircmesrecommandations similaires agrave leurs preacutefeacuterences ou encore daugmenter le nombre des ressourcespouvant ecirctre recommandeacutees agrave un utilisateur (cette proportion entre ressources existantes et res-sources pouvant ecirctre recommandeacutees est appeleacutee la couverture dun systegraveme) Citons aussi lamesure de nouveauteacute qui fait quant agrave elle reacutefeacuterence agrave une ressource qui na jamais eacuteteacute vue parlutilisateur [Castells et al 2015] La nouveauteacute permet de remplir un des buts principaux dunsystegraveme de recommandation agrave savoir faire deacutecouvrir agrave lutilisateur des ressources quil nauraitpeut-ecirctre pas trouveacutees sans le systegraveme Il est cependant important de preacuteciser que lapport deces mesures dans les systegravemes de recommandation est aussi discuteacute Par exemple [Ekstrandet al 2014] ont montreacute que si la diversiteacute eacutetait correacuteleacutee positivement avec la satisfaction desutilisateurs ce neacutetait pas le cas de la nouveauteacute Les auteurs expliquent que cette correacutelationneacutegative pourrait ecirctre due au fait quun systegraveme proposant beaucoup de ressources nouvelles sans

1 https wwwyoutubecom2 https wwwdeezercom3 https wwwnetixcom4 https wwwamazoncom

5

Chapitre 1 Introduction

lien avec les preacutefeacuterences de lutilisateur serait mal vu par ce dernier Les auteurs suggegraverent ainside ne pas inteacutegrer de ressources issues de la meacutetrique de nouveauteacute aux nouveaux utilisateurspour leur laisser le temps davoir conance dans le systegraveme avant eacuteventuellement dinteacutegrer dela nouveauteacute dans les recommandations agrave mesure que lutilisateur shabitue au systegraveme

Il apparaicirct donc important dinclure plusieurs critegraveres dans le calcul les recommandationstout en eacutequilibrant ces dieacuterentes recommandations selon lutilisateur Cependant cet eacutequilibreest loin decirctre eacutevident agrave trouver alors que les informations disponibles sur les ressources et les uti-lisateurs sont souvent limiteacutees et que certaines de ces meacutetriques semblent opposeacutees les unes auxautres comme par exemple la similariteacute et la diversiteacute De plus cet eacutequilibre est non seulementameneacute agrave changer selon chaque utilisateur mais il peut aussi varier selon les attentes dun mecircmeutilisateur Ce dernier souhaitera par exemple deacutecouvrir les ressources les plus populaires dansun premier temps apregraves secirctre inscrit sur un site Apregraves avoir consulteacute ces ressources ce mecircmeutilisateur souhaitera peut-ecirctre deacutecouvrir des ressources moins populaires ou plus reacutecentes Il estdonc important de pouvoir modier limportance de chacun de ces facteurs agrave tout moment lorsde la recommandation

Reprenons maintenant le premier exemple de lintroduction sur les appareils photographiquesen proposant cette fois-ci une solution gracircce aux dieacuterentes meacutetriques expliciteacutees ci-dessus Unutilisateur arrive sur un site de vente en ligne et commence agrave consulter du mateacuteriel photogra-phique Le systegraveme neacutetant pas encore certain du but de lutilisateur ses recommandations sontrelativement diverses Apregraves un certain temps lutilisateur qui a aneacute ses recherches sur desappareils photographiques se voit proposer dautres types dappareils similaires agrave celui quil esten train de consulter dans le but de lui faire deacutecouvrir des alternatives possibles Le systegravemedeacutetecte nalement que lutilisateur est sur le point de se deacutecider Il propose alors une liste derecommandations plus diverses permettant agrave lutilisateur deectuer un dernier tour dhorizongeacuteneacuteral avant lachat et de conrmer son choix [Castagnos et al 2010] Apregraves secirctre deacutecideacute aveclaide du systegraveme lutilisateur achegravete son appareil Lors de ses prochaines connexions sur le sitede vente en ligne le systegraveme de recommandation ne proposera peu ou plus dappareils photo-graphiques Agrave la place lutilisateur se verra recommander du mateacuteriel photographique dont ilpourrait maintenant avoir lutiliteacute comme un eacutetui de protection ou encore dieacuterents objectifsLe systegraveme lui recommandera aussi de nouveaux produits quil na encore jamais consulteacute dansle but de lui faire deacutecouvrir la grande varieacuteteacute des produits vendus par le site comme par exempledu mateacuteriel informatique On peut voir ici linteacuterecirct dinteacutegrer de nouveaux facteurs comme ladiversiteacute dans la recommandation La variation du niveau de diversiteacute au cours du temps et enfonction du contexte permet dans cet exemple dameacuteliorer la qualiteacute de la recommandationnale en sadaptant plus nement aux besoins de lutilisateur et en laidant agrave des moments cleacutescomme juste avant ou apregraves son achat Lajout dun facteur comme la diversiteacute permet de plusdeacuteviter la scleacuterose des recommandations passeacute un certain temps cest-agrave-dire la recommandationdes mecircmes ressources en boucle agrave un utilisateur Ce pheacutenomegravene se produit ineacutevitablement dansun systegraveme baseacute uniquement sur la preacutecision ougrave les ressources recommandeacutees nissent toutes parecirctre deacutejagrave connues de lutilisateur ou trop similaires agrave ses goucircts Ce problegraveme peut en fait ecirctreconsideacutereacute comme du sur-apprentissage dans le sens ougrave le systegraveme est tellement speacutecialiseacute sur lespreacutefeacuterences de lutilisateur que quelques ressources obtiennent un tregraves haut score de preacutecisionet sont recommandeacutees en permanence Lintroduction de nouveaux facteurs permettant dautresmaniegraveres de calculer des recommandations ainsi que des variations dimportance entre ces fac-teurs au cours du temps peuvent reacuteduire ce problegraveme

6

12 Preacuteambule

De cet exemple la premiegravere probleacutematique scientique permettant de reacutepondre agrave la questiongeacuteneacuterale poseacutee agrave la n de lintroduction peut ecirctre deacutenie comme suit

SP1 Quels sont les facteurs agrave prendre en compte pour satisfaire les uti-lisateurs et comment adapter leur importance au cas par cas pour chaqueutilisateur

Comme nous lavons eacutevoqueacute preacuteceacutedemment les systegravemes de recommandation se sont gran-dement deacutemocratiseacutes et existent deacutesormais dans la plupart des domaines ougrave se trouvent denombreuses ressources mises agrave disposition de nombreux utilisateurs et ce quelque soit le typede ces ressources Classiquement un systegraveme de recommandation va calculer par divers moyensles ressources que lutilisateur pourraient le plus appreacutecier Le reacutesultat de cette opeacuteration est biensouvent une valeur reacuteelle dutiliteacute ou dinteacuterecirct comprise dans lintervalle [0 1] associeacutee agrave chaqueressource ougrave 1 correspond agrave la preacutediction selon laquelle lutilisateur devrait tregraves fortement appreacute-cier la ressource en question et inversement Ainsi les n ressources ayant les plus hautes valeurssont recommandeacutees agrave lutilisateur Certains domaines comme le-commerce se satisfont tregraves biende recommandations proposeacutees de cette maniegravere sous forme de listes Cependant dautres do-maines comme le-eacuteducation ou le tourisme beacuteneacutecieraient de recommandations proposeacutees auxutilisateurs sous la forme dune seacutequence Nous deacutenissons ici une seacutequence comme une suiteordonneacutee de ressources posseacutedant un deacutebut une n un but et eacuteventuellement une ou plusieurscontrainte(s) agrave respecter lors de sa creacuteation Cette deacutenition implique entre autres de deacutenir ceque signie la notion dordre dans la seacutequence Un ordre correspond agrave un agencement particulierde ressources permettant datteindre le but rechercheacute de maniegravere optimiseacutee Reprenons main-tenant le deuxiegraveme exemple de lintroduction sur le site de-eacuteducation en ajoutant cette fois-cila notion de seacutequence an dillustrer son inteacuterecirct Un utilisateur sest inscrit reacutecemment sur unsite proposant des cours en ligne car il souhaite apprendre la programmation en Java Cepen-dant et avant de commencer le site lui propose de fournir quelques informations sur son objectifeacuteducatif Ainsi lutilisateur explicite lobjectif quil souhaite atteindre (apprendre les bases deJava) ainsi que le temps dont il dispose (exprimeacute par exemple ici sous la forme dun nombre nde ressources eacuteducatives voulues pour atteindre lobjectif) Avec ces informations le systegraveme derecommandation du site va calculer parmi toutes les ressources eacuteducatives disponibles lesquellescorrespondent aux besoins de lutilisateur Le niveau de diculteacute de ces ressources seacutelectionneacuteesest ensuite calculeacute par le systegraveme gracircce agrave leurs caracteacuteristiques Enn le systegraveme construit uneseacutequence de taille n ougrave la place de chaque ressource eacuteducative deacutepend de son niveau de diculteacutede maniegravere agrave ce que lutilisateur deacutebute avec la ressource la moins complexe puis progresse avecdes ressources abordant des notions de plus en plus avanceacutees La seacutequence creacuteeacutee va donc luipermettre datteindre son objectif gracircce agrave des cours agrave la diculteacute croissante tout en respectantla contrainte de temps imposeacutee

Avec cet exemple nous pouvons maintenant expliciter les deuxiegraveme et troisiegraveme probleacutema-tiques scientiques

SP2 Connaissant les facteurs humains agrave prendre en compte (SP1) com-ment passer dune recommandation unitaire agrave une seacutequence de recomman-dations

7

Chapitre 1 Introduction

SP3 Connaissant les facteurs humains agrave prendre en compte (SP1) com-ment les combiner dans un mecircme modegravele permettant de faire varier leurimportance les uns par rapport aux autres agrave tout moment

Le domaine de la recommandation est en plein essor et mecircme si des problegravemes subsistentencore actuellement des solutions existent pour y reacutepondre comme lont illustreacute les exemples ci-dessus La compreacutehension des besoins des utilisateurs la prise en consideacuteration de la dimensiontemporelle et dobjectifs multiples et parfois antagonistes dans le processus de recommandationsont deacutesormais les objectifs principaux du domaine de la recommandation et cest au sein dece mouvement que cette thegravese sinscrit De plus les nouveaux domaines applicatifs souvrantagrave la recommandation (eg le-eacuteducation le tourisme ) sont agrave la fois une chance et un deacute une chance car il devient possible dassister lutilisateur dans un panel de plus en plus grand desituations un deacute dans le sens ougrave les modegraveles doivent ecirctre assez geacuteneacuteriques pour sadapter agravecette grande varieacuteteacute de situations possibles Une derniegravere probleacutematique scientique est toutefoisneacutecessaire dans le cadre de cette thegravese pour compleacuteter ce tour dhorizon Il est en eet neacutecessairede pouvoir quantier agrave quel point SP1 et SP2 ameacuteliorent la qualiteacute des recommandations Nousavons vu dans les exemples preacuteceacutedents que cette qualiteacute neacutetait pas une notion simple agrave mesurermais il est pourtant neacutecessaire de satteler agrave ce problegraveme pour quantier les performances dunmodegravele La 3egraveme et derniegravere probleacutematique de cette thegravese peut donc ecirctre exprimeacutee ainsi

SP4 Comment eacutevaluer les seacutequences produites en SP2 et SP3

Leacutevaluation des recommandations est au cdivideur des nouveaux deacutes eacutevoqueacutes preacuteceacutedemment Ledomaine de la recommandation est intimement lieacute agrave lecirctre humain et il est important de ne plusuniquement se concentrer sur une seule mesure comme la preacutecision Lecirctre humain est complexedans ses besoins et leacutevaluation des recommandations doit reeacuteter cette complexiteacute

13 Contributions

Dans cette thegravese une reacuteponse agrave eacuteteacute apporteacutee agrave chacune des probleacutematiques scientiques eacutenon-ceacutees ci-dessus Ces contributions scientique ont fait lobjet de trois publications

Workshop international SMAP 5 Walk the line Toward an ecient user model

for recommendations in museums [Osche et al 2016] Confeacuterence internationale ECIR 6 AntRS Recommending lists through a multi-

objective ant colony system [Osche et al 2019a] Workshop international ALA 7 organiseacute avec la confeacuterence internationale AAMAS 8

From Music to Museum Applications of Multi-Objective Ant Colony Sys-

tems to Real World Problems [Osche et al 2019b]

Dans la suite de cette section un aperccedilu plus en deacutetail des reacuteponses apporteacutees aux probleacute-matique scientique est donneacute

5 SMAP International Workshop on Semantic Media Adaptation and Personalization

6 ECIR European Conference on Information Retrieval http ecir2019org7 ALA Adaptive and Learning Agents

8 AAMAS International Conference on Autonomous Agents and Multiagent Systems

8

13 Contributions

131 SP1 les facteurs agrave prendre en compte pour satisfaire les utilisateurs

Pour reacutepondre agrave la premiegravere probleacutematique scientique SP1 nous avons seacutelectionneacute un en-semble de quatre critegraveres deacutevaluation repreacutesentant au mieux les besoins de lutilisateur Cescritegraveres ont eacuteteacute choisis car ils apparaissent dans la litteacuterature scientique comme eacutetant lieacutes agravela satisfaction nale de lutilisateur Ils repreacutesentent un panel inteacuteressant de facteurs humainsimportants pour les utilisateurs mais il est important de noter que ce choix nest pas exhaustifComme nous lavons mentionneacute le nombre de facteurs humains rentrant en compte dans la prisede deacutecision est potentiellement inni et varie en fonction de lutilisateur Nous avons donc choisices quatre critegraveres car ils sont les plus eacutetudieacutes dans la litteacuterature mais le but de cette thegravese estde pouvoir inteacutegrer de nouveaux critegraveres de faire varier leur importance si neacutecessaire et de lestraiter comme un problegraveme doptimisation multi-critegraveres Ces quatre critegraveres nous permettentde nous situer par rapport aux travaux existants de la litteacuterature tout en eacutetablissant un modegravelegeacuteneacuterique capable de sadapter agrave de multiples besoins Voici ces quatre critegraveres

1 La similariteacute garantissant agrave lutilisateur des recommandations similaires aux ressourcesquil appreacutecie deacutejagrave

2 La diversiteacute permettant dorir de la varieacuteteacute dans les recommandations

3 La nouveauteacute proposant agrave lutilisateur des ressources quil ne connaicirct et quil nauraitpeut-ecirctre jamais trouveacute lui-mecircme

4 Les preacutefeacuterences orant agrave lutilisateur la possibiliteacute de revoir les ressources quil a deacutejagraveaimeacute par le passeacute

132 SP2 la conception de seacutequences de recommandations en accord avec

les facteurs seacutelectionneacutes

La notion de seacutequence est centrale pour comprendre son inteacuterecirct dans le paysage actuel dessystegravemes de recommandation ainsi que pour ecirctre capable den geacuteneacuterer Dans ce travail nousavons proposeacute une meacutethode permettant de garantir des transitions optimales entre ressourcesau sein dune seacutequence Nous avons ensuite mis en pratique ces contributions dans un jeu dedonneacutees existant provenant de Deezer un site deacutecoute de musique en ligne Ce jeu de donneacuteescorrespond agrave un mois deacutecoutes de titres par plusieurs milliers dutilisateurs et possegravede desinformations sur les titres ainsi que sur les utilisateurs Gracircce agrave ce jeu de donneacutees nous avonspu extraire des seacutequences deacutecoutes et nous avons utiliseacute ces seacutequences reacuteelles comme eacutevaluationpour notre systegraveme Nous avons enn creacuteeacute un modegravele permettant de geacuteneacuterer des seacutequences de lataille voulue posseacutedant un point de deacutepart et darriveacutee deacutenis

133 SP3 et SP4 la creacuteation dun modegravele geacuteneacuterique prenant en compte

plusieurs meacutetriques et produisant des seacutequences

Apregraves avoir deacuteni les meacutetriques agrave utiliser la maniegravere de les calculer et apregraves avoir deacuteni lanotion de seacutequence et la maniegravere de les construire nous avons deacuteveloppeacute un modegravele reacuteunissantlensemble de ces caracteacuteristiques Pour cela nous nous sommes inspireacutes de solutions deacuteveloppeacuteespendant des millions danneacutees par la seacutelection naturelle pour reacutesoudre des problegravemes dexplora-tion et doptimisation de chemins dans la nature Il existe en eet tout un domaine de recherchedeacutedieacute agrave la modeacutelisation informatique de systegravemes vivants complexes et agrave lapplication de cesmodegraveles agrave des problegravemes complexes humains les Systegravemes Multi-Agents [Ferber and Weiss1999] Nous avons utiliseacute lun de ces systegravemes inspireacute des colonies de fourmis pour reacutepondre agrave

9

Chapitre 1 Introduction

notre probleacutematique [Dorigo et al 1996] [Dorigo et al 2006] Dans la nature il a eacuteteacute observeacute queles fourmis empruntaient la plupart du temps le plus court chemin possible entre leur fourmiliegravereet une source de nourriture Une fourmi prise seacutepareacutement na pas des capaciteacutes cognitives tregravesdeacuteveloppeacutees avec ses quelques centaines de milliers de neurones seulement Cependant linter-action entre toutes les fourmis de la fourmiliegravere produit ce quon appelle un eet deacutemergenceLinteraction danimaux simples (ou dagents si lon parle dun systegraveme informatique) provoqueleacutemergence dune intelligence collective capable de reacutesoudre des problegravemes dont la complexiteacute deacute-passe la somme des capaciteacutes des individus [Bonabeau et al 1999] Cest bien ce pheacutenomegravene quiest agrave ldivideuvre lors de loptimisation de la distance dun chemin par toutes les fourmis dune four-miliegravere Nous reviendrons plus en deacutetail sur lensemble des meacutecanismes permettant leacutemergencede cette intelligence collective dans ce manuscrit An de reacutepondre agrave notre probleacutematique nousavons deacuteveloppeacute un modegravele ougrave une multitude dagents tregraves simples (correspondant aux fourmis)sont deacuteployeacutes dans un graphe ougrave les sommets repreacutesentent les ressources dun domaine applicatifet ougrave les arecirctes repreacutesentent les liens entre ces ressources (correspondant agrave lenvironnement agraveparcourir pour les fourmis) An dinteacutegrer les quatre meacutetriques discuteacutees ci-dessus nous avonscreacuteeacute dieacuterentes colonies posseacutedant chacune leurs agents speacutecialiseacutes dans loptimisation dune desmeacutetriques De par le pheacutenomegravene dintelligence collective les agents produisent des seacutequencesoptimiseacutees dans le graphe pouvant ecirctre recommandeacutees agrave lutilisateur Cette approche apporteainsi des solutions aux problegravemes souleveacutes par les probleacutematiques scientiques sus-mentionneacutes

Nous sommes capables de prendre en compte les dieacuterentes meacutetriques expliciteacutees dans unseul et mecircme modegravele De plus nous produisons des solutions repreacutesentant un compromisentre des objectifs parfois divergents entre eux (similariteacute et diversiteacute)

Dans la nature les fourmis creacuteent un chemin entre leur fourmiliegravere et la source de nourri-ture Nous utilisons cette aptitude inheacuterente an de creacuteer des seacutequences entre une ressourcede deacutepart (la fourmiliegravere) et une ressource darriveacutee (la nourriture)

Ladaptation aux changements de lenvironnement est rapide (nouvel utilisateur nouvelleressource suppression dune ressource etc) De la mecircme maniegravere que dans la nature lesfourmis sont capables de retrouver un autre chemin optimiseacute si le premier venait agrave ecirctrebloqueacute par une branche venant de tomber par exemple

Notre modegravele est souple car il permet de modier le poids de chaque meacutetrique dans laseacutequence nale permettant de sadapter agrave chaque utilisateur

Il est possible dajouter ou denlever des colonies agrave la voleacutee dans le systegraveme permettantde sadapter rapidement agrave dieacuterents domaines applicatifs et agrave dieacuterents objectifs

14 Plan de la thegravese

La suite de ce manuscrit se preacutesente ainsi dans le chapitre 2 nous preacutesenterons les travaux dela litteacuterature portant sur les dieacuterents facteurs humains utiliseacutes dans les systegravemes de recomman-dation les approches existantes de recommandations en seacutequences et les systegravemes multi-agentsDans le chapitre 3 nous preacutesenterons notre modegravele et son fonctionnement en deacutetail Ensuitenous preacutesenterons les reacutesultats obtenus par ce modegravele dans le domaine applicatif de leacutecoute demusique en ligne dans le chapitre 4 Enn nous conclurons et discuterons des perspectives de cetravail dans le chapitre 5

10

Chapitre 2

Eacutetat de lart

Sommaire

21 Les systegravemes de recommandation 12

211 Le ltrage par contenu 12

212 Le ltrage collaboratif 13

213 Les actions des utilisateurs 13

214 Discussion et limites des systegravemes classiques 14

22 Les facteurs humains agrave prendre en compte dans la recommandation 15

221 La similariteacute 17

222 La diversiteacute 19

223 La nouveauteacute 20

224 Discussion 21

23 La recommandation en seacutequence 22

231 Deacutenition et geacuteneacuteraliteacutes sur les seacutequences 22

232 Domaines dapplication des modegraveles seacutequentiels 26

233 Discussion 30

24 Les systegravemes multi-agents 31

241 Deacutenition 31

242 Preacutesentation de deux systegravemes multi-agents reacuteactifs 33

243 Ant Colony System 38

244 Discussion sur le modegravele ACS 40

25 Utilisation et eacutevolution reacutecentes des algorithmes de colonies de four-

mis 43

251 Les algorithmes de colonies de fourmis dans les systegravemes de recomman-

dation 43

252 Les algorithmes de colonies de fourmis multi-objectifs 47

253 Discussion sur lutilisation de loptimum de Pareto 50

26 Discussion geacuteneacuterale 50

11

Chapitre 2 Eacutetat de lart

Dans cet eacutetat de lart nous allons tout dabord nous pencher sur le fonctionnement dessystegravemes de recommandation classiques ainsi que sur leurs limites Nous allons ensuite eacutetudierquelques reacuteponses agrave ces limites proposeacutees par la litteacuterature et discuter des ameacuteliorations possibles

21 Les systegravemes de recommandation

Les systegravemes de recommandation ont pour but principal de proposer aux utilisateurs desressources adapteacutees agrave leurs attentes Une ressource peut ecirctre un document une page web unemusique un lm un livre un objet un cours etc Pour eectuer une recommandation une hy-pothegravese simple a eacuteteacute exploiteacutee par les premiers systegravemes les preacutefeacuterences passeacutees dun utilisateurpeuvent ecirctre utiliseacutees pour preacutedire les preacutefeacuterences futures de ce mecircme utilisateur Cette hypothegravesesest deacuteclineacutee dans les deux approches principales des systegravemes de recommandation que sont leltrage par contenu [Belkin and Croft 1992 Lops et al 2011] et le ltrage collaboratif [Resnicket al 1994] La principale dieacuterence entre ces deux approches repose sur lexploitation de dieacute-rents types des donneacutees le ltrage par contenu utilise les informations descriptives caracteacuterisantles utilisateurs et les ressources du systegraveme tandis que le ltrage collaboratif exploite uniquementles interactions entre utilisateurs et ressources comme les consultations ou les votes [Aggarwalet al 2016] Ces deux familles ont par la suite donneacute naissance a de nombreuses techniquesque nous naborderons pas ici Toutes peuvent cependant ecirctre rapporteacutees agrave lune ou lautre deces familles ou agrave une combinaison des deux Dans la suite de cette section nous reviendronsrapidement sur ces deux familles qui ont marqueacute les deacutebuts des systegravemes de recommandationet qui regroupent agrave elles seules un grand nombre darticles de la litteacuterature du domaine Cetteintroduction aux systegravemes de recommandation servira aussi agrave preacutesenter quelques concepts-cleacuteslieacutes agrave ces systegravemes

211 Le ltrage par contenu

Le ltrage par contenu est une des deux approches majeures dans les systegravemes de recomman-dation [Belkin and Croft 1992 Lops et al 2011] Le but dun systegraveme de ltrage par contenu estde proposer des recommandations agrave lutilisateur uniquement en fonction des caracteacuteristiques desressources appreacutecieacutees Ce genre de systegraveme va donc enregistrer les actions de lutilisateur sur lesressources quil a consulteacutees dans le but de trouver dautres ressources quil pourrait appreacutecierCette meacutethode de fonctionnement implique deux principes

1 Le systegraveme doit pouvoir enregistrer les actions de lutilisateur dans le systegraveme 9 Le sys-tegraveme doit ensuite pouvoir interpreacuteter ces dieacuterentes actions an decirctre capable deacutevalueragrave quel point un utilisateur appreacutecie la ressource sur laquelle il a eectueacute des actions Nousdiscuterons de ces actions et des maniegraveres de les interpreacuteter plus en deacutetail dans la suitede cette section

2 Le systegraveme doit pouvoir comparer des ressources entre elles an de deacuteterminer lesquellespourraient ecirctre appreacutecieacutees par lutilisateur en fonction de son historique de consultationsPour reacutealiser cela il est neacutecessaire que les ressources soient deacutecrites par ce que lon appelledes meacuteta-donneacutees cest-agrave-dire des donneacutees deacutecrivant dautres donneacutees ou comme ici desdonneacutees deacutecrivant des ressources Il est dusage de deacutenir ou dutiliser des standards pour

9 Des exemples dactions possibles consulter une ressource donner une note agrave une ressource acheter uneressource bannir une ressource pour ne plus la voir placer une ressource dans ses favoris etc

12

21 Les systegravemes de recommandation

les meacuteta-donneacutees an de deacutecrire toutes les ressources de la mecircme maniegravere et eacuteventuelle-ment de pouvoir partager ou utiliser des bases de donneacutees utilisant les mecircmes standardsOn peut par exemple citer le Learning Object Metadata qui est un standard utiliseacute ene-eacuteducation pour deacutecrire des ressources eacuteducatives [RISK 2002] Des domaines commele web seacutemantique ou les systegravemes agrave base dontologie ont comme but de structurer cesdonneacutees descriptives lorsquelles ne le sont initialement pas

Le ltrage par contenu a lavantage de pouvoir fournir des recommandations agrave un utilisateurmecircme sil est le seul agrave utiliser le systegraveme tant que ce dernier possegravede des informations sur lesressources consulteacutees Cependant la qualiteacute des recommandations deacutependra directement de laqualiteacute de ces informations Si les actions de lutilisateur ou les descriptions de ressources sontinsusantes un systegraveme de ltrage par contenu ne sera pas capable de proposer de recommanda-tions de grande qualiteacute Une autre limite majeure de ce genre de systegraveme reacuteside dans le manquede nouveauteacute En eet apregraves un certain temps les recommandations proposeacutees par le systegravemeont un risque de scleacuterose provoqueacute par un manque de nouvelles informations dans le systegraveme

212 Le ltrage collaboratif

La deuxiegraveme approche majeure des systegravemes de recommandation est donc le ltrage colla-boratif [Resnick et al 1994] Cette technique utilise les preacutefeacuterences des autres utilisateurs dusystegraveme sur les ressources pour estimer les preacutefeacuterences de lutilisateur Lhypothegravese sous-jacentea cette meacutethode est quil est possible de preacutedire les preacutefeacuterences dun utilisateur en eacutetudiant ce quedautres utilisateurs similaires en termes de preacutefeacuterences ont aimeacute Si beaucoup de ces utilisateurssimilaires ont appreacutecieacute une ressource alors il est probable que lutilisateur appreacutecie aussi cetteressource Cette meacutethode repose ici aussi sur deux principes

1 Comme pour le ltrage par contenu il faut dabord pouvoir collecter les actions de nom-breux utilisateurs sur les ressources du systegraveme an den deacuteterminer leurs preacutefeacuterences

2 Le systegraveme doit ensuite deacuteterminer les utilisateurs les plus similaires agrave lutilisateur enterme de preacutefeacuterences avec pour but nal de lui recommander des ressources quil na pasencore consulteacute et qui sont appreacutecieacutees par ces utilisateurs similaires

Le ltrage collaboratif permet par rapport au ltrage par contenu de proposer des recom-mandations agrave lutilisateur sans forceacutement connaicirctre le contenu des ressources recommandeacutees Eneet le systegraveme ne manipule que des preacutefeacuterences geacuteneacuterales souvent repreacutesenteacutees numeacuteriquementpar une note associeacutee agrave une ressource et agrave un utilisateur En dautres termes le ltrage col-laboratif sinteacuteresse agrave lusage qui est fait des ressources et non aux ressources en elles-mecircmesUne fois ces preacutefeacuterences eacutetablies ce genre de systegraveme peut donc sadapter agrave des domaines ougraveles ressources sont dieacuterentes Cependant il est aussi neacutecessaire davoir agrave disposition un grandnombre dutilisateurs ainsi que leurs preacutefeacuterences an de pouvoir utiliser ce genre de systegravemecorrectement

213 Les actions des utilisateurs

Comme nous lavons deacutecrit plus haut peu importe le type de systegraveme de recommandationutiliseacute il est neacutecessaire de reacutecolter les actions des utilisateurs an dobtenir une eacutevaluation desressources quils ont consulteacutees Cette eacutevaluation prend la plupart du temps la forme dune noter entiegravere variant de 1 agrave 5 ou dune valeur continue r isin [0 1] ougrave dans les deux cas une preacutefeacuterence

13

Chapitre 2 Eacutetat de lart

marqueacutee correspond agrave une valeur haute et inversement Dune maniegravere geacuteneacuterale on nommeretours les informations reacutecupeacutereacutees par un systegraveme sur un utilisateur permettant daboutir agravecette note Dans les systegravemes de recommandation on peut distinguer deux types de retours le retour explicite et le retour implicite Le retour explicite est le plus simple des deux puisquilcorrespond agrave la situation ougrave lutilisateur fournit naturellement de lui-mecircme la note associeacutee agrave uneressource quil a consulteacutee Cette maniegravere de proceacuteder est courante dans le-commerce ou dansle divertissement ougrave les utilisateurs peuvent geacuteneacuteralement noter de 1 agrave 5 le produit quils ontacheteacute ou encore le lm quils ont vu Cette meacutethode permet dacceacuteder agrave leacutevaluation reacuteelle delutilisateur et agrave ses preacutefeacuterences orant de maniegravere directe des donneacutees de haute qualiteacute [Korenet al 2009] Agrave linverse le retour implicite repreacutesente les traces laisseacutees par lutilisateur lors desa preacutesence dans le systegraveme Ces traces ne sont pas directement des eacutevaluations ou des notes maisrepreacutesentent bien les dieacuterentes possibiliteacutes dactions quore un systegraveme agrave ses utilisateurs Cesactions diegraverent donc selon le domaine dapplication du systegraveme Pour un site web de-commerceles actions pourront ecirctre la consultation dune page la consultation dune che produit la misedun produit dans le panier ou encore lachat dun produit Pour un site web deacutecoute de musiqueles actions pourront ecirctre leacutecoute dune musique en entier larrecirct de leacutecoute dune musique avantla n la consultation de la page dun artiste etc On voit bien ici que les actions possiblessont deacutependantes du domaine mais aussi que toutes les actions nont pas la mecircme importanceni la mecircme signication On peut en eet supposer quun utilisateur appreacuteciera davantage unproduit sil lachegravete que sil consulte seulement sa page On retrouve cette distinction dans [Oardet al 1998] ougrave les auteurs deacutenissent trois cateacutegories permettant de grouper les actions de mecircmeimportance ensemble (1 consultation de la ressource 2 conservation de la ressource 3 partagede la ressource) On peut aussi citer [Castagnos 2008] qui dune maniegravere plus geacuteneacuterale proposeune meacutethode permettant de calculer linteacuterecirct preacutesumeacute dun utilisateur pour une ressource selonles types dactions eectueacutees par lutilisateur et leurs importances respectives An de conclurecette section il est important de preacuteciser que mecircme si le retour explicite semble plus deacutesirablepour les systegravemes de recommandation il a eacuteteacute montreacute que ces deux types de retours apportentdes informations dieacuterentes et quil peut justement ecirctre inteacuteressant de les prendre tous les deuxen compte [Jawaheer et al 2010]

214 Discussion et limites des systegravemes classiques

Dans les deux approches de recommandation preacutesenteacutees ci-dessus le problegraveme et la solutionsont fondamentalement les mecircmes Le problegraveme peut se formuler ainsi comment estimer linteacuterecirctr qua un utilisateur u sur une ressource i encore non consulteacutee en se basant sur les connaissancesincomplegravetes repreacutesenteacutees par le prol de lutilisateur u Le prol de lutilisateur est incompletcar les informations sur ses preacutefeacuterences proviennent uniquement des interactions que ce dernier aeu avec le systegraveme Autrement dit il nest pas possible de connaicirctre les facteurs ayant abouti auxactions de lutilisateur puisque ces derniegraveres sont le fruit des meacutecanismes de raisonnement internede lutilisateur Il nest par exemple pas possible de savoir reacuteellement pourquoi un utilisateur adonneacute la note de 5 sur 5 agrave un lm Est-ce parce quil considegravere que cest le meilleur lm quil a vude sa vie et quil aimerait deacutecouvrir plus de lms de ce genre Ou bien est-ce parce que cest unlm quil a vu dans un contexte particulier et que mecircme sil la beaucoup aimeacute il ne souhaiteraitpas revoir des lms similaires aujourdhui Il existe ainsi probablement une multitude de facteursjouant dans les actions que nous eectuons et il nest pas possible de tous les appreacutehender Devantce constat la solution adopteacutee par les deux approches est la mecircme se baser sur les preacutefeacuterencesconnues de lutilisateur pour extrapoler ses preacutefeacuterences futures potentielles Cependant et commenous lavons vu dans lexemple de lintroduction sur les appareils photo il est aiseacute de concevoir

14

22 Les facteurs humains agrave prendre en compte dans la recommandation

des situations ougrave les preacutefeacuterences et actions passeacutees dun utilisateur ne sont pas forceacutement lesmeilleurs indicateurs de ses besoins actuels ou futurs

22 Les facteurs humains agrave prendre en compte dans la recom-

mandation

Comme nous lavons vu dans la section preacuteceacutedente la performance des premiers systegravemes derecommandation a eacuteteacute mesureacutee avec les outils du domaine de la recherche dinformation Parmiceux-ci on peut citer la preacutecision et le rappel qui sont deux mesures permettant de jauger la per-tinence des ressources seacutelectionneacutees en les comparant avec lensemble des ressources disponiblesLa Figure 21 preacutesente bien la maniegravere dont ces deux mesures sont calculeacutees 10

Figure 21 Preacutesentation scheacutematiseacutee du calcul de la preacutecision et du rappel en fonction desressources trouveacutees par rapport agrave lensemble des ressources disponibles (creacutedit image Datamok UserWalber)

Plusieurs raisons peuvent expliquer pourquoi les systegravemes de recommandations ont initiale-ment emprunteacute des techniques venant de la recherche dinformation et en voici trois parmi lesplus eacutevidentes Premiegraverement les systegravemes de recommandation sont agrave la croiseacutee de plusieurs

10 httpsfrwikipediaorgwikiPreacutecision_et_rappel

15

Chapitre 2 Eacutetat de lart

disciplines parmi lesquelles entre autres la recherche dinformation [Adomavicius and Tuzhilin2005] Ce domaine a beaucoup utiliseacute et utilise toujours les mesures de preacutecision et de rappel[Salton 1989] il est donc naturel que les premiers systegravemes de recommandation aient utiliseacuteces mesures de performance Deuxiegravemement tregraves tocirct dans le domaine des systegravemes de recom-mandation des corpus de donneacutees ont eacuteteacute mis agrave disposition de tous tel que MovieLens 11 gracircceagrave GroupLens [Resnick et al 1994] Ces corpus de donneacutees ont beaucoup aideacute le domaine enpermettant agrave tous les chercheurs de mesurer la performance de leurs algorithmes en les com-parant avec les reacutesultats obtenus par dautres eacutetudes de la litteacuterature sur les mecircmes donneacuteesLa populariteacute toujours haute du corpus MovieLens depuis maintenant 25 ans illustre linteacuterecirctscientique de partager des donneacutees initiales Cependant lutilisation principale des meacutetriquesde preacutecision pour eacutevaluer la performance des premiers systegravemes de recommandation a meacutecani-quement pousseacute les autres auteurs voulant comparer leurs algorithmes agrave utiliser eux aussi cesmecircmes meacutetriques rareacuteant potentiellement le travail sur dautres meacutetriques Troisiegravemement lemesure de la performance des algorithmes en fonction de la preacutecision megravene forceacutement agrave la creacutea-tion dalgorithmes de plus en plus performants dans ce domaine Les chercheurs sont en eet plusenclins agrave deacutevelopper des algorithmes optimisant la mesure de preacutecision si la performance de lamajoriteacute des algorithmes existants est mesureacutee via cette meacutetrique Ce point mecircme sil est lieacute aupreacuteceacutedent nest pas agrave neacutegliger et explique en partie la concentration des premiers systegravemes surla meacutetrique de preacutecision La recherche dans le domaine de linformatique est compeacutetitive et lesrevues scientiques accepteront plus facilement de publier un article montrant quun algorithmeobtient de meilleures performances sur une meacutetrique bien connue plutocirct quune eacutetude reposantsur dautres meacutetriques moins communes

Apregraves ces explications donnant quelques raisons systeacutemiques de lutilisation de la preacutecisioncomme mesure deacutevaluation il est neacutecessaire de nuancer ce constat La preacutecision a beaucoup eacuteteacuteutiliseacutee car avant toute chose elle est au cdivideur des systegravemes de recommandation et doit doncecirctre consideacutereacutee par tous ces systegravemes Le but de lutilisation de la preacutecision est dobtenir desrecommandations proches de ce que lutilisateur a deacutejagrave consulteacute et donc appreacutecie deacutejagrave Il est im-portant de preacuteciser aussi ici que malgreacute les critiques faites dans le paragraphe preacuteceacutedent sur cettemesure il est indispensable de la conserver et de lutiliser lors du processus de recommandationUn utilisateur souhaite avant tout se voir proposer des ressources pertinentes et il convient pourun systegraveme dutiliser la preacutecision pour arriver agrave cet objectif Il est cependant neacutecessaire de ne pasuniquement consideacuterer la preacutecision pour produire de bonnes recommandations et nous allons levoir dans la suite de cette section

Nous venons de voir quelques-unes des raisons de lomnipreacutesence de leacutevaluation par la preacuteci-sion au deacutebut des systegravemes de recommandation Nous allons maintenant eacutetudier les conseacutequencesque la sur-utilisation de la preacutecision a pu avoir sur les utilisateurs en se basant agrave la fois sur lalitteacuterature et sur des constatations empiriques Pour comprendre les limites de cette meacutetrique ilest tout dabord neacutecessaire de sinteacuteresser agrave ce que repreacutesente une recommandation preacutecise pourlutilisateur nal Nous lavons vu preacuteceacutedemment plus un modegravele sapproche des preacutefeacuterences deacutejagraveconnues dun utilisateur et plus il obtiendra de bonnes performances dans les meacutetriques mesurantla preacutecision Dans la pratique cela se traduit par le systegraveme proposant agrave lutilisateur nal desressources souvent deacutejagrave connues de celui-ci ou a minima des ressources tregraves proches de ce quilaime deacutejagrave [McNee et al 2006] Un utilisateur dun site de recommandation de lms indiquantquil a aimeacute le premier lm Star Wars se verra probablement recommander une liste de tous les

11 httpsgrouplensorgdatasetsmovielens

16

22 Les facteurs humains agrave prendre en compte dans la recommandation

lms Star Wars suivants Intuitivement on voit bien que ces recommandations ne seront proba-blement pas satisfaisantes pour lutilisateur bien queacutetant les plus preacutecises possibles par rapportagrave ses preacutefeacuterences Ces lms sont anciens connus et il ny a donc que tregraves peu de chances pour quelutilisateur nen ait pas deacutejagrave connaissance On peut imaginer que lutilisateur aurait souhaiteacuteque le systegraveme lui propose des lms de science-ction ou de guerre spatiale reacutecents ou du moinsquil ne connaissait pas encore Plus que de ne pas ecirctre utiles ce genre de recommandations peutmecircme deacutegrader linteacuterecirct et la conance que lutilisateur porte au systegraveme En eet un utilisa-teur recevant beaucoup de recommandations inutiles ou deacutejagrave connues de la part dun systegravemenira par ne plus lui accorder de limportance Cet argument peut ecirctre rapprocheacute du TechnologyAcceptance Model de Fred Davis sur la maniegravere dont les utilisateurs appreacutehendent une technolo-gie [Davis 1989] et notamment sur la notion dutiliteacute perccedilue qui fait reacutefeacuterence agrave la tendancequont les personnes agrave utiliser une technologie si cela leur permet de reacutealiser plus ecacementleur tacircche en cours (comme par exemple trouver un bon lm ou deacutecouvrir une nouvelle musique)Pour conclure il semble eacutevident que de nouvelles maniegraveres de concevoir et deacutevaluer les systegravemesde recommandation sont neacutecessaires Dans la suite de cette section nous allons voir commentlinteacutegration de facteurs humains suppleacutementaires dans le processus de recommandation et lamise en place de nouvelles maniegraveres deacutevaluer la qualiteacute des recommandations nales doiventpermettre de palier les problegravemes eacutevoqueacutes preacuteceacutedemment

221 La similariteacute

Comme nous lavons vu dans la section preacuteceacutedente limportance de la similariteacute dans lessystegravemes de recommandation est eacutevidente tant ces derniers ont longtemps eu comme but principalde proposer des ressources proches autrement dit similaires de ce quappreacuteciait deacutejagrave lutilisateurNous avons vu que la preacutecision a beaucoup eacuteteacute utiliseacutee pour eacutevaluer ces systegravemes mais il eacutetaitaussi neacutecessaire de deacuteterminer agrave quel point des ressources etou des utilisateurs eacutetaient prochesles uns des autres En eet les approches les plus utiliseacutees comme le ltrage collaboratif ou leltrage par contenu neacutecessitent souvent de deacuteterminer un ensemble dutilisateurs ou un ensemblede ressources proches des goucircts de lutilisateur Pour ce faire ces systegravemes vont utiliser desmeacutetriques permettant de juger la similariteacute de deux variables entre elles On retrouve parmi cesmeacutetriques le coecient de correacutelation de Pearson qui calcule la correacutelation lineacuteaire r entre deuxvariables agrave laide de leur covariance Cette correacutelation peut ecirctre appliqueacutee agrave des prols utilisateurs[Shardanand and Maes 1995] posseacutedant des eacutevaluations communes sur des ressources LEacutequation21 deacutecrit son calcul pour deux prols utilisateurs ux et uy

ruxuy =

sumn1 (uxi minus ux)times (uyi minus uy)radicsumn

1 (uxi minus ux)2 timessumn

1 (uyi minus uy)2(21)

ougrave n est le nombre de co-consultations des deux prols utilisateurs ux et uy uxi est une noteindividuelle du prol de lutilisateur ux et ux est la moyenne des notes dans le prol ux Classi-quement les eacutevaluations des ressources co-consulteacutees sont consideacutereacutees pour calculer la correacutelationde Pearson dont la valeur r isin [minus1 1] ougrave une valeur proche de 1 signie une correacutelation posi-tive entre les utilisateurs (autrement dit une forte similariteacute entre les deux) minus1 une correacutelationneacutegative (autrement dit une forte dissimilariteacute entre les deux utilisateurs) et 0 une absence decorreacutelation lineacuteaire entre les deux prols 12

12 Une valeur de correacutelation de Pearson r = 0 signie uniquement une absence de correacutelation lineacuteaire entre lesdeux variables eacutetudieacutees Il est cependant possible quune correacutelation non lineacuteaire existe entre ces deux variables

17

Chapitre 2 Eacutetat de lart

On peut aussi citer la tregraves utiliseacutee similariteacute cosinus permettant de calculer langle formeacute pardeux vecteurs Cette ideacutee a dabord eacuteteacute proposeacutee dans le domaine de la recherche dinformationan de comparer deux documents repreacutesenteacutes sous forme de vecteurs doccurrences de mots[Salton and McGill 1986] Cette mesure a ensuite eacuteteacute adapteacutee pour le ltrage collaboratif enremplacant les documents par les utilisateurs les mots par les ressources et les occurrences parles votes [Breese et al 2013] 13 Le calcul de la similariteacute cosinus est preacutesenteacute dans lEacutequation22

Cosine_Similarity(u1 u2) =

sumu1u2radicsumu21radicsum

u22(22)

ougrave comme pour le coecient de correacutelation de Pearson on considegravere uniquement les eacuteva-luations des ressources co-consulteacutees par les deux utilisateurs dans le calcul Beaucoup dautresmesures de similariteacute existent dans le cadre de la comparaison de deux variables entre elles etchacune possegravede des avantages et des inconveacutenients Lensemble de ces mesures ont cependantpour point commun de mesurer la similariteacute entre deux ressources uniquement et on peut tou-tefois apporter quelques critiques agrave ce genre de mesures En eet [McNee et al 2006] critiquejustement le fait que les mesures classiques calculent geacuteneacuteralement la preacutecision de chaque res-source recommandeacutee une par une Cependant limmense majoriteacute des recommandations sontproposeacutees via des listes agrave lutilisateur et non via une seule ressource On peut le voir chez tousles grands sites utilisant un systegraveme de recommandation tels que Netix 14 Youtube 15 Ama-zon 16 Deezer etc Cette maniegravere de calculer la preacutecision ressource par ressource peut provoquerleacutemergence de listes de recommandations posseacutedant des ressources toutes similaires entre ellesLe site de recommandation de lms proposant agrave un utilisateur la liste de tous les lms Star Warssoure de ce problegraveme Toutes ces recommandations sont preacutecises et similaires par rapport auxpreacutefeacuterences de lutilisateur mais les meacutetriques classiques ne donnent aucune indication sur ledegreacute de similariteacute de ces recommandations entre elles dans la liste proposeacutee agrave lutilisateur Unemaniegravere de mitiger ce problegraveme est de calculer la similariteacute non plus ressource par ressourcemais pour la liste entiegravere La similariteacute intra-liste permet justement de calculer agrave quel point lesressources dune liste sont similaires entre elles [Ziegler et al 2005] La similariteacute de chaque pairede ressources est calculeacutee et la moyenne est ensuite calculeacutee pour obtenir agrave une valeur uniquemesurant agrave quel point la liste dans son ensemble possegravede des ressources similaires entre elles

ILS(u) =

sumijisinL

sumikisinLij 6=ik sim(ij ik)

2(23)

ougrave ILSu est la similariteacute intra-liste dun utilisateur u ij et ik sont deux ressources de laliste recommandeacutee L et sim(ij ik) est la similariteacute des deux items ij et ik similariteacute pouvantecirctre calculeacutee dieacuteremment selon la meacutethode utiliseacutee (similariteacute cosinus similariteacute de Jaccardetc) Cette maniegravere de proceacuteder est inteacuteressante car premiegraverement elle deacutenote avec les mesuresclassiques et permet de proposer une liste plus homogegravene plaisante pour lutilisateur et nonplus uniquement sur les performances pures des systegravemes Deuxiegravemement le fait de consideacutererla liste de recommandations comme un tout et non plus uniquement comme des ressourcesaligneacutees les unes agrave la suite des autres permet de se rapprocher de la notion de seacutequence dontnous allons parler dans la suite de cette section Enn larticle de [McNee et al 2006] dont

13 Il est agrave noter quune variante de la mesure de similariteacute cosine sappliquant aux ressources et non auxutilisateurs a aussi eacuteteacute deacuteveloppeacutee14 httpswwwnetixcom15 httpswwwyoutubecom16 httpswwwamazoncom

18

22 Les facteurs humains agrave prendre en compte dans la recommandation

est tireacutee cette reacuteexion marque un tournant dans le domaine des systegravemes de recommandationavec la critique de la sur-utilisation de la similariteacute et linteacutegration dautres facteurs humainsToutefois dans le contexte de cette thegravese ce constat doit ecirctre nuanceacute En eet la similariteacute a eacuteteacutela meacutetrique reine pendant plusieurs anneacutees dans le domaine de la recommandation pour mesurerla performance des modegraveles Cette omnipreacutesence a provoqueacute lessor dun nouveau pan de larecherche portant sur dautres facteurs humains et dautres meacutetriques deacutevaluation Neacuteanmoinsla similariteacute reste une meacutetrique centrale dans la mesure des performances dun algorithme etdans la qualiteacute perccedilue des recommandations des utilisateurs comme lont montreacute les multitudesdeacutetudes utilisant principalement cette meacutetrique Il est donc naturel que cette meacutetrique soitinteacutegreacute dans notre modegravele comme un objectif Notre approche se veut cependant multi-objectifset nous allons preacutesenter dans la suite de cette section les autres objectifs agrave consideacuterer

222 La diversiteacute

La diversiteacute est une des meacutetriques ayant attireacute le plus lattention de la communauteacute scien-tique des recommandations ces derniegraveres anneacutees La diversiteacute est au cdivideur du changement deparadigme du domaine et larticle de McNee amp al justement intituleacute Being accurate is not en-ough how accuracy metrics have hurt recommender systems 17 repreacutesente bien ce changement[McNee et al 2006] Dans cet article les auteurs expliquent que jusqualors la majoriteacute desrecherches seacutetaient eacutetroitement concentreacutees sur lameacutelioration de la preacutecision des systegravemes Ilssoutiennent cependant que cet eacutetat de fait a nui au domaine en nencourageant pas les recherchesallant dans dautres directions et a aussi nui aux utilisateurs car les recommandations les pluspreacutecises ne sont pas forceacutement les meilleures pour ces derniers Mecircme si ce constat a eacuteteacute fait il y aplus dune deacutecennie la preacutecision est toujours tregraves utiliseacutee dans le domaine des recommandationsPar conseacutequent il nest pas rare de trouver des eacutetudes tregraves reacutecentes se deacutemarquant encore enprocircnant lutilisation dautres mesures [Gan et al 2020]

La diversiteacute et la similariteacute sont deux mesures extrecircmement lieacutees et ont souvent eacuteteacute deacutecritesensemble La similariteacute intra-liste preacutesenteacutee dans la section preacuteceacutedente est un exemple de ce lienpuisque cette mesure permet de faire varier le taux de similariteacute ou inversement de diversiteacutedune liste de ressources Dans [Smyth and McClave 2001] les auteurs soutiennent lideacutee quelorsque plusieurs ressources sont proposeacutees il est important de mesurer agrave la fois la similariteacutede chacune de ces ressources par rapport agrave la cible (pouvant ecirctre par exemple un modegraveleutilisateur) mais aussi la diversiteacute de chacune de ces ressources entre elles Le deacute revient alorsagrave ameacuteliorer la diversiteacute des ressources entre elles sans compromettre leur similariteacute par rapport agravela cible Les auteurs deacutenissent ainsi la diversiteacute dun ensemble de ressources (i1 in) commela dissimilariteacute moyenne entre toutes les paires de ressources illustreacute dans lEacutequation 24 ougrave ladissimilariteacute est deacutenie comme eacutetant linverse de la similariteacute

Diversity(i1 in) =

sumi=1n

sumj=1n(1minus Similarity(ii ij))

n2 lowast (nminus 1)

(24)

Il existe plusieurs interpreacutetations et deacutenitions de la diversiteacute dans les systegravemes de recom-mandation mais nous nutiliserons ici que la plus reacutepandue vue ci-dessus la diversiteacute sappliqueagrave un ensemble de ressources et correspond agrave la mesure moyenne de la dissimilariteacute par rapportagrave chacune dentre elles Pour compleacutementer cette deacutenition qui permet dintroduire une valeurgeacuteneacuterale de diversiteacute pour une liste de ressources nous pouvons preacutesenter ici la notion de diversiteacute

17 Ecirctre preacutecis nest pas susant comment les mesures de preacutecision ont nui aux systegravemes de recommandation

19

Chapitre 2 Eacutetat de lart

relative RD 18 qui consiste agrave calculer lapport en diversiteacute de chaque ressource i agrave un ensemblede ressources C 19 [Smyth and McClave 2001] La RD permet dobserver les changements dansla diversiteacute de la liste au moment mecircme de sa construction agrave chaque fois que le systegraveme ajouteune nouvelle ressource agrave la liste deacutejagrave existante La maniegravere de la calculer est expliqueacutee danslEacutequation 25

RD(i C) =

0 si C = sum

i=1m(1minus Similarity(i cj))

m sinon

(25)

La diversiteacute est aujourdhui reconnue comme une mesure importante agrave prendre en comptedans les systegravemes de recommandation car permettant dameacuteliorer la satisfaction de lutilisateur[Jones 2010] Cependant il est important de savoir utiliser la diversiteacute agrave bon escient et au bonmoment Comme lexemple donneacute dans lintroduction agrave propos des appareils photos le montraitlinteacuterecirct de la diversiteacute dans la recommandation deacutepend de nombreux facteurs comme lutilisa-teur son ancienneteacute dans le systegraveme le contexte de sa visite le moment de la recommandationetc Certains travaux se sont ainsi concentreacutes sur la dimension temporelle de la diversiteacute et surlimpact que cette derniegravere avait selon le contexte de la recommandation On peut citer [Mc-Ginty and Smyth 2003] dont leurs travaux portent sur le rocircle de la diversiteacute dans les systegravemesde recommandation conversationnels 20 et sur linteacuterecirct dapporter de la diversiteacute dans ce genrede systegravemes Les auteurs ont ainsi montreacute que lajout de diversiteacute durant le processus de re-commandation eacutetait beacuteneacuteque pour lutilisateur Cependant ils ont aussi montreacute que mecircme silinteacuterecirct de la diversiteacute est indeacuteniable il nest pas forceacutement justieacute dintroduire de la diversiteacuteagrave chaque recommandation sous peine de nuire agrave lecaciteacute du systegraveme [Castagnos et al 2013]De la mecircme maniegravere on peut rappeler les travaux de [Castagnos et al 2010] prouvant quilest beacuteneacuteque pour lutilisateur de se voir proposer des recommandations diverses juste avant unachat sur un site de-commerce

223 La nouveauteacute

La nouveauteacute est un facteur humain qui sous la mecircme impulsion que la diversiteacute est ap-parue comme une reacuteponse possible au problegraveme de la sur-utilisation de la preacutecision Mecircme siles deux mesures de diversiteacute et de nouveauteacute sont lieacutees il convient de ne pas les confondreLa nouveauteacute dune ressource se deacutenit geacuteneacuteralement par rapport aux autres ressources deacutejagraveconsulteacutees par lutilisateur La notion de diversiteacute sapplique quant agrave elle agrave un ensemble deressources en deacuteterminant si elles sont diverses les unes par rapport aux autres [Castells et al2015] La nouveauteacute reacutepond de plus agrave un besoin bien speacutecique de lutilisateur En eet etcomme lexpliquent [Vargas and Castells 2011] dans la majoriteacute des sceacutenarios le but dune re-commandation est de faire deacutecouvrir agrave lutilisateur des ressources quil naurait pas deacutecouvertesautrement Les auteurs preacutecisent aussi que la nouveauteacute est une caracteacuteristique importante dansun systegraveme de recommandation car elle contribue agrave diminuer la preacutevisibiliteacute des recommanda-tions et donc agrave maintenir linteacuterecirct des utilisateurs pour le systegraveme En partant de ce principeles recommandations eacutevidentes ne sont pas forceacutement de grande utiliteacute mecircme si elles possegravedentun haut niveau de preacutecision avec les preacutefeacuterences de lutilisateur On peut illustrer ce point en

18 RD pour Relative Diversity19 C pour Class soit classeensemble de ressources20 Un systegraveme de recommandation conversationnel consiste en un systegraveme interactif qui va dialoguer avec

lutilisateur sous la forme deacutechange de propositions et de critiques de ces propositions par ce dernier [Mahmoodand Ricci 2009]

20

22 Les facteurs humains agrave prendre en compte dans la recommandation

citant le classique exemple du fan de musique rock qui apregraves avoir eacutecouteacute quelques musiquesde lalbum Dark Side of the Moon de Pink Floyd se voit recommander le reste des musiquesde lalbum En terme de preacutecision la recommandation est quasi parfaite mais lutiliteacute dunetelle recommandation peut laisser agrave deacutesirer On retrouve le mecircme constat chez [Zhang 2013] ougravelomnipreacutesence de la preacutecision et de ses mesures y est critiqueacutee Les auteurs proposent ainsi unedeacutenition de la nouveauteacute en deacutenissant les trois caracteacuteristiques quune ressource doit posseacutederpour ecirctre consideacutereacutee comme nouvelle pour un utilisateur

1 Inconnue la ressource doit ecirctre inconnue de lutilisateur

2 Satisfaisante la ressource doit ecirctre satisfaisante par rapport aux besoins de lutilisateur

3 Dissimilaire la ressource doit ecirctre dissimilaire aux autres ressources que lutilisateur ap-preacutecie

En utilisant les 3 caracteacuteristiques eacutenonceacutees ci-dessus les auteurs ont ensuite proposeacute deacutevaluerla nouveauteacute dune ressource i pour un utilisateur u comme preacutesenteacute dans lEacutequation 34

Novelty(i u) = p(i|unknown u) middot dis(i prefu) middot p(i|like u) (26)

ougrave p(i|unknown u) est la probabiliteacute que lutilisateur u ne connaisse pas la ressource idis(i prefu) est la dissimilariteacute entre i et lensemble des ressources consulteacutees par lutilisateur etp(i|like u) est la probabiliteacute que u appreacutecie i On retrouve ainsi dans cette maniegravere de mesurerla nouveauteacute les 3 caracteacuteristiques mises en avant par [Zhang 2013] pour que le score de nou-veauteacute dune ressource soit haut elle doit ecirctre pour lutilisateur agrave la fois inconnue satisfaisanteet dissimilaire avec ce quil a lhabitude de voir

De reacutecentes eacutetudes ont exploreacute plus avant le lien entre nouveauteacute et satisfaction de lutilisateurNous pouvons citer ici [Schnabel et al 2018] ougrave les auteurs ont testeacute limpact de nouvellesrecommandations par rapport agrave lexploitation des preacutefeacuterences deacutejagrave connues des utilisateurs Ilsen concluent quune petite dose de nouveauteacute permet dameacuteliorer la satisfaction de lutilisateurmais que trop de ressources nouvelles nuisent fortement agrave sa satisfaction

224 Discussion

Au travers de ces quelques exemples un changement de vision dans le domaine de la re-commandation a eacuteteacute illustreacute Dun domaine ougrave la majeure partie des eacutetudes eacutetait initialementconcentreacutee sur la maximisation dune seule meacutetrique la preacutecision [Ricci et al 2015] nous avonsvu que de plus en plus de travaux sinteacuteressaient agrave dautres maniegraveres de proposer des recomman-dations Ainsi on peut deacutesormais trouver pleacutethore deacutetudes tentant de trouver des compromisentre plusieurs des facteurs discuteacutes ci-dessus comme la preacutecision et la diversiteacute [Ziegler et al2005 LHuillier et al 2014] ou encore entre la preacutecision la seacuterendipiteacute 21 et la nouveauteacute [Ka-minskas and Bridge 2016] Ces nouvelles maniegraveres de proceacuteder ont pour but didentier lesfacteurs explicatifs de la satisfaction des utilisateurs an de les prendre en compte dans des mo-degraveles plus complexes et plus geacuteneacuteraux

Il est cependant important de noter que outre ceux citeacutes dans les sections preacuteceacutedentes denombreux autres facteurs humains ont eacuteteacute eacutetudieacutes dans la litteacuterature pour reacutepondre au problegraveme

21 La notion de seacuterendipiteacute fait reacutefeacuterence agrave lheureuse deacutecouverte soit le fait de deacutecouvrir par hasard quelquechose dinteacuteressant qui naurait potentiellement pas eacuteteacute deacutecouvert sans aide [Iaquinta et al 2008]

21

Chapitre 2 Eacutetat de lart

de la satisfaction utilisateur et de la sur-utilisation de la preacutecision On peut citer la seacuterendipiteacutela couverture le contexte la personnaliteacute de lutilisateur Nous avons fait le choix de nous ba-ser sur 4 facteurs couramment dans la litteacuterature an de tester la probleacutematique de cette thegravesesur la recommandation multi-objectifs La multitude de facteurs humains eacutetudieacutes ces derniegraveresanneacutees pour enrichir les recommandations soulignent agrave quel point il est important de nos joursde penser des modegraveles geacuteneacuteriques capables dinteacutegrer de nouveaux facteurs humains agrave la demande

Cette premiegravere grande section de leacutetat de lart a montreacute que le domaine de la recommanda-tion est passeacute dun problegraveme doptimisation mono-objectif agrave un problegraveme doptimisation multi-objectifs Un systegraveme de recommandation agrave lheure actuelle se doit de prendre en compte lesfacteurs humains tels que ceux preacutesenteacutes dans les sections preacuteceacutedentes an decirctre performant etcapable de satisfaire le plus grand nombre de type dutilisateurs dans le maximum de situationspossibles Cest dans ce contexte multi-objectif que cette thegravese se positionne Dans la deuxiegraveme etderniegravere grande section de cet eacutetat de lart nous allons preacutesenter et comparer dieacuterentes maniegraveresde proposer des recommandations agrave lutilisateur la recommandation unitaire la recommanda-tion en liste et la recommandation en seacutequences Nous allons notamment nous attarder sur leslistes et les seacutequences car elles sont les plus agrave mecircmes de fournir des recommandations complexesinteacutegrant de multiples objectifs

23 La recommandation en seacutequence

231 Deacutenition et geacuteneacuteraliteacutes sur les seacutequences

Pour comprendre linteacuterecirct des seacutequences il est neacutecessaire de sattarder sur les listes En eetdegraves les premiers systegravemes de recommandation les utilisateurs se sont la plupart du temps vuproposer soit des ressources uniques soit des listes de ressources On peut deacutenir une liste ainsi

Dans le domaine de la recommandation une liste est un ensemble de res-sources ordonneacutees selon un ou plusieurs critegraveres orant agrave lutilisateur lechoix de consulter ces ressources indeacutependamment les unes des autres

Preacutesenter une liste de recommandations a ainsi pour but de proposer les ressources ayantobtenu le score le plus haut selon un ou plusieurs critegraveres choisis par le systegraveme pour produiredes recommandations Comme nous lavons vu dans la section preacuteceacutedente un des critegraveres les plusutiliseacutes eacutetait originellement la preacutecision Lautre speacuteciciteacute dune liste est dorir agrave un utilisateurplusieurs ressources adapteacutees agrave ses preacutefeacuterences agrave un temps t Ainsi le but nest pas moins desatisfaire lobjectif agrave moyenlong terme de lutilisateur que de simplement lui proposer une listede ressources alternatives adapteacutees agrave son prochain choix Autrement dit le but dune liste derecommandations est de satisfaire les besoins dun utilisateur au temps t+ 1 (soit agrave sa prochaineaction) Le format des listes a donc souvent eacuteteacute utiliseacute car il permet agrave la fois de maximiser leschances de satisfaire lutilisateur tout en tirant parti des meacutecanismes internes de production derecommandations geacuteneacuterant la plupart du temps des listes de ressources de la plus preacutecise agrave lamoins preacutecise pour chaque utilisateur Ce mode de repreacutesentation de par sa capaciteacute agrave pro-poser des alternatives se rapproche deacutejagrave un peu plus du cadre de notre travail doptimisationmulti-critegraveres contrairement aux recommandations unitaires Il nest donc pas question ici deremettre en cause linteacuterecirct dutiliser des listes de ressources comme format de recommandationsces derniegraveres eacutetant adapteacutees agrave de nombreux domaines dapplication De tregraves populaires sites

22

23 La recommandation en seacutequence

de-commerce ou de divertissement utilisent dailleurs principalement des recommandations parlistes comme Netix Youtube ou encore Amazon Un client sur un site de-commerce pourrapar exemple ecirctre satisfait de se voir proposer par le systegraveme une liste darticles similaires agrave sesrecherches an de laider dans son choix Cependant certains domaines peuvent ne pas beacuteneacuteciervoire ecirctre desservis par ce format de recommandation On peut ici agrave nouveau rappeler lexempledirecteur de lintroduction agrave ce sujet ougrave un apprenant se voyait proposer une liste de ressourceseacuteducatives toutes similaires au cours quil avait deacutejagrave suivi sans tenir compte de sa progression nide ses objectifs De la mecircme maniegravere un visiteur dun museacutee ne sera pas forceacutement satisfait de sevoir proposer une liste de 10 divideuvres dart similaires agrave ce quil vient de voir mais potentiellementeacuteparpilleacutees dans tous le museacutee Dans ces deux exemples on devine bien que dautres maniegraveresde proposer les recommandations seraient beacuteneacuteques Cest ici que lon peut deacutenir la notion deseacutequence qui pourrait permettre de reacutepondre agrave des situations ougrave une liste de ressources nest passusante pour satisfaire lutilisateur et ougrave la composante temporelle entre en ligne de compte

Dans le domaine de la recommandation une seacutequence est une suite de res-sources permettant datteindre un ou plusieurs objectifs speacutecieacutes ou nonpar lutilisateur (eg une compeacutetence speacutecique la sortie dun museacutee unapprentissage des recommandations diverses pour un parcours eacuteclectiqueetc) Une seacutequence possegravede donc un deacutebut une n et une progression deacute-nie sous forme dun ordonnancement temporel Une seacutequence est reacutegiepar les objectifs agrave atteindre ces derniers eacutetant speacutecique au domaine et agravelutilisateur

Une seacutequence peut donc ecirctre vue comme une liste ameacutelioreacutee de ressources prenant uncompte un nombre plus grand de variables et une dimension temporelle dans le but de mieuxsatisfaire lutilisateur Nous allons ici deacutetailler la notion de progression qui est importante dansune seacutequence Le principe dune seacutequence reacuteside dans lexistence dau moins un objectif agrave at-teindre et cest ce qui la dieacuterencie dune liste Comme nous lavons vu une liste de ressourcesna pas fondamentalement dobjectif agrave atteindre si ce nest satisfaire lutilisateur agrave t + 1 en luiproposant des ressources adapteacutees De part la notion dobjectif agrave atteindre une seacutequence a pourbut de satisfaire les besoins de lutilisateur non plus agrave t + 1 mais agrave t + n Il nest donc plusquestion daider lutilisateur pour sa prochaine action mais bien daider lutilisateur agrave atteindreun objectif plus complexe qui neacutecessitera n actions ou paliers intermeacutediaires Avec ces deux deacute-nitions on se rend bien compte que les notions de liste et de seacutequence ne sont pas opposeacutees maiscompleacutementaires Certains domaines ne neacutecessitent pas forceacutement lutilisation de seacutequences carlutilisateur naura pas dobjectif agrave moyenlong terme agrave satisfaire (ex la recherche dun lmsur une plateforme de videacuteos agrave la demande) tandis que dans dautres domaines une liste serainsusante pour satisfaire lutilisateur (ex e-eacuteducation heacuteritage culturel playlist musicale)De la mecircme maniegravere il nest pas neacutecessaire de recommander des seacutequences agrave un utilisateur si cedernier na pas dobjectif agrave atteindre et souhaite simplement une aide pour sa prochaine actionet ce mecircme si le domaine dapplication est propice agrave lutilisation de seacutequences

Linteacuterecirct des seacutequences na pas eacutechappeacute aux chercheurs du domaine des systegravemes de recom-mandation qui les ont consideacutereacute comme eacutetant un moyen suppleacutementaire permettant de mieuxsatisfaire lutilisateur Cette prise de conscience sest dailleurs deacutemocratiseacutee au mecircme momentque la prise en compte des facteurs humains autre que la preacutecision dans larticle deacutejagrave citeacute preacute-ceacutedemment [McNee et al 2006] Ainsi on peut lire en 2004 dans le tregraves complet article sur

23

Chapitre 2 Eacutetat de lart

leacutevaluation des systegravemes de recommandation de [Herlocker et al 2004] une liste des tacircchesusuelles que doivent reacutealiser ces systegravemes Dans cette liste se trouve entre autres une reacuteexiondes auteurs sur la recommandation de seacutequences dans le cadre de lutilisation dun site deacutecoutede musiques en ligne

[] Cependant le deacute que repreacutesente le fait de passer dune recommandation dune seulemusique agrave une recommandation dune seacutequence de musiques satisfaisante dans son ensemblenous a intrigueacute Cette mecircme tacircche peut sappliquer agrave la recommandation darticles de recherchean dappreacutehender un domaine (lire cette introduction puis lire cette eacutetude ) Alors que ledomaine de la recherche dinformation a exploreacute le timing et les seacutequences dachat de produitsnous navons connaissance daucun systegraveme de recommandation ou de recherche sattelant direc-tement agrave la reacutesolution de cette tacircche (ie la recommandation en seacutequences)

Les auteurs expliquent donc clairement ici que la recommandation de seacutequences mecircme sielle navait pas encore eacuteteacute traiteacutee agrave leacutepoque eacutetait un point inteacuteressant agrave deacutevelopper et pouvaitsatisfaire des besoins speacuteciques comme la recommandation de musiques en ligne ou encore lac-quisition de nouvelles connaissances en ligne La premiegravere partie de leur reacuteexion qui na pas eacuteteacutetraduite ici sur les speacuteciciteacutes des recommandations musicales sera eacutetudieacutee plus en deacutetail dans lechapitre suivant Mecircme si les recommandations de ressources uniques ou de listes de ressourcessont resteacutees tregraves largement majoritaires dans le domaine quelques travaux se sont tout de mecircmeatteleacutes au problegraveme des seacutequences Il est tout dabord neacutecessaire de distinguer deux utilisationsde la notion de seacutequence dans la litteacuterature lutilisation de seacutequences deacutejagrave existantes en entreacuteedun systegraveme et la production de seacutequences en sortie dun systegraveme Dans la suite de cette sec-tion nous allons eacutetudier ces deux maniegraveres de proceacuteder ainsi que leurs avantages et inconveacutenients

Comme nous lavons vu dans la majoriteacute des cas les systegravemes de recommandation se basentsur la matrice deacutevaluations utilisateurs times ressources pour preacutedire les ressources encore nonconsulteacutees pouvant inteacuteresser lutilisateur Cependant mecircme si elle permet lapplication de nom-breuses et puissantes meacutethodes de preacutediction que nous ne deacutetaillerons pas ici 22 lutilisationdune matrice ne permet pas en leacutetat de tenir compte de lordre dans lequel les ressources onteacuteteacute consulteacutees ni de distinguer les variances agrave court ou moyen-terme des prols utilisateurs [Qua-drana et al 2018] De la mecircme maniegravere une cellule de cette matrice rui repreacutesente uniquementune eacutevaluation r dun utilisateur u sur une ressource i pouvant cacher une reacutealiteacute plus complexeougrave un utilisateur a consulteacute plusieurs fois cette ressource au cours du temps potentiellement dansdieacuterents contextes et avec une eacutevaluation dieacuterente agrave chaque fois Pour remeacutedier agrave ce problegravemedes approches agrave base de tenseurs ont eacuteteacute proposeacutees permettant dutiliser plusieurs matrices re-preacutesentant dieacuterents moments ou critegraveres dans le prol de lutilisateur [Frolov and Oseledets2017] Il est donc clair que les seacutequences de consultation contiennent des informations richespouvant ecirctre exploiteacutees dans un systegraveme de recommandation Lexploitation de lordre des res-sources dans des seacutequences nest cependant pas nouvelle et provient principalement du domainede la recherche dinformation [Agrawal et al 1995] Aujourdhui on retrouve lexploitation delordre des seacutequences dans de nombreux autres domaines comme la fouille de motifs seacutequentielsou encore la reconnaissance de la parole [Han et al 2007] Lexplosion des services proposeacutes parla deacutemocratisation dInternet et du numeacuterique en geacuteneacuteral ces derniegraveres anneacutees a ameneacute la recom-mandation agrave sadapter agrave de nombreux domaines ougrave lordre dans lequel les utilisateurs reacutealisent

22 On peut par exemple citer les techniques de factorisation de matrice qui dominent le domaine [Koren et al2009]

24

23 La recommandation en seacutequence

des actions a de limportance Ces systegravemes de recommandation portant une attention particu-liegravere aux seacutequences sont regroupeacutes sous le terme de systegravemes de recommandation sensiblesaux seacutequences (sequence-aware recommender system) [Quadrana et al 2018] Dans leur tourdhorizon du domaine les auteurs proposent une vue densemble de la maniegravere dont un systegravemede recommandation sensible aux seacutequences fonctionne agrave laide dun scheacutema en 3 parties preacutesenteacutepar la Figure 22

Figure 22 Vue densemble du fonctionnement dun systegraveme de recommandation sensible auxseacutequences (source [Quadrana et al 2018])

Dans la Figure 22 on peut donc bien distinguer 3 parties distinctes dans le fonctionnementinterne dun systegraveme de recommandation sensible aux seacutequences

1 Les entreacutees les entreacutees se caracteacuterisent par des donneacutees relatives aux actions eectueacuteespar les utilisateurs du systegraveme Ces actions doivent ecirctre classeacutees selon lordre dans lequelelles ont eacuteteacute eectueacutees par chaque utilisateur an de pouvoir exploiter toutes les infor-mations disponibles (si les actions ne sont pas reccedilues de maniegravere ordonneacutee ces derniegraveresdoivent au minimum ecirctre associeacutees agrave un timestamp agrave une date preacutecise pour pouvoir ecirctrereacute-ordonneacutees et traiteacutees dans le bon ordre par le systegraveme de recommandation)

2 Le processus de recommandation le processus de recommandation est geacuteneacuteralementdieacuterent des systegravemes de recommandation classiques utilisant des matrices 23 mais leprincipe geacuteneacuteral reste le mecircme utiliser lensemble des informations fournies par les entreacuteespour produire des recommandations adapteacutees agrave lutilisateur nal On retrouve dans cettepartie les tacircches purement lieacutees agrave la recommandation la prise en compte des facteurshumains du contexte eacuteventuellement des contraintes sil y en a etc Dans la Figure 22les auteurs distinguent 4 types de tacircches lieacutees aux systegravemes de recommandation sensiblesaux seacutequences Nous discuterons de ces 4 tacircches dans la suite de ce manuscrit lors de lapreacutesentation du modegravele et des expeacuterimentations meneacutees pour le tester

23 Mecircme si quelques modegraveles utilisant agrave la fois des seacutequences et des meacutethodes de factorisation de matrices onteacuteteacute proposeacutes ces derniegraveres anneacutees [Yu and Riedl 2012 Zhao et al 2014 Twardowski 2016 Chen and Li 2019]

25

Chapitre 2 Eacutetat de lart

3 Les sorties les auteurs distinguent ici deux types de sorties possibles Le premier typede sortie concerne dabord les listes ordonneacutees de ressources que nous avons deacutejagrave expli-citeacutees auparavant dans ce manuscrit Une liste aura pour but de proposer agrave lutilisateurun ensemble de ressources ordonneacutees de la meilleure agrave la moins bonne selon une ou plu-sieurs meacutetriques speacuteciques Une liste propose dans les faits un ensemble dalternatives dechoix possibles que le systegraveme met agrave disposition de lutilisateur an que ce dernier puissechoisir une (ou eacuteventuellement plusieurs) ressource(s) parmi toutes celles proposeacutees Cepremier type de sortie est donc identique aux systegravemes de recommandation classiques Ledeuxiegraveme type de sortie concerne les seacutequences de ressources Contrairement aux listesconsistant en un ensemble dalternatives les ressources dune seacutequence ont pour but decirctretoutes consulteacutees dans lordre donneacute par le systegraveme Lagrave ougrave pour les listes une recomman-dation consiste en une ressource pour les seacutequences une recommandation consiste en unesuite de ressources agrave consulter dans lordre proposeacute Ainsi une seacutequence peut ecirctre consi-deacutereacutee comme une unique recommandation de la mecircme maniegravere que dans une liste chaqueressource est une recommandation unique

232 Domaines dapplication des modegraveles seacutequentiels

Comme nous lavons expliqueacute auparavant il est eacutevident que certains domaines dapplicationssont adapteacutes aux systegravemes de recommandation sensibles aux seacutequences comme par exemple lamusique ou le tourisme [Nurbakova et al 2018] Inversement certains domaines semblent moinsbeacuteneacutecier de tels systegravemes Le domaine de le-commerce est un cas particulier dans le sens ougraveil a vu un grand nombre de ces systegravemes y ecirctre testeacutes quand bien mecircme il semble agrave premiegraverevue ecirctre moins adapteacutes aux seacutequences Deux raisons peuvent expliquer cet eacutetat de fait Premiegrave-rement il a statistiquement eacuteteacute prouveacute que la tregraves grande majoriteacute des clients consultant un sitede-commerce ne le font en reacutealiteacute que dans le but de trouver un seul produit speacutecique avantde quitter le site [Qiu et al 2015] Deuxiegravemement le domaine de le-commerce est geacuteneacuteralementtregraves repreacutesenteacute dans les systegravemes de recommandation [Quadrana et al 2018] potentiellement ducircaux forts inteacuterecircts nanciers et agrave lancienneteacute de lutilisation de ce domaine dapplication Dansla suite de cette section nous allons nous inteacuteresser agrave quelques exemples de systegravemes sensiblesaux seacutequences dans les domaines de la musique et du tourisme an dillustrer leacutetat du domaineainsi que les directions potentielles pour de futurs travaux

Dans le domaine musical

Le domaine de la musique est un deacuteboucheacute naturel des systegravemes de recommandation sinteacute-ressant aux seacutequences autant quand il sagit dexploiter les seacutequences creacuteeacutees par les utilisateursque lorsquil sagit den produire en sortie dun systegraveme Cet eacutetat de fait sexplique par la speacuteci-citeacute du domaine musical ougrave les utilisateurs eacutecoutent tregraves souvent plusieurs musiques les unes agravela suite des autres Ces utilisateurs produisent des seacutequences signicatives de par leurs eacutecoutes etpeuvent ecirctre demandeurs de seacutequences de musiques ou playlists adapteacutees agrave leurs preacutefeacuterences Ilnest donc pas eacutetonnant de trouver degraves le deacutebut des anneacutees 2000 dans la litteacuterature des travauxportant sur ce sujet Les travaux de leacutepoque souraient cependant dun certain nombre de pro-blegravemes comme un manque de personnalisation et dexpressiviteacute ou encore des diculteacutes pourgeacuterer le grand nombre de musiques des catalogues en ligne problegravemes qui ont par la suite eacuteteacutereacutesolus avec la production de nouveaux systegravemes et laugmentation de la puissance de calcul desmachines [Aucouturier and Pachet 2002] On peut cependant aussi trouver des eacutetudes dont le

26

23 La recommandation en seacutequence

but eacutetait dexploiter les caracteacuteristiques speacuteciques du domaine musical pour proposer des adap-tations des techniques classiques de recommandation utiliseacutees dans le-commerce [Logan 2002]Plus reacutecemment le domaine des recommandations musicales a beaucoup gagneacute en populariteacutecomme lillustre le ceacutelegravebre ACM RecSys Challenge dont leacutedition 2018 en partenariat avec Spo-tify 24 sest porteacutee sur la musique avec comme challenge de creacuteer un systegraveme capable de prolongerdes playlists deacutejagrave existantes 25 Au total plus de 100 eacutequipes ont participeacute agrave ce deacute et plus de15 articles ont eacuteteacute publieacutes Voici un court reacutesumeacute des 4 approches ayant eacuteteacute les plus performantes

[Volkovs et al 2018] ont proposeacute un modegravele en deux eacutetapes baseacute sur des meacutethodes deltrage collaboratif utilisant la factorisation de matrice (Weighted Regularized Matrix Fac-torization[Hu et al 2008]) et de renforcement de gradient (gradient boosting) La premiegravereeacutetape est optimiseacutee pour reacutecupeacuterer rapidement une liste de musiques candidates tandisque le deuxiegraveme stage reacuteordonne ces musiques en maximisant la preacutecision au deacutebut de laliste ainsi creacuteeacutee [Rubtsov et al 2018] ont proposeacute une approche relativement similaireavec un modegravele posseacutedant aussi deux eacutetapes la premiegravere utilisant des techniques de l-trage collaboratif pour seacutelectionner des candidats potentiels et la deuxiegraveme utilisant uneplaylist avec ces candidats agrave laide de techniques de renforcement de gradient

[Yang et al 2018] ont proposeacute un modegravele multimodal de ltrage collaboratif en deuxparties utilisant chacune des reacuteseaux de neurones (autoencoder pour la premiegravere partie etreacuteseau neuronal convolutif pour la deuxiegraveme partie) Le but des auteurs eacutetait de prendreen compte 3 des problegravemes les plus communs aux systegravemes de recommandation musicauxagrave savoir (1) le problegraveme du deacutemarrage agrave froid (2) les biais de populariteacute ougrave des musiquesse retrouvent soit dans la plupart des playlists soit dans tregraves peu dentre elles (3) et ennle contexte de la playlist originale (autrement dit le fait dutiliser les preacutefeacuterences agrave courtterme de lutilisateur dans la session deacutecoute en cours pour continuer du mieux possiblela playlist)

[Antenucci et al 2018] ont proposeacute une approche mecirclant agrave la fois des techniques de l-trage collaboratif et de ltrage par contenu Les preacutedictions de ces dieacuterentes techniquessont ensuite agreacutegeacutees ensemble dans le but de maximiser la qualiteacute de la recommandation

On peut remarquer que ces 4 approches ayant obtenu les 4 premiegraveres places de la compeacute-tition possegravedent des points communs et orent des perspectives inteacuteressantes sur la maniegraverede concevoir des systegravemes de recommandation performants dans ce domaine Premiegraverementon remarque que toutes ces approches sont relativement complexes et utilisent des meacutethodesvarieacutees pour la recommandation (ltrage collaboratif ltrage par contenu factorisation de ma-trice reacuteseaux neuronaux gradient boosting etc) prouvant que les systegravemes de recommandationperformants utilisent plus que jamais des techniques hybrides Deuxiegravemement chacune de ces 4approches propose un modegravele en deux parties La premiegravere partie est geacuteneacuteralement utiliseacutee pourseacutelectionner un certain nombre de candidats parmi les 22 millions de musiques disponibles quiavaient eacuteteacute mises agrave disposition et ce an de limiter lespace de recherche et donc le temps decalcul La deuxiegraveme partie consiste en la creacuteation de la playlist nale baseacutee sur les candidats deacutejagraveseacutelectionneacutes Cette partie peut potentiellement ecirctre plus complexe dun point de vue algorith-mique car lespace de recherche est beaucoup plus restreint quinitialement

Par ailleurs chacune de ces 4 approches a aussi tenteacute de prendre en compte un maximum

24 https wwwspotifycom25 http wwwrecsyschallengecom2018

27

Chapitre 2 Eacutetat de lart

dinformations an de satisfaire au mieux lutilisateur (caracteacuteristiques des musiques preacutecisiondiversiteacute contexte de la playlist initiale utilisation de la session deacutecoute en cours) validantainsi lapproche deacuteveloppeacutee depuis le deacutebut de ce manuscrit qui consiste agrave prendre en compte unmaximum dobjectifs associeacutes agrave des facteurs humains dans la recommandation Cette constata-tion se retrouve aussi chez [Jannach et al 2016] ougrave les auteurs expliquent que le but des systegravemesde recommandation dans le domaine de la musique est dacqueacuterir et dexploiter des informationssuppleacutementaires agrave propos des musiques an de comprendre le thegraveme sous-jacent des playlistscreacuteeacutees par les utilisateurs [] Le but ultime serait ainsi de concevoir de nouvelles approchesalgorithmiques qui seraient explicitement conccedilues pour creacuteer des playlists correspondant agrave une ouplusieurs caracteacuteristiques signicatives pour lutilisateur En dehors des facteurs humains deacutejagravedeacuteveloppeacutes au deacutebut de cette section (similariteacute diversiteacute nouveauteacute) les auteurs explicitentces caracteacuteristiques signicatives comme pouvant aussi ecirctre lhomogeacuteneacuteiteacute de la playlist dansson ensemble ou encore les transitions entre chacune des musiques dune playlist Le but seraitdonc ici de reacuteussir agrave creacuteer des playlists semblables agrave ce quun ecirctre humain pourrait faire tout entenant compte au maximum des besoins en similariteacute diversiteacute et nouveauteacute [Quadrana et al2018] deacuteveloppent aussi cette ideacutee en expliquant quun systegraveme de recommandation musical peutsoit proposer des musiques correspondant dune maniegravere geacuteneacuterale au thegraveme de la playlist soitproposer une playlist avec un ordre speacutecique permettant de garantir des transitions douces entrechaque musique comme par exemple une augmentation graduelle du tempo Les notions de pro-gression et de transitions douces dans une playlist correspondent agrave la deacutenition dune seacutequencedonneacutee plus haut dans le manuscrit et sont donc particuliegraverement inteacuteressantes dans le cadre decette thegravese Il est cependant agrave noter que dans le domaine des recommandations musicales undeacutebat est reacutecemment apparu sur limportance de lordre des musiques dans les recommandationsde playlist En eet une eacutetude exploratoire reacutecente a montreacute que si les utilisateurs jugent posi-tivement un systegraveme recommandant des musiques diverses et nouvelles ces derniers ne portaientque peu dinteacuterecirct agrave lordre dans lequel les musiques eacutetaient proposeacutees (voire dans certains casne percevaient mecircme pas dordre speacutecique dans les recommandations) [Tintarev et al 2017]Mecircme si cette eacutetude na porteacute que sur 20 participants les reacutesultats obtenus sont inteacuteressantset soulignent agrave quel point chaque domaine agrave des particulariteacutes propres dont il est neacutecessairede tenir compte pour la conception dun systegraveme de recommandation sensible aux seacutequencesPour renforcer encore cette derniegravere constatation nous allons nous inteacuteresser dans la prochainesous-section aux systegravemes de recommandation touristiques

Dans le domaine touristique

Le domaine du tourisme a lui aussi vu sa populariteacute croicirctre dans la litteacuterature gracircce agrave lexplo-sion des teacuteleacutephones portables et tablettes orant un nouveau support pour les recommandationsDe la mecircme maniegravere que pour le domaine de la musique le tourisme a vu ses premiegraveres appli-cations de recommandation apparaicirctre au deacutebut des anneacutees 2000 Dans [Cheverst et al 2000]par exemple les auteurs ont deacuteveloppeacute un guide mobile permettant daider les visiteurs de laville de Lancaster en leur fournissant des informations contextuelles (localisation date heure dela journeacutee ouvertures et fermetures dattractions heures de visites etc) ainsi quen proposantau visiteur plusieurs services comme avoir plus dinformations sur un monument ou geacuteneacuterer unparcours prenant en compte ces informations contextuelles Cette eacutetude a permis de proposer unstandard dans la recommandation touristique comme la prise en compte du contexte et eacutetaittregraves complegravete pour son eacutepoque mecircme si lon peut critiquer labsence dun modegravele utilisateurne permettant pas de prendre en compte les besoins speacuteciques de chaque visiteur Toujours audeacutebut des anneacutees 2000 nous pouvons aussi citer [Chou et al 2005] dont les auteurs ont modeacuteliseacute

28

23 La recommandation en seacutequence

agrave laide dun systegraveme de repreacutesentation de connaissances (OWL pour Web Ontology Language)les inteacuterecircts dun visiteur ainsi que les divideuvres dun museacutee dans un systegraveme de recommandationproposant des parcours Il est agrave noter que dans cette eacutetude les auteurs ont pu prouver que letemps passeacute par un visiteur devant un objet eacutetait positivement correacuteleacute avec son appreacuteciationpositive sur cet objet Le terme objet est utiliseacute ici car les auteurs ont reacutealiseacute cette expeacuteriencesur un site proposant des vecirctements et non dans le museacutee comme le reste de leur application

Plus reacutecemment les systegravemes de recommandation touristiques de ces derniegraveres anneacutees ontproteacute des nombreuses avanceacutees technologiques leur donnant plus de possibiliteacutes quant agrave la lo-calisation de lutilisateur et agrave laide personnaliseacutee dans des lieux autrefois complexes agrave atteindreEn eet la deacutemocratisation des smartphones recevant tous un signal GPS de bonne qualiteacute per-met deacutesormais agrave des applications de connaicirctre relativement preacuteciseacutement la position dun visiteurtant quil est dehors Dune maniegravere geacuteneacuterale les systegravemes utilisant des donneacutees geacuteographiquesdans le processus de recommandation sont regroupeacutes sous le terme systegravemes de recommandationsensibles agrave la position (Location-Aware Recommender Systems (LARS)) Pour les systegravemes derecommandation destineacutes agrave ecirctre utiliseacutes agrave linteacuterieur dun bacirctiment ougrave le signal GPS ne peutpas passer (comme un museacutee par exemple) il existe maintenant plusieurs solutions eacutetudieacutees etdeacuteveloppeacutees dans le domaine de recherche des systegravemes de localisation en interne comme parexemple le Wi-Fi [Tesoriero et al 2014] les puces RFID 26 [Tesoriero et al 2008] les senseursde proximiteacute Bluetooth [Yoshimura et al 2014] et mecircme le geacuteomagneacutetisme 27 Les moyens tech-niques permettant de localiser preacuteciseacutement un visiteur ou de lui fournir des recommandations agravedistance via une application ne seront pas deacutetailleacutes ici Cependant il est important de prendreen compte ces problegravemes lorsque lon passe dun domaine agrave un autre Mecircme si lobjectif est lemecircme agrave savoir recommander les meilleures seacutequences agrave un utilisateur dun systegraveme les moyenstechniques agrave mettre en divideuvre ainsi que les caracteacuteristiques agrave prendre en compte pour produire debonnes recommandations peuvent drastiquement changer Ainsi alors que certains systegravemes derecommandations musicaux commencent depuis quelques anneacutees agrave prendre en compte le contextede lutilisateur quand cela est possible [Wang et al 2012] les systegravemes deacuteployeacutes dans le domainedu tourisme doivent neacutecessairement tenir compte du contexte de lutilisateur au minimum pourpouvoir le guider activement [Adomavicius and Tuzhilin 2011 Gavalas et al 2014] De la mecircmemaniegravere les modegraveles utilisateurs requis dans les recommandations touristiques diegraverent de ceuxdes autres domaines Il est par exemple important de prendre en compte la maniegravere dont lesvisiteurs se deacuteplacent physiquement agrave la fois pour proposer des recommandations satisfaisantesdun point de vue individuel mais aussi pour avoir une vision globale de la foule et de ses ef-fets sur les individus Ainsi [Veacuteron and Levasseur 1989] ont reacutealiseacute une eacutetude ethnographiqueau centre Pompidou montrant que les visiteurs pouvaient ecirctre classeacutes en 4 cateacutegories selon leurmaniegravere de se deacuteplacer tandis que [Yoshimura et al 2014] ont observeacute pendant 3 semaines lecomportement de plus de 27000 visiteurs au museacutee du Louvre permettant de discerner 2 typesde visiteurs selon la dureacutee de leur visite ainsi que linuence de la foule sur les comportements

Ces deux eacutetudes toujours tregraves utiliseacutees aujourdhui reacutevegravelent que le domaine des recomman-dations touristiques possegravede des speacuteciciteacutes quil est important de prendre en compte an decorrectement modeacuteliser le comportement de lutilisateur et de lui fournir des recommandationspertinentes Dune maniegravere geacuteneacuterale et peut-ecirctre encore plus que dans dautres domaines la

26 Acronyme de Radio-Frequency IDentication deacutesignant lutilisation de radio-eacutetiquettes adheacutesives permet-tant de recevoir et de reacutepondre agrave des signaux agrave courte distance27 IndoorAtlas

29

Chapitre 2 Eacutetat de lart

recommandation de points dinteacuterecircts physiques neacutecessite une attention toute particuliegravere agrave uncertain nombre de caracteacuteristiques quant agrave la modeacutelisation de lutilisateur parmi lesquelles onpeut citer [Osche et al 2016]

Le style de visite repreacutesente le style de visite de lutilisateur en rapport avec les deuxeacutetudes citeacutees ci-dessus [Veacuteron and Levasseur 1989 Yoshimura et al 2014]

Le niveau de fatigue repreacutesente agrave quel point lutilisateur est mentalement etouphysiquement fatigueacute

Les preacutefeacuterences implicites repreacutesente les preacutefeacuterences sur les ressources deacuteduites ducomportement de lutilisateur

La toleacuterance agrave la distance repreacutesente agrave quel point lutilisateur souhaite se deacuteplacer La toleacuterance agrave la foule repreacutesente agrave quel point lutilisateur est deacuterangeacute par les autres

visiteurs autour de lui La toleacuterance agrave la preacutecision repreacutesente le souhait de lutilisateur concernant la balance

entre recommandations preacutecises et recommandations diverses La toleacuterance agrave lintrusion technologique repreacutesente agrave quelle freacutequence lutilisateur

souhaite recevoir des recommandations du systegraveme Le niveau de controcircle repreacutesente le niveau de choix que lutilisateur attend cest-agrave-

dire le nombre dalternatives proposeacutees

Outre ces points relatifs agrave la modeacutelisation de lutilisateur il est aussi important de prendreen compte lenvironnement dans lequel il se trouve comme par exemple la geacuteographie du lieu etses contraintes les distances physiques entre les points dinteacuterecircts les donneacutees meacuteteacuteorologiquesles horaires douvertures et de fermetures sil y en a etc

Mecircme si agrave premiegravere vue le domaine touristique semble dieacuterent du domaine musical denombreux points communs peuvent ecirctre trouveacutes comme par exemple la gestion de la distance(distance physique entre deux points dinteacuterecircts ou distance matheacutematiques entre deux ressourcesles preacutefeacuterences implicites les divers niveaux de toleacuterances etc) Dans la prochaine section nousallons discuter des points communs entre ces dieacuterents domaines et des caracteacuteristiques quunmodegravele se voulant geacuteneacuterique et multi-domaines se doit de posseacuteder

233 Discussion

Cette section a eu pour but de preacutesenter un certain nombre de travaux lieacutes de pregraves ou de loinagrave la notion de seacutequence Nous avons vu que dans le domaine des recommandations musicales lacreacuteation ou la continuation de playlists sont des objectifs de plus en plus consideacutereacutes par les cher-cheurs Ce domaine sy precircte en eet tregraves bien car la majoriteacute des utilisateurs eacutecoutent plusieursmusiques les unes agrave la suite des autres permettant dexploiter linformation contenue dans cesseacutequences deacutejagrave existantes et de tenter den creacuteer de nouvelles De la mecircme maniegravere le rapidetour dhorizon du domaine des recommandations touristiques a permis de mettre en exerguemecircme sil existe des dieacuterences notables avec le domaine musical dont il faut tenir compte unobjectif principal commun consideacuterer le maximum de donneacutees pertinentes disponibles (compor-tements preacuteceacutedents des utilisateurs informations sur les ressources caracteacuteristiques personnellesde chaque utilisateur etc) dans le but de produire des seacutequences adapteacutees agrave chaque utilisateurLes eacutetudes de ces domaines ont permis de faire ressortir 5 directions majeures dans la conceptiondun tel systegraveme de recommandation

1 Les approches les plus performantes actuellement semblent geacuteneacuteralement composeacutees de

30

24 Les systegravemes multi-agents

deux parties distinctes La premiegravere partie consiste en une preacute-seacutelection avec pour but dediminuer lespace de recherche en seacutelectionnant une liste de candidats potentiels tandisque dans la deuxiegraveme partie une seacutequence est produite en utilisant les meilleurs candidatspreacute-seacutelectionneacutes dans leacutetape 1

2 Ces approches ne se limitent plus uniquement agrave lutilisation de techniques provenantdes systegravemes de recommandation classiques mais mecirclent deacutesormais dieacuterentes techniquesprovenant de divers domaines de la recherche en informatique

3 Les seacutequences deacutejagrave creacuteeacutees en amont par les utilisateurs peuvent ecirctre utiliseacutees an dexploi-ter les informations quelles contiennent et produire en aval des seacutequences plus conformesagrave ce quun ecirctre humain ferait

4 Le mouvement geacuteneacuteral des eacutetudes produites ces derniegraveres anneacutees va dans le sens dune priseen compte conjointe et toujours plus importante de facteurs et caracteacuteristiques humains

5 Un systegraveme geacuteneacuterique permettant de produire des seacutequences personnaliseacutees quelque soit ledomaine reste possible mais ce dernier devra ecirctre susamment modulable pour sadapteraux dieacuterences bien reacuteelles entre tous les domaines concerneacutes

Dans la suite de cette section nous allons nous concentrer sur un domaine de linformatiquedont les meacutethodes saccordent avec lensemble des points eacutevoqueacutes ci-dessus les systegravemes multi-agents et plus particuliegraverement les algorithmes de colonies de fourmis Cest dans le cadre de ceparadigme que nous reacutepondrons aux probleacutematiques de cette thegravese

24 Les systegravemes multi-agents

241 Deacutenition

Les systegravemes multi-agents deacutesignent lensemble des systegravemes ougrave de nombreux agents co-opegraverent dans le but de reacutesoudre un problegraveme trop complexe pour un agent seul [Ferber andWeiss 1999 Weiss 2013] Un agent dans sa deacutenition la plus large repreacutesente toute entiteacute pou-vant percevoir son environnement agrave travers ses senseurs et pouvant agir dans cet environnementavec ses actuateurs [Russell and Norvig 2016] comme le preacutesente la Figure 23

Selon cette deacutenition limmense majoriteacute des ecirctres vivants robots machines et programmesinformatiques peuvent ecirctre consideacutereacutes comme des agents Nous allons aner petit agrave petit cettedeacutenition an de rentrer dans le cadre speacutecique des systegravemes multi-agents Un premier eacuteleacutementpouvant ecirctre ajouteacute est la notion de rationaliteacute Un agent rationnel est un agent dont le com-portement est le bon eacutetant donneacute un environnement speacutecique dans lequel il eacutevolue Avoir lebon comportement autrement dit eectuer une bonne seacutequence dactions implique de deacutenirun but preacutecis ainsi quune maniegravere deacutevaluer les seacutequences dactions que lagent eectue commepar exemple la maximisation dune fonction dutiliteacute An de reacutealiser des actions dans son en-vironnement un agent a besoin de pouvoir prendre des deacutecisions de lui-mecircme Il existe dans lalitteacuterature deux types dagents repreacutesentant deux conceptions dieacuterentes pour la reacutesolution dunproblegraveme [Ferber 1995]

Le premier type dagent est appeleacute agent cognitif et fait reacutefeacuterence agrave des agents pos-seacutedant une repreacutesentation symbolique du monde avec laquelle ils peuvent appliquer desraisonnements Ces agents possegravedent donc une repreacutesentation interne de leur environ-nement et sont capables dinteragir entre eux de maniegravere sophistiqueacutee Ce type dagent

31

Chapitre 2 Eacutetat de lart

Figure 23 Scheacutema repreacutesentant linteraction entre un agent et lenvironnement dans lequel ileacutevolue [Russell and Norvig 2016]

correspond plus geacuteneacuteralement agrave une approche cognitive qui a pour but de faire commu-niquer et coopeacuterer des systegravemes experts classiques [ougrave] chaque agent dispose dune base deconnaissance comprenant lensemble des informations et des savoir-faire neacutecessaires agrave lareacutealisation de sa tacircche et agrave la gestion des interactions avec les autres agents et avec sonenvironnement [Ferber and Weiss 1999]

Le deuxiegraveme type dagent nommeacute agent reacuteactif ne possegravede pas de repreacutesentation sym-bolique du monde et est donc limiteacute par ses propres perceptions Ces agents et leursinteractions sont geacuteneacuteralement moins complexes que les agents cognitifs Ce type dagentcorrespond plus geacuteneacuteralement agrave une approche reacuteactive qui quant agrave elle preacutetend quil nestpas neacutecessaire que les agents soient intelligents individuellement pour que le systegraveme aitun comportement global intelligent Des meacutecanismes de reacuteaction aux eacuteveacutenements ne pre-nant en compte ni une explicitation des buts ni des meacutecanismes de planication peuventalors reacutesoudre des problegravemes qualieacutes de complexes [Ferber and Weiss 1999]

En plus de ces deux types dagents dieacuterencieacutes par leur repreacutesentation du monde Ferberpropose un autre type de distinction sur les comportements ces derniers peuvent ecirctre teacuteleacuteono-miques cest-agrave-dire dirigeacutes vers des buts explicites ou bien reacuteexes cest-agrave-dire reacutegis par lesperceptions Ces 4 dieacuterents types dagents peuvent se combiner comme illustreacute dans le Tableau21

Nous allons plus particuliegraverement nous inteacuteresser ici aux agents reacuteactifs et agrave leurs dieacuterencesavec les agents cognitifs Malgreacute leur relative simpliciteacute les interactions entre agents reacuteactifsexistent bien Mais contrairement aux agents cognitifs elles seectuent au travers de lenvi-ronnement geacuteneacuteralement par des traces laisseacutees dans ce dernier comme des donneacutees visuellesolfactives auditives etc Lagrave ougrave les agents cognitifs raisonnent avant de prendre une deacutecisionles agents reacuteactifs ne font que reacuteagir agrave des stimuli externes Ils possegravedent bien des senseurs ande deacutetecter leur environnement et des actuateurs pour agir mais leur fonctionnement reste tregraves

32

24 Les systegravemes multi-agents

Agents cognitifs Agents reacuteactifsTeacuteleacuteonomiques Agents intentionnels Agents pulsionnels

Reacuteexes Agents modules Agents tropiques

Table 21 Description des dieacuterents types dagents selon leur relation au monde et selon leursconduites [Ferber 1995]

simple par rapport aux agents cognitifs La relative simpliciteacute de ces agents est inteacuteressante carelle sinscrit dans un changement de paradigme par rapport agrave la vision classique des lintelligencearticielle dans le domaine de linformatique En eet le domaine de lintelligence articielleexiste depuis pregraves de 60 ans maintenant et agrave lorigine les systegravemes intelligents creacuteeacutes dans cedomaine pour reacutesoudre des problegravemes lont eacuteteacute selon une approche dite top-down cest-agrave-direde haut en bas avec les notions de penseacutee et de raison au centre de ces systegravemes Ainsi cessystegravemes manipulaient les connaissances agrave laide de symboles et de regravegles et navaient aucune in-teraction ni avec leur environnement ni avec dautres systegravemes intelligents Cest ce quon appellecommuneacutement la Good Old Fashioned Articial Intelligence Depuis les anneacutees 1990 une autreapproche est apparue pour eacutetudier lintelligence et creacuteer des systegravemes intelligents lapprochebottom-up soit de bas en haut dont certains systegravemes tregraves populaires sinspirent de systegravemesbiologiques incarneacutes dans un environnement et pouvant communiquer entre eux Cest dans cemouvement que sinscrivent les systegravemes multi-agents et comme le dit Rodney A Brooks dansson article justement intituleacute Intelligence without Reason [Brooks 1991]

Les comportements intelligents peuvent ecirctre geacuteneacutereacutes sans laide de systegravemes de raisonne-ment explicites

Lintelligence est une proprieacuteteacute eacutemergente de certains systegravemes complexes apparaissantparfois sans quelle nait de raison speacutecique dapparaicirctre

Une premiegravere implication de la simpliciteacute des agents reacuteactifs est quil est neacutecessaire de faireinteragir un certain nombre de ces agents pour pouvoir solutionner des problegravemes Lagrave ougrave unagent cognitif peut potentiellement ecirctre tregraves complexe et capable de solutionner des problegravemesprincipalement par lui-mecircme (en deacuteleacuteguant ou coopeacuterant parfois avec dautres agents) un agentreacuteactif seul nen sera pas capable de par sa simpliciteacute Cependant cette simpliciteacute ore aussides avantages dans le sens ougrave il est aiseacute de comprendre de programmer ou de modier cesagents Apregraves cette partie theacuteorique nous allons voir dans la sous-section suivante deux modegravelesmulti-agents an dillustrer la maniegravere dont ils fonctionnent reacuteellement Ces deux systegravemes nouspermettrons par la suite de tirer quelques conclusions sur leur utiliteacute dans le cadre de cette thegravese

242 Preacutesentation de deux systegravemes multi-agents reacuteactifs

Nous avons pour le moment seulement deacutecrit le principe des modegraveles multi-agents et lesagents pouvant les composer Cependant ces systegravemes ne puisent pas leur origine uniquementdans linformatique Beaucoup de systegravemes multi-agents sinspirent agrave lorigine de comportementsdanimaux ou dinsectes observeacutes en milieu naturel par des eacutethologues En eet certaines espegravecesanimales semblent agir en groupe de maniegravere tregraves intelligente sans quil ny ait de meneur ou sansquun individu pris seacutepareacutement ne soit speacutecialement intelligent On parle alors dauto-organisationet deacutemergence de lintelligence quand une masse dindividus peu intelligents se coordonne ainsidans la nature Ce pheacutenomegravene a eacuteteacute eacutetudieacute par le biologiste franccedilais Pierre-Paul Grasseacute en 1959

33

Chapitre 2 Eacutetat de lart

et a eacuteteacute nommeacute stigmergie [Grasseacute 1959] La stigmergie est le meacutecanisme par lequel des agentsvont se synchroniser et travailler ensemble dans un but commun sans quaucun nait lideacutee agravelavance de laction agrave faire ou nait le plan nal de la construction agrave reacutealiser (une fourmiliegravereou un nid de termites par exemple) Pour deacutecrire le pheacutenomegravene de stigmergie agrave ldivideuvre chezcertains animaux Pierre-Paul Grasseacute explique ainsi Louvrier ne dirige pas son travail maisil est guideacute par lui Cette phrase signie quun agent na pas dintention et dideacutee de ce quildoit faire mais quil sait cependant exactement quoi faire au moment ougrave il est preacutesent devant letravail Cette capaciteacute sexplique par le fait que les individus sont geacuteneacutetiquement preacuteprogrammeacutespour eectuer certaines tacircches [Oster 1981] Cest de cette maniegravere que des espegraveces ne posseacutedantquune tregraves faible intelligence individuelle comme les fourmis ou les termites sont capables deproduire des constructions extrecircmement grandes et sophistiqueacutees On peut par exemple citer uneespegravece nommeacutee la fourmi coupe-feuille du Texas aussi appeleacutee fourmi champignonniste dontles individus vivent dans de grandes colonies de plusieurs millions dindividus et cultivent deschampignons dans des piegraveces souterraines doteacutees dune structure particuliegravere et dune aeacuterationspeacutecique destineacutee agrave favoriser la pousse du champignon [Houmllldobler et al 1990] La cleacute de lacapaciteacute de ces animaux agrave agir de la bonne maniegravere face agrave tel ou tel stimulus reacuteside dans lADNmecircme de lespegravece faccedilonneacute par des millions danneacutees deacutevolution Cest ainsi quune ouvriegraverevaquera agrave ses tacircches jusquagrave ce quun pan de mur de son nid seondre et que devant ce nouveaustimulus elle deacuteploie une nouvelle panoplie de comportements approprieacutes agrave la situation agrave laquelleelle fait soudainement face Ces exemples deacutemontrent que lintelligence est bien preacutesente dans cessystegravemes biologiques vivants et dans la suite de cette section nous allons donner deux exemplesde modeacutelisation de ces systegravemes biologiques en systegravemes multi-agents dans linformatique

Murmuration deacutetourneaux le modegravele des boids

Les eacutetourneaux repreacutesentent une famille dune quinzaine despegraveces doiseaux et vivent surles 5 continents Ces oiseaux se regroupent parfois dans la nature sous forme de nueacutees pouvantcontenir des dizaines de milliers dindividus La raison de ces murmurations nest pas encoreconnue avec certitude mais des theacuteories existent expliquant par exemple que ces regroupementspermettraient une plus grande chance de survie face aux preacutedateurs [King and Sumpter 2012]ou bien que le regroupement et la haute densiteacute dindividus leur permettraient de se reacutechauerdurant les peacuteriodes les plus froides de lanneacutee [Goodenough et al 2017] Ce pheacutenomegravene est beau-coup eacutetudieacute car tous les oiseaux semblent se deacuteplacer dans la mecircme direction et modient leurtrajectoire en mecircme temps sans quaucun oiseau ne se touche en vol ce qui est remarquable eacutetantdonneacute le nombre dindividus et la vitesse agrave laquelle ils volent Malgreacute cette complexiteacute il ny apas doiseau meneur deacutecidant de la direction agrave prendre et un individu seul na pas la capaciteacuteintellectuelle susante pour planier ce genre de deacuteplacements complexes dans un environne-ment en 3 dimensions On retrouve bien lagrave les caracteacuteristiques dun systegraveme multi-agents ougrave desagents simples provoquent de par leurs interactions un comportement intelligent et complexedeacutepassant de loin les capaciteacutes dun individu seul Le domaine des systegravemes multi-agents sestdonc inteacuteresseacute agrave creacuteer un modegravele permettant agrave laide de simulations informatiques de recreacuteer lesmumurations deacutetourneaux Ce modegravele ougrave les agents sont appeleacutes des boids 28 permet dobtenirinformatiquement des murmurations dagents dans un environnement simuleacute gracircce agrave trois regraveglesimplanteacutees dans chaque agent donneacutees ici par ordre de prioriteacute [Reynolds 1987]

28 Le terme boid provient de la contraction de lexpression bird-oid object et signiant objet ressemblant agrave unoiseau

34

24 Les systegravemes multi-agents

1 Eacutevitement des collisions eacuteviter les collisions avec les agents se trouvant agrave proximiteacuteSi un agent est trop proche seacuteloigner dans une autre direction

2 Coordination de la vitesse aller agrave la mecircme vitesse que les agents se trouvant agraveproximiteacute

3 Centrage rester le plus proche possible des autres agents se trouvant agrave proximiteacute sansdeacuteclencher la regravegle deacutevitement de collision

Ces trois regravegles sont donc exeacutecuteacutees par les agents en permanence de la plus prioritaire agravela moins prioritaire et permettent dobtenir virtuellement un comportement de murmurationougrave tous les agents restent proches les uns des autres et changent de direction ensemble commemontreacute dans la Figure 24 Ce modegravele a par exemple eacuteteacute utiliseacute dans lindustrie du divertissementpour simuler des foules coheacuterentes dans des jeux videacuteos ou des lms [Silva et al 2009]

Figure 24 Simulation de boids ougrave lon peut voir les agents se deacuteplaccedilant dans la mecircme directionagrave une certaine distance les uns des autres dans un environnement simuleacute [Reynolds 1987]

Le fourragement des fourmis algorithme de colonies de fourmis

Un autre exemple de systegraveme biologique complexe ougrave lon peut observer leacutemergence duneintelligence collective est le comportement des fourmis dans la nature Dans la section preacuteceacutedentenous avons deacutejagrave vu que par un meacutecanisme de stigmergie certains insectes sociaux comme lesfourmis ou les termites eacutetaient capables de construire des structures tregraves complexes Un autrepheacutenomegravene dauto-organisation a eacuteteacute observeacute lors du fourragement 29 des fourmis de lespegravece de lafourmi dArgentine En eet les ouvriegraveres de cette espegravece se deacuteplacent de maniegravere aleacuteatoire auxalentours de la fourmiliegravere jusquagrave trouver une source de nourriture Une fois que des fourmis onttrouveacute de la nourriture elles retournent agrave la fourmiliegravere Apregraves un certain temps de plus en plusdouvriegraveres se dirigent vers cette source de nourriture jusquagrave ce quun chemin de fourmis allantde la fourmiliegravere jusquagrave la nourriture se forme Ce chemin a cependant la particulariteacute decirctreoptimiseacute en termes de distance agrave parcourir et dobstacles agrave eacuteviter de sorte que les ouvriegraveres em-pruntent eectivement le plus court chemin possible entre leur nid et la nourriture [Deneubourg

29 Le fourragement deacutesigne le comportement des fourmis recherchant de la nourriture et revenant avec celle-ciagrave la fourmiliegravere

35

Chapitre 2 Eacutetat de lart

et al 1990] La Figure 25 donne un exemple de ce agrave quoi peut ressembler un de ces chemins unefois emprunteacute par beaucoup dindividus Ce comportement est remarquable quand on le replacedans le contexte des individus qui en sont agrave lorigine Les ouvriegraveres ne font pas plus de 1 ou 2centimegravetre(s) de long et peuvent couvrir des distances jusquagrave 100 megravetres an de trouver de lanourriture Lenvironnement dans lequel elles se deacuteplacent est complexe joncheacute dobstacles eteacutevolue en permanence alors quelles nont quun sens de lorientation limiteacute et une faible capaciteacutede traitement ducirce agrave leur tregraves petit nombre de neurones (environ 250000)

Figure 25 Illustration dun chemin creacuteeacute par des fourmis appartenant agrave lespegravece des fourmisleacutegionnaires (creacutedit photo Mehmet Karatay)

An de comprendre les meacutecanismes permettant leacutemergence de ce comportement intelligentdes expeacuterimentations ont eacuteteacute meneacutees en laboratoire avec de petites colonies de fourmis dansun environnement controcircleacute [Goss et al 1989] Voici donc le principe de fonctionnement de lacreacuteation de chemins optimiseacutes chez les fourmis

1 Des fourmis se deacuteplacent aleacuteatoirement autour de la colonie agrave la recherche de nourriture

2 Quand une fourmi trouve de la nourriture elle retourne du mieux possible agrave la fourmiliegravereen deacuteposant des pheacuteromones

3 Dautres fourmis attireacutees par ces pheacuteromones vont avoir tendance agrave suivre ce cheminLes nouvelles fourmis atteignant la nourriture vont elles aussi revenir agrave la fourmiliegravere endeacuteposant des pheacuteromones

4 Les fourmis reacuteussissant agrave revenir plus rapidement avec des chemins plus courts agrave la four-miliegravere vont redeacuteposer plus rapidement de nouvelles pheacuteromones eacutetant donneacute quellesmettront moins de temps pour faire des allers-retours entre la nourriture et la fourmi-liegravere

5 Agrave linverse les fourmis ayant emprunteacute des chemins plus longs vont deacuteposer de nouvellespheacuteromones moins rapidement puisquelles mettront plus de temps agrave faire leurs allers-retours

6 Petit agrave petit le chemin le plus court va ecirctre emprunteacute par de plus en plus de fourmisdeacuteposant chacune des pheacuteromones renforccedilant de plus en plus ce mecircme chemin

36

24 Les systegravemes multi-agents

7 Les chemins les plus longs sont peu agrave peu abandonneacutes dautant plus que les pheacuteromonesseacutevaporent avec le temps renforccedilant encore plus les chemins fortement emprunteacutes

8 Au bout dun certain temps seul le chemin le plus court est emprunteacute par la majoriteacute desfourmis

9 Quelques fourmis ne prennent cependant pas ce chemin permettant la recherche de nou-velles sources de nourriture ou de nouveaux chemins En eet si jamais le chemin em-prunteacute par la majoriteacute des individus se voit perturbeacute par un nouvel obstacle (un arbrevenant de tomber par exemple) alors ces quelques fourmis pourront eacuteventuellement trou-ver le nouveau meilleur chemin le plus court et le cycle de renforcement recommencera

Comme pour les murmurations deacutetourneaux on retrouve bien les caracteacuteristiques de lauto-organisation dans un systegraveme multi-agents aucun meneur nest preacutesent les agents suivent seule-ment quelques regravegles simples permettant leacutemergence dun comportement deacutepassant les capaciteacutescognitives de lespegravece Ces regravegles ont eacuteteacute deacutecrites de maniegravere formelle par Marco Dorigo durant sathegravese dans un modegravele appeleacute Ant System (AS) permettant de recreacuteer le comportement des four-mis au sein dune simulation informatique [Dorigo et al 1996] Dans ce modegravele lenvironnementest repreacutesenteacute par un graphe dont les sommets sont les points dinteacuterecircts ougrave lagent peut se rendreet dont les arecirctes sont les chemins disponibles permettant de se deacuteplacer de point en point Agravechaque arecircte (i j) est associeacutee deux valeurs numeacuteriques la premiegravere repreacutesentant la distanceagrave parcourir pour se deacuteplacer du sommet i au sommet j la deuxiegraveme repreacutesentant la quantiteacutede pheacuteromones preacutesente sur cette arecircte Un agent se trouvant agrave un sommet i a connaissancede lensemble des sommets Vi accessibles directement agrave partir de i Pour deacutecider quelle arecircteemprunter lagent prend en compte la distance et la quantiteacute de pheacuteromones associeacutees agrave chaquearecircte Une fois que lagent a atteint un sommet speacutecique deacutesigneacute agrave lavance comme objectif ildeacutepose des pheacuteromones sur chacune des arecirctes emprunteacutees La quantiteacute de pheacuteromones deacuteposeacuteeest deacutependante de la longueur du chemin emprunteacute de sorte quun agent ayant trouveacute un chemincourt deacuteposera plus de pheacuteromones quun agent ayant trouveacute un chemin plus long Ce cycle peutensuite recommencer avec une multitude dagents jusquagrave ce quune solution eacutemerge de la mecircmemaniegravere que pour les fourmis dans la nature Marco Dorigo a dans la suite de ses travaux deacuteve-loppeacute dautres modegraveles ayant tous comme base le modegravele AS mais posseacutedant quelques variationsou ajouts orant une plus grande varieacuteteacute doutils pour reacutesoudre les nombreux problegravemes de larecherche en informatique Dans les faits le modegravele original AS a aujourdhui pratiquement dis-paru au prot de ses descendants et cest pour cette raison que nous nallons pas ici deacutetailler plusavant le modegravele AS [Dorigo and Birattari 2010] Tous ces dieacuterents modegraveles sont maintenantregroupeacutes sous le nom de Ant Colony Optimization (ACO) [Dorigo and Birattari 2011] Cesderniers ont eacuteteacute exploiteacutes dans de nombreux domaines de la recherche scientique pour reacutesoudredes problegravemes varieacutes On peut par exemple citer trois de ces problegravemes tregraves connus et eacutetudieacutesen informatique de par leur complexiteacute qui ont chacun vu des solutions leur ecirctre trouveacutees gracircceagrave ACO

Le problegraveme du voyageur de commerce [Dorigo and Gambardella 1997] Le problegraveme des tourneacutees de veacutehicules [Bell and McMullen 2004] Le problegraveme de gestion de projet agrave contraintes de ressources [Merkle et al 2002]

Dans la prochaine section nous allons nous inteacuteresser plus particuliegraverement agrave lun des modegravelesde la famille ACO nommeacute Ant Colony System (ACS) Nous allons voir son fonctionnement deacutetailleacuteet expliquer les speacuteciciteacutes qui le rendent particuliegraverement inteacuteressant dans le cadre de cette thegravese

37

Chapitre 2 Eacutetat de lart

243 Ant Colony System

Le modegravele ACS possegravede plusieurs modications majeures par rapport au modegravele initial ASnotamment par rapport aux meacutecanismes lieacutes aux pheacuteromones et agrave la prise de deacutecision des agents[Dorigo and Birattari 2010] Premiegraverement seul lagent ayant trouveacute le meilleur chemin est au-toriseacute agrave deacuteposer des pheacuteromones sur les arecirctes quil a emprunteacute alors que dans AS tous les agentsdeacuteposaient des pheacuteromones Deuxiegravemement et pour contrer la relatif manque de pheacuteromones en-gendreacute par cette premiegravere modication les agents possegravedent un nouveau comportement appeleacutemise agrave jour locale de pheacuteromones (locale pheromone update) consistant en la mise agrave jour despheacuteromones par chaque agent sur la derniegravere arecircte emprunteacutee durant la construction dun che-min Cette mise agrave jour sarticule autour dun seuil de pheacuteromones speacutecieacute comme meacutetavariableavant lexeacutecution du programme Si une arecircte traverseacutee par un agent possegravede une quantiteacute depheacuteromones infeacuterieure agrave ce seuil alors lagent deacutepose des pheacuteromones Agrave linverse si la quantiteacutede pheacuteromone sur cette arecircte est supeacuterieure au seuil alors lagent retire une certaine quantiteacute depheacuteromones En dautres termes dans ACS degraves quun agent emprunte une arecircte il met agrave jourla quantiteacute de pheacuteromones sur cette arecircte et ce quelle que soit la qualiteacute du chemin quil est entrain de construire Marco Dorigo explique lui-mecircme les avantages que possegravede ACS par rapportagrave dautres versions existantes [Dorigo and Birattari 2011]

ACS permet de diversier lexploration eectueacutee par les agents pendant une iteacuterationde lalgorithme en diminuant la quantiteacute des pheacuteromones sur les arecirctes les plusutiliseacutees les agents suivants sont encourager agrave se deacuteplacer sur dautres arecirctes moinsexploreacutees permettant de diversier les solutions trouveacutees agrave la n dune iteacuterationCette meacutecanique rend moins probable le fait que plusieurs agents puissent produiredes solutions identiques durant une iteacuteration

Une autre modication du modegravele ACS par rapport au modegravele AS concerne le deacuteplacementdes agents Il est maintenant possible gracircce agrave une nouvelle meacutetavariable de donner limportancesouhaiteacutee entre les pheacuteromones et la distance lors du processus de choix de la prochaine arecircte agraveemprunter par un agent Dans le reste de cette sous-section nous allons expliquer les principalesformules reacutegissant le comportement des agents et la mise agrave jour des pheacuteromones dans ACS

Regravegle de transition deacutetat - la regravegle de transition (state transition rule) deacutetat utilise laregravegle proportionnelle pseudo-aleacuteatoire (pseudo-random proportional rule) ougrave une variable aleacutea-toire q isin [0 1] est compareacutee agrave une meacutetavariable q0 an de deacutecider si lagent courant va explorerle graphe ou sil va exploiter la connaissance produite par les autres agents avant lui En dautrestermes il est possible deacutequilibrer avec cette variable limportance des pheacuteromones et de la dis-tance lors du choix des arecirctes q0 = 0 entraicircne lexploration du graphe en tenant uniquementcompte de la distance associeacutee aux arecirctes tandis que q0 = 1 correspond agrave un comportement derenforcement pur via les pheacuteromones sans aucune exploration LEacutequation 27 permet de choisirentre lexploitation de la connaissance ou lexploration du graphe donnant plus de latitude aumodegravele ACS par rapport agrave AS

Exploitation (Equation 28) si q le q0Exploration biaiseacutee (Equation 29) si q ge q0

(27)

LEacutequation 28 repreacutesente lexploitation directe du graphe ougrave la meilleure arecircte est toujourschoisie

arg maxlisinVi ταil middot η

βil (28)

38

24 Les systegravemes multi-agents

ougrave Vi est lensemble des sommets accessibles depuis le sommet i τil isin [0 1] est la quantiteacute depheacuteromones deacuteposeacutee sur larecircte (i l) par les agents preacuteceacutedents ηil est linformation heuristique delarecircte (i l) α et β sont deux meacutetavariables repreacutesentant respectivement le poids des pheacuteromoneset celui de lheuristique dans le calcul Lheuristique ηil repreacutesente classiquement linformationrelative agrave la distance seacuteparant les sommets i et l et sera deacutecrite apregraves

Il est agrave noter quon ne parle pas ici de pure exploration mais dexploration biaiseacutee dans lesens ougrave les meilleures arecirctes ont une probabiliteacute plus eacuteleveacutee decirctre seacutelectionneacutees Lexpressionmeilleure arecircte est ici deacutenie comme le produit de lheuristique avec la quantiteacute de pheacuteromonesassocieacutees agrave cette arecircte LEacutequation 29 correspond agrave lexploration biaiseacutee du graphe

pij =

ταij middot η

βijsum

lisinViταil middot η

βil

si j isin Vi

0 sinon

(29)

Mise agrave jour globale des pheacuteromones - Apregraves chaque iteacuteration cest-agrave-dire apregraves que tousles agents aient termineacute leur chemin seul lagent qui a trouveacute le meilleur chemin est autoriseacute agravemettre agrave jour le niveau de pheacuteromones τij sur chaque arecircte (i j) quil a emprunteacute

τij =

(1minus ρ) middot τij + ρ middot∆τij si (i j) appartient au meilleur chemin

τij sinon(210)

ougrave ρ est le taux deacutevaporation des pheacuteromones et ∆τij = 1Lbest ougrave Lbest est la longueur dumeilleur chemin

Mise agrave jour locale des pheacuteromones - Un autre ajout du modegravele ACS par rapport aumodegravele AS est la mise jour locale des pheacuteromones Eacutetant donneacute que seul lagent ayant trouveacute lemeilleur chemin deacutepose des pheacuteromones dans ACS (contrairement agrave tous les agents proportion-nellement agrave la qualiteacute de leur solution dans AS) tregraves peu de pheacuteromones sont deacuteposeacutes avec laregravegle de mise agrave jour globale des pheacuteromones Pour contrer ce problegraveme tous les agents mettentagrave jour la quantiteacute de pheacuteromones agrave chaque arecircte emprunteacutee lors de la construction du chemincomme deacutecrit dans lEacutequation 211

τij = (1minus ρ) middot τij + ρ middot τ0 (211)

ougrave τ0 est le niveau de pheacuteromones placeacute sur chaque arecircte du graphe agrave linitialisation du modegravele

Information heuristique - linformation heuristique ηij repreacutesente linformation que lafourmi possegravede a priori sur une arecircte (i j) Dans lalgorithme ACS linformation heuristiqueest calculeacutee en se basant sur la distance entre les deux sommets i et j de larecircte (i j) plus lesdeux sommets sont eacuteloigneacutes lun de lautre et plus la valeur de ηij sera basse indiquant agrave unagent situeacute sur le sommet i quil nest a priori pas inteacuteressant pour lui demprunter larecircte (i j)LEacutequation 212 deacutecrit comment obtenir la valeur de linformation heuristique ηij de larecircte (i j)

ηij =1

dij (212)

ougrave dij est la distance entre les sommets i et j

39

Chapitre 2 Eacutetat de lart

244 Discussion sur le modegravele ACS

Dans cette sous-section nous allons revenir sur un des principes de lalgorithme ACS laregravegle proportionnelle pseudo-aleacuteatoire et son importance danc le fonctionnement du modegraveleCette regravegle comme deacutetailleacutee ci-dessus permet de geacuterer leacutequilibre dans lexploration et lex-ploitation de maniegravere semi-aleacuteatoire (ie avec une variable aleacuteatoire servant agrave xer le seuil debasculement dun comportement vers lautre) Cette dualiteacute explorationexploitation est bienconnue des systegravemes de recherche et de creacuteation de connaissances [March 1991] en voici leurdeacutenition

Lexploration est deacutenie comme eacutetant lexpeacuterimentation avec de nouvelles alternatives sanstenir compte de la connaissance du domaine Les reacutesultats obtenus via cette tactique sont incer-tains mais peuvent aussi aboutir agrave de nouveaux et potentiellement meilleurs reacutesultats que ceuxdeacutejagrave deacutecouverts

Lexploitation quant agrave elle est deacutenie comme le perfectionnement et lextension de reacute-sultats deacutejagrave connus Les reacutesultats obtenus via cette tactique sont plutocirct certains et preacutevisiblesCependant un processus trop axeacute sur lexploitation aura des diculteacutes agrave trouver de tregraves bonnessolutions agrave un problegraveme et aura tendance agrave deacutevelopper la premiegravere solution trouveacutee mecircme sidautres solutions de meilleures qualiteacutes pourraient ecirctre deacutecouvertes en explorant plus avant les-pace de recherche

Il est donc important de trouver un eacutequilibre entre lexploration de lespace de recherchepour trouver de nouvelles solutions et lexploitation permettant daner ces solutions Dautresmeacutethodes dexploration et de deacutecouverte de solutions dans un espace de recherche proposent destechniques speacuteciques pour solutionner ce problegraveme On peut par exemple citer la meacutethode dela descente du gradient consistant agrave minimiser une fonction reacuteelle dans un espace de rechercheCette meacutethode procegravede par iteacuterations successives et se deacuteplace dabord de maniegravere importantedans lespace de recherche an dexplorer un maximum de solutions Puis une fois quune bonnesolution est trouveacutee la meacutethode va diminuer son deacuteplacement dans lespace de recherche andaner la solution trouveacutee La descente de gradient utilise donc une approche ougrave lexplorationest dabord privileacutegieacutee puis petit agrave petit se dirige vers de lexploitation comme illustreacute dans laFigure 26

On pourrait penser agrave premiegravere vue que lexploitation autrement dit le fait que lagent prennela meilleure arecircte disponible agrave chaque choix sorant agrave lui permettrait dobtenir les meilleursreacutesultats En eet le but est ici de trouver le meilleur chemin soit le plus court chemin dans lecadre dune distance euclidienne dun sommet a agrave un sommet b Le fait de permettre agrave lagentde ne pas forceacutement prendre la meilleure arecircte lors de la construction du chemin est donc relati-vement contre-intuitif On peut cependant lever cette intuition avec une seacuterie dexpeacuterimentationsprovenant de la litteacuterature et des observations meneacutees sur les fourmis dans la nature Jean-LouisDeneubourg dont nous avons deacutejagrave parleacute au deacutebut de cette section a beaucoup eacutetudieacute le compor-tement des fourmis en milieu reacuteel et la modeacutelisation de leur processus deacutecisionnel collectif Il aainsi proposeacute en 1990 une expeacuterience appeleacutee le pont binaire [Deneubourg et al 1990] pouvantecirctre reacutesumeacutee ainsi le nid dune colonie de fourmis est seacutepareacutee dune source de nourriture par deuxchemins de longueurs identiques Pour ramener la nourriture au nid les fourmis peuvent doncemprunter lune de ces deux voies sans conseacutequence sur la longueur du chemin total Au deacutepartles fourmis empruntent les deux voies sans distinctions puis une fois un certain temps passeacute

40

24 Les systegravemes multi-agents

Figure 26 Exemple de descente de gradient ougrave lon peut voir lexploration au deacutebut avecun deacuteplacement rapide puis lexploitation ensuite vers la solution trouveacutee ( creacutedit image JorisGillis

une des voies est privileacutegieacutee par rapport agrave lautre et la majoriteacute des fourmis lempruntent Cecomportement est la conseacutequence des pheacuteromones deacuteposeacutees par les fourmis au bout de quelquestemps une des deux voies est emprunteacutee par plus de fourmis que lautre et comme les four-mis deacuteposent des pheacuteromones et sont attireacutees par celles-ci cette dieacuterence saccentue jusquagrave cequune voie soit majoritairement emprunteacutee Il est agrave noter que ce comportement de renforcementnest pas forceacutement vrai pour toutes les espegravece de fourmis dans la nature Cependant cest surce principe que Deneubourg a modeacuteliseacute les eacutequations deacuteterminant le choix eectueacutee par chaquefourmi Ces eacutequations sont agrave la base mecircme des modegraveles ACO deacuteveloppeacutes par Dorigo quelquesanneacutees plus tard Le dispositif de lexpeacuterience des ponts binaires est preacutesenteacute par la Figure 27

Figure 27 Illustration de lexpeacuterience des ponts binaires par Jean-Louis Deneubourg (a)Apregraves un certain temps les fourmis choisissent majoritairement une des deux voies possibles (b)[Deneubourg et al 1990]

Une autre expeacuterimentation du mecircme genre a eacuteteacute reacutealiseacutee par la mecircme eacutequipe de chercheurs ougraveles fourmis doivent se deacuteplacer dun point A agrave un point B en choisissant parmi dieacuterentes voiespossibles [Goss et al 1989] Le dispositif expeacuterimental contient cependant une dieacuterence notable

41

Chapitre 2 Eacutetat de lart

avec lexpeacuterience initiale dans le sens ougrave les dieacuterentes voies ne font pas la mecircme longueurComme le montre la Figure 28 pour aller du nid jusquagrave la nourriture les fourmis disposentdun chemin ougrave deux embranchements similaires sont proposeacutes Chacun de ces embranchementspossegravede une voie courte et une voie longue La fourmi a donc 4 choix agrave eectuer lors dun aller-retour pour partir de son nid et ramener de la nourriture Au deacutebut de lexpeacuterimentation lesfourmis ont besoin de 5 agrave 10 minutes pour explorer leur environnement et trouver la nourritureTous les chemins sont dabord choisis de maniegravere aleacuteatoire puis quelques minutes plus tard etde maniegravere abrupte le meacutecanisme de renforcement rentre en jeu et les voies les plus courtes sontprivileacutegieacutees Une trentaine de minutes apregraves le deacutebut de lexpeacuterimentation les fourmis empruntentmajoritairement le chemin le plus court

Figure 28 Scheacutema du dispositif expeacuterimental utiliseacute pour veacuterier si les fourmis sont biencapables demprunter rapidement la voie la plus courte lorsque leur sont preacutesenteacutes des choixqualitativement dieacuterents [Goss et al 1989]

Alors que la premiegravere expeacuterience a montreacute que les fourmis possegravedent bien un meacutecanismedexploration aleacuteatoire menant au choix puis au renforcement dune des deux voies possibles ladeuxiegraveme expeacuterience montre que les fourmis sont bien capables de choisir le chemin le plus courtlorsquelles sont confronteacutees agrave deux voies possibles ayant des distances dieacuterentes Une critiquepeut ecirctre formuleacutee dans le sens ougrave ces deux expeacuterimentations se sont deacuterouleacutees en laboratoireavec un dispositif expeacuterimental relativement petit (quelques dizaines de centimegravetres pour allerdu nid agrave la nourriture) De par la taille reacuteduite des dispositifs les expeacuterimentations ne duraientgeacuteneacuteralement pas plus dune trentaine de minutes Durant ce laps de temps relativement courtle meacutecanisme deacutevaporation des pheacuteromones ne pouvait pas entrer en jeu car les pheacuteromonesnavaient pas le temps de seacutevaporer

Ces deux expeacuteriences sont inteacuteressantes et illustrent chacune des capaciteacutes fondamentalesdes fourmis dans la nature quant agrave leur deacuteplacement et agrave leur survie Jean-Louis Deneubourg[Deneubourg et al 1990] et Marco Dorigo [Dorigo 2001] ont montreacute comment il eacutetait possible dereproduire ces comportements via des simulations informatiques Dans la tradition des systegravemesmulti-agents les principes permettant de modeacuteliser ces comportements sont relativement simpleset comme montreacute dans la section preacuteceacutedente seules quelques eacutequations susent agrave obtenir unemodeacutelisation de la reacutealiteacute et leacutemergence de comportements intelligents Dans la suite de cettesection nous allons voir quelques exemples dutilisation dalgorithmes provenant des modegraveles

42

25 Utilisation et eacutevolution reacutecentes des algorithmes de colonies de fourmis

ACO dans les systegravemes de recommandation

25 Utilisation et eacutevolution reacutecentes des algorithmes de colonies

de fourmis

Nous avons vu dans les sections preacuteceacutedentes que les algorithmes de colonies de fourmis onteacuteteacute utiliseacutees dans des problegravemes connus comme le voyageur de commerce les tourneacutees de veacutehi-cules ou la gestion de projet agrave contraintes Chacun de ces exemples a la particulariteacute decirctre unproblegraveme doptimisation ougrave le but est de minimiser une distance agrave parcourir ou un temps dexeacute-cution avec certaines contraintes ce qui correspond bien au but premier des ACO La versatiliteacutedes systegravemes multi-agents leur a permis de sadapter dans des domaines comme les systegravemesde recommandation et ils ont particuliegraverement eacuteteacute exploiteacute pour le-eacuteducation Dans la suite decette section nous allons eacutetudier quelques applications des algorithmes de la famille des ACOdans ce domaine particulier

251 Les algorithmes de colonies de fourmis dans les systegravemes de recomman-

dation

Lune des premiegraveres applications des ACO dans le domaine des systegravemes de recommandationa eacuteteacute proposeacutee par [Semet et al 2003] dans le-education Le but de leacutetude eacutetait de recomman-der des cours et des exercices agrave des lyceacuteens avec lobjectif peacutedagogique dameacuteliorer leur reacuteussitescolaire Cette eacutetude est inteacuteressante car en plus de proposer une modication des modegraveles ACOpour la recommandation elle a eacuteteacute reacutealiseacutee en partenariat avec Paraschool 30 une entreprise deacute-dieacutee agrave lapprentissage en ligne pour les lyceacuteens franccedilais permettant aux auteurs de tester leurmodegravele Dans ce dernier le domaine peacutedagogique est repreacutesenteacute par un graphe valueacute ougrave les som-mets sont des items peacutedagogiques et les arcs sont les liens hypertextes ougrave des probabiliteacutes depassage sont associeacutees Les eacutetudiants sont repreacutesenteacutes par des agents se deacuteplaccedilant dans le grapheen laissant des pheacuteromones sur les arcs quils suivent Chaque page de cours ou dexercice (re-preacutesenteacute par un sommet unique dans le graphe) est doteacute dun bouton NEXT amenant leacutetudiantvers un nouveau cours selon une arecircte choisie par lalgorithme selon les facteurs suivants

Poids peacutedagogique W cest la valeur principale de chaque arecircte Il est impleacutementeacutecomme une variable globale accessible agrave tous les agents W est manuellement deacuteni enamont par les professeurs et reegravete limportance des arecirctes venant dun sommet particulier(ie cet exercice est important apregraves la leccedilon x donc W = 0 8 la leccedilon y nest pas tregravesimportante apregraves la leccedilon x donc W = 0 3)

Pheacuteromones S and F S repreacutesente la pheacuteromone de succegraves tandis que F repreacutesente lapheacuteromone deacutechec S est increacutementeacutee quand les eacutetudiants ont reacuteussi agrave compleacuteter lexercicecorrespondant et inversement pour F Ces pheacuteromones sont associeacutees agrave larecircte qui ameneacute lagent au sommet courant mais aussi aux preacuteceacutedents sommets emprunteacutes avec unequantiteacute de plus en plus reacuteduite limiteacutee agrave 4 sommets en arriegravere Le but est de repreacutesenterle fait que le reacutesultat dun exercice deacutepend de lensemble du parcours emprunteacute et nondu dernier sommet uniquement 31 Les pheacuteromones seacutevaporent aussi au fur et agrave mesure

30 http wwwparaschoolcom31 Cette meacutethode est similaire dans son fonctionnement agrave la technique de reacutetropropagation du gradient dans

lapprentissage des reacuteseaux de neurones

43

Chapitre 2 Eacutetat de lart

chaque jour Historique personnel H cest une variable propre agrave chaque sommet visiteacute pour chaque

agent Quand un eacutetudiant valide le module peacutedagogique associeacute au sommet alors la valeurh associeacutee agrave ce sommet particulier est eacutegale agrave 0 5 quand un eacutetudiant eacutechoue le modulepeacutedagogique alors h = 0 75 Cette valeur est ensuite utiliseacutee comme facteur multiplicatifpour reacuteduire la probabiliteacute de visiter le sommet agrave nouveau Si le sommet est revisiteacute Hest agrave nouveau multiplieacute par ces mecircmes valeurs H seacutevapore avec le temps pour tendrevers 1 symbolisant le fait que plus le temps passe et plus un eacutetudiant aura tendance agraveoublier le module peacutedagogique visiteacute

Pour chaque arc a une tness value est calculeacutee selon lEacutequation f(a) = H(ω1W + ω2S minusω3F ) ougrave ω1 ω2 et ω3 sont les poids permettant de moduler limportance des 3 facteurs pris encompte Plus la valeur de f(a) est haute et plus larc sera consideacutereacute attractif Un arc sera doncattractif quand

son ndivideud darriveacutee na jamais eacuteteacute visiteacute ou na pas eacuteteacute visiteacute depuis longtemps (H rarr 1) il est pleacutebisciteacute par les professeurs (W important) il y a une atmosphegravere de succegraves autour de cet arc (S important) peu deacutechecs ont eu lieu pregraves de cet arc (F faible)

An de choisir le prochain arc pour leacutetudiant le systegraveme seacutelectionne aleacuteatoirement un cer-tain nombre darcs possibles et garde celui posseacutedant la plus haute valeur f(a) La seacutelection dunsous-ensemble darcs permet de varier un minimum les recommandations et deacuteviter de proposertout le temps les arcs les plus attractifs

Les auteurs proposent donc ici une adaptation complegravete des ACO pour un systegraveme de recom-mandation dans le-eacuteducation tout en inteacutegrant des principes peacutedagogiques importants Luti-lisation de plusieurs types de pheacuteromones et de dieacuterentes valuations sur les arecirctes du graphepermettent dentrevoir le potentiel et ladaptabiliteacute des algorithmes ACO Quelques critiquespeuvent cependant ecirctre proposeacutees

Une premiegravere critique possible est quil nexiste pas de modegravele utilisateur prenant en compteles caracteacuteristiques personnelles de chaque eacutetudiant (notes niveau style dapprentissage) Pos-seacuteder et utiliser un modegravele par eacutetudiant pourrait permettre agrave lalgorithme de mieux sadapteraux cas particuliers nombreux dans le domaine des systegravemes de recommandation [Gras et al2016] Dans cet article les auteurs montrent que les techniques classiques de ltrage collaboratifnarrivent pas agrave bien deacutetecter les utilisateurs atypiques 32 alors quil est possible de deacutetecter etde satisfaire ces derniers avec des techniques speacuteciques

Une autre critique possible concerne le fait que les professeurs doivent au preacutealable eacutevaluerles chemins possibles agrave partir de chaque sommet sous la forme du poids peacutedagogique W Ce faitreacutevegravele que lexpeacuterimentation na pas utiliseacute un grand nombre de ressources peacutedagogiques (ce quiest le cas car le graphe utiliseacute par les auteurs ne posseacutedait que 20 ndivideuds et 47 arecirctes soit 20ressources peacutedagogiques) Dans la pratique cette meacutethode nest pas adapteacutee pour trois raisonsmajeures Premiegraverement il est dicilement concevable deacutevaluer manuellement la probabiliteacute de

32 Les utilisateurs atypiques (Grey Sheep Users) sont des utilisateurs posseacutedant des preacutefeacuterences dieacuterentes dela majoriteacute des autres utilisateurs du systegraveme

44

25 Utilisation et eacutevolution reacutecentes des algorithmes de colonies de fourmis

passage de chaque arecircte dans des domaines deacutepassant les quelques dizaines de ressources Deuxiegrave-mement lutilisation dexperts du domaine comme les professeurs dans le-eacuteducation nest pasforceacutement possible selon le domaine consideacutereacute Qui peut par exemple juger de la qualiteacute destransitions agrave partir dune musique speacutecique Troisiegravemement un tel modegravele nest que dicile-ment transfeacuterable en leacutetat dun domaine applicatif agrave un autre pour les raisons eacutevoqueacutees ci-dessus

Inteacuteressons-nous maintenant agrave une autre eacutetude dans le-eacuteducation qui propose une solutionpour permettre une plus grande personnalisation des recommandations Dans leur article [Kurilo-vas et al 2015] utilisent eux aussi les ACO avec comme but de fournir des seacutequences composeacutees demodules dapprentissage aux eacutetudiants en fonction de leur style dapprentissage Des recherchesont montreacute quil existait de grands styles dapprentissage et que les apprenants posseacutedaient despreacutefeacuterences pour certains styles plus que dautres Les auteurs utilisent ici la cateacutegorisation en 4grands styles proposeacutee par [Honey et al 1992] 33 Ainsi les agents ne sont deacutesormais plus tousidentiques mais possegravedent un ou plusieurs style(s) dapprentissage preacutefeacutereacute(s) et la mise agrave jourdes pheacuteromones est elle aussi modieacutee an de prendre en compte ces preacutefeacuterences Ainsi un agentpreacutefeacuterera un chemin composeacute de modules dapprentissage correspondant agrave son ou ses propre(s)style(s) dapprentissage et deacuteposera plus de pheacuteromones le cas eacutecheacuteant Ces changements reegravetentune volonteacute de personnalisation des recommandations sinscrivant dans le reacutecent changement deparadigme du domaine des systegravemes de recommandation ougrave les preacutefeacuterences des utilisateurs sontde plus en plus prises en compte Il est neacuteanmoins agrave noter pour cette eacutetude quil est neacutecessairede faire passer un long questionnaire pour deacutenir les styles dapprentissage des apprenants avantde pouvoir utiliser le systegraveme De plus ces styles dapprentissage sont xes et ne peuvent plusecirctre modieacutes apregraves le deacutemarrage du systegraveme empecircchant potentiellement un apprenant deacutevoluerdans sa maniegravere dapprendre

Lideacutee de modier le modegravele ACO pour prendre en compte plusieurs types dutilisateurs aaussi eacuteteacute exploiteacutee dans une autre eacutetude en e-eacuteducation par [Kardan et al 2014] Cette eacutetude a lemecircme but que la preacuteceacutedente agrave savoir recommander des seacutequences personnaliseacutees eacuteducatives avecACO mais les auteurs proposent une autre solution tout aussi inteacuteressante Ils se basent ainsi surla theacuteorie de David Ausubel selon laquelle lapprentissage est faciliteacute lorsque lapprenant peutmettre en relation les nouveaux concepts quil est en train de deacutecouvrir avec ce quil connaicirct deacutejagrave[Ausubel 1963] Les auteurs proposent un algorithme en deux parties

1 Les apprenants sont dabord eacutevalueacutes avec des items de tests correspondant chacun agrave unou plusieurs concepts devant ecirctre appris An de deacuteterminer le degreacute de familiariteacute agraveun concept par un apprenant le score quil a obtenu agrave chaque item de test est utiliseacuteen combinaison avec le degreacute de lien entre les concepts et chaque item pour creacuteer unematrice learners times concepts Lalgorithme des k-means est ensuite utiliseacute an de diviserles apprenants en groupes ayant les mecircmes familiariteacutes avec les concepts

2 lalgorithme ACO est appliqueacute avec autant de groupes dagents speacuteciques quil y a degroupes dapprenants deacutecouverts preacuteceacutedemment avec les k-means Ainsi un chemin opti-mal est trouveacute pour chaque groupe permettant de naviguer parmi tous les concepts dansun ordre preacutecis et speacutecique au degreacutes de familiariteacute de chaque groupe Autrement dit lesystegraveme recommande pour chaque groupe dapprenants une seacutequence eacuteducative person-naliseacutee en fonction de ses connaissances initiales

33 Activist Theorist Pragmatist Reector

45

Chapitre 2 Eacutetat de lart

On retrouve donc ici lideacutee de creacuteer dieacuterents types dagents pour reacutesoudre dieacuterents pro-blegravemes Cette constatation nest pas eacutetonnante dans le sens ougrave lorsquil sagit doptimisationun seul groupe dagents peut sure agrave optimiser une variable unique comme par exemple la dis-tance En revanche dans le domaine des systegravemes de recommandation il nest pas envisageablede proposer la mecircme recommandation agrave tous les utilisateurs Au contraire lapproche agrave privi-leacutegier est de pouvoir sadapter au cas par cas agrave chaque utilisateur et de prendre en compte sespreacutefeacuterences pour lui proposer une solution adapteacutee On peut dailleurs eacutemettre deux critiques decette eacutetude agrave la lumiegravere de cette analyse Premiegraverement mecircme si le modegravele propose un certaindegreacute de personnalisation sa granulariteacute nest encore pas assez ne puisquil traite des groupesdindividus et non un individu unique Ensuite il ny a encore une fois pas de moyen pour unapprenant de changer dynamiquement de groupe eacutetant donneacute que ces derniers doivent ecirctre creacuteeacutesen amont du processus de recommandation

Toujours dans la famille des algorithmes ACO nous pouvons eacutegalement citer le modegraveleAttribute-based Ant Colony System qui est similaire aux derniers modegraveles deacutecrits ci-dessus touten proposant un degreacutes de personnalisation plus n [Yang and Wu 2009] Les auteurs utilisentle modegravele dapprentissage de Kolb [Kolb and Fry 1974] an dassigner agrave chaque ressource eacuteduca-tive et agrave chaque apprenant deux attributs les deacutecrivant (type dapprentissage de la ressourcedelapprenant et niveau de compeacutetence de la ressourcede lapprenant) Les agents possegravedent aussices attributs puisquils correspondent aux apprenants Les auteurs calculent ensuite un niveaude correspondance entre lapprenant et la ressource eacuteducative permettant de juger de la qualiteacutedu chemin trouveacute Finalement la seacutequence dont les ressources eacuteducatives la composant corres-pondent le plus aux caracteacuteristiques de lagent est recommandeacutee agrave lapprenant Ce travail estinteacuteressant car il pousse encore un peu plus la personnalisation des recommandations Cependanton commence agrave remarquer ici que la neacutecessiteacute de personnaliser toujours plus les recommandationscommence agrave complexier de maniegravere importante les systegravemes proposeacutes Nous discuterons plusen deacutetail de ce point dans la conclusion de cette section

Prenons enn une derniegravere eacutetude dans le domaine de le-eacuteducation qui sest particuliegravere-ment inteacuteresseacutee agrave la notion de seacutequence et dobjectif agrave atteindre pour lapprenant [Van den Berget al 2005] En eet les auteurs expliquent que les plateformes deacuteducation en ligne proposentde plus en plus datteindre des objectifs peacutedagogiques de haut niveau (eg acqueacuterir une com-peacutetence speacutecique posseacuteder un certain niveau de connaissance dans un domaine ) tout enlaissant les apprenants libres de suivre les modules quils souhaitent Cependant cette exibiliteacutede fonctionnement complexie les programmes de ces plateformes et peut amener agrave labandondes apprenants Pour remeacutedier agrave ce problegraveme les auteurs proposent un systegraveme de guidage desapprenants utilisant ACO baseacute sur la speacutecication au preacutealable de plusieurs concepts pour chaqueapprenant

Le but de lapprenant cest la description du niveau de compeacutetence que lapprenant veutatteindre)

Le parcours le plan pour atteindre le but de lapprenant deacutecrit comme une seacuterie deseacutequences de ressources eacuteducatives Les plateformes dapprentissage en ligne proposentsouvent elles-mecircmes des parcours via lesquels les apprenants peuvent atteindre leur but

La position de lapprenant repreacutesente lensemble des ressources eacuteducatives ayant eacuteteacutecompleacuteteacutees par lapprenant

Autrement dit an de pouvoir satisfaire un apprenant il est neacutecessaire de savoir quel est

46

25 Utilisation et eacutevolution reacutecentes des algorithmes de colonies de fourmis

le but quil souhaite atteindre la maniegravere dont il veut latteindre et sa position actuelle Cestrois informations sont primordiales pour comprendre la trajectoire dun utilisateur et pour ecirctrecapable de lui recommander une seacutequence adapteacutee agrave ses besoins

Nous avons vu dans cette section le potentiel des algorithmes de colonies de fourmis pour larecommandation Neacuteanmoins la premiegravere partie de leacutetat de lart a montreacute agrave quel point il eacutetaitimportant pour les systegravemes actuels de pouvoir prendre en compte plusieurs facteurs humainsan de satisfaire au mieux les utilisateurs Dans la section suivante nous allons nous inteacuteresseragrave la maniegravere dont les algorithmes de colonies de fourmis sont capables de minimiser non plus unseul objectif (la distance) mais bien plusieurs objectifs pouvant ecirctre opposeacutes les uns aux autres

252 Les algorithmes de colonies de fourmis multi-objectifs

En parallegravele du deacuteveloppement des algorithmes de colonies de fourmis mono-objectif dans lalitteacuterature une partie de la communauteacute scientique sest inteacuteresseacutee aux algorithmes de coloniesde fourmis multi-objectifs dans le but de reacutesoudre de nouvelles classes de problegravemes En eetles algorithmes ACO ont agrave lorigine eacuteteacute conccedilus pour minimiser une valeur souvent repreacutesenteacuteepar la notion de distance Cependant de nombreux problegravemes neacutecessitent la minimisation demultiples valeurs en parallegravele an dobtenir une solution On peut par exemple citer les variantesmulti-objectifs de problegravemes vus dans la section preacuteceacutedente

Le problegraveme du voyageur de commerce multi-objectifs (multi-objective travelling salesmanproblem) ougrave la distance agrave minimiser ainsi que le temps de voyage sont les deux objectifsagrave minimiser (avec lintroduction de contraintes de circulation rendant certains cheminsplus ou moins longs agrave emprunter)

Le problegraveme de la tourneacutee de veacutehicules avec fenecirctre de temps (vehicle routing problem withtime windows) ougrave en plus de minimiser le nombre de veacutehicules utiliseacutes et le trajet totalparcouru par ceux-ci les clients doivent ecirctre livreacutes dans une certaine fenecirctre de temps

Dans le cas de ces deux problegravemes ainsi que pour beaucoup de problegravemes multi-objectifstraiteacutes dans la litteacuterature scientique les objectifs agrave minimiser sont souvent incompatibles entreeux dans le sens ougrave minimiser un objectif speacutecique tend agrave peacutenaliser un ou plusieurs des autresobjectifs Prenons comme exemple le problegraveme du voyageur de commerce multi-objectifs Le butest de trouver le plus court chemin dun point A agrave un point B non seulement dun point devue de la distance parcourue mais aussi du temps neacutecessaire pour faire le chemin Cependantminimiser la distance parcourue impliquera potentiellement demprunter des chemins encombreacutesrallongeant le temps de voyage En dautres termes minimiser lobjectif de distance parcouruepeut deacutegrader lobjectif de temps Inversement optimiser lobjectif de temps demanderait po-tentiellement dutiliser des chemins moins emprunteacutes mais plus longs deacutegradant ainsi lobjectifde minimisation de la distance totale parcourue Ces problegravemes ougrave loptimisation dun objectifaecte les performances des autres objectifs ne possegravedent souvent pas de solution optimale Eneet dans un problegraveme mono-objectif plus un algorithme reacuteussira agrave minimiser cet objectif etmeilleure sera la solution Un problegraveme mono-objectif possegravede donc une solution optimale ougravelobjectif agrave optimiser possegravede une valeur minimale et corollairement il est possible de classerles solutions trouveacutees en fonction de cette valeur Autrement dit pour deux solutions dieacuterentess1 s2 devant minimiser la valeur v pour le mecircme problegraveme si vs1 lt vs2 alors s1 est strictementune meilleure solution que s2 Pour les problegravemes multi-objectifs il nest pas directement possiblede deacuteterminer si une solution est meilleure quune autre Lexemple du voyageur de commerce

47

Chapitre 2 Eacutetat de lart

multi-objectifs avec la distance d et le temps t illustre bien ce fait comment deacuteterminer si une

solution s1 =

d = 13 kmt = 23 mn

est meilleure quune autre solution s2 =

d = 11 kmt = 26 mn

Devant

la multitude de solutions possibles sans moyen direct de les classer il est utile de consideacutererle concept doptimum de Pareto Le principe de Pareto a dabord eacuteteacute inventeacute dans le domainesocio-eacuteconomique pour deacutecrire la distribution de pouvoir et de richesses au sein dune populationIl a ensuite eacuteteacute eacutetendu avec la notion doptimum de Pareto deacutecrivant lensemble des solutionsagrave un problegraveme multi-objectifs ougrave il nest pas possible dameacuteliorer un des objectifs sans deacutegraderles autres 34 Toutes les solutions Pareto-optimales agrave un problegraveme sont donc eacutequivalentes entreelles (mecircme si elles sont bien toutes dieacuterentes les unes des autres) et sont strictement meilleuresque toutes les autres solutions non optimales agrave ce mecircme problegraveme (aussi appeleacutees solutions do-mineacutees) La Figure 29 illustre lespace des solutions sur un problegraveme de minimisation de deuxvariables On remarque la preacutesence dune frontiegravere aussi appeleacute front de Pareto ougrave toutes lessolutions sont optimales

Figure 29 Front de Pareto dun problegraveme de minimisation de deux variables f1 et f2 Toutesles solutions sur cette frontiegravere sont optimales (source Wikipedia)

On peut trouver dans la litteacuterature des exemples de reacutesolution de problegravemes multi-objectifsavec ACO utilisant le concept de Pareto [Alaya et al 2007] proposent un algorithme geacuteneacuteriquebaseacute sur le MAX-MIN Ant System 35 ougrave les nombres de colonies et de structures de pheacuteromonesvarient en fonction du nombre dobjectifsm agrave optimiser Les auteurs proposent ainsi plusieurs va-riantes de leur algorithme ayant des paramegravetres dieacuterents (nombres de colonies de pheacuteromonesde fourmis de cycles et valeur des meta-paramegravetres) Ces dieacuterentes versions sont ensuite testeacuteesavec le problegraveme du sac-agrave-dos multi-objectifs 36 et montrent que la version posseacutedant 1 seulecolonie et m pheacuteromones obtient les meilleurs reacutesultats Outre les reacutesultats obtenus ce travailest inteacuteressant car il propose plusieurs strateacutegies dieacuterentes pour pouvoir adapter les algorithmes

34 On peut deacutecliner ce concept en socio-eacuteconomie ougrave le but est deacutetudier les richesses dune socieacuteteacute an quellessoient reacuteparties selon une solution optimale de Pareto entre toutes les personnes Ce concept a cependant deslimites que nous verrons par la suite35 Le MAX-MIN Ant System [Stuumltzle and Hoos 2000] est une version dieacuterente de lalgorithme initial de

Marco Dorigo posseacutedant deux dieacuterences majeures avec ce dernier seule la fourmi ayant reacutealiseacutee le meilleurparcours peut mettre agrave jour les pheacuteromones du chemin emprunteacute et la quantiteacute de pheacuteromones est limiteacute dans unintervalle speacutecique sur chaque arc36 Le plus souvent reacutefeacuterenceacute dans la litteacuterature en anglais via lacronyme MOKP Multi-Objective Knapsack

Problem

48

25 Utilisation et eacutevolution reacutecentes des algorithmes de colonies de fourmis

ACO aux problegravemes multi-objectifs agrave savoir

Traces de pheacuteromones 2 strateacutegies existent lorsquun problegraveme possegravede plusieurs objec-tifs La premiegravere est de nutiliser quun seul type de pheacuteromones Dans ce cas la quantiteacutede pheacuteromones deacuteposeacutee par les fourmis est deacutenie par une agreacutegation des dieacuterents objec-tifs La deuxiegraveme strateacutegie consiste agrave utiliser plusieurs pheacuteromones Dans ce cas chaqueobjectif est geacuteneacuteralement associeacute agrave une colonie de fourmis unique chacune posseacutedant sonpropre type de pheacuteromones

Deacutenition des heuristiques encore une fois 2 strateacutegies existent pour la partie heuristiqueUne premiegravere solution consiste agrave agreacuteger tous les objectifs en une seule heuristique Unedeuxiegraveme solution consiste agrave consideacuterer chaque objectif seacutepareacutement Dans ce cas il y ageacuteneacuteralement une colonie par objectif

Mise-agrave-jour des pheacuteromones lors de la mise agrave jour des pheacuteromones il est neacutecessaire dedeacutecider sur quelle solution des pheacuteromones doivent ecirctre deacuteposeacutees Une premiegravere possibi-liteacute est de reacutecompenser les meilleures solutions agrave chaque objectif Une seconde possibiliteacuteest de reacutecompenser toutes les solutions appartenant agrave lensemble des solutions Pareto-optimales

Le concept doptimisation multi-objectifs est aussi utiliseacute pour reacutesoudre des problegravemes sansutiliser des algorithmes de type ACO Ces travaux sont inteacuteressants dans le cadre de cette thegravesecar ils peuvent orir un point de comparaison aux modegraveles deacuteveloppeacutes dans le chapitre suivantougrave le but est le mecircme mais la technique utiliseacutee pour y parvenir est dieacuterente Nous allons main-tenant voir plus en deacutetails le travail de [Ribeiro et al 2014] ougrave les auteurs ont proposeacute deuxmeacutethodes de recommandation multi-objectifs sans utiliser dalgorithmes de type ACO

Pareto-ecient ranking dans cette premiegravere meacutethode le principe est ici de re-preacutesenter chaque ressource recommandable agrave un point dans un espace agrave n dimensionsappeleacute le user-interest space Un point dans cet espace est repreacutesenteacute par n coordon-neacutees [c1 c2 cn] ougrave chacune repreacutesente un score de pertinence de la ressource pourlutilisateur estimeacute par dieacuterents algorithmes Les points situeacutes agrave la frontiegravere de Paretocorrespondent aux cas ougrave aucune Pareto-ameacutelioration nest possible dans les dieacuterentesdimensions

Pareto-Ecient Hybridization (PEH) dans cette deuxiegraveme meacutethode le principe estdassocier chaque ressource avec une valeur de pertinence unique pour lutilisateur Cettevaleur est elle-mecircme estimeacutee par une combinaison lineacuteaire des scores de pertinence obtenuspar n dieacuterents algorithmes de recommandation existants (ie αtimesc1+βtimesc2+ +θtimescn)Dans cette tactique lespace appeleacute objective space comporte 3 dimensions ougrave chaquepoint correspond aux niveaux de preacutecision de diversiteacute et de nouveauteacute atteint par unetechnique dhybridation possible Le but est de chercher les poids (ie α β θ) pourlesquels lhybridation des dieacuterents algorithmes permet dobtenir le meilleur reacutesultat pourlutilisateur Il est ensuite possible de moduler cette hybridation an de correspondre aumieux aux prioriteacutes de lutilisateur au moment de la recommandation (eg pour un utilisa-teur reacutecent le systegraveme pourrait proposer des ressources pertinentes et classiques pour luiprouver linteacuterecirct du systegraveme de recommandation tandis que pour un utilisateur ancienil pourrait ecirctre inteacuteressant de privileacutegier la diversiteacute et la nouveauteacute an de lui apporterde nouvelles ressources quil ne connaicirct pas encore)

Selon les auteurs la premiegravere meacutethode permet de trouver un ordonnancement partiel entre

49

Chapitre 2 Eacutetat de lart

les ressources tout en eacutevitant les ressources positionneacutees aux positions extrecircmes de la frontiegravere dePareto La deuxiegraveme meacutethode quant agrave elle utilise la frontiegravere de Pareto pour trouver des hybri-dations capable de sadapter aux demandes et dorir des recommandations eacutetant simultaneacutementpertinentes en termes de preacutecision de diversiteacute et de nouveauteacute Dans le cadre de cette thegravese ladeuxiegraveme technique pareto-ecient hybridization (PEH) est particuliegraverement inteacuteressante carelle correspond aux probleacutematiques poseacutees au chapitre preacuteceacutedent De plus cet article est agrave lafois reacutecent est beaucoup reacutefeacuterenceacute dans la litteacuterature scientique de par la qualiteacute des solutionsproposeacutees Ainsi nous preacuteciserons le fonctionnement de lalgorithme PEH proposeacute par [Ribeiroet al 2014] et nous utiliserons ses reacutesultats comme comparaison pour eacutevaluer les performancesde notre modegravele dans la chapitre preacutesentant les expeacuterimentations meneacutees et les reacutesultats obtenus

253 Discussion sur lutilisation de loptimum de Pareto

Dans ces derniegraveres pages nous nous sommes attardeacutes sur lutilisation du concept doptimumde Pareto dans la litteacuterature Cependant mecircme si lutilisation de cette technique est courantepour reacutesoudre des problegravemes multi-objectifs elle nest pas forceacutement la plus adapteacutee selon lessituations rencontreacutees et les solutions attendues On peut deacutenombrer au moins quatre problegravemesengendreacutes par lutilisation du concept de Pareto

1 Comme le souligne [Iredi et al 2001] lutilisation du front de Pareto est utile lorsquilnest pas possible dordonner limportance des dieacuterents objectifs du problegraveme Lorsquecela est possible des poids sont attribueacutes agrave chacun des objectifs et il devient possible declasser les dieacuterentes solutions obtenues selon ces poids

2 Il est neacutecessaire decirctre capable de geacuteneacuterer beaucoup de solutions pour un problegraveme donneacutean de pouvoir deacuteterminer les solutions Pareto-optimales et les solutions domineacutees

3 Une solution Pareto-optimale nest pas forceacutement une solution inteacuteressante pour le pro-blegraveme Un exemple connu illustre ce fait une socieacuteteacute ougrave un seul homme possegravede lensembledes richesses est optimale car partager ces richesses entraicircnerait la reacuteduction du bien-ecirctredau moins un individu

4 Si le problegraveme exige le choix dune solution le front de solutions Pareto-optimales nepermet pas a priori de faire un choix eacutetant donneacute que toutes les solutions du front sonteacutequivalentes les unes aux autres Le problegraveme dispose alors dun ensemble de solutions lereacutesolvant et non dune seule solution

Le dernier point ci-dessus est eacutegalement eacutevoqueacute dans [Dorigo and Birattari 2010] ougrave lesauteurs expliquent que deux maniegraveres de reacutesoudre les problegravemes multi-objectifs existent dans lalitteacuterature soit il est possible de classer les objectifs par ordre dimportance ou eacuteventuellementde combiner tous les objectifs en un seul gracircce agrave une somme pondeacutereacutee soit les preacutefeacuterences ou lespoids a priori ne sont pas connus et dans ce cas il est inteacuteressant de deacuteterminer un ensemblede solutions Pareto optimales Dans le cadre dun systegraveme de recommandation et comme nouslavons illustreacute dans la Section 22 il est possible destimer les besoins des utilisateurs danschacune des dimensions eacutevalueacutees (diversiteacute nouveauteacute preacutecision ) et donc de moduler leurimportance en amont de la recommandation (eg en leur attribuant des poids par exemple)

26 Discussion geacuteneacuterale

Dans cet eacutetat de lart nous avons fait un tour dhorizon du domaine de la recommandationet de son eacutevolution au cours de ces derniegravere anneacutees Avec la deacutemocratisation dInternet de plus

50

26 Discussion geacuteneacuterale

en plus dutilisateurs ont eacuteteacute ameneacutes agrave utiliser ces systegravemes et aujourdhui ils accompagnentlimmense majoriteacute des grands sites web et prennent une place de plus en plus importante Cettedeacutemocratisation a permis la mise en relief des besoins toujours plus varieacutes des utilisateurs et amontreacute que les systegravemes mono-objectif baseacutes uniquement sur la preacutecision des recommandationsneacutetaient plus susants Agrave la lumiegravere de ce constat nous nous sommes particuliegraverement inteacute-resseacutes aux techniques permettant de prendre en compte le plus de dimensions possibles dans lesbesoins des utilisateurs que nous avons appeleacutes facteurs humains Les travaux de la litteacuteraturedu domaine preacutesenteacutes dans cette section ont permis de mettre en exergue un certain nombre depoints inteacuteressants qui seront utiliseacutes pour reacutepondre aux probleacutematiques de cette thegravese ils sontreacutesumeacutes dans la liste suivante

[Dorigo and Birattari 2011] les auteurs ont preacutesenteacute dieacuterents modegraveles dalgorithmes defourmis permettant de reacutesoudre un grand nombre de problegravemes Ces modegraveles sont inteacuteres-sants notamment de par leur capaciteacute de reacutesoudre des problegravemes multi-objectifs complexesgracircce aux notions dintelligence collective et deacutemergence Ils sont utiliseacutes dans dieacuterentsdomaines dapplication (optimisation recommandation) ils sont tregraves modulables etorent de nombreuses possibiliteacutes pour les probleacutematiques de cette thegravese

[Semet et al 2003] cette eacutetude est lune des premiegraveres agrave proposer lutilisation de plusieurspheacuteromones dieacuterentes dans les ACO dans le cadre dun systegraveme de recommandation dansle-education Ces dieacuterents pheacuteromones eacutetaient chacun destineacutes agrave reacutesoudre une facettedu problegraveme Ce travail a neacuteanmoins aussi montreacute les limites de la creacuteation manuelle dungraphe sur lequel appliquer les ACO deacutemontrant linteacuterecirct davoir une meacutethode automa-tique de creacuteation et de valuation dun graphe repreacutesentant le domaine dapplication et sesressources

[Kurilovas et al 2015] les auteurs ont deacutemontreacute dans cette eacutetude linteacuterecirct de pouvoircateacutegoriser les utilisateurs dun systegraveme an de personnaliser davantage les recommanda-tions mais elle a aussi montreacute le besoin de pouvoir modier en cours de fonctionnementces cateacutegories pour ne pas enfermer les utilisateurs dans les mecircmes recommandations

[Kardan et al 2014] les auteurs ont ici montreacute lutilisation de plusieurs types dagentsdieacuterents qui chacun cherchaient dieacuterentes solutions Cette technique est proche de luti-lisation des dieacuterents types de pheacuteromones de [Semet et al 2003] et permet de chercherdes solutions plus varieacutees agrave des problegravemes complexes

[Yang and Wu 2009] cette eacutetude utilise les modegraveles ACO dans le-education en eacutetoantencore le niveau de personnalisation pour chaque utilisateur Elle illustre cependant leproblegraveme courant ougrave lameacutelioration de la personnalisation des recommandations reacutesultesouvent dans laugmentation de la complexiteacute du modegravele

[Van den Berg et al 2005] cet article propose de recommander des seacutequences de res-sources eacuteducatives agrave des apprenants Il illustre linteacuterecirct de deacutenir une seacutequence de recom-mandation avec des buts peacutedagogiques agrave atteindre un objectif nal et un point de deacutepartougrave lutilisateur se trouve actuellement

[Ribeiro et al 2014] ce dernier article nutilise pas les ACO mais une hybridation de plu-sieurs algorithmes permettant de proposer des recommandations de ressources pertinentespour chaque utilisateur sur 3 dimensions (preacutecision diversiteacute nouveauteacute) Il propose doncde reacutesoudre un problegraveme similaire agrave celui poseacute dans cette thegravese mais avec une techniquedieacuterente des travaux preacutesenteacutes preacuteceacutedemment il sera par conseacutequent une solide base decomparaison pour mesurer les performances dun algorithme de type ACO

Dune maniegravere geacuteneacuterale cette revue des travaux sur les algorithmes de colonies de fourmis

51

Chapitre 2 Eacutetat de lart

ont montreacute leur puissance de reacutesolution de problegravemes varieacutes et leur modulariteacute Cependant nousavons aussi constateacute ici une tendance geacuteneacuterale ces derniegraveres anneacutees agrave complexier toujours plusle modegravele initial et les agents le composant illustrant un certain eacuteloignement avec la philosophiedes modegraveles multi-agents Celle-ci repose sur la reacutesolution de problegravemes complexes gracircce agrave laproprieacuteteacute de leacutemergence et de lauto-organisation dagents simples reacutegis par des regravegles simplesCette complexication deacutecoule cependant de la direction prise par le domaine des systegravemes de re-commandation ces derniegraveres anneacutees avec la deacutemocratisation de nombreuses mesures deacutevaluationtelles que la diversiteacute la nouveauteacute etc Dans la suite de cette thegravese nous eacutetudierons la maniegraveredont il est possible de combiner la neacutecessaire complexication des recommandations an decirctrele plus pertinent possible pour lutilisateur et la simpliciteacute inheacuterente aux modegraveles multi-agents

En conclusion nale de cet eacutetat de lart nous pouvons deacutenir deux enjeux qui guiderontla suite de ce travail la recommandation multi-objectifs et la recommandation enseacutequences Le but de cette thegravese est donc de sinscrire agrave lintersection de ces deux enjeux gracircceagrave un modegravele de colonies de fourmis multi-objectifs qui sera deacutecrit dans le chapitre suivant

52

Chapitre 3

Notre modegravele de recommandationmulti-objectifs AntRS

Sommaire

31 Introduction 54

32 Fonctionnement geacuteneacuteral du modegravele 54

33 Graphe 55

34 Objectifs 60

341 Similariteacute 63

342 Diversiteacute 64

343 Nouveauteacute 64

344 Preacutefeacuterences 66

345 Progressiviteacute 67

35 Tactiques de fusion 70

351 Colonie de fusion 71

352 Fusion de seacutequences 72

353 Conclusion 72

53

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

31 Introduction

Apregraves cet eacutetat des lieux de la recherche sur les systegravemes de recommandation il peut ecirctre utilede rappeler ici les principaux objectifs que nous nous sommes xeacutes pour ecirctre satisfaits par notremodegravele multi-objectifs de recommandation de seacutequences

Ecirctre susamment geacuteneacuterique pour quil puisse ecirctre utiliseacute dans plusieurs domaines touten sadaptant aux diverses contraintes et eacutevolutions de lenvironnement de ces domaines

Permettre de prendre des facteurs humains Pouvoir geacuterer dimportantes quantiteacute de donneacutees cest-agrave-dire ecirctre capable de produire des

recommandations satisfaisantes dans un grand espace de recherche Produire des recommandations sous forme de seacutequences

Tous ces objectifs sont neacutecessaires pour produire un modegravele reacutepondant aux probleacutematiqueseacutenonceacutees dans lintroduction de ce manuscrit Le modegravele que nous avons conccedilu prend inspirationdes modegraveles de colonies de fourmis preacutesenteacutes dans leacutetat de lart et plus particuliegraverement dela variante ACS (Ant Colony System) car cette version possegravede des qualiteacutes intrinsegraveques im-portantes notamment sa capaciteacute supeacuterieure dexploration de lenvironnement pour reacutepondreaux probleacutematiques poseacutees Pour rappel les avantages du modegravele ACS ont eacuteteacute deacutetailleacutes dans laSection 243 En se basant sur Dans la suite de ce chapitre nous deacutetaillerons le fonctionnementgeacuteneacuteral du modegravele dans la Section 32 Ensuite nous preacutesenterons la creacuteation du graphe dansla Section 33 et les facteurs humains consideacutereacutes et leur inteacutegration dans la Section 34 Nousdeacutetaillerons par la suite les deux tactiques de fusion des reacutesultats pour la recommandation naledans la Section 35 et enn nous discuterons du modegravele dans son ensemble

32 Fonctionnement geacuteneacuteral du modegravele

Dans le chapitre preacuteceacutedent sur leacutetat de lart nous avons preacutesenteacute dans la Section 243 lemodegravele ACS de Dorigo et son fonctionnement [Dorigo and Birattari 2010] Notre modegravele sinspiredACS dans le sens ougrave nous reprenons les grandes eacutetapes de ce dernier tout en ladaptant aucontexte et aux contraintes des systegravemes de recommandation Pour rappel voici lalgorithme 1de haut niveau sur lequel se base le fonctionnement de lensemble des algorithmes des ACO

Algorithm 1 Meacutetaheuristique Ant Colony Optimization

Initialisation des paramegravetres et des pheacuteromoneswhile conditions darrecircts non atteintes doConstruction des solutionsRecherche Locale (optionnelle)Mise agrave jour des pheacuteromones

end while

Chaque version existante des ACO a introduit des variations dans une ou plusieurs deseacutetapes centrales de lalgorithme La variante ACS a par exemple introduit la mise agrave jour localedes pheacuteromones dans la derniegravere eacutetape UpdatePheromones Notre modegravele suit cette philosophieen prolongeant les travaux de Dorigo agrave travers une variante multi-colonies et multi-objectifs quenous avons nommeacute AntRS Avant de deacutenir plus en deacutetail ces modications dans le reste duchapitre voici lalgorithme 2 modieacute correspondant au fonctionnement de notre modegravele

54

33 Graphe

Algorithm 2 AntRS

Initialisation des paramegravetres et des pheacuteromonesCreacuteation du grapheInitialisation des dieacuterentes colonieswhile conditions darrecircts non atteintes doConstruction des solutions pour chaque colonieMise agrave jour locale et globale des pheacuteromones modieacutee

end whileFusion des dieacuterentes solutionsRecommandation

Dans notre modegravele inspireacute dACS nous pouvons distinguer un certain nombre dapports quiseront approfondis dans la suite de ce chapitre La creacuteation du graphe prend ainsi une placepreacutepondeacuterante en amont de lexeacutecution de lalgorithme an de pouvoir repreacutesenter correctementle domaine dapplication et ses ressources De plus alors que dans les modegraveles initiaux de Dorigoune seule colonie de fourmis avait pour but de trouver des solutions notre modegravele possegravedeplusieurs colonies travaillant chacune agrave optimiser un objectif (ie un aspect correspondant agraveun facteur humain) de la recommandation nale Ces dieacuterentes colonies constituent le cdivideurde notre approche et seront expliqueacutees en deacutetail Enn apregraves la convergence dune solutiondans chacune des colonies (ie un chemin dans le graphe correspondant agrave une seacutequence deressources dans un ordre preacutecis) un dernier processus de fusion de ces solutions a lieu an dene proposer agrave lutilisateur nal quune seule seacutequence orant le meilleur compromis entre lesdieacuterents objectifs de chaque colonie Apregraves cette derniegravere eacutetape la recommandation peut ecirctreproposeacutee agrave lutilisateur Dans la suite de ce chapitre ces dieacuterentes eacutetapes seront deacutetailleacutees ande mettre en exergue le fonctionnement de notre modegravele

33 Graphe

La premiegravere eacutetape de fonctionnement du modegravele est la creacuteation du graphe Celui-ci repreacute-sente lenvironnement dans lequel les agents eacutevoluent Dans ce contexte les ndivideuds repreacutesententles ressources du domaine (musiques oeuvres dart contenu peacutedagogique etc) tandis que lesarecirctes sont les chemins permettant dacceacuteder agrave ces ressources Les agents se deacuteplacent ainsi dendivideuds en ndivideuds en empruntant des arecirctes Le processus de creacuteation du graphe nest souvent quepeu deacutetailleacute dans la litteacuterature pour plusieurs raisons Premiegraverement un certain nombre deacutetudesse focalisent sur un jeu de test composeacute de peu de ressources limitant linteacuterecirct de deacutevelopperdes tactiques eacutelaboreacutees de creacuteation dun graphe Cela peut ecirctre ducirc agrave la simpliciteacute dutiliser unpetit jeu de donneacutees aux limites poseacutees par le domaine dapplication ou encore agrave la diculteacute dereacutecolter des donneacutees Par exemple si le but est de deacutevelopper un systegraveme de recommandationdans un museacutee contenant 100 divideuvres dart le graphe repreacutesentant le domaine sera relativementpeu complexes (ie 100 ndivideuds et quelques centaines ou milliers darecirctes) De la mecircme maniegraverelorsque le jeu de donneacutees est limiteacute en taille il est possible pour des experts du domaine decreacuteer et de valuer manuellement les arecirctes entre les dieacuterentes ressources comme cela a eacuteteacute faitdans [Semet et al 2003] Cependant la conception dun algorithme permettant de construire latopologie du graphe de maniegravere automatique possegravede agrave la fois des avantages et des inconveacutenients

55

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

Avantages Inconveacutenientsbull La conception algorithmique du graphepermet de sadapter rapidement agrave dieacute-rents domaines applicatifs ayant dieacuterentstypes et nombres de ressources

bull La qualiteacute dun graphe produit automa-tiquement deacutepend fortement de la qualiteacutede son algorithme et peut potentiellementecirctre moins pertinent quun graphe creacutee parun expert du domaine

bull Il devient possible dinteacutegrer untregraves grand nombre de ressources du do-maine applicatif si cela est neacutecessaire (parexemple toutes les musiques dun sitedeacutecoute de musiques en ligne)

bull La prise en compte dun grand nombrede ressources a pour conseacutequence daug-menter signicativement le temps de calculde lalgorithme travaillant sur ce graphe enaval

bull Lintervention dexperts humains ne de-vient plus neacutecessaire pour creacuteer la topolo-gie du graphe et valuer ses arecirctes

bull Lalgorithme de creacuteation automatiquedu graphe doit capturer les informationsdun domaine et les reeacuteter dans la topolo-gie du graphe (ie pourquoi une ressourceest lieacutee par une arecircte agrave une autre etc)

Le but de cette section sera donc de deacutetailler lalgorithme de creacuteation du graphe ainsi que lesreacuteponses proposeacutees aux inconveacutenients eacutenonceacutes ci-dessus

Avant de preacutesenter la meacutethode de creacuteation du graphe il est important de discuter de ceque repreacutesente ce graphe dans le modegravele ACO et de son pendant pour les fourmis Une desdieacuterences principales entre le comportement reacuteel des fourmis dans la nature et les simulationsinformatiques des algorithmes ACO reacuteside dans la deacutenition de lespace de recherche Les four-mis reacuteelles eacutevoluent dans un espace de recherche continu sans aucun point de repegravere ni cheminpreacute-eacutetabli Les fourmis sont en outre libres dexplorer lenvironnement ougrave bon leur semble Lesagents simuleacutes avec ACO sont quant agrave eux limiteacutes agrave un espace de recherche discret (le graphe)et ne peuvent se mouvoir quagrave certains points dinteacuterecircts (les sommets) en empruntant certainschemins deacutejagrave eacutetablis (arecirctes) Cette simplication de lespace de recherche est neacutecessaire agrave la foispour reacuteduire la complexiteacute de lalgorithme et pour permettre de repreacutesenter des domaines dap-plication posseacutedant des ressources connues contrairement agrave un environnement naturel inconnuet potentiellement inni du point de vue dune fourmi Cependant les algorithmes ACO ontavant tout un but de simulation du comportement de ces fourmis An de combiner agrave la fois lescontraintes dune simulation informatique avec le comportement reacuteel observeacute des fourmis dansla creacuteation du graphe plusieurs solutions sont possibles

Lun des moyens les plus simples pour approcher le comportement reacuteel des fourmis dansla nature consiste agrave creacuteer des arecirctes entre chaque sommet du graphe dans le but de creacuteer unenvironnement ougrave lagent simuleacute pourra se deacuteplacer ougrave il veut en empruntant le chemin quildeacutesire Le graphe creacuteeacute serait ainsi complet Neacuteanmoins cette approche nest pas reacutealiste pour deuxraisons principales Premiegraverement lenvironnement peut contenir des obstacles infranchissablespour des fourmis et elles ne peuvent donc pas se deacuteplacer partout Dans un graphe cela setraduirait par une absence darecircte entre deux sommets Deuxiegravemement cette solution est aussipeu pratique degraves que le nombre de sommets deacutepasse plusieurs centaines car le nombre darecirctesn creacuteeacutees se calcule avec |E| = n(nminus1)

2 Le nombre darecirctes dun graphe de 100 sommets est doncde 4950 tandis que pour un graphe de 1000 sommets ce nombre atteint deacutejagrave 499500 comme lemontre la Figure 31 Cette augmentation exponentielle nest eacutevidemment pas envisageable degraveslors que lon traite de domaines pouvant posseacuteder plusieurs dizaines de milliers de ressources agrave

56

33 Graphe

repreacutesenter dans le graphe

Figure 31 Graphe repreacutesentant leacutevolution exponentielle du nombre darecirctes selon le nombrede sommets existants dans un graphe complet

Un des objectifs de cette thegravese eacutetant dappliquer notre modegravele agrave un domaine applicatif reacuteelposseacutedant de tregraves nombreuses ressources la creacuteation dun graphe complet neacutetait pas une op-tion Nous avons donc opteacute pour une approche plus reacutealiste dans la creacuteation du graphe ande diminuer sa taille et les temps de calculs potentiels Pour reacutealiser cette tacircche nous navonsque deux solutions possibles supprimer des sommets etou supprimer des arecirctes La premiegraverepossibiliteacute a rapidement eacuteteacute eacutecarteacutee car supprimer des sommets aecte directement la qualiteacutedes solutions trouveacutees en faisant meacutecaniquement baisser la mesure de couverture du systegraveme derecommandation cest-agrave-dire la capaciteacute qua un systegraveme agrave recommander toutes les ressourcesdun domaine De plus il nest pas eacutevident de justier la suppression de certains sommets parrapport agrave dautres Chaque sommet du graphe repreacutesentant une ressource unique du domainedapplication la suppression de certains sommets ne pourrait se faire que par la creacuteation de regraveglesgeacuteneacuterales Une solution possible pourrait ecirctre par exemple de ne pas inteacutegrer dans le graphe lesressources nayant jamais eacuteteacute consulteacutees ou nayant pas eacuteteacute consulteacutees lors des 6 derniers moisCependant on voit bien que ces regravegles ne sont pas forceacutement adapteacutees agrave chaque utilisateur etont un grand risque de supprimer des ressources que ces derniers auraient pu appreacutecier Nousavons donc preacutefeacutereacute la deuxiegraveme solution supprimer des arecirctes Cette meacutethode a lavantage degarder lensemble des ressources du domaine recommandables par le systegraveme tout en reacuteduisantgrandement la complexiteacute du graphe 37 La question sest donc poseacutee didentier les arecirctes agraveseacutelectionner le but eacutetant de permettre au systegraveme de proposer des recommandations agrave la foisqualitatives adapteacutees mais aussi potentiellement nouvelles agrave lutilisateur tout en reacuteduisant lataille du graphe Pour ce faire nous avons formuleacute deux hypothegraveses aidant agrave la seacutelection desarecirctes

37 Tant quil y a un chemin dans le graphe permettant de se deacuteplacer dun sommet quelconque vers tous lesautres sommets alors toutes les ressources peuvent theacuteoriquement ecirctre recommandeacutees par le systegraveme

57

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

1 Les seacutequences de ressources deacutejagrave consulteacutees par le passeacute contiennentdes informations sur le comportement des utilisateurs qui peuventecirctre exploiteacutees pour la topologie du graphe

2 Les seacutequences de ressources deacutejagrave consulteacutees par les utilisateurs au-paravant ne sont pas toujours les meilleures possibles et auraient puecirctre ameacutelioreacutees avec des recommandations pertinentes

La premiegravere hypothegravese H1 se justie par le fait que lutilisateur est le premier agrave connaicirctreses envies ses besoins et les ressources qui le satisferaient le plus agrave un moment t [Jones 2010]Il est donc neacutecessaire de consideacuterer ces seacutequences de consultations passeacutees an de comprendrelutilisation que font les utilisateurs des ressources du domaine La deuxiegraveme hypothegravese se justiequant agrave elle par le fait quun utilisateur ne peut pas dans la majoriteacute des cas avoir une vue den-semble de toutes les ressources dun domaine Il est en eet courant pour un site de e-commerceou deacutecoute de musiques de posseacuteder plusieurs dizaines de milliers de ressources La deuxiegravemehypothegravese H2 se base donc sur le problegraveme fondamental que les systegravemes de recommandationessaient de reacutesoudre agrave savoir aider les utilisateurs agrave faire les meilleurs choix possibles dans desenvironnements toujours plus complexes et vastes Cette discussion sur les deacutes ameneacutes par cesdeux hypothegraveses nous amegravene agrave consideacuterer le travail dHerbert Simon qui a eacuteteacute deacutecoreacute dun prixnobel deacuteconomie et dun prix Turing Ce dernier a theacuteoriseacute et nommeacute le problegraveme de rationaliteacutelimiteacutee devant des contraintes alteacuterant et limitant les capaciteacutes dun individu (domaine tropvaste manque dinformation etc) il est preacutefeacuterable de se diriger vers des solutions satisfaisantesplutocirct quoptimales [Simon 1997] En reacuteponse agrave ce problegraveme les utilisateurs procegravedent donc paressais-erreurs pour reacutepondre agrave leurs besoins de maniegravere empirique [Jameson et al 2015] Les seacute-quences dinteractions creacuteeacutees par les utilisateurs durant ces processus contiennent donc beaucoupdinformations exploitables par un systegraveme de recommandation mais aussi beaucoup de bruitset dapproximations [Kuhlthau 1991 Castagnos et al 2010] La philosophie de notre modegraveleest les reacuteponses que nous apportons aux problegravemes ci-dessus sont inspireacutees par cette theacuteorie

An de prendre en compte ces deux hypothegraveses nous proposons dans la suite de cette sectionune meacutethode permettant de creacuteer un graphe orienteacute en se basant agrave la fois sur les seacutequencespasseacutees des utilisateurs ainsi que sur la creacuteation de nouvelles arecirctes Lobjectif est dexploiterles informations contenues dans les seacutequences passeacutees des utilisateurs mais aussi de garantirune certaine seacuterendipiteacute du systegraveme de recommandation via la creacuteation de nouvelles arecirctes Lapremiegravere eacutetape de ce processus est de creacuteer un sommet par ressource du domaine Ensuite pourconstruire les arecirctes reliant ou non ces sommets nous calculons les poids associeacutes aux nombrede co-consultations preacutesentes dans lensemble des seacutequences de consultations passeacutees Autrementdit quand un utilisateur consulte une ressource A puis une ressource B directement apregraves nousconsideacuterons que la transition A rarr B est une co-consultation Pour deacuteterminer si une arecircte estconstruire entre deux sommets nous calculons ensuite le poids de la co-consultation cest-agrave-direle nombre de fois quelle apparaicirct dans les seacutequences des utilisateurs En fonction de ce poidsdeux opeacuterations sont reacutealiseacutees

1 Toutes les co-consultations posseacutedant un poids supeacuterieur agrave seuil speacutecique sont ajouteacuteescomme arecirctes orienteacutees dans le graphe reliant les deux sommets concerneacutes Le seuil estdeacutetermineacute de maniegravere empirique car il est deacutependant de chaque domaine et de la base dedonneacutees utiliseacutees

2 En dessous du seuil seules certaines co-consultations sont seacutelectionneacutees pour devenir des

58

33 Graphe

arecirctes selon un processus inteacutegrant une part daleacuteatoire que nous deacutetaillerons dans la suitede cette section

Ces deux opeacuterations permettent de peupler le graphe darecirctes correspondant agrave la fois agrave toutesles transitions les plus eectueacutees par les utilisateurs ainsi quagrave certaines des transitions moinsusiteacutees par ces derniers Apregraves ces deux opeacuterations le graphe possegravede donc un certain nombredarecirctes reliant ses sommets mais rien ne garantit que chaque sommet est bien relieacute au reste dugraphe (si par exemple un sommet repreacutesente une ressource tregraves peu consulteacutee du domaine) Deplus et malgreacute la deuxiegraveme opeacuteration mitigeant cet eet les transitions tregraves usiteacutees (entre desressources populaires par exemple) seront sur-repreacutesenteacutees avec cette meacutethode de constructionCette sur-repreacutesentation produira forceacutement en aval des solutions que lon pourrait qualier declassique dans le sens ougrave elles reprendraient en majoriteacute ces transitions tregraves utiliseacutees et connuesdes utilisateurs An de limiter cet eet et de sassurer que tous les sommets sont bien connecteacutesau graphe une troisiegraveme et derniegravere opeacuteration est eectueacutee

3 Pour chaque sommet si un certain niveau de connectiviteacute nest pas atteint autrement ditsi le sommet possegravede moins darecirctes quun seuil xeacute agrave lavance alors des arecirctes aleacuteatoiressont ajouteacutees an datteindre ce seuil

Cette troisiegraveme opeacuteration permet de sassurer quaucun sommet repreacutesentant une ressourcepeu consulteacutee ne soit laisseacute sans connexion avec le reste du graphe Ainsi chaque sommet pos-seacutedera un certain niveau de connectiviteacute aussi appeleacute degreacute avec le reste du graphe Le grapheainsi obtenu apregraves ces 3 opeacuterations possegravede dans sa topologie agrave la fois les liens les plus usiteacutes parles utilisateurs ainsi que des liens aleacuteatoires permettant la creacuteation de recommandations poten-tiellement nouvelles Lensemble du processus de creacuteation du graphe est repris dans lEacutequation31 ci-dessous

(1) si tij ge m alors creacuteer eij(2) si tij lt m et q lt tij ougrave q isin [min til log(max til)] alors creacuteer eij(3) si deg(i) lt d alors choisir un sommet k aleacuteatoire

et creacuteer eik jusquagrave deg(i) = d

(31)

(1) et (2) sappliquent pour chaque co-consultation tandis que (3) sapplique pour chaque som-met du graphe eij repreacutesente larecircte entre les sommets i et j tij est le poids de la co-consultationde la ressource i vers la ressource j par les utilisateurs dans les seacutequences de consultations passeacuteesm est le seuil au-dessus duquel les co-consultations sont automatiquement ajouteacutees au graphecomme arecirctes q isin [min til log(max til)] est une variable aleacuteatoire uniformeacutement distribueacutee danslintervalle deacutecrit min til est le nombre minimal de co-consultations entre la ressource i et toutesles autres ressources l isin Vi ougrave au moins une co-consultation a eacuteteacute trouveacutee deg(i) est le degreacutedu ndivideud i dans le graphe et d est un paramegravetre speacuteciant le degreacute minimal de connectiviteacute quedoit posseacuteder chaque sommet dans le graphe nal Il est agrave noter quagrave ce stade du processus decreacuteation du graphe les arecirctes ne sont pas valueacutees car les valeurs attribueacutees aux arecirctes varientpour chaque utilisateur Ce processus sera deacutetailleacute dans la suite de la section

Avec cette technique de construction la taille du graphe deacutepend deacutesormais principalementde la variable d deacutenissant le degreacute minimal de connectiviteacute agrave atteindre (en plus du nombrede sommets comme preacuteceacutedemment) La Figure 32 ci-dessous repreacutesente leacutevolution du nombredarecirctes uniquement en fonction de la variable d Dans la pratique le nombre darecirctes sera

59

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

supeacuterieur aux nombres preacutesenteacutes dans la gure eacutetant donneacute que les deux premiegraveres eacutetapes de lacreacuteation du graphe ajoutent des arecirctes en fonction des transitions trouveacutees dans les consultationspasseacutees des utilisateurs

Figure 32 Graphe repreacutesentant leacutevolution lineacuteaire du nombre darecirctes selon le nombre desommets voulus dans un graphe creacuteeacute avec dieacuterentes valeurs de d

Ce processus de construction de graphe a pour double objectif dexploiter les informationsdes seacutequences des utilisateurs et de creacuteer de nouvelles seacutequences possibles Il existe potentiel-lement une inniteacute de creacuteer un graphe agrave partir des ressources dont nous disposons et il esteacutevident que la topologie du graphe a une inuence importante sur les reacutesultats possibles carle graphe repreacutesente lentiegravereteacute de lenvironnement dans lequel les agents vont eacutevoluer Le pro-cessus de construction que nous avons deacutecrit nest quune maniegravere parmi dautres daboutir agraveun graphe Cependant nous faisons lhypothegravese que la combinaison darecirctes repreacutesentant desco-consultations aux poids importants darecirctes repreacutesentant certaines co-consultations moinspreacutesentes et darecirctes creacuteant de nouvelles transitions permet de capturer linformation preacutesentedans le domaine tout en garantissant une certaine seacuterendipiteacute avec leacutemergence possible nouvellesseacutequences

34 Objectifs

Une fois le graphe creacuteeacute le modegravele peut ecirctre appliqueacute sur ce dernier an de produire des recom-mandations Dans cette section nous allons deacutenir comment fonctionne le modegravele pour produiredes recommandations agrave partir du graphe ainsi que les facteurs humains ie les objectifs quilcherche agrave satisfaire

Comme nous lavons vu dans le chapitre preacuteceacutedent sur leacutetat de lart il est deacutesormais lar-gement admis que la mesure de preacutecision seule nest pas susante pour produire de bonnesrecommandations aux utilisateurs Dautres facteurs humains doivent ecirctre consideacutereacutes pour satis-faire la plus grande varieacuteteacute dutilisateurs et de contextes possible Nous proposons donc de deacutenirun ensemble de 4 facteurs humains parmi les plus eacutetudieacutes dans la litteacuterature et de les prendre encompte dans notre modegravele de recommandation Ces facteurs humains seront par la suite appe-

60

34 Objectifs

leacutes objectifs car pour notre modegravele ces facteurs humains sont en eet consideacutereacutes comme desobjectifs agrave atteindre et agrave maximiser Les voici accompagneacutee dune courte description

1 Similariteacute recommander des ressources similaires agrave ce que lutilisateur a aimeacute par lepasseacute

2 Diversiteacute recommander des ressources diverses par rapport agrave ce que lutilisateur a aimeacutepar le passeacute

3 Nouveauteacute recommander des ressources nouvelles que lutilisateur ne connaicirct pas en-core

4 Preacutefeacuterences recommander des ressources que lutilisateur a deacutejagrave appreacutecieacute dans le passeacute

La similariteacute et les preacutefeacuterences sont proches des notions de preacutecision et de rappel mais diegraverenttoutefois dans le sens ougrave lon ne cherche pas agrave reproduire exactement les mecircmes seacutequences quelutilisateur a consulteacute mais agrave lui recommander des seacutequences pouvant le satisfaire Ces objectifsrepreacutesentent des facteurs humains important dans la creacuteation dune bonne recommandationIls seront deacutetailleacutes dans la suite de cette section Agrave ces 4 objectifs concernant les ressourcesrecommandeacutees nous ajoutons un cinquiegraveme objectif sinteacuteressant quant agrave lui agrave la maniegravere dontsont proposeacutees les recommandations agrave un utilisateur

5 Progressiviteacute recommander une seacutequence de ressources de sorte que la transition entrechacune de ces ressources soit uide et adapteacutee aux preacutefeacuterences de lutilisateur

Ces 5 objectifs consideacutereacutes sont tous transposables dans dieacuterents domaines applicatifs ga-rantissant la geacuteneacutericiteacute de cette approche Cependant il est eacutevident que dun domaine applicatifagrave lautre certaines dieacuterences peuvent justier la mise en avant dun objectif plutocirct quun autreDe la mecircme maniegravere les besoins et preacutefeacuterences pour ces objectifs peuvent varier dun utilisateuragrave un autre au sein du mecircme domaine Pour reacutepondre agrave ces deux problegravemes nous expliqueronsaussi dans cette section comment adapter limportance de chaque objectif Il est aussi importantde consideacuterer le fait que nous nous appuyons sur ces objectifs car ils sont les plus freacutequemmentciteacutes dans la litteacuterature Lobjectif est de deacutemontrer que notre modegravele est capable de produiredes seacutequences satisfaisant les objectifs consideacutereacutes Ce faisant nous montrons par la mecircme occa-sion que les objectifs peuvent ecirctre adapteacutes enleveacutes ou ajouteacutes En eet on pourrait tregraves bienconsideacuterer dautres objectifs (personnaliteacute point de congestion si lon est dans un museacutee etc)En dautres termes le but est de deacutemontrer la geacuteneacutericiteacute de notre modegravele

Avant de deacutetailler comment calculer ces objectifs nous allons expliquer ici comment les in-teacutegrer dans le modegravele Le but de notre modegravele est de proposer des recommandations orant unbon compromis entre les dieacuterents objectifs ougrave limportance de ces derniers peut ecirctre ajusteacutees agravevolonteacute Pour ce faire notre modegravele doit ecirctre capable de transformer ces objectifs listeacutes plus hauten valeurs pouvant ecirctre chireacutees et optimiseacutees Autrement dit notre modegravele a pour but de reacute-soudre un problegraveme de recommandation multi-objectifs Le choix des algorithmes ACO est ici dusens eacutetant donneacutes ces besoins speacuteciques En eet nous avons montreacute dans leacutetat de lart que lemodegravele ACS faisant partie des ACO eacutetait capable de reacutesoudre des problegravemes posseacutedant plusieursobjectifs comme par exemple avec le vehicle routing problem with time windows [Gambardellaet al 1999] ou encore avec le multi-objective travelling salesman problem [Angus 2007] Devantla complexiteacute et les dimensions toujours croissantes des problegravemes agrave reacutesoudre en informatique lesapproches multi-dimensionnelles des algorithmes ACO se sont multiplieacutees ces derniegraveres anneacutees

61

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

[Doerner et al 2004 Alaya et al 2007 Angus and Woodward 2009 Dorigo and Stuumltzle 2019]Mecircme si chacune de ces approches a pour but de reacutesoudre un problegraveme multi-objectif la maniegraveredy arriver est dieacuterente tant les algorithmes ACO sont modulaires Pour rappel notre problegravemeconsiste en la recommandation de seacutequences agrave partir dun graphe et prenant en compte plusieursobjectifs pouvant potentiellement ecirctre incompatible entre eux Il est important dinsister sur cedernier point an de comprendre la solution mise en place dans notre modegravele Les objectifs quenous avons deacutecrits ci-dessus peuvent en eet ecirctre incompatibles les uns avec les autres quandbien mecircme le but est de geacuteneacuterer une recommandation posseacutedant un certain eacutequilibre parmi cha-cun dentre eux Lobjectif de preacutefeacuterences dont le but est de proposer des ressources deacutejagrave connueset appreacutecieacutees ainsi que lobjectif de nouveauteacute dont le but est de proposer des ressources en-core non connues sont par exemple en contradiction claire Chaque objectif traiteacute seacutepareacutementproduira potentiellement des recommandations mutuellement exclusives et pourtant il peut ecirctreinteacuteressant de proposer agrave lutilisateur une seacutequence de recommandations posseacutedant ces deux as-pects speacuteciques Partant de ce constat nous avons deacutecideacute dinteacutegrer chaque objectif comme unecolonie dieacuterente dans le modegravele ACS Ainsi nos 4 premiers objectifs (similariteacute diversiteacute nou-veauteacute preacutefeacuterences) seront repreacutesenteacutes par 4 colonies dans notre modegravele tandis que le cinquiegravemeobjectif la progressiviteacute sera quant agrave lui traiteacute agrave part eacutetant donneacute quil concerne la structure dela recommandation et non les ressources recommandeacutees en elles-mecircmes

Inteacutegrer ces objectifs par le biais de plusieurs colonies a neacutecessiteacute quelques changements danslalgorithme ACS Dans le modegravele initial les agents dune seule colonie se deacuteplacent sur le graphedont chacune des arecirctes est valueacutee en fonction de la distance seacuteparant les 2 sommets la consti-tuant Le but des agents est ensuite de se deacuteplacer sur ce graphe an de trouver le plus courtchemin dun sommet A agrave un sommet B agrave laide des pheacuteromones quils y deacuteposent Une fois quunesolution eacutemerge comme eacutetant la meilleure gracircce au meacutecanisme de stigmergie lalgorithme peutsarrecircter et la meilleure solution est retenue

La philosophie derriegravere cette solution deacutecoule des principes mecircme des systegravemes multi-agentsLeacutetat de lart du chapitre preacuteceacutedent la montreacute lapproche multi-agent pour la reacutesolution deproblegravemes est agrave la fois simple eacuteleacutegante et ecace Dautres solutions auraient eacuteteacute possiblescomme par exemple complexier les agents en leur ajoutant de nouveaux comportementS maisnous avons voulu garder lessence des systegravemes multi-agents reacuteactifs leacutemergence de comporte-ments intelligents de par les interactions entre agents tregraves simples An de rester aussi procheque possible des principes de base de lalgorithme nous avons voulu converser le fonctionnementgeacuteneacuteral des colonies et de la deacutecouverte de solutions sur le graphe tout en les adaptant agrave notrecontexte Pour ce faire nous avons jouer sur la maniegravere dont se deacutenit et se calcule la notionde distance dans le graphe Dans les algorithmes ACO la distance d associeacutee agrave chaque arecirctedu graphe repreacutesente comme son nom lindique la distance physique neacutecessaire pour aller dunsommet agrave lautre de larecircte Cette distance ne demande a priori pas de calcul et est simple-ment deacuteduite ou mesureacutee de lenvironnement repreacutesenteacute par le graphe Elle est ensuite utiliseacuteepour calculer lheuristique ηij comme montreacute dans lEacutequation 212 (pour rappel lheuristiquese calcule ainsi ηij = 1

dij) Nous navons pas modieacute le calcul de ηij mais nous avons modieacute

le sens de la distance d qui le compose Au lieu de repreacutesenter la distance physique entre deuxsommets d repreacutesente dans notre modegravele une distance calculeacutee entre deux ressources sa valeureacutetant directement deacutependante de lobjectif de la colonie Prenons un exemple pour illustrer lamaniegravere dont cette distance peut varier entre deux sommets pour dieacuterentes colonies

62

34 Objectifs

Supposons un systegraveme de recommandation dans le domaine museacuteal dont le but est de proposerdes parcours composeacutes de dieacuterentes peintures Le museacutee possegravede entre autres deux tableauxde Vincent van Gogh appartenant agrave la seacuterie des Tournesols Ces tableaux sont tous les deux desnatures mortes repreacutesentant un vase et 15 tournesols ils ont tous les deux eacuteteacute peints en 1889 les palettes de couleurs et le style sont quasi similaires Dans le graphe les sommets A et Brepreacutesentent ces deux tableaux et (AB) repreacutesente larecircte les reliant Pour toutes les raisonseacutevoqueacutees ci-dessus on peut raisonnablement penser que ces deux ressources sont tregraves similairesentre elles La distance dsimilarit de la colonie axeacutee sur la similariteacute sera donc faible indiquant auxagents que les deux sommets sont eectivement proches lun de lautre et favorisant le passagepar cette arecircte pour minimiser la distance totale de la solution Agrave linverse la colonie relativeagrave la diversiteacute aura agrave traverser une plus longue distance ddiversit entre les deux sommets commeces derniers sont tregraves similaires entre eux Agrave travers ces exemples sont illustreacutees les dieacuterencespossibles dans le calcul de la distance d en fonction de lobjectif consideacutereacute La conseacutequence agrave celaest que mecircme si la topologie du graphe peut rester la mecircme pour tous les objectifs le calculdes distances et la valuation des arecirctes seront quant agrave eux dieacuterents selon lobjectif Le reste decette section propose une maniegravere de calculer ces distances pour chaque objectif

341 Similariteacute

Cest lun des facteurs humains les plus importants des systegravemes de recommandation et il estpris en compte par limmense majoriteacute de ces systegravemes En eet un des objectifs majeurs dunsystegraveme de recommandation est de proposer des ressources similaires agrave celles que lutilisateura aimeacute auparavant ou proche des ressources quil consultait reacutecemment La similariteacute est unecaracteacuteristique bien connue et largement utiliseacutee dans la litteacuterature Nous adheacuterons au principeselon lequel un systegraveme de recommandation ne peut pas la neacutegliger et doit linclure pour produiredes recommandations satisfaisantes Cependant la similariteacute ne devrait pas non plus ecirctre lapierre angulaire de chaque systegraveme de recommandation comme elle la eacuteteacute par le passeacute Le butde cette colonie est donc de trouver une liste avec des eacuteleacutements aussi proches que possible dece que lutilisateur appreacutecie ou est en train de consulter Il existe de nombreuses meacutethodespour calculer la similariteacute entre deux ressources Dune maniegravere geacuteneacuterale les ressources dundomaine sont deacutecrites par des meacutetadonneacutees numeacuteriques textuelles binaires etc Le format deces meacutetadonneacutees est entiegraverement deacutependant de chaque domaine applicatif Nous avons deacutecideacutede geacuteneacuteraliser ce problegraveme et de le consideacuterer comme une comparaison entre deux vecteursNous avons ensuite deacutecideacute dutiliser la mesure de la similariteacute cosinus entre ces deux vecteurs depar sa populariteacute dans la litteacuterature scientique et sa pertinence quand aux donneacutees dont nousdisposons [Su and Khoshgoftaar 2009] La maniegravere dimpleacutementer cette similariteacute dun point devue applicatif deacutepend des meacutetadonneacutees disponibles Dans le cas de donneacutees non numeacuteriques il estpossible dobtenir des valeurs numeacuteriques de similariteacute agrave partir de listes ou de valeurs qualitatives[lHuillier 2018] De mecircme dautres maniegravere de calculer la similariteacute peuvent ecirctre utiliseacutees enfonction de leur pertinence par rapport au domaine applicatif Dans notre contexte geacuteneacuteralisteet an de deacuteterminer la valeur de la distance d associeacutee agrave chaque arecircte du graphe nous avonstout dabord calculeacute la similariteacute cosinus entre les deux ressources repreacutesenteacutees par les sommetsPlus formellement pour une arecircte (i j) la similariteacute de ses deux ressources sij est calculeacutee avecla similariteacute cosinus entre les deux vecteurs des caracteacuteristiques descriptives C des ressources iet j comme montreacute dans lEacutequation 32

sij =1

sim(Ci Cj)(32)

63

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

ougrave Ci repreacutesentent les caracteacuteristiques de la ressource i Le terme de caracteacuteristiques estgeacuteneacuterique et peut inclure toutes les meacutetadonneacutees exploitables de domaine applicatif sur une res-source Comme expliqueacute plus haut ces caracteacuteristiques sont donc deacutependantes de chaque basede donneacutees et de chaque domaine dapplication Nous avons ici geacuteneacuteraliseacute ces donneacutees avec laformalisation suivante chaque ressource (ou item) i du domaine dapplication est deacutecrite par ncaracteacuteristiques c comme suit Ci = c1 c2 cn

Dans lexemple donneacute plus haut avec les deux tableaux de van Gogh nous avons expliqueacute quela distance seacuteparant deux sommets sur le graphe repreacutesentait intuitivement leur eacuteloignementselon lobjectif consideacutereacute Ainsi pour la similariteacute deux sommets repreacutesentant des ressourcessimilaires verront larecircte les reliant posseacuteder une faible distance et inversement Le but est icidecirctre le plus proche possible du fonctionnement du modegravele initial ougrave une petite distance entredeux sommets repreacutesentent eectivement une petite distance physique entre ces deux points(par exemple deux points geacuteographiques proches lun de lautre) La similariteacute cosinus produitcependant une valeur comprise entre [0 1] ne correspondant pas agrave la valuation des arecirctes dansle modegravele initial An de convertir cette similariteacute s isin [0 1] en distance d isin [1 +infin] nous avonssimplement utiliseacute linverse multiplicatif d = 1

s Ainsi et agrave linstar du modegravele initial de Dorigoune distance proche de 1 associeacutee agrave une arecircte (i j) signie que les deux ressources i et j sontsimilaires

342 Diversiteacute

Ce facteur est souvent preacutesenteacute en mecircme temps que la similariteacute eacutetant donneacute quils sont tousdeux lieacutes agrave la distance ou agrave la correacutelation entre les ressources consulteacutees par lutilisateur etses recommandations Mais contrairement agrave la similariteacute la diversiteacute illustre agrave quel point deuxeacuteleacutements sont dissemblables lun par rapport agrave lautre La similariteacute et la diversiteacute se complegravetentdans la mesure ougrave elles sont toutes deux neacutecessaires pour adapter le systegraveme de recommandationaux besoins des dieacuterents utilisateurs [Jones 2010] Nous avons choisi dutiliser linterpreacutetationclassique consistant agrave consideacuterer la diversiteacute comme linverse de la similariteacute La diversiteacute divijentre deux ressources i et j est donc obtenue en calculant linverse de la similariteacute entre i etj comme indiqueacute dans Eacutequation 33 De la mecircme maniegravere que pour la similariteacute nous avonsensuite utiliseacute linverse multiplicatif de la diversiteacute pour obtenir une distance d isin [1 +infin]

divij =1

1minus sim(Ci Cj)(33)

Toutefois cette seule mesure ne capture pas lensemble de la diversiteacute dune seacutequence Destravaux de la litteacuterature ont eacuteteacute meneacutes sur les seacutequences et les dieacuterentes maniegraveres de les ca-racteacuteriser On peut citer la diversiteacute relative (RD Relative Diversity) qui permet de mesurerlapport de chaque ressource ajouteacutee agrave une seacutequence existante en cours de construction ou encorela similariteacute intra-liste (ILS Intra-List Similarity) qui est la moyenne des similariteacutes cosinusde toutes les ressources composant une seacutequence [Ziegler et al 2005] Nous navons pas utiliseacuteces deux mesures agrave ce stade de notre modegravele mais nous les exploiteront an de mesurer lesperformances de notre modegravele

343 Nouveauteacute

Ce facteur humain repreacutesente les ressources encore non connues de lutilisateur Il peut sagirde nouvelles ressources reacutecemment ajouteacutees au systegraveme ou de ressources plus anciennes mais

64

34 Objectifs

moins populaires que lutilisateur na pas consulteacutees Selon le domaine dapplication etou selonlancienneteacute de lutilisateur les ressources non consulteacutees peuvent ne constituer quune faible par-tie des ressources totales (eg dans un petit museacutee ne posseacutedant que quelques dizaines ddivideuvres)comme elles peuvent aussi repreacutesenter limmense majoriteacute des ressources totales (eg sur des sitesdeacutecoute de musiques en ligne qui ont souvent des catalogues de plusieurs centaines de milliers demusiques disponibles) La nouveauteacute ne doit cependant pas ecirctre confondue avec la diversiteacute carles ressources consideacutereacutees comme nouvelles peuvent ecirctre soit similaires soit dieacuterentes de cellesque lutilisateur aime habituellement La nouveauteacute est une caracteacuteristique importante dans unsystegraveme de recommandation car elle permet deacuteviter un deacutesinteacuterecirct potentiel des utilisateurs an-ciens En eet apregraves un certain temps passeacute agrave produire des recommandations un systegraveme peutavoir tendance agrave enfermer lutilisateur dans les mecircmes recommandations agrave linstar dun algo-rithme dapprentissage automatique trop bien entraicircneacute 38 Ce problegraveme dans les systegravemes derecommandation reacutesulte en une trop grande preacutevisibiliteacute des ressources recommandeacutees [Vargasand Castells 2011] Lintroduction de la nouveauteacute permet entre autres de mitiger ce problegravemeet de produire des recommandations inattendues agrave lutilisateur

An de deacuteterminer si une ressource est nouvelle ou pas pour un utilisateur en particuliernous avons utiliseacute le travail de Zhang [Zhang 2013] qui a deacuteni la nouveauteacute comme une mesurecomposeacutee de trois caracteacuteristiques

1 Unknown (notion dinconnue) repreacutesente si la ressource est connue ou non de lutilisa-teur

2 Satisfactory (satisfaction) repreacutesente si la ressource est aimeacutee ou non par lutilisateur

3 Dissimilarity (dissimilariteacute) repreacutesente si la ressource est dissimilaire aux autres res-sources connues par lutilisateur

Lauteur a ensuite proposeacute deacutevaluer formellement la nouveauteacute dune ressource i pour luti-lisateur u en proposant lEacutequation 34

Novelty(i u) = p(i|unknown u) middot dis(i prefu) middot p(i|like u) (34)

ougrave p(i|unknown u) est la probabiliteacute que lutilisateur u ne connaisse pas la ressource idis(i prefu) est la dissimilariteacute entre i et les ressources consulteacutees par lutilisateur et p(i|like u)est la probabiliteacute que lutilisateur u appreacutecie la ressource i Cette eacutequation est inteacuteressante maisdans le contexte de ce travail les notions de satisfaction et de dissimilariteacute de lutilisateur enversla ressource i sont proches des autres objectifs de notre modegravele agrave savoir respectivement pour lasatisfaction par lobjectif de diversiteacute et pour la dissimilariteacute par les deux objectifs de similariteacuteet de preacutefeacuterences Nous avons donc deacutecideacute de reacuteduire lEacutequation 34 agrave lEacutequation 35 an deacuteviterune redondance entre les objectifs

p(i|unknown u) = minuslog(1minus popi) (35)

ougrave popi est la populariteacute de la ressource i La notion de populariteacute est ici volontairement lais-seacutee geacuteneacuterale car largement deacutependante du domaine dapplication et des ressources consideacutereacuteesEn eet la populariteacute peut prendre la forme dun nombre de vues dun nombre deacutecoutes dunevaleur calculeacutee de maniegravere interne par des sites dune comparaison entre les consultations des

38 Cest le problegraveme statistique classique de lovertting ou du surentrainement souvent rencontreacute dans ledomaine de lapprentissage automatique

65

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

ressources etc On peut toutefois consideacuterer que cette valeur sera geacuteneacuteralement numeacuterique

Il est important ici de preacuteciser un point de dieacuterence important avec les deux autres objectifsqui ont eacuteteacute vu jusquagrave preacutesent Dans les eacutequations ci-dessus on peut en eet remarquer que lecalcul de la distance se fait non plus en consideacuterant deux ressources mais uniquement avec uneressource et le prol de lutilisateur Ainsi une arecircte du graphe ne repreacutesente plus la distanceentre les deux sommets la composant mais la distance neacutecessaire pour atteindre le sommet selonchaque utilisateur Autrement dit lagrave ougrave jusquagrave maintenant la distance associeacutee agrave larecircte (AB)repreacutesentait la distance entre le sommet A et le sommet B (la similariteacute ou la diversiteacute entreA et B) cette distance repreacutesente maintenant la distance de lutilisateur avec ce sommet BLe sommet dorigine ne rentre plus en compte dans le calcul de la distance dune arecircte maisuniquement son sommet de destination Par conseacutequent toutes les arecirctes arrivant agrave un sommetunique posseacutederont la mecircme valuation Les calculs de valuation des arecirctes du graphe sont doncmoins nombreux mais en contrepartie il est neacutecessaire de recalculer ces valuations pour chaqueutilisateur eacutetant donneacute quelles deacutependent maintenant du prol de ce dernier

344 Preacutefeacuterences

Le facteur que nous avons appeleacute preacutefeacuterences correspond aux ressources que lutilisateur aparticuliegraverement appreacutecieacutees dans le passeacute Cet objectif bien quassez proche de la similariteacute aupremier abord exprime un autre aspect dune recommandation satisfaisante que nous pensonsimportant En eet le but nest pas ici de recommander des ressources proches et potentiellementnouvelles de ce que lutilisateur connaicirct deacutejagrave comme la similariteacute mais bien de lui reproposer desressources quil a deacutejagrave consulteacutees et aimeacutees par le passeacute Autrement dit cet objectif cherche agraverecommander agrave lutilisateur les ressources les plus en accord avec ses preacutefeacuterences (ses ressourcespreacutefeacutereacutees) sans essayer de faire des preacutedictions Par conseacutequent le but de lobjectif de simila-riteacute est de proposer agrave lutilisateur des ressources proches de ce que lutilisateur a consulteacute ouconsulte mais il nest pas possible de savoir si ce dernier va reacuteellement appreacutecier ces recomman-dations Il est par exemple commun dappreacutecier une musique particuliegravere dun artiste et de nepas aimer les autres musiques appartenant pourtant au mecircme album Toutes les musiques de cetalbum sont tregraves similaires les unes aux autres (mecircme artiste mecircme date de sortie mecircme albumprobablement mecircme genre) elles auraient donc de tregraves hautes valeurs de similariteacute entre ellesmais lutilisateur qui se verrait proposer le reste de lalbum jugerait ces recommandations nonsatisfaisantes Lobjectif de preacutefeacuterences favorisera quant agrave lui les ressources connues et aimeacuteespar lutilisateur et pourrait donc recommander dans cette situation uniquement la musique quelutilisateur appreacutecie

Le but des agents de la colonie preacutefeacuterences est donc de trouver un chemin ougrave les ressourcessont connues et aimeacutees de lutilisateur On peut dores et deacutejagrave lister deux conseacutequences agrave cefait Tout dabord nous nous retrouvons dans le mecircme cas de gure que pour lobjectif denouveauteacute ougrave une arecircte du graphe ne repreacutesente plus la distance entre ses deux sommets maisla distance neacutecessaire pour atteindre le sommet darriveacutee Ensuite il est neacutecessaire de deacutenir desmoyens de calculer les preacutefeacuterences des utilisateurs envers les ressources mises agrave leur dispositionComme nous lavons vu dans leacutetat de lart il y a deux grandes maniegraveres de calculer linteacuterecirctdun utilisateur envers une ressource avec des retours explicites (eg notes sur les ressourcesbouton jaime et je naime pas) avec des retours implicites (eg temps passeacute agrave consulterles ressources nombre de consultations) 39 La nature des retours va donc eacutenormeacutement varier

39 Ces deux types de retours ne sont pas redondants mais plutocirct compleacutementaires Lorsque cela est possible

66

34 Objectifs

selon le domaine dapplication mais nous pouvons tout de mecircme formaliser la maniegravere dont ilssont consideacutereacutes Chaque information collecteacutee par le systegraveme concernant le comportement dunutilisateur doit ecirctre prise en compte Plus preacuteciseacutement chaque interaction directe ou indirectequun utilisateur peut avoir avec une ressource doit ecirctre inteacutegreacutee dans lestimation de son inteacuterecirctsur cette ressource Soit Cu lensemble de tous les types dinteractions possibles quun utilisateuru peut avoir avec les ressources du systegraveme cui repreacutesente alors la somme des interactions dunmecircme type c dun utilisateur u sur une ressource i Voici un rapide exemple toujours dans ledomaine musical an dillustrer ces derniers points

Cu eacutecouter une musique noter une musique passer une musique avant la n mettre unemusique dans sa playlist

cui pourrait par exemple renseigner sur le fait que lutilisateur u agrave eacutecouter la musiquei 15 fois

An dagreacuteger tous les types dinteractions possibles dans une unique valeur dinteacuterecirct dunutilisateur envers une ressource nous avons utiliseacute la formule proposeacutee par Castagnos [Castagnosand Boyer 2006] et deacutecrite dans lEacutequation 36

presumed interestui = vmin +

sumcisinC

(w(c) middot c(ui))sumcisinC

w(c)middot (vmax minus vmin)

cmax(36)

ougrave c(u i) correspond aux valeurs normaliseacutees donneacutees agrave la ressource i par lutilisateur u agravechaque type dinteraction c w(c) est le poids ou limportance de chaque type dinteraction cvmin et vmax sont les valeurs minimales et maximales attendues pour linteacuterecirct preacutesumeacute et cmaxest la valeur maximale que c(u i) peut prendre peu importe le critegravere c consideacutereacute

Linteacuterecirct de cette colonie peut ecirctre discuteacute selon les domaines dapplications auquel le mo-degravele est appliqueacute Lexemple preacuteceacutedant portant sur la musique illustre bien linteacuterecirct dinteacutegrerun tel facteur humain dans un systegraveme de recommandations En eet il est rare de neacutecou-ter quune seule fois une musique que lon appreacutecie Comme lont montreacute divers travaux il estbeaucoup plus courant deacutecouter plusieurs fois ses musiques preacutefeacutereacutees parfois de suite parfois agravedieacuterents moments de la journeacutee parfois sur plusieurs semaines mois ou anneacutees etc [lHuillier2018][Jones 2010] Lideacutee davoir une colonie deacutedieacutee agrave la revisite de ressources deacutejagrave consulteacuteespeut ecirctre eacutetendue agrave dautres domaines a priori moins eacutevidents que la musique Cet objectif depreacutefeacuterences peut par exemple ecirctre inteacuteressant dans le domaine de le-eacuteducation ougrave une ressourceeacuteducative peut avoir eacuteteacute consulteacutee par un utilisateur sans pour avoir eacuteteacute comprise (apregraves avoirpasseacute une eacutevaluation sur les thegravemes de cette ressource par exemple) Dans ce cas il peut ecirctreinteacuteressant de recommander une nouvelle fois agrave lutilisateur cette ressource an quil puisse mieuxla comprendre En conclusion lobjectif de preacutefeacuterences est certes plus speacutecique agrave certains do-maines que les autres objectifs plus geacuteneacuteralistes preacutesenteacutes jusquagrave maintenant mais nous pensonsneacuteanmoins quil a sa place dans le modegravele notamment pour les possibiliteacutes quil apporte dansces domaines dapplication speacuteciques

345 Progressiviteacute

Le concept de la progressiviteacute fait partie inteacutegrante du but de notre modegravele qui est de trouveret de recommander une bonne seacutequence de ressources Contrairement agrave la majoriteacute des systegravemes

il est beacuteneacuteque de les prendre tous les deux en comptes pour estimer linteacuterecirct de lutilisateur

67

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

de recommandation actuels nous ne souhaitons pas proposer quune simple liste agrave lutilisateurnal mais bien une seacutequence construite dans un but posseacutedant un deacutebut une n et une progres-sion entre ses divers eacuteleacutements An de bien faire la dieacuterence entre une liste et une seacutequence derecommandation voici 3 exemples dans 3 domaines dapplications dieacuterents

Listes

1 Musique Les musiques les plus similaires aux derniegraveres eacutecoutes voire agrave la toutederniegravere eacutecoute de lutilisateur sans ordre particulier

2 Museacutee Des divideuvres dart correspondant agrave ce que lutilisateur vient de voir Si lecritegravere principal de la creacuteation de liste est la similariteacute les ressources de celles-ci neseront pas forceacutement adapteacutees agrave la topologie du museacutee ou agrave sa sceacutenographie

3 E-eacuteducation Des ressources eacuteducatives sans ordre particulier (cours videacuteos expli-catives exercices) tous proches de ce que lutilisateur eacutetait en train de consulter

Seacutequences

1 Musique Une playlist de musiques proposant par exemple les titres dun mecircmeartiste selon leur date de sortie ou bien posseacutedant un tempo de plus en plus rythmeacuteou encore proposant une transition douce dun style de musical agrave un autre

2 Museacutee Un chemin composeacute de plusieurs divideuvres dart prenant compte de la distancephysique entre chaque divideuvre an davoir un parcours adapteacute au museacutee et en inteacutegrantune progression dans les divideuvres proposeacutees (par date styles auteurs etc)

3 E-eacuteducation Une seacutequence composeacutee de ressources eacuteducatives adapteacutees au niveauactuel de lutilisateur et agrave son objectif inteacutegrant des cours et des exercices proposantune progression mesureacutee (ni trop rapide ni trop lente) entre chaque ressources eacuteduca-tives de la seacutequences

Comme le montrent ces exemples lideacutee geacuteneacuterale derriegravere la recommandation de seacutequencesest de proposer une suite de ressources eacutetant toutes en lien les unes avec les autres et posseacutedantune progression sur un ou plusieurs critegraveres Cette progression se manifeste alors par de leacutegegraverestransitions entre chaque ressource an de faire avancer petit agrave petit la seacutequence vers un but Lebut est donc ici de parvenir agrave construire une seacutequence dont la progression nest ni trop lenteni trop rapide mais adapteacutee agrave lutilisateur et agrave son but Nous donnons agrave cet objectif le nom deprogressiviteacute optimale o Cette meacutetrique est utiliseacutee an de sassurer que les agents de la colo-nie de progressiviteacute trouvent un chemin dans le graphe ougrave chaque sommet seacutelectionneacute ore unebonne progressiviteacute par rapport agrave son preacutedeacutecesseur et agrave son successeur Pour ce faire nous avonscalculeacute la valeur de o en prenant en compte une ressource de deacutepart et une ressource darriveacuteerepreacutesenteacutee dans le graphe par deux sommets speacuteciques

Colonie de progressiviteacute

Le concept de progressiviteacute est lieacute agrave notre objectif de construire une bonne seacutequence deressources Contrairement agrave la majoriteacute des systegravemes de recommandation nous ne souhaitonspas seulement recommander une liste de ressources mais une seacutequence ayant un deacutebut unen et un ordre speacutecique Comme indiqueacute preacuteceacutedemment dans un museacutee une bonne seacutequencerecommandeacutee pourrait consister en des divideuvres dart lieacutees dune maniegravere ou dune autre (ie du

68

34 Objectifs

mecircme artiste ou de la mecircme peacuteriode) et situeacutees agrave proximiteacute les unes des autres Une telle seacutequencepourrait ensuite progresser lentement vers un autre artiste ou une section dieacuterente du museacuteeNotre objectif est donc de recommander une seacutequence qui ne progresse ni trop lentement ni troprapidement cest ce que nous appelons la progressiviteacute optimale o Cette meacutetrique est utiliseacuteepour sassurer que chaque ressource ore une bonne progressiviteacute par rapport agrave ses preacutedeacutecesseurset successeurs Pour ce faire nous avons calculeacute o sur la base des premier et dernier eacuteleacutementsdune seacutequence donneacutee pour un utilisateur speacutecique comme le montre lEacutequation 37

on =czn minus can

s(37)

ougrave on est la valeur de progressiviteacute optimale de la n-iegraveme caracteacuteristique dune seacutequencespeacutecique czn est la n-iegraveme caracteacuteristique de la derniegravere ressource z de la seacutequence czn estidentique pour la premiegravere ressource de la seacutequence et s est le nombre de ressources de la seacute-quence LEacutequation 37 sera appliqueacutee pour les caracteacuteristiques de la ressource m ce qui donneun vecteur de taille m de valeurs de progressiviteacute optimales (o1 o2 middot middot middot om) pour la seacutequencespeacutecique Ce vecteur sera ensuite utiliseacute dans le calcul de la distance dun bord (i j) pour lacolonie de progressiviteacute Cette meacutethode implique de disposer de caracteacuteristiques numeacuteriques pourappliquer leacutequation comme par exemple le tempo dune piste musicale ou la date dune divideuvredart

La valeur optimale o de la progressiviteacute est alors utiliseacutee pour calculer la distance d entredeux ndivideuds du graphe dans lEacutequation 38

dij =

msumnwon middot

cjnminuscinon

msumnwon

(38)

ougrave m est le nombre de caracteacuteristiques de la ressource consideacutereacutee on est la valeur de pro-gressiviteacute optimale de la n-iegraveme caracteacuteristiques de la ressource won est le poids de la n-iegravemecaracteacuteristique pour lutilisateur deacutependant de ses preacutefeacuterences et cjn est la valeur de la n-iegravemecaracteacuteristique de la ressource j

LEacutequation 38 produit une valeur de distance dij isin [minusinfin +infin] En fonction de lintervallede d nous pouvons deacuteduire que

dij isin [minusinfin 0] les caracteacuteristiques de la ressource j vont dans la direction inverse parrapport agrave la valeur de progressiviteacute optimale o

dij isin [0 1] la progression est trop lente par rapport agrave la valeur o attendue dij = 1 la progression est ideacuteale dij isin [1 +infin] la progression trop rapide

Dans un souci dhomogeacuteneacuteisation des distances entre toutes les colonies et pour respecterle modegravele initial ACS ougrave d repreacutesentait une distance physique nous avons souhaiteacute garder ladistance d isin [1 +infin] Pour ce faire nous avons donc reacutealiseacute une opeacuteration de transformationlorsque dij lt 1 preacutesenteacutee dans lEacutequation 39

69

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

Si dij isin

[minusinfin 0] alors dij = |dij |

[0 1] alors dij =1

dij

(39)

Inteacutegration compleacutementaire de la progressiviteacute dans le calcul de la distance parcou-rue des agents

Dans la section preacuteceacutedente nous avons deacutecrit le fonctionnement dune colonie deacutedieacutee agrave laprogressiviteacute Cependant nous soutenons le fait que la progressiviteacute ne doit pas ecirctre lapanagedune seule colonie mais doit ecirctre preacutesente dans toutes les colonies La progressiviteacute doit avoirune place preacutepondeacuterante dans les seacutequences que notre modegravele construit car cest une notionfondamentale dans la dieacuterence entre une liste de recommandation et une seacutequence de recom-mandation

An de renforcer la progressiviteacute des seacutequences construites par toutes les colonies nous pro-posons une version modieacutee de la mise agrave jour globale des pheacuteromones deacutecrite dans lEacutequation210 Dans lalgorithme initial ACS Lbest est la longueur du plus court chemin trouveacute par unagent Cette valeur est une simple somme de la distance associeacutee agrave chaque arecircte du meilleurchemin Cette valeur est ensuite utiliseacutee dans le calcul deacuteterminant la quantiteacute de pheacuteromonesagrave ajouter sur chaque arecircte du chemin Ainsi plus un chemin est court plus les arecirctes le com-posant sont reacutecompenseacutees par une plus grande quantiteacute de pheacuteromones Ce meacutecanisme est aucdivideur du renforcement de bonnes solutions et de leacutemergence de comportements intelligents Ande maximiser les seacutequences posseacutedant une progression constante nous avons modieacute le calcul deLbest pour inteacutegrer une notion de progressiviteacute Pour ce faire nous nutilisons plus simplementla distance dune arecircte mais aussi sa deacuteriveacutee comme montreacute dans lEacutequation 310

Lbest =sumeisinE

de +

sumeisinE

partde

|E|(310)

ougrave E est lensemble des arecirctes du meilleur chemin et de est la distance associeacutee agrave larecircte eAvec cette eacutequation modieacutee du calcul de la distance totale dun chemin nous peacutenalisons lesgrandes dieacuterences de distance entre des arecirctes successives tout en continuant de favoriser leschemins les plus courts En dautres termes lobjectif des agents est maintenant de trouver deschemins agrave la fois courts et progressifs les uns par rapport aux autres

35 Tactiques de fusion

Dans les sections preacuteceacutedentes nous avons deacutecrit 4 facteurs humains 4 objectifs agrave optimiserpar notre modegravele ainsi quun cinquiegraveme objectif de contrainte de construction des seacutequencesChacun de ces 4 premiers objectifs est associeacute agrave une colonie de fourmis speacutecique dont le but estde trouver un chemin dans le graphe Par conseacutequent apregraves cette premiegravere eacutetape il existe autantde chemins ou de seacutequences de ressources que de colonies dans le modegravele Le but est cependantde ne proposer agrave la n quune seule recommandation agrave lutilisateur Chaque seacutequence repreacutesentedonc ideacutealement une partie de la recommandation nale de lutilisateur An de construire cetteseacutequence nale il eacutetait neacutecessaire de fusionner ces dieacuterentes seacutequences provenant des coloniesen une seacutequence de recommandation unique Pour reacutesoudre ce problegraveme de nombreuses maniegraverede proceacuteder existent Dans la suite de cette section nous avons exploreacute deux tactiques de fusion

70

35 Tactiques de fusion

que nous allons preacutesenter

351 Colonie de fusion

La premiegravere tactique pour fusionner les dieacuterentes seacutequences produites preacuteceacutedemment a natu-rellement eacuteteacute dutiliser le mecircme modegravele que pour la premiegravere eacutetape agrave savoir une colonie speacuteciquedont les agents se deacuteplacent sur un graphe pour trouver une solution Cette colonie est cependantdieacuterente des preacuteceacutedentes pour deux raisons principales

Premiegraverement le graphe sur lequel cette colonie opegravere na aucun inteacuterecirct agrave contenir lensemblede toutes les ressources existantes du domaine Nous consideacuterons ici que la premiegravere eacutetape dumodegravele eectue une seacutelection dun certain nombre de ressources speacuteciques agrave chaque colonie Cesressources peuvent ensuite ecirctre utiliseacutees pour creacuteer un second graphe posseacutedant beaucoup moinsde ndivideuds sur lequel la colonie de fusion pourra chercher une solution Nous avons utiliseacute toutesles ressources seacutelectionneacutees dans la premiegravere eacutetape en tant que ndivideuds du nouveau graphe Nousavons ensuite ajouteacute des arecirctes agrave chaque paire conseacutecutives de ressources dans les seacutequences de lapremiegravere eacutetape an de conserver les meilleurs chemins trouveacutes par les agents Enn nous avonsajouteacute des arecirctes aleacuteatoires en suivant la mecircme meacutethode que deacutecrite au deacutebut de ce chapitre dansla creacuteation du graphe principal en Eacutequation 31 Le but de ces arecirctes aleacuteatoires est le mecircme quepreacuteceacutedemment agrave savoir permettre aux agents dexplorer de nouveaux chemins potentiels Cettepremiegravere tactique reprend donc les points principaux de la creacuteation du graphe principal

Deuxiegravemement et contrairement agrave la premiegravere eacutetape ougrave toutes les colonies avaient un butpreacutecis la colonie de fusion na pas pour vocation doptimiser une caracteacuteristique speacutecique Aucontraire cette colonie a pour essence de regrouper au mieux dans une solution unique les reacute-sultats speacuteciques trouveacutes auparavant Pour ce faire la colonie de fusion utilise lensemble desfacteurs humains preacutesenteacutes preacuteceacutedemment dans une somme pondeacutereacutee an dattribuer aux arecirctesune distance d prenant en compte tous les objectifs Le calcul de cette distance est preacutesenteacuteci-dessous dans lEacutequation 311

dij =sum

colisincoloniesw(col) middot dij(col) (311)

ougrave w(col) est le poids repreacutesentant limportance estimeacutee de lobjectif de la colonie col dansla recommandation nale Nous proposons ici de calculer les poids moyens de chaque objectif(similariteacute diversiteacute nouveauteacute et preacutefeacuterences) sur les derniegraveres n sessions dactiviteacute de lutilisa-teur Par exemple un utilisateur nayant eacutecouteacute que lalbum Wish you were here des Pink Floyddurant ses derniegraveres sessions deacutecoute se verra attribuer des poids forts pour la similariteacute et lespreacutefeacuterences Inversement les poids des objectifs de diversiteacute et de nouveauteacute seront faibles

Cette meacutethode permet dobtenir limportance relative de chacun des objectifs dans lhisto-rique de consultations reacutecent de lutilisateur En faisant varier n il est aussi possible de fairevarier la taille de lhistorique pris en compte Ainsi une valeur de n faible concernera uniquementles derniegraveres interactions de lutilisateur avec le systegraveme tandis quune valeur de n eacuteleveacutee pren-dra en compte agrave la fois lhistorique reacutecent et plus ancien La variation de la fenecirctre dhistoriquepeut ainsi apporter un comportement dieacuterent du modegravele pour dieacuterents types dutilisateurs(utilisateur reacutecent ou ancien peu actif ou tregraves actif etc)

71

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

352 Fusion de seacutequences

Nous avons souhaiteacute impleacutementer une deuxiegraveme tactique de fusion an davoir un point decomparaison avec la colonie de fusion Dans cette deuxiegraveme tactique nous avons eacutegalement cal-culeacute le poids w(col) de chaque objectif sur lhistorique n de lutilisateur de la mecircme maniegravereque dans lEacutequation 311 Ces poids ont ensuite eacuteteacute utiliseacutes dans la construction dune seacutequencenale ressource par ressource Pour ce faire nous avons reacuteunis toutes les ressources composantles seacutequences des colonies speacutecialiseacutees dans un ensemble agrave la maniegravere dun sac de mots Puis agravechaque iteacuteration lapport de chacune des ressources restantes agrave la seacutequence nale a eacuteteacute mesureacuteet la meilleure ressource a eacuteteacute ajouteacutee Les iteacuterations sont stoppeacutees lorsquil nest plus possibledameacuteliorer la seacutequence nale De la mecircme maniegravere que pour la tactique preacuteceacutedente lapportde chaque ressource agrave la seacutequence de recommandation peut ecirctre mesureacute de multiple maniegraveresDe la mecircme maniegravere que dans lEacutequation 311 nous avons choisi de calculer limportance dechaque objectif de la seacutequence nale en construction puis de choisir les ressources permettantde sapprocher des poids correspondant agrave lhistorique n de lutilisateur

353 Conclusion

Dans ce chapitre nous avons preacutesenteacute le fonctionnement de notre modegravele de recommanda-tion multi-objectifs AntRS Notre modegravele sinspire de lalgorithme multi-agents ACS de MarcoDorigo Au lieu de trouver le plus court chemin dans un graphe agrave laide dune colonie dagentsfourmis nous utilisons 4 colonies en parallegravele qui chacune maximise un aspect de la recomman-dation nale Comme nous lavons montreacute dans leacutetat de lart il est deacutesormais neacutecessaire que lesrecommandations prennent en compte de multiples facteurs comme la diversiteacute la similariteacute oula nouveauteacute Il est tout aussi important pour les systegravemes de recommandation decirctre modulaireset geacuteneacuteriques an de sadapter aux situations toujours plus complexes et aux domaines applicatifstoujours plus varieacutes dans lesquels ils sont utiliseacutes Le choix de sinspirer dun modegravele multi-agentsest une reacuteponse agrave ces deacutes de la recommandation moderne Les systegravemes multi-agents ont unefaible complexiteacute algorithmique et sont particuliegraverement adaptables par nature Le modegravele quenous avons proposeacute est de plus susamment geacuteneacuterique pour sadapter aux domaines applicatifsougrave il est possible de faire de la recommandation de seacutequences

Dans la suite de ce manuscrit nous allons appliquer notre modegravele AntRS a un domaineapplicatif et reacutealiser des expeacuterimentations avec des donneacutees dutilisation concregravete an deacutetudierses performances dans des conditions dutilisation reacuteelles

72

Chapitre 4

Expeacuterimentations et reacutesultats

Sommaire

41 Introduction 74

42 Expeacuterimentations preacuteliminaires portant sur le modegravele ACS initial 74

421 Preacutesentation et inteacuterecircts de ces premiegraveres expeacuterimentations 74

422 Expeacuterimentations preacuteliminaires sur le modegraveles ACS 78

423 Conclusion 84

43 Expeacuterimentations sur le modegravele AntRS 84

431 Base de donneacutees utiliseacutee 84

432 AntRS mono-objectif expeacuterimentations sur chaque colonie isoleacutee 89

433 AntRS multi-objectifs expeacuterimentations sur lensemble des colonies si-

multaneacutement et sur les tactiques de fusion 93

434 Optimisation des meacutetavariables de AntRS 99

44 Conclusion 103

73

Chapitre 4 Expeacuterimentations et reacutesultats

41 Introduction

Dans la section preacuteceacutedente nous avons deacutetailleacute le modegravele AntRS que nous avons deacuteveloppeacutepour reacutepondre aux probleacutematiques de cette thegravese Comme nous lavons expliqueacute AntRS se basesur le travail de [Dorigo and Birattari 2011] qui a modeacuteliseacute le comportement de fourragementdes fourmis dans la nature Son modegravele et le notre par extension ont donc au cdivideur de leur fonc-tionnement le mecircme meacutecanisme permettant agrave des agents teacuteleacuteonomiques de suivre et de deacuteposerdes pheacuteromones sur un graphe An de mettre en exergue le cdivideur de ces modegraveles qui sera parla suite enrichi nous avons en premier lieu deacuteveloppeacute les modegravele Ant Colony System de MarcoDorigo [Dorigo and Birattari 2011] en Java avec une interface visuelle Cela nous a permis detester son fonctionnement dans diverses conditions expeacuterimentales controcircleacutees ainsi que de testerses limites Nous avons ensuite impleacutementeacute lensemble de notre modegravele AntRS en utilisant la basedeacutejagrave deacuteveloppeacutee preacuteceacutedemment puis nous avons reacutealiseacute les expeacuterimentations principales de cettethegravese agrave laide dune base de donneacutees deacutecrivant les habitudes de personnes eacutecoutant de la musique

Ce chapitre est constitueacute de deux sections principales Dans la premiegravere section nous allonsdabord nous inteacuteresser agrave limpleacutementation et au fonctionnement expeacuterimental du modegravele ACS deDorigo Cette section mettra en exergue les points importants permettant le bon fonctionnementdu modegravele classique Agrave laide dexpeacuterimentations simples nous reprendrons et expliquerons dunpoint du vue pratique les notions introduites de maniegravere theacuteorique dans leacutetat de lart lors de lapreacutesentation du modegravele ACS Ces premiegraveres expeacuterimentations permettront au lecteur de mieuxappreacutehender la suite du chapitre dans laquelle les notions abordeacutees seront reacute-utiliseacutees et eacutetenduesDans la deuxiegraveme section de ce chapitre nous nous inteacuteresserons aux expeacuterimentations principalesde cette thegravese portant sur notre modegravele AntRS Nous deacutecrirons dabord la base de donneacutees quenous avons utiliseacute pour tester notre modegravele puis lensemble des expeacuterimentations faites et ennles principaux reacutesultats obtenus

42 Expeacuterimentations preacuteliminaires portant sur le modegravele ACS

initial

421 Preacutesentation et inteacuterecircts de ces premiegraveres expeacuterimentations

La premiegravere eacutetape de ce travail expeacuterimental a consisteacute dans limpleacutementation du modegraveleinitial proposeacute par Dorigo sans modication Le but eacutetait agrave la fois de veacuterier si les reacutesultatsobtenus correspondaient agrave ce qui eacutetait attendu dans la litteacuterature et davoir par ailleurs unprogramme repreacutesentant une base fonctionnelle permettant de tester de nouveaux modegraveles pluscomplexes par la suite Nous avons donc commenceacute par impleacutementer le modegravele Ant ColonySystem deacutecrit par Dorigo dans son article [Dorigo and Birattari 2011] Comme nous avons deacutejagravedeacutecrit en deacutetail ce modegravele dans la Section 243 de leacutetat de lart nous ne reviendrons pas surles eacutequations reacutegissant le fonctionnement dACS Cependant nous allons plutocirct nous inteacuteresserici aux reacutesultats obtenus lors dexpeacuterimentations connues de la litteacuterature scientique Le choixdu langage de programmation dans lequel a eacuteteacute reacutealiseacute limpleacutementation et les expeacuterimentationsdurant toute cette thegravese a eacuteteacute Java Ce choix se justie par 3 principales raisons

1 La connaissance avanceacutee de ce langage

2 les bibliothegraveques 40 disponibles correspondant aux besoins de la thegravese

40 Ensemble de ressources (fonctions algorithmes speacuteciques documentation) permettant la creacuteation acceacuteleacutereacuteede programmes

74

42 Expeacuterimentations preacuteliminaires portant sur le modegravele ACS initial

3 Le fait que Java soit un langage de programmation orienteacute objet qui est un paradigmede programmation particuliegraverement adapteacute pour limpleacutementation dagents (chaque agentpeut ecirctre repreacutesenteacute par un objet Java)

Pour rappel lalgorithme geacuteneacuteral des Ant Colony Optimization servant de base pour toutesles dieacuterentes versions proposeacutees par Dorigo (Ant System Ant Colony System Ant-q ) estsyntheacutetiseacute dans lAlgorithme 3 ci-dessous

Algorithm 3 Meacutetaheuristique Ant Colony Optimization

Initialisation des paramegravetres et des pheacuteromoneswhile conditions darrecircts non atteintes doConstruction des solutionsRecherche locale (optionnelle)Mise agrave jour des pheacuteromones

end while

Agrave partir de lalgorithme geacuteneacuteral Ant Colony Optimization voici le fonctionnement de savariante Ant Colony System syntheacutetiseacute dans lAlgorithme 4 ci-dessous

Algorithm 4 Algorithme Ant Colony System

Initialisation des paramegravetres et des pheacuteromoneswhile conditions darrecircts non atteintes dowhile toutes les fourmis nont pas atteint le but dowhile tous les ndivideuds nont pas eacuteteacute pris en compte doAppliquer la regravegle de transition et choisir le prochain ndivideud agrave atteindreAppliquer la mise agrave jour locale des pheacuteromones sur larecircte traverseacutee

end whileend whileMise agrave jour globale des pheacuteromones

end while

Cet algorithme ACS peut aussi ecirctre deacutecrit sous la forme dun diagramme de ux commela proposeacute [Schlunz 2011] dans la Figure 41 Le format du diagramme de ux permet de bienvisualiser le fonctionnement de lalgorithme et notamment ses boucles iteacuteratives imbriqueacutees tantquun critegravere de n na pas eacuteteacute trouveacute tant quil reste des fourmis agrave deacuteplacer et tant quil restedes ndivideuds agrave explorer pour une fourmi

Apregraves avoir impleacutementeacute en Java lalgorithme ACS deacutecrit ci-dessus nous avons voulu testerson fonctionnement Agrave cette n nous avons repris les expeacuteriences des ponts binaires que nousavons preacutesenteacute dans la section 244 de leacutetat de lart Pour rappel ces types dexpeacuterimentationsconsistent agrave placer des fourmis dans un dispositif comportant un point de deacutepart (la fourmiliegrave-re) un point darriveacutee (la nourriture) et deux chemins y menant Ces chemins peuvent avoirla mecircme distance ou des distances dieacuterentes selon le type dexpeacuterimentation Le but est ensuitedobserver le comportement des fourmis sur quelques dizaines de minutes an de deacuteterminer si unchemin est plus emprunteacute quun autre La Figure 42 preacutesente deux exemples de congurationspossibles de cette expeacuterience utiliseacutee sur de vraies fourmis Le but eacutetant bien sucircr dobserver lecomportement de groupes de fourmis et leurs capaciteacutes agrave trouver le chemin le plus court vers

75

Chapitre 4 Expeacuterimentations et reacutesultats

Figure 41 Diagramme de ux repreacutesentant le deacuteroulement de lalgorithme ACS proposeacute par[Schlunz 2011]

une source de nourriture dans un environnement inconnu

Nous revenons sur ces expeacuterimentations dans ce chapitre de la thegravese apregraves les avoir deacutejagrave

76

42 Expeacuterimentations preacuteliminaires portant sur le modegravele ACS initial

Figure 42 Deux exemples de congurations expeacuterimentales dieacuterentes permettant chacune detester la capaciteacute des fourmis agrave trouver le plus court chemin dans un evironnement [Goss et al1989]

mentionneacutees dans leacutetat de lart car elles peuvent ecirctre utiliseacutees pour veacuterier le comportement dumodegravele ACS que nous avons impleacutementeacute En eet ces expeacuterimentations sont simples agrave mettreen divideuvre et les reacutesultats attendus sont connus De plus le modegravele ACS possegravede plusieurs meacuteta-variables permettant chacune de moduler le comportement de certaines parties du systegraveme Leparameacutetrage de ces meacutetavariables inue de maniegravere importante sur les reacutesultats potentiels dumodegravele il est donc important de bien comprendre le rocircle de chacune dentre elles et de les testerextensivement pour maximiser les capaciteacutes du modegravele Voici toutes les meacutetavariables du modegraveleACS

1 τ0 isin [0 1] valeur initiale des pheacuteromones disposeacutees sur chaque arecircte du graphe avant lepremier passage des agents

2 α isin [0 1] importance des pheacuteromones lorsque lagent fourmi choisit dune nouvelle arecircteagrave explorer Plus la valeur de ce paramegravetre est eacuteleveacutee plus lagent privileacutegiera les arecirctesavec un niveau eacuteleveacute de pheacuteromones

3 β isin [0 1] importance de lheuristique lorsque lagent fourmi deacutecide dune nouvelle arecircteagrave explorer Plus la valeur de ce paramegravetre est eacuteleveacutee plus lagent privileacutegiera les arecirctesposseacutedant une bonne heuristique

4 ρ isin [0 1] paramegravetre geacuterant leacutevaporation des pheacuteromones sur les arecirctes du graphe Plusla valeur de ce paramegravetre est eacuteleveacutee et plus les pheacuteromones seacutevaporent rapidement entrechaque passage dagent

5 Q0 isin [0 1] paramegravetre permettant deacutequilibrer la part dexploration et dexploitationbiaiseacutee du modegravele Plus la valeur de ce paramegravetre est eacuteleveacutee et plus les agents auront ten-dance agrave exploiter les arecirctes ougrave beaucoup dautres agents sont deacutejagrave passeacutes Inversementplus la valeur de ce paramegravetre est basse et plus les agents auront tendance agrave explorer denouveaux chemins encore peu visiteacutes

En plus de ces 5 meacutetavariables utiliseacutees dans le modegravele theacuteorique et les eacutequations dACSdautres meacutetavariables sont inheacuterentes au fonctionnement du modegravele en pratique On peut ainsideacutenombrer 2 autres meacutetavariables

77

Chapitre 4 Expeacuterimentations et reacutesultats

6 a nombre dagents fourmis se deacuteplaccedilant sur le graphe Plus le nombre dagents est eacuteleveacuteet plus lintelligence collective du systegraveme baseacutee sur les pheacuteromones se deacuteveloppera Ungrand nombre dagents allonge cependant la dureacutee de lexeacutecution du programme

7 n nombre diteacuterations du programme Lors dune iteacuteration chaque agent se deacuteplace surle graphe et produit un parcours complet Plus le nombre diteacuterations est grand et plusles agents ont de temps pour renforcer leacutemergence dune solution (un chemin particuliersur le graphe) mais plus lexeacutecution prendra du temps

Linteacuterecirct de mettre en place les expeacuterimentations des ponts binaires est donc double

1 Veacuterier le comportement du modegravele ACS impleacutementeacute en Java sur des expeacuterimentationsconnues

2 Observer limpact des 7 meacutetavariables listeacutees ci-dessus sur le comportement et les reacutesultatsdu modegravele dans le but de mieux appreacutehender les expeacuterimentations principales de cettethegravese qui seront preacutesenteacutees dans la suite de cette section

422 Expeacuterimentations preacuteliminaires sur le modegraveles ACS

Expeacuterimentation 11 ponts binaires de mecircme longueur

La premiegravere expeacuterimentation avait pour but de tester le graphe le plus simple possible agravelimage du dispositif de lexpeacuterimentation de Deneubourg dont nous avons deacutejagrave parleacute dans leacutetatde lart et qui est rappeleacute avec la Figure 43 un point de deacutepart un point darriveacutee et deuxchemins possibles strictement eacutequivalents en terme de distance agrave parcourir

Figure 43 Illustration de lexpeacuterience des ponts binaires par Jean-Louis Deneubourg (a)Apregraves un certain temps les fourmis choisissent majoritairement une des deux voies possibles (b)[Deneubourg et al 1990]

Avec le passage successif des fourmis un chemin va petit agrave petit ecirctre privileacutegieacute et renforceacute viales pheacuteromones deacuteposeacutees par ces derniegraveres Au bout dun certain temps un des deux chemins estemprunteacute par la majoriteacute des fourmis mecircme si quelques-unes dentre elles continuent toujoursdemprunter lautre chemin au cas ougrave celui-ci deviendrait plus avantageux Comme les cheminsrestent strictement identiques dans cette expeacuterience le choix nal du chemin nest pas important

An de pouvoir mieux appreacutecier le fonctionnement du modegravele en temps reacuteel nous avonsimpleacutementeacute une interface graphique permettant dacher le graphe ses ndivideuds ses arecirctes et

78

42 Expeacuterimentations preacuteliminaires portant sur le modegravele ACS initial

toutes leurs informations Cette interface a eacuteteacute deacuteveloppeacutee agrave laide dune bibliothegraveque Java gra-tuite nommeacutee GraphStream 41 orant tout un ensemble de fonctions permettant lachage degraphes Cette couche graphique se rajoute au-dessus de limpleacutementation complegravete du modegravelesans toutefois en modier son fonctionnement daucune maniegravere Linterface graphique reacutecupegraveresimplement les donneacutees agrave acher agrave linitialisation (la disposition du graphe avec ses arecirctes etses ndivideuds) ainsi quagrave chaque iteacuteration du modegravele pour mettre agrave jour les valeurs de pheacuteromonesagrave chaque arecircte Une fois lexeacutecution termineacutee le chemin nal trouveacute par les agents est coloreacutepermettant une rapide visualisation des reacutesultats du modegravele Pour cette sous-section les reacutesultatsdes expeacuterimentations seront preacutesenteacutes agrave laide de GraphStream

Figure 44 Repreacutesentation graphique de lExpeacuterimentation 11 meneacutee sur le modegravele ACSgracircce agrave la bibliothegraveque Java GraphStream Le ndivideud repreacutesenteacute par un carreacute rouge correspondau deacutepart le ndivideud repreacutesenteacute par un carreacute bleu repreacutesente larriveacutee les ndivideuds ronds noirsrepreacutesentent des points de passage possible les nombres noirs accoleacutes aux arecirctes repreacutesentent ladistance pour parcourir larecircte les nombres violets repreacutesentent le taux de pheacuteromones deacuteposeacuteessur larecircte

La Figure 44 est une capture deacutecran de la fenecirctre graphique construite avec les fonction-naliteacutes oertes par GraphStream montrant la conguration de lExpeacuterimentation 11 On y voitnotamment lensemble du graphe avec ses 4 ndivideuds distinguables par leur numeacutero didentication0 1 2 9 Le ndivideud 0 repreacutesente le point de deacutepart ougrave les agents sont initialement placeacutes tandisque le ndivideud 9 repreacutesente le ndivideud darriveacutee ougrave les agents atteignent leur but et cessent de sedeacuteplacer Au niveau des arecirctes du graphe on peut distinguer deux informations en violet laquantiteacute de pheacuteromones τ preacutesente sur larecircte en noir la distance d agrave parcourir pour traverserlarecircte Dans cette conguration lheuristique ηij associeacutee agrave chaque arecircte i j est calculeacutee demaniegravere classique uniquement avec la distance dij agrave savoir ηij = 1

dij Lheuristique est donc ici

41 httpgraphstream-projectorg

79

Chapitre 4 Expeacuterimentations et reacutesultats

eacutequivalente agrave la distance et nest pas acheacutee dans la fenecirctre graphique La conguration repreacute-senteacutee par la Figure 44 correspond agrave leacutetat dinitialisation du systegraveme avant que les agents neparcourent le graphe Toutes les arecirctes ont donc les mecircmes valeurs le taux de pheacuteromones τcorrespond au taux de pheacuteromones initial τ0 ici eacutegal agrave 0 1 et la distance est xeacute agrave 10 uniteacutesLes deux chemins possibles permettant aux agents de se deacuteplacer du ndivideud de deacutepart 0 au ndivideuddarriveacutee 9 sont eectivement strictement identiques

Figure 45 Reacutesultats obtenus apregraves 30 iteacuterations sur lExpeacuterimentation 11 Agrave gauche laconguration nale du graphe agrave droite le pourcentage dagents fourmis ayant emprunteacutes lesdeux chemins

LExpeacuterimentation 11 se deacuteroule donc ainsi 100 agents se deacuteplaceront agrave chaque fois etchercheront un chemin du ndivideud 0 au ndivideud 9 durant 30 iteacuterations La Figure 45 preacutesente lesreacutesultats de cette expeacuterimentation Agrave gauche la fenecirctre graphique montre leacutetat du graphe agrave lan des 30 iteacuterations on peut voir le chemin seacutelectionneacute par les agents passant par les ndivideudslt 0 1 9 gt Agrave droite le graphique preacutesentant leacutevolution du pourcentage dagents prenant soitle chemin 1 (lt 0 1 9 gt) ou le chemin 2 (lt 0 2 9 gt) Leacutevolution des pourcentages est similaireaux reacutesultats trouveacutes par Deneubourg avec de vraies fourmis (Figure 43) Une fois quun cheminest privileacutegieacute par rapport agrave un autre entre 80 et 95 des agents y passent Cet eacutecart saccentuede plus en plus au l des iteacuterations Il est toutefois important de noter quil subsiste un faiblepourcentage dagents deacutecidant quand mecircme de prendre le chemin 2 permettant au systegraveme desadapter agrave un potentiel changement denvironnement On voit ici linteacuterecirct de la meacutetavariableQ0 qui eacutequilibre lexploitation du chemin 1 en majoriteacute mais qui autorise aussi quelques agentsagrave explorer dautres chemins du graphe

Expeacuterimentation 12 ponts binaires de mecircme longueur et inuence des meacutetava-riables

LExpeacuterimentation 12 illustre limportance des meacutetavariables sur le comportement du sys-tegraveme La mecircme topologie du graphe est conserveacutee mais certaines meacutetavariables sont modieacutees Q0 et β La premiegravere gegravere leacutequilibre entre exploration et exploitation tandis que la deuxiegravemeconcerne limportance de lheuristique dans lexploration Contrairement agrave lExpeacuterimentation11 Q0 est ici biaiseacute pour privileacutegier lexploration et β est augmenteacute an de donner plus dimpor-tance agrave lheuristique par rapport au pheacuteromones lors de lexploration Les agents ont donc plus

80

42 Expeacuterimentations preacuteliminaires portant sur le modegravele ACS initial

de probabiliteacute dexplorer de nouvelles arecirctes plutocirct que demprunter des arecirctes ougrave beaucoup depheacuteromones sont deacutejagrave deacuteposeacutes Dans cette conguration lexploration se base principalement surlheuristique qui est ici strictement identique quelle que soit larecircte puisque baseacutee sur la distanceLes agents nont donc en theacuteorie pas vraiment de direction claire quant au chemin agrave prendre Onpeut voir le reacutesultat de lExpeacuterimentation 12 sur la Figure 46 les agents oscillent dun chemin agravelautre selon liteacuteration sans quaucun des deux ne soit vraiment privileacutegieacute Quand bien mecircme unchemin serait plus emprunteacute que lautre pendant une iteacuteration les pheacuteromones suppleacutementairesdeacuteposeacutees sur les arecirctes nont que peu dinuence sur la deacutecision lors des prochaines iteacuterations

Figure 46 Reacutesultats obtenus apregraves 30 iteacuterations sur lExpeacuterimentation 12 Comme les agentsse basent principalement sur lheuristique qui est partout eacutegale ils oscillent entre les deux cheminssans en privileacutegier un

Expeacuterimentation 13 ponts binaires de mecircme longueur et inuence des meacutetava-riables

LExpeacuterimentation 13 dont les reacutesultats sont preacutesenteacutes par la Figure 47 montre quil estaussi possible dobtenir linverse du comportement de lExpeacuterimentation 12 En donnant uneforte importance aux pheacuteromones et en favorisant grandement lexploitation par rapport agrave lex-ploration les agents choisissent tregraves rapidement un chemin et nen changent plus Au bout dequelques iteacuterations seulement 100 des agents prennent le mecircme chemin Lautre chemin aban-donneacute nit par voir toutes ses pheacuteromones seacutevaporer et les agents nont plus aucun moyen dyretourner

Expeacuterimentation 2 ponts binaires avec chemins de longueurs dieacuterentes

Apregraves avoir testeacute le comportement du modegravele ACS sur un graphe ougrave les chemins sont iden-tiques dans lExpeacuterimentation 1 nous allons maintenant creacuteer un graphe ayant la mecircme con-guration que dans la Figure 42 Le but est ici de tester la capaciteacute des agents agrave imiter lesfourmis dans la nature qui sont capables apregraves quelques dizaines de minutes de privileacutegier les 2

81

Chapitre 4 Expeacuterimentations et reacutesultats

Figure 47 Reacutesultats obtenus apregraves 30 iteacuterations sur lExpeacuterimentation 13 Les agents ex-ploitent ici les arecirctes ayant le plus de pheacuteromones Tregraves rapidement tous les agents utilisent lemecircme chemin

arecirctes courtes par rapport aux 2 arecirctes longues Nous allons de plus garder les mecircmes valeursde meacutetavariables que pour lExpeacuterimentation 11 sauf pour la quantiteacute initiale de pheacuteromoneτ0 qui sera augmenteacutee an de rester au-dessus de 0 La Figure 48 montre la conguration dugraphe directement apregraves 30 iteacuterations Toutes les arecirctes courtes avec une distance de 10 ont eacuteteacuteseacutelectionneacutees tandis que toutes les arecirctes longues avec une distance de 20 nont pas eacuteteacute utiliseacutees

Figure 48 Conguration nale du graphe pour lExpeacuterimentation 2 apregraves 30 iteacuterations Lesagents ont en majoriteacute bien seacutelectionneacute le chemin le plus court lt 0 1 3 4 9 gt

82

42 Expeacuterimentations preacuteliminaires portant sur le modegravele ACS initial

Expeacuterimentation 3 graphes aleacuteatoires plus complexes

Dans les preacuteceacutedentes expeacuterimentations le graphe eacutetait le plus simple possible pour pouvoirjouer avec le comportement du modegravele Avant de passer agrave la section suivante nous souhaitionstester les capaciteacutes du modegravele sur des topologies de graphes plus complexes Nous avons donccreacuteeacute aleacuteatoirement 10 graphes posseacutedant chacun 20 ndivideuds et des arecirctes aleacuteatoires selon un degreacutemoyen de 5 sur lesquels 100 agents se deacuteplaceront sur 50 iteacuterations La Figure 49 preacutesente lepremier de ces 10 graphes apregraves 30 iteacuterations On peut voir que le but est de trouver un chemindu ndivideud 0 au ndivideud 19 et les agents ont trouveacute le chemin lt 0 1 4 2 19 gt Ce chemin est eecti-vement le plus court avec une distance de 284 le deuxiegraveme meilleur chemin eacutetant lt 0 5 6 19 gtavec une distance de 315

Figure 49 Exemple de graphe de lExpeacuterimentation 3 agrave la n des 50 iteacuterations Ces graphessont geacuteneacutereacutes aleacuteatoirement

Parmi les 10 graphes aleacuteatoires le modegravele a trouveacute le chemin le plus court pour 9 dentre euxcar dans lun des graphes il neacutetait pas possible de rejoindre le ndivideud de n 19 Autrement dit

83

Chapitre 4 Expeacuterimentations et reacutesultats

les agents ont trouveacute le chemin le plus optimiseacute agrave chaque fois que cela eacutetait possible

423 Conclusion

Dans cette premiegravere section nous avons impleacutementeacute et testeacute le modegravele ACS proposeacute parDorigo Malgreacute la relative simpliciteacute des expeacuterimentations reacutealiseacutees nous avons pu comparer etveacuterier les reacutesultats que nous avons obtenus avec ceux de la litteacuterature scientique du domaineOutre ce point nous avons aussi pu deacuteduire quelques informations cruciales pour la suite de cettesection

Les meacutetavariables jouent un rocircle central dans le comportement les performances etles reacutesultats du modegravele

Les meacutetavariables peuvent donner de bons reacutesultats avec un type de graphemais pas forceacutement avec un autre Il sera donc important de pouvoir les adapter auxgraphes des expeacuterimentations principales

Leacutequilibre de ces meacutetavariables est relativement complexe agrave obtenirMecircme avecces congurations simples de graphes et laide de linterface graphique chaque expeacuterimen-tation a demandeacute un certain nombre dessais avant de trouver des valeurs concluantes Deplus comme ces meacutetavariables sont propres agrave chaque expeacuterimentation leacutetat de lart necontient que tregraves peu dindications sur les valeurs agrave leur donner Il sera donc importantdeacutetudier ce problegraveme pour les expeacuterimentations principales de cette thegravese

Il est important de noter que comme notre modegravele AntRS est une extension du modegravele ACSde Dorigo et reprend ses principes de fonctionnement toutes les conclusions ci-dessus pourrontecirctre appliqueacutees dans la section suivante ougrave nous reacutealiserons plusieurs expeacuterimentations avec lemodegravele AntRS

43 Expeacuterimentations sur le modegravele AntRS

Dans cette section nous allons maintenant deacutecrire les expeacuterimentations meneacutees sur le modegraveleAntRS que nous avons conccedilu dans le cadre de cette thegravese et deacutecrit dans le chapitre 3 preacuteceacutedentNous nallons pas re-deacutetailler la theacuteorie du modegravele AntRS ici comme cela a deacutejagrave eacuteteacute fait dansle chapitre preacuteceacutedent mais nous allons plutocirct nous concentrer sur son application et sur sescomportements dun point de vue expeacuterimental De la mecircme maniegravere que pour le modegravele ACSdans la section preacuteceacutedente il est important de proceacuteder agrave quelques tests pour jauger notremodegravele avant de lancer des expeacuterimentations pouvant ecirctre longues Toutefois et contrairementagrave la section preacuteceacutedente toutes les expeacuterimentations qui vont ecirctre preacutesenteacutees ici ont eacuteteacute reacutealiseacuteessur une base de donneacutees reacuteelles Avant de sinteacuteresser agrave ces expeacuterimentations nous allons doncpreacutesenter la base de donneacutees utiliseacutee

431 Base de donneacutees utiliseacutee

Tout dabord et avant de discuter du choix des donneacutees il est important de preacuteciser pour-quoi nous navons pas eu recours comme dans la section preacuteceacutedente pour le modegravele ACS agrave desdonneacutees simuleacutees Lexplication de cette deacutecision reacuteside dans lobjectif viseacute par ces expeacuterimen-tations Les expeacuterimentations reacutealiseacutees preacuteceacutedemment avaient seulement pour but de tester lebon fonctionnement du modegravele son comportement et linuence de ses meacutetavariables Lobjectifdes expeacuterimentations que nous allons preacutesenter maintenant est dieacuterent proposer des seacutequences

84

43 Expeacuterimentations sur le modegravele AntRS

de ressources correspondant aux preacutefeacuterences de lutilisateur Il serait theacuteoriquement possible desimuler un grand nombre de ressources aleacuteatoires posseacutedant des caracteacuteristiques elles aussi aleacutea-toires Cependant nous souhaitons principalement eacutevaluer la pertinence des seacutequences produitespar notre modegravele Pour ce faire il est neacutecessaire de disposer de donneacutees dusage pour veacuteriera posteriori si ces seacutequences sont susceptibles dinteacuteresser les utilisateurs Lexploitation dunebase de donneacutees reacuteelle posseacutedant ces donneacutees dusages eacutetait essentielle

Choix du domaine applicatif

Le choix du domaine applicatif a eacuteteacute un point crucial pour pouvoir tester notre modegravele dans debonnes conditions La recommandation de seacutequences restreint le choix du domaine en imposantcertaines contraintes

Les utilisateurs doivent consulter reacuteguliegraverement les ressources du domaine applicatif Lors dune peacuteriode dactiviteacute les utilisateurs doivent consulter un nombre susant (au

moins une dizaine) de ressources dans un court intervalle de temps Par conseacutequent les ressources doivent pouvoir ecirctre consulteacutees et consommeacutees rapide-

ment Ces ressources doivent aussi ecirctre disponibles en nombre susant

En se basant sur les eacutetudes de leacutetat de lart explorant les algorithmes de fourmis ou la recom-mandation de seacutequences deux domaines applicatifs sont majoritairement utiliseacutes les ressourceseacuteducatives ou les ressources multimeacutedias Le domaine eacuteducatif permet de geacuteneacuterer des seacutequencesdestineacutees aux apprenants comme le ferait un vrai professeur tandis que le domaine du divertisse-ment multimeacutedia est en plein essor depuis quelques anneacutees gracircce agrave la deacutemocratisation dInternethaut deacutebit et des smartphones permettant agrave tout un chacun de regarder des lms ou deacutecouter dela musique par exemple Un troisiegraveme domaine a aussi eacuteteacute consideacutereacute car il a eacuteteacute le sujet de monstage de n de Master en collaboration avec le projet europeacuteen CrossCult 42 le domaine museacutealautrement dit les seacutequences que creacuteent les visiteurs dun museacutee en se deacuteplaccedilant physiquementdans un museacutee [Osche et al 2016 Osche et al 2019b]

Toutefois mecircme si ces trois domaines sont adapteacutes agrave notre application la reacutecupeacuteration dunebase de donneacutees assez importante pour reacutealiser des expeacuterimentations ne pose pas les mecircmes pro-blegravemes selon le domaine consideacutereacute

Domaine eacuteducatif dans ce domaine les ressources sont des supports peacutedagogiques denatures dieacuterentes 43 et le but est de creacuteer des seacutequences permettant agrave des utilisateurs dat-teindre des connaissances speacutecieacutees Il existe des bases de donneacutees publiques provenantduniversiteacutes ouvertes comme par exemple lUniversiteacute Ouverte des Humaniteacutes 44 maisces derniegraveres nont pas de prols utilisateurs assez fournis pour pouvoir les utiliser icinotamment ducirce agrave une connexion avec une session unique et anonyme sans prol Commeil est preacutefeacuterable davoir plusieurs dizaines (voire centaines) dentreacutees preacute-existantes pourmodeacuteliser le graphe et les prols utilisateurs il est neacutecessaire dutiliser les donneacutees dunsite permettant la connexion de lutilisateur et lenregistrement de ses habitudes pendantune certaine dureacutee

42 httpwwwcrossculteu projet europeacuteen ayant pour but de modier la maniegravere dont les citoyens europeacuteensvoient et sapproprient lHistoire en creacuteant de nouvelles interconnexions entre lheacuteritage culturel des lieux deculture (museacutees villes etc) et le point de vue des citoyens eux-mecircmes43 Les supports peacutedagogiques peuvent inclure des cours eacutecrits oraux des videacuteos des exercices des tests etc44 httpwwwuohfr

85

Chapitre 4 Expeacuterimentations et reacutesultats

Domaine museacuteal ce domaine est unique car il est le seul des trois agrave neacutecessiter dereacutecolter des donneacutees de maniegravere physique et non sur ordinateur Comme nous lavons vudans leacutetat de lart des eacutetudes existent dans ce domaine et ont reacutecolteacute les positions desutilisateurs avec plus ou moins de preacutecision mais il nexiste agrave notre connaissance pas debase de donneacutees publique permettant de savoir ce que le visiteur regarde preacutecisemment 45Or cette information est essentielle agrave notre modegravele car la position seule ne permet pas dedeacuteterminer ce que fait preacuteciseacutement lutilisateur (par exemple il peut sassoir en face dunedivideuvre mais regarder derriegravere lui ou encore discuter avec quelquun sans precircter attentionagrave ldivideuvre devant lui etc) Autrement dit sans savoir ce que regarde lutilisateur il nestpas possible de savoir les ressources quil a consulteacute Eacutetant donneacute le sujet du stage eectueacuteavant cette thegravese cest sur ce problegraveme preacutecis que nous nous sommes dabord concentreacutesCependant devant le coucirct en temps de la mise en place dune telle expeacuterimentation nousavons chercheacute des alternatives plus reacutealisables Il est agrave noter quil existe aussi la possi-biliteacute dun museacutee virtuel ougrave les visiteurs utilisent un ordinateur et un casque de reacutealiteacutevirtuelle pour se deacuteplacer ddivideuvre en divideuvre dans un espace recreacuteeacute pour simuler un museacuteeLa creacuteation de lensemble des composants permettant cette expeacuterimentation ainsi que lerecrutement des visiteurs virtuels est cependant complexe et tregraves coucircteux en temps nechangeant pas le problegraveme principal de la reacutecolte de donneacutees dans notre cas

Domaine du divertissement multimeacutedia depuis le tout deacutebut des systegravemes de re-commandations le domaine multimeacutedia (musique lms etc) occupe une place majeuredans leacutetat de lart On peut citer par exemple la base de donneacutees publique MovieLensqui depuis 1998 a eacuteteacute utiliseacutee dans des milliers deacutetudes sur la recommandation de lms[Harper and Konstan 2015] La raison de cette omnipreacutesence est la grande quantiteacute desites web permettant souvent de maniegravere gratuite de regarder des videacuteos deacutecouter dela musique etc Les donneacutees dutilisation de ce genre de sites sont aussi relativementsimples agrave reacutecupeacuterer et agrave exploiter Leacutecoute de musique en ligne est speacuteciquement inteacute-ressante dans le cadre de cette thegravese car elle est propice agrave la consommation de multiplesressources agrave la suite dans une mecircme session orant ainsi la possibiliteacute de travailler avecdes seacutequences De plus il existe plusieurs sites de diusion de musique en ligne orantla possibiliteacute dacceacuteder agrave leur API et agrave certaines de leurs donneacutees comme Deezer 46 ouencore Spotify 47

Le choix sest nalement porteacute sur le domaine de leacutecoute de musique en ligne dune part pourla possibiliteacute dexploiter et de recommander des seacutequences de musiques et dautre part pour lapossibiliteacute dobtenir une base de donneacutees de la part de nos partenaires dans lindustrie musicaleNotre modegravele AntRS ayant la capaciteacute de sadapter agrave de nombreux domaines applicatifs nousavons pu nous diriger vers une base de donneacutees existante an de commencer les expeacuterimentationsAmaury LHuillier ancien doctorant de leacutequipe KIWI a reacutecupeacutereacute et exploiteacute durant sa thegraveseune base de donneacutees musicale provenant de Deezer [lHuillier 2018] Dans la section suivantenous allons deacutecrire les caracteacuteristiques de cette base de donneacutees

45 Bien que des solutions soient en cours deacutetudes[Mokatren et al 2018]46 httpswwwdeezercom47 httpswwwspotifycom

86

43 Expeacuterimentations sur le modegravele AntRS

Description de la base de donneacutees

La base de donneacutees que nous avons utiliseacute se base sur le comportement dutilisateurs deDeezer pendant un mois entre le 5 deacutecembre 2016 et le 5 janvier 2017 Durant ce mois nousavons pu identier

3561 utilisateurs uniques 1871919 eacutecoutes enregistreacutees 178910 musiques uniques eacutecouteacutees

En plus de ces donneacutees nous avons calculeacute le nombre de sessions uniques durant ce mois Unesession est deacutetermineacutee par un utilisateur se connectant sur le site eacutecoutant un certain nombre demusiques puis se deacuteconnectant Une session se poursuit tant que lutilisateur eacutecoute des musiquessans pause plus longues que 15 minutes Nous avons ainsi pu identier 91468 sessions uniquescomposeacutees en moyenne de 183 morceaux de musique Ces sessions seront la base de travail nouspermettant de construire le graphe de notre modegravele AntRS et de proposer des recommandationsLa Figure 410 preacutesente en scheacutema la deacutetection de sessions dans la base de donneacutees

Figure 410 Exemple de deacutetection de sessions dans la base de donneacutees Lheure agrave laquelleest lanceacutee chaque musique (ici en bas dans le scheacutema) ainsi que sa dureacutee sont enregistreacutees Silutilisateur ne relance pas de musique pendant 15 minutes apregraves la n de sa derniegravere eacutecoute alorsla session en cours est termineacutee et une nouvelle session est commenceacutee agrave la prochaine musiquelanceacutee

Deezer possegravede des meacutetadonneacutees sur chaque musique quil est possible de reacutecupeacuterer et decoupler agrave dautres API 48 (comme par exemple lAPI de Spotify 49) an de les compleacuteter si neacute-cessaire Sans preacutesenter la base de donneacutees dans lensemble de ses deacutetails voici ci-dessous les ca-racteacuteristiques potentiellement exploitables enregistreacutees pour chaque musique que nous pouvonsregrouper en trois cateacutegories Tout dabord nous disposons dinformations textuelles classiques

id identiant unique de la musique title titre de la musique album nom de lalbum auquel appartient la musique artist nom de lartiste (ou du groupe) qui a creacuteeacute la musique artistGenre genre musical de lartiste

Ensuite les API de descriptions de meacutetadonneacutees musicales disposent dun ensemble de va-leurs numeacuteriques correspondant aux caracteacuteristiques de chaque musique

48 API Application Programming Interface

49 httpsdeveloperspotifycomdocumentationweb-api

87

Chapitre 4 Expeacuterimentations et reacutesultats

duration dureacutee de la musique en secondes acousticness isin [0 1] indique agrave quel point la musique est acoustique cest-agrave-dire si

la musique est plutocirct de type eacutelectronique ou plutocirct classique (ie composeacutee avec desinstruments de musique agrave corde ou agrave vents par exemple)

danceability isin [0 1] indique agrave quel point la musique est adapteacutee agrave la danse energy isin [0 1] indique agrave quel point la musique est eacutenergique instrumentalness isin [0 1] indique agrave quel point la musique possegravede ou non des parties

vocales liveness isin [0 1] indique si la musique a eacuteteacute enregistreacutee avec ou sans la preacutesence dun

public loudness isin [0 1] mesure la preacutesence et la puissance des basses dans la musique speechiness isin [0 1] mesure limportance des paroles dans la musique sil y en a tempo rythme de la musique valence indique si leacutemotion geacuteneacuterale de la musique est plutocirct heureuse ou triste

Enn Deezer eacutetant un service de musique en ligne il dispose des donneacutees de freacutequentationsdes musiques les unes par rapport aux autres Il est donc possible de connaicirctre pour chaquemusique et artiste sa populariteacute

trackRankDeezer repreacutesente la populariteacute de la musique sur le site Deezer artistRankDeezer repreacutesente la populariteacute de lartiste sur le site Deezer

La base de donneacutees possegravede aussi une table concernant les utilisateurs Ces derniers sontbien sucircr anonymiseacutes avec un identiant geacuteneacutereacute automatiquement De plus pour chaque chansonDeezer peut connaicirctre quelles actions lutilisateur a eectueacute durant son eacutecoute (sil en a eectueacute)

idUser identiant unique de lutilisateur idTrack identiant unique de la musique eacutecouteacutee timestamp date preacutecise agrave laquelle lutilisateur a lanceacute la musique skip indique si lutilisateur est passeacute agrave la musique suivante durant son eacutecoute ban indique si lutilisateur a banni la musique eacutecouteacutee de ses futures recommandations love indique si lutilisateur a aimeacute la musique durant son eacutecoute

Ces trois derniegraveres informations sont importantes car elles repreacutesentent lavis de lutilisateursur la musique quil eacutecoute On peut par exemple deacuteduire dun utilisateur qui passe la musiqueen cours (skip) quil ne lappreacutecie pas ou alors quil laime mais que ce nest pas le bon momentpour leacutecouter Un utilisateur supprimant une musique de ses futures eacutecoutes (ban) indique quilne souhaite plus eacutecouter cette musique et ce quelles que soient les circonstances Le Tableau 41preacutesente la freacutequence agrave laquelle les utilisateurs se sont servis de ces fonctionnaliteacutes dans notrebase de donneacutees

Discussion sur la base de donneacutees

Dans cette section nous avons justieacute le choix dune base de donneacutees musicale et deacutecritson contenu Mecircme si initialement nous nous sommes plutocirct dirigeacutes vers lespace museacuteal etle-eacuteducation devant le temps et la complexiteacute de la reacutecupeacuteration de donneacutees dans ces deuxdomaines nous avons nalement proceacutedeacute au choix plus pragmatique du domaine musical dont

88

43 Expeacuterimentations sur le modegravele AntRS

Nombre doccurrences Pourcentage

skip 603773 3225ban 3417 018love 14174 076

Total 621364 3319

Table 41 Tableau repreacutesentant le nombre de fois ougrave un utilisateur a cliqueacute sur les boutonspour passer bannir ou aimer une musique durant son eacutecoute On remarque quau total dansnotre base de donneacutees pregraves dun tiers des utilisateurs ont passeacute la musique quils eacutecoutaient

une base de donneacutees eacutetait deacutejagrave disponible et precircte agrave lemploi Le travail preacuteliminaire sur les deuxdomaines applicatifs non seacutelectionneacutes na cependant pas eacuteteacute vain car des projets en parallegravelesur la creacuteation dune base de donneacutees de visiteurs se deacuteplaccedilant dans le museacutee des Beaux-arts deNancy sont en cours de reacutealisation [Osche et al 2019b][Castagnos et al 2019]

Un autre objectif derriegravere la prise en compte de plusieurs domaines sur lesquels appliquernotre modegravele est la geacuteneacutericiteacute de notre approche Ces trois domaines possegravedent de nombreusesdieacuterences les uns par rapports aux autres Le domaine des museacutees est un environnement physiqueougrave les distances entre les divideuvres dart et la foule sont des notions importantes agrave prendre en compteet unique agrave ce domaine Le domaine de le-eacuteducation quant agrave lui neacutecessite de prendre en comptelobjectif peacutedagogique de lapprenant son niveau ou encore sa vitesse dapprentissage plutocirctque les seules preacutefeacuterences quil est dusage dexploiter dans les systegravemes de recommandationNotre modegravele AntRS a eacuteteacute conccedilu dans le but de pouvoir sadapter agrave ces dieacuterentes speacuteciciteacutesAinsi le fonctionnement du cdivideur du modegravele reste le mecircme quel que soit le domaine et seulsles objectifs des colonies ainsi que le type des colonies neacutecessite decirctre adapteacute en fonctiondes objectifs importants du domaine et des caracteacuteristiques de ses ressources Pour illustrer cedernier point tregraves concregravetement les expeacuterimentations qui suivent nincluent pas la colonie deprogressiviteacute Nous avons reacutealiseacute de nombreux tests avec cette colonie avec le corpus de donneacuteesmais les reacutesultats obtenus nont jamais eacuteteacute concluants Cela sexplique par le fait que les seacutequencesdeacutecoutes utilisateurs que nous avons recueilli ne posseacutedaient elles-mecircmes aucun motif deacutetectablede progressiviteacute selon les critegraveres deacutenis dans notre modegravele Nous avons donc deacutecideacute dutiliser lamodulariteacute quore notre modegravele en enlevant cette colonie

432 AntRS mono-objectif expeacuterimentations sur chaque colonie isoleacutee

Apregraves avoir deacutetailleacute la base de donneacutees nous allons maintenant aborder la premiegravere expeacuteri-mentation que nous avons reacutealiseacute avec celle-ci Comme nous lavons fait au deacutebut de ce chapitreavec le modegravele ACS classique nous avons jugeacute important de reacutealiser quelques expeacuterimentationsde tests an dappreacutecier le fonctionnement en pratique de notre modegravele qui jusquagrave maintenantdans ce manuscrit na eacuteteacute preacutesenteacute que de maniegravere theacuteorique Pour rappel notre modegravele simuleen parallegravele plusieurs colonies de fourmis ayant chacune un objectif unique Ensuite un algo-rithme se charge de fusionner les dieacuterents reacutesultats de lensemble des colonies pour ne proposeragrave lutilisateur quune seule seacutequence de ressources Avant de tester lensemble de notre modegravelenous avons voulu tester les colonies seacutepareacutement an dobserver si les reacutesultats quelles produisentsont bien adapteacutes agrave leurs objectifs respectifs Voici les 4 colonies que nous avons preacutesenteacutes dansle chapitre 3 et que nous allons mesurer ici

1 Similariteacute

89

Chapitre 4 Expeacuterimentations et reacutesultats

2 Diversiteacute

3 Nouveauteacute

4 Preacutefeacuterences

An de mesurer les performances de ces 4 colonies nous allons les isoler et les lancer sur ungraphe identique en tous points La modulariteacute dAntRS nous permettant de changer le nombrede colonies utiliseacutees au vol agrave chaque exeacutecution est ici mis agrave prot pour lancer notre modegraveleavec uniquement une colonie au lieu des 4 habituelles La deuxiegraveme phase de notre modegravele lafusion des seacutequences provenant des dieacuterentes colonies nest ici pas utiliseacutee eacutetant donneacute que nousnaurons que les reacutesultats dune seule colonie autrement dit nous naurons agrave la n quune seuleseacutequence unique par utilisateur et par expeacuterimentation (soit 4 seacutequences par utilisateur pourlensemble des 4 expeacuterimentations) Nous allons donc proceacuteder agrave 4 tests dieacuterents pour chaquecolonie avec des conditions de deacutepart strictement identiques Le but est ici de voir si les reacutesultatsobtenus correspondent bien agrave lobjectif de la colonie testeacutee Autrement dit pour un utilisateurdonneacute les agents de la colonie de similariteacute devraient favoriser les musiques similaires au goucirct delutilisateur en question De son cocircteacute la colonie de nouveauteacute devrait dans les mecircmes conditionsproduire des seacutequences de musiques moins familiegraveres pour lutilisateur

Avant de preacutesenter les reacutesultats de ces premiegraveres expeacuterimentations nous allons deacutecrire dequelle maniegravere nous les avons reacutealiseacutees Nous avons deacutejagrave deacutetailleacute la base de donneacutees avec laquellenous travaillons dans la section preacuteceacutedente mais nous navons pas encore expliqueacute commentnous avons utiliseacute ces donneacutees Comme nous lavons preacuteciseacute nous avons agrave notre disposition plusde 3500 utilisateurs et plus de 91400 sessions Parmi lensemble total des utilisateurs nous enavons seacutelectionneacute 500 au hasard an de travailler uniquement sur eux Cette reacuteduction du nombredutilisateurs nous a permis de reacutealiser beaucoup plus rapidement des expeacuterimentations tout engardant une diversiteacute importante Pour chacun de ces 500 utilisateurs nous avons reacutecupeacutereacute leurssessions deacutecoute et gardeacute toutes celles contenant 5 musiques ou plus Ces 500 utilisateurs ontensuite eacuteteacute diviseacutes aleacuteatoirement en 2 groupes de 400 et de 100 les 400 premiers utilisateursont servi pour lentraicircnement du modegravele (dans notre cas la creacuteation du graphe) et cest sur les100 utilisateurs restants que nous avons meneacute les tests Dans le cadre de cette expeacuterimentationpreacutecise les utilisateurs de la base dentraicircnement ont eacutecouteacute 10621 sessions uniques de plus de5 musiques et les utilisateurs de la base de test ont quant agrave eux eacutecouteacute 2569 sessions Pourchacune des sessions deacutecoute des utilisateurs de la base de test notre modegravele a produit uneseacutequence de recommandations en partant de la premiegravere musique eacutecouteacutee Autrement dit pourchaque session les agents de notre modegravele ont eacuteteacute lanceacutes sur le graphe en prenant comme pointde deacutepart la premiegravere musique que lutilisateur avait eacutecouteacute Par exemple pour la session dunutilisateur consistant en leacutecoute de lalbum entier Dark Side of the Moon des Pink Floyd conte-nant 9 musiques les agents eacutetaient placeacutes sur le ndivideud du graphe correspondant agrave la premiegraveremusique de lalbum Speak to me Breathe puis notre modegravele sexeacutecute et les agents trouventun chemin dans le graphe Les agents possegravedent 3 conditions de parcours de graphe une condi-tion de taille minimale de la seacutequence recommandeacutee et deux conditions darrecircts La conditionde taille minimale de la seacutequence recommandeacutee est xeacutee agrave la moitieacute de la longueur de la sessioninitiale de lutilisateur Dans lexemple de lalbum de Pink Floyd un agent sera donc forceacute deparcourir au moins 5 ndivideuds du graphe avant de pouvoir sarrecircter Les deux conditions darrecirctseacutetaient quant agrave elles imposeacutees dans notre modegravele an de limiter la taille maximale de la seacutequencerecommandeacutee des agents Premiegraverement la derniegravere musique de la session initiale eacutecouteacutee parlutilisateur neacutetait pas donneacutee en amont mais si jamais les agents arrivaient agrave cette musique ils

90

43 Expeacuterimentations sur le modegravele AntRS

arrecirctaient ici leur chemin Deuxiegravemement dans le cas ougrave les agents natteignaient pas la derniegraveremusique de la session initiale de lutilisateur ces derniers sarrecirctaient lorsquils avaient parcourudeux fois la taille de la session initiale Dans notre exemple avec lalbum de Pink Floyd les agentspourraient donc parcourir au maximum 18 ndivideuds du graphe et produire ainsi une seacutequence derecommandations de 18 musiques En prenant en compte le nombre de ndivideuds des graphes surlesquels nous avons travailleacute (entre plusieurs dizaines de milliers jusquagrave plusieurs centaines demilliers) cest cette deuxiegraveme condition darrecirct qui eacutetait tregraves largement atteinte Ces trois condi-tions son neacutecessaires et ont eacuteteacute mises en place an dobtenir des seacutequences de recommandationfaisant sens dans le contexte du domaine applicatif musical Sans ces 3 conditions il est pos-sible dobtenir des seacutequences ne faisant que deux musiques ou posseacutedant des centaines voire desmilliers de musiques Comme le reste des paramegravetres de notre modegravele nous avons fait en sortequil soit aiseacute de les changer au vol en fonction du domaine applicatif voire mecircme en fonctionde chaque utilisateur au sein dun mecircme domaine

Nous allons maintenant nous inteacuteresser agrave la creacuteation du graphe Nous avons deacutecrit la maniegraveredont nous creacuteons le graphe sur lequel les agents se deacuteplacent dans la Section 33 du chapitrepreacuteceacutedent Nous avons utiliseacute un sous-ensemble de 500 utilisateurs choisis aleacuteatoirement parmilensemble des utilisateurs de notre base de donneacutees Deezer pour reacutealiser cette expeacuterimentationApregraves cette seacutelection aleacuteatoire nous avons seacutepareacute ces 500 utilisateurs en 5 blocs de 100 utilisateursan de reacutealiser une validation croiseacutee agrave 5 blocs 4 blocs ont constitueacute la base dapprentissage tandisque le dernier bloc restant a constitueacute la base de test Ce processus a eacuteteacute reacutepeacuteteacute 5 fois pour reacutealiserlexpeacuterimentation avec toutes les combinaisons possibles Le choix speacutecique dutiliser lensembledes connaissances disponibles de 80 des utilisateurs et dessayer de preacutevoir les preacutefeacuterences desderniers 20 est deacutelibeacutereacutement voulu Il nous permet de simuler au mieux le fonctionnement dunservice de recommandations en cours dutilisation En eet un nouvel utilisateur arrivant surle site sera inconnu du systegraveme de recommandation La tacircche de preacutediction est plus ardue etsaidera initialement des preacutefeacuterences des autres utilisateurs deacutejagrave connus du modegravele Au fur et agravemesure que le nouvel utilisateur eacutecoute des musiques et apporte ses retours sur ces derniegraveresle modegravele peut inteacutegrer ses preacutefeacuterences speacuteciques et de ce fait ameacuteliorer les recommandationsquil lui propose Pour simuler cette eacutevolution des connaissances du modegravele nous avons inteacutegreacutechaque session de lutilisateur au graphe apregraves avoir proposer une recommandation pour celle-ciAutrement dit une fois que le modegravele a proposeacute une recommandation de seacutequence en se basantsur une session deacutecoute de lutilisateur le graphe est reconstruit en inteacutegrant les informationsde cette nouvelle session deacutecoute Ainsi agrave chaque nouvelle session deacutecoute pour laquelle notremodegravele propose une recommandation le graphe gagne en information et est plus agrave mecircme depreacutedire correctement les preacutefeacuterences de lutilisateur Cependant linconveacutenient majeur de cettemeacutethode est de devoir reconstruire le graphe apregraves chaque recommandation an dinteacutegrer lesnouvelles informations Apregraves cette premiegravere expeacuterimentation nous proposerons une meacutethodeplus classique de reacutepartition des connaissances apporteacutees par les utilisateurs

Le Tableau 42 preacutesente les reacutesultats de cette expeacuterience pour les 4 colonies choisies Ce for-mat de tableau de reacutesultats et les meacutetriques deacutevaluations qui le compose seront utiliseacutes pour lesprochaines expeacuterimentations nous allons donc les expliquer ici avant de discuter des reacutesultatsobtenus An de mesurer les performances de notre modegravele nous avons utiliseacute diverses mesuresnous permettant de capturer dieacuterents aspects que nous consideacuterons ecirctre importants dans unerecommandation de seacutequence Nous allons deacutecrire ces dieacuterentes mesures ci-dessous

Preacutecision Rappel et F-mesure les mesures classiques dans le domaine de la recherche

91

Chapitre 4 Expeacuterimentations et reacutesultats

Preacutecision Rappel F-mesure Similariteacute SIL Diversiteacute DR Nouveauteacute Preacutefeacuterences

Colonie de Similariteacute 0317 0126 0165 0952 0923 0048 0049 072 0447 Colonie de Diversiteacute 0211 0104 0127 0862 077 0138 019 0806 0393 Colonie de Nouveauteacute 0132 0112 0114 0895 0837 0105 0144 0909 079 Colonie de Preacutefeacuterences 0296 0159 0191 0946 091 0054 008 0695 0804

Table 42 Expeacuterimentations avec le modegravele AntRS mono-objectif pour les 4 objectifs desimilariteacute diversiteacute nouveauteacute preacutefeacuterencesLe code couleur fait reacutefeacuterence agrave la signicativiteacute statistique de la p-valeur avec p isin [0 1] 0 0001 001 005 01 1

dinformation [Baeza-Yates et al 1999] Elles permettent de comparer directement lesseacutequences de recommandation produites par notre modegravele avec les sessions deacutecoute ini-tiales des utilisateurs Dans un contexte dutilisation reacuteel ougrave un utilisateur se connecte etle systegraveme propose une recommandation il ne serait pas possible dutiliser ces mesuresCependant dans le cadre dune eacutevaluation hors-ligne elles apportent des informations ma-jeures sur la qualiteacute des recommandations car nous consideacuterons que les sessions deacutecouteque nous posseacutedons sont de bons modegraveles pour nos recommandations

Similariteacute et SIL (Similariteacute Intra-Liste) bien quelles soient sur-utiliseacutees les me-sures de similariteacute et notamment la similariteacute intra-liste sont de bons indicateurs de lacoheacuterence de nos seacutequences de recommandations La mesure de similariteacute intra-liste pro-vient des travaux de Ziegler amp al[Ziegler et al 2005]

Diversiteacute et DR (Diversiteacute Relative) comme nous lavons expliqueacute plus tocirct dans cemanuscrit la diversiteacute est une caracteacuteristique cruciale des systegravemes de recommandationsen plus de la similariteacute Il eacutetait donc important de mesurer agrave quel point les musiques re-commandeacutees ainsi que les seacutequences en elles-mecircmes eacutetaient diverses [McGinty and Smyth2003 Vargas and Castells 2011]

Nouveauteacute et Preacutefeacuterences pour mesurer ces deux derniegraveres caracteacuteristiques nousavons utiliseacute les deux mesures proposeacutees dans larticle de[Vargas and Castells 2011] quenous avons aussi reproduites preacuteceacutedemment dans les Eacutequations 35 et 36

Apregraves avoir expliqueacute en deacutetail lexpeacuterimentation et le processus deacutevaluation nous pouvonsmaintenant nous inteacuteresser aux reacutesultats agrave proprement parler Le Tableau 42 preacutesente les reacutesul-tats de notre premiegravere expeacuterimentation mono-objectif avec 500 utilisateurs pour chacune des 4colonies isoleacutees

An de sassurer que les reacutesultats obtenus et preacutesenteacutes ci-dessus sont signicatifs nous avonsreacutealiseacute pour chacune des cases du tableau un test de signicativiteacute statistique An de savoirsi nos donneacutees suivaient la loi normale nous avons reacutealiseacute un test de Shapiro-Wilk et ce der-nier sest reacuteveacuteleacute neacutegatif Nous avons ainsi ducirc utiliser le test non parameacutetrique de Wilcoxon quinous a permis de comparer les moyennes des deux eacutechantillons connexes (mecircme utilisateurs maisdieacuterentes colonies) Les reacutesultats pour cette expeacuterimentation se sont tous reacuteveacuteleacutes ecirctre tregraves si-gnicatifs avec un p maximal infeacuterieur agrave p lt 0 001 Nous avons preacutesenteacutes la signicativiteacute dechaque case de reacutesultat avec un systegraveme de symboles coloreacutees ougrave les trois premiers symboles (0 0001 001 ) sont signicatifs Ces tests de signicativiteacute ont eacuteteacute systeacutematiquementeectueacutes agrave chaque expeacuterimentation et par conseacutequent tous les reacutesultats que nous preacutesenterons

92

43 Expeacuterimentations sur le modegravele AntRS

dans la suite de cette section seront accompagneacutes de leur signicativiteacute

Nous pouvons maintenant revenir sur les reacutesultats preacutesenteacutes dans le Tableau 42 Commeil eacutetait preacutevu on peut observer que chaque colonie a produit des recommandations orienteacuteesvers son objectif speacutecique Ainsi la colonie de similariteacute a produit des seacutequences de musiquesayant obtenu les plus hauts scores de preacutecision similariteacute et similariteacute intra-liste la colonie dediversiteacute a produit les seacutequences avec le plus haut score de diversiteacute et de diversiteacute relative tandis que les colonies de nouveauteacute et de preacutefeacuterences ont respectivement produit des seacutequencesavec le plus haut score de nouveauteacute et de preacutefeacuterences On peut cependant remarquer que pourcertaines mesures (la preacutecision la similariteacute ou encore la diversiteacute par exemple) les eacutecarts sontrelativement faibles entre les dieacuterentes colonies Nous pouvons reacutepondre agrave cette constatation endeux points Tout dabord et comme nous lavons preacuteciseacute plus haut toutes les cases ougrave 3 eacutetoilesvertes ont eacuteteacute apposeacutees repreacutesentent des reacutesultats tregraves signicatifs dun point de vue statistiqueEnsuite lobjectif principal de cette expeacuterimentation est de prouver que notre modegravele est biencapable de produire des recommandations diverses et complegravetes suivant plusieurs dimensionsLa deuxiegraveme partie de notre modegravele ougrave les reacutesultats de chaque colonie seront fusionneacutes devraproduire des seacutequences eacutequilibrant au mieux chacune des dimensions Les premiegraveres seacutequencesproduites par les colonies mono-objectifs prouvent que cela est possible mais quil est neacutecessairedavoir cette deuxiegraveme eacutetape an de mieux eacutequilibrer les seacutequences nales qui seront proposeacuteesagrave lutilisateur

433 AntRS multi-objectifs expeacuterimentations sur lensemble des colonies

simultaneacutement et sur les tactiques de fusion

Objectifs de lexpeacuterimentation

Apregraves avoir montreacute que toutes les colonies eacutetaient capables de produire des seacutequences demusiques speacutecialiseacutees dans une dimension speacutecique nous pouvons maintenant reacutealiser des ex-peacuterimentations sur notre modegravele AntRS dans son ensemble cest-agrave-dire avec les 4 colonies enparallegravele suivi de leacutetape de fusion pour ne produire quune seacutequence unique posseacutedant toutes lesqualiteacutes de chaque dimension agrave lutilisateur nal Autrement dit avec la premiegravere expeacuterimenta-tion nous avons obtenu 4 seacutequences excellant chacune dans une dimension speacutecique (similariteacutediversiteacute nouveauteacute et preacutefeacuterences) et doreacutenavant lobjectif est dobtenir une seule seacutequencereacuteunissant ces 4 dimensions

Nous nallons pas reacuteexpliquer en deacutetail ici la construction du graphe ni le fonctionnement descolonies eacutetant donneacute que nous lavons deacutejagrave fait preacuteceacutedemment mais les dieacuterences entre cetteexpeacuterimentation et les preacuteceacutedentes seront cependant souligneacutees Contrairement agrave lexpeacuterimenta-tion preacuteceacutedente les 4 colonies ont eacuteteacute exeacutecuteacutees en parallegravele en exploitant les threads de JavaLa deuxiegraveme et principale dieacuterence se trouve dans lexploitation des seacutequences geacuteneacutereacutees par lescolonies Au lieu de les preacutesenter directement comme nous lavons fait dans lexpeacuterimentationmono-objectif ces seacutequences ont eacuteteacute fusionneacutees avec la deuxiegraveme partie du modegravele preacutesenteacutee dansle chapitre preacuteceacutedent dans la Section 35 Le but est ici dobtenir une seule seacutequence combinantau mieux tous les points forts des 4 colonies Les meacutetavariables utiliseacutees sont les mecircmes que pourlexpeacuterience preacuteceacutedente

93

Chapitre 4 Expeacuterimentations et reacutesultats

Comparaison de performances intra-modegravele

Maintenant que nous avons deacutecrit lobjectif de cette expeacuterimentation nous allons deacutecrire lamaniegravere dont nous avons mesureacute et compareacute les reacutesultats obtenus Tout dabord nous avons testeacute3 versions de notre modegravele les voici deacutecrites ci-dessous

AntRS avec les 4 colonies en parallegravele et le fusion de seacutequences Comme nous lavonsexpliqueacute dans le chapitre preacuteceacutedent Section 35 nous avons proposeacute deux tactiques defusion pour les seacutequences trouveacutees par les dieacuterentes colonies lors de la premiegravere eacutetape dumodegravele La fusion de seacutequences est la premiegravere de ces deux tactiques Pour rappel cettetactique consiste agrave geacuteneacuterer une liste de toutes les ressources de chacune des 4 meilleuresseacutequences trouveacutees par les colonies lors de la premiegravere eacutetape du modegravele puis de les reacutear-ranger an de creacuteer la seacutequence nale

AntRS avec les 4 colonies en parallegravele et la colonie de fusion Le deuxiegraveme modegraveletesteacute est identique au premier sauf en ce qui concerne la tactique de fusion Nous avonsutiliseacute ici la deuxiegraveme tactique de fusion preacutesenteacutee dans la Section 35 Pour rappel cettetactique consiste agrave construire un nouveau graphe constitueacute uniquement des ressources quicomposent les seacutequences des colonies de la premiegravere eacutetape cette derniegravere agissant donccomme une sorte de seacutelection pour reacutecupeacuterer les ressources les plus inteacuteressantes

Colonie de fusion uniquement La troisiegraveme et derniegravere version de cette expeacuterimen-tation sur le modegravele AntRS est dieacuterente des deux premiegraveres Au lieu deectuer seacutequen-tiellement la premiegravere eacutetape (les 4 colonies) puis la deuxiegraveme eacutetape avec les reacutesultats dela premiegravere (la fusion) nous avons voulu tester si le fait dexeacutecuter la colonie de fusiondirectement avec lensemble des ressources de tous les utilisateurs pouvait produire desreacutesultats inteacuteressants En eet dans le modegravele AntRS classique cette colonie est exeacutecuteacuteeavec quelques dizaines de ressources tout au plus qui ont eacuteteacute seacutelectionneacutees par les autrescolonies de la premiegravere eacutetape mais rien nempecircche de lancer directement cette colonieavec le mecircme graphe quutilisent les premiegraveres colonies et qui contient quelques dizainesde milliers de sommets Notre hypothegravese est que la seacutequence nale obtenue par ce biaisobtiendra de moins bons reacutesultats que le processus complet de notre modegravele AntRS avecnotamment la preacute-seacutelection de ressources potentiellement inteacuteressantes par les premiegraverescolonies speacutecialiseacutees

Enn les mecircmes meacutetriques ont eacuteteacute utiliseacutees pour mesurer les performances de chaque ver-sion testeacutee du modegravele que pour lexpeacuterimentation mono-objectif preacuteceacutedente an de garder laconsistance des reacutesultats entre toutes les expeacuterimentations meneacutees

Comparaison de performances inter-modegraveles

En plus de mesurer les performances des dieacuterentes versions de notre modegravele nous avonsvoulu comparer nos reacutesultats obtenus avec dautres systegravemes de recommandation deacutejagrave existantsLe but est ici de conrmer que notre modegravele produit des recommandations compeacutetitives parrapport agrave dautres algorithmes souvent utiliseacutes dans leacutetat de lart Pour ce faire nous avonsutiliseacute deux types dalgorithmes (1) trois algorithmes classiques mono-objectif capables de pro-duire des listes de recommandations et (2) un algorithme speacuteciquement multi-objectifs an dedavoir un point de comparaison provenant dun modegravele de la mecircme classe que le nocirctre Nous

94

43 Expeacuterimentations sur le modegravele AntRS

avons choisi ces 2 familles dalgorithmes an de comparer au mieux notre modegravele Les algo-rithmes mono-objectif permettent deacutetablir une base de comparaison an de deacuteterminer si notremodegravele est compeacutetitif face agrave des systegravemes noptimisant quun seul de nos objectifs De plus cesalgorithmes sont classiques dans le domaine de la recommandation et sont tregraves souvent utiliseacutescomme base de comparaison Lalgorithme multi-objectifs de comparaison permet quant agrave lui demesurer nos performances sur lensemble des objectifs que nous optimisons Nous allons deacutecriresuccinctement le principe de ces algorithmes sans entrer dans les deacutetails eacutetant donneacute que nousavons deacutejagrave deacutecrit leur fonctionnement geacuteneacuteral preacuteceacutedemment dans leacutetat de lart

Algorithmes classiques mono-objectifs

1 UserKNN [Breese et al 2013] algorithme classique de ltrage collaboratif ougrave les k plusproches voisins de lutilisateur actif baseacutes sur la similariteacute des preacutefeacuterences sont seacutelectionneacutesan de participer au processus de recommandation

2 TrustMF [Yang et al 2017] dans cette meacutethode plus reacutecente de ltrage collaboratifles auteurs proposent des ameacuteliorations du modegravele classique de factorisation de matricesan dadresser les problegravemes de deacutemarrage agrave froid et de manque de donneacutees Mecircme silsutilisent la meacutethode classique de la factorisation de matrice ils se deacutemarquent en utilisantla conance quont les utilisateurs les uns envers les autres an de reeacuteter leur inuencereacuteciproque sur leurs opinions

3 SVD++ [Koren 2008] dans cet article les auteurs proposent des ameacuteliorations auxtechniques des facteurs latents et des plus proches voisins qui sont les deux approches dultrage collaboratif obtenant les meilleurs reacutesultats Les auteurs combinent ces deux ap-proches ensemble et utilisent agrave la fois les retours explicites et implicites an dobtenir unepreacutecision plus importante Ce modegravele a eacuteteacute creacutee dans le cadre du Netix Prize de 2008une compeacutetition organiseacutee par Netix ougrave le but eacutetait de creacuteer un algorithme de ltragecollaboratif an de preacutedire au mieux les preacutefeacuterences des utilisateurs [Bennett et al 2007]

Ces trois algorithmes ont eacuteteacute seacutelectionneacutes car ils repreacutesentent des techniques connues et bienutiliseacutees du domaine des systegravemes de recommandation Ils ont prouveacute leur ecaciteacute de par lesnombreuses eacutetudes de leacutetat de lart les utilisant comme nous lavons montreacute dans le chapitre 2de ce manuscrit De plus ces algorithmes sont mis agrave disposition dans la librairie Java Librec 50

[Guo et al 2015] Cette librairie propose plus de 70 algorithmes de systegravemes de recommandationen open source et a deux missions principales la preacutediction de preacutefeacuterences (via des notes) et leclassement de ressources Lutilisation de Librec nous a permis de travailler directement sur desalgorithmes agrave jour et sans erreur

Algorithme multi-objectifs

4 PEH [Ribeiro et al 2014] Nous avons souhaiteacute ajouter agrave cette liste un quatriegraveme algo-rithme qui contrairement aux trois premiers est multi-objectifs Cet algorithme nommeacutePEH pour Pareto-Ecient Hybridization a eacuteteacute preacutesenteacute dans la Section 252 de leacutetatde lart de ce manuscrit et nous allons ici discuter de son impleacutementation PEH est unmodegravele ougrave plusieurs algorithmes de recommandation sont exeacutecuteacutes en mecircme temps Lebut est dobtenir une valeur de pertinence pour chaque paire ressourcetimes utilisateur in-diquant agrave quel point il est pertinent de recommander la ressource agrave lutilisateur Chaquealgorithme produit un score et an de nobtenir quune seule valeur unique par paire

50 Librec la librarie Java pour les systegravemes de recommandation

95

Chapitre 4 Expeacuterimentations et reacutesultats

Table 43 Expeacuterimentations avec 3 versions du modegravele AntRS et 4 algorithmes de compa-raison 3 algorithmes mono-objectifs classiques (UserKNN TrustMF SVD++) et 1 algorithmemulti-objectifs (Pareto-Ecient Hybridization)

Preacutecision Rappel F-mesure Similariteacute SIL Diversiteacute DR Nouveauteacute Preacutefeacuterences Couverture

AntRS (4 colonies+ fusion de seacute-quences)

0344 0131 01838 0947 0908 0053 0069 0741 061 9692

AntRS (4 colonies+ colonie de fu-sion)

0288 0151 01836 0945 0905 0055 0082 0702 0612 9692

AntRS (colo-nie de fusionuniquement)

0197 0118 0141 0953 093 0047 0068 0324 0389 9692

UserKNN 0224 0138 0162 095 0905 005 0081 068 0541 6139TrustMF 0195 0117 014 095 0894 0058 009 0697 0458 6817SVD++ 0195 012 014 0941 0892 006 0093 070 0455 6817PEH 0193 0118 014 0941 0892 0059 0096 0697 0452 9752

Signicance codes (compared to AntRS with 4 colonies + lists merging) 0 0001 001 005 01 1

le modegravele PEH associe chacun de ces scores dans une combinaison lineacuteaire selon une hy-bridation speacutecique (ie des poids dieacuterents attribueacutes agrave chaque algorithme mitigeant ouaugmentant ainsi leur importance sur la valeur de pertinence nale) Le reacutesultat de cettecombinaison lineacuteaire est la valeur de pertinence de la recommandation de la ressource agravelutilisateur Plusieurs hybridations sont ainsi testeacutees et repreacutesenteacutees dans un espace en3 dimensions ougrave chaque point correspond aux niveaux de preacutecision de diversiteacute et denouveauteacute atteint par une hybridation Comme ces 3 dimensions sont aussi importantesles unes que les autres les auteurs utilisent le concept dOptimum de Pareto an de seacute-lectionner les meilleurs hybridations cest-agrave-dire les hybridations les plus proches ou surla frontiegravere de Pareto Dans leur article les auteurs utilisent dieacuterents algorithmes clas-sique de recommandation Ayant agrave notre disposition Librec ainsi que les 3 algorithmespreacutesenteacutes ci-dessus repreacutesentant plusieurs techniques de recommandation agrave la fois dieacute-rentes les unes des autres et tregraves utiliseacutees dans la litteacuterature nous les avons inclus dansle processus dhybridation Le reste du modegravele a eacuteteacute impleacutementeacute agrave partir de larticle desauteurs Ce modegravele est tregraves inteacuteressant pour notre comparaison de performance car il estmulti-objectifs comme le nocirctre mais utilise une technique tout agrave fait dieacuterente de An-tRS non baseacutee sur des modegraveles multi-agents et utilisant le concept dOptimum de Pareto

Pour cette expeacuterimentation nous avons donc un total de 4 algorithmes dieacuterents qui vontecirctre exeacutecuteacutes sur exactement la mecircme base de donneacutees et le mecircme nombre dutilisateurs quepour les trois versions de notre modegravele Les reacutesultats de cette expeacuterimentation sont preacutesenteacutesdans le Tableau 43

Reacutesultats

Comme pour lexpeacuterimentation mono-objectif nous avons mesureacute la signicativiteacute statistiqueavec le test des rangs signeacutes de Wilcoxon an de sassurer que les donneacutees obtenues pouvaientecirctre interpreacuteteacutee De plus les valeurs en gras pour chaque colonne montrent les meilleurs reacutesultatsobtenus

Les reacutesultats de cette expeacuterimentation nous reacutevegravelent plusieurs informations importantes Toutdabord nous allons nous inteacuteresser aux performances de notre modegravele AntRS Comme expliqueacute

96

43 Expeacuterimentations sur le modegravele AntRS

ci-dessus nous avons testeacute deux tactiques de fusion pour combiner les reacutesultats de nos quatreobjectifs Nous avons eacutegalement exeacutecuteacute directement la colonie de fusion sur le graphe completet sans la premiegravere eacutetape de notre modegravele

Les deux premiegraveres lignes du Tableau 43 preacutesentent les reacutesultats de notre modegravele AntRScomplet avec ses deux variations la fusion de seacutequences et la colonie de fusion Nous pouvonsvoir que dune maniegravere geacuteneacuterale notre modegravele obtient de tregraves bonnes performances par rapportaux 4 algorithmes de comparaison Les deux variations de notre modegravele obtiennent la meilleurepreacutecision (jusquagrave +7823) de rappel (jusquagrave +2905) et F-mesure (jusquagrave +3128) de tousles modegraveles testeacutes dans cette expeacuterimentation ce qui signie que notre modegravele est le meilleurpour modeacuteliser les preacutefeacuterences agrave partir des sessions initiales eacutecouteacutees par les utilisateurs AntRSa eacutegalement surpasseacute les autres modegraveles pour les preacutefeacuterences et les meacutetriques de nouveauteacute touten parvenant agrave maintenir un niveau correct de similitude et de diversiteacute Il est utile de rappelerici que nous avons deacutelibeacutereacutement choisi des objectifs non compatibles entre eux (Similariteacute vs Di-versiteacute Nouveauteacute vs Preacutefeacuterences) ce qui rend le processus de recommandations plus complexepour les algorithmes multi-objectifs (AntRS et PEH) par rapport aux algorithmes mono-objectifMalgreacute une diversiteacute un peu plus faible par rapport aux algorithmes de comparaison AntRS oreun meilleur compromis entre tous les objectifs que PEH et dans un temps dexeacutecution beaucoupplus court Enn nous pouvons remarquer que les deux modegraveles multi-objectifs AntRS et PEHont une bien meilleure couverture par rapport aux autres algorithmes

Les reacutesultats montrent que notre modegravele AntRS a obtenu de meilleurs reacutesultats que lesautres algorithmes de comparaison Cependant un autre objectif de cette expeacuterimentation eacutetaitde comparer les deux versions de la deuxiegraveme phase de notre modegravele la fusion de seacutequences et lacolonie de fusion Ces deux tactiques permettant dobtenir une seacutequence de recommandation -nale multi-objectifs agrave partir de plusieurs seacutequences mono-objectif repreacutesentent deux philosophiesdieacuterentes de construction de seacutequences et il est inteacuteressant de pouvoir observer leurs dieacuterencesde performance Dapregraves les reacutesultats obtenus ces deux meacutethodes sont relativement proches lunede lautre avec lexception majeure de la preacutecision qui est plus eacuteleveacutee pour la fusion de seacutequences(0 344) que pour la colonie de fusion (0 288) On peut noter aussi une leacutegegravere dieacuterence au ni-veau de la diversiteacute relative (respectivement 0 069 contre 0 082) et de la nouveauteacute (0 741 contre0 702) Limportance de la preacutecision dans la litteacuterature et la dieacuterence entre les deux tactiquesconcernant cette meacutetrique nous permettent de dire que la fusion de seacutequence est la meilleure desdeux tactiques pour cette expeacuterimentation

Nous allons maintenant nous inteacuteresser agrave la troisiegraveme ligne du tableau de reacutesultats repreacute-sentant lexeacutecution de la 2egraveme partie de notre modegravele seule Pour rappel lhypothegravese de cettetroisiegraveme version de notre modegravele est de veacuterier si la premiegravere eacutetape de notre modegravele permet biendameacuteliorer la qualiteacute des reacutesultats en preacute-seacutelectionnant les ressources correspondant le mieux auxquater objectifs agrave maximiser On peut observer en eet avec les reacutesultats que lexeacutecution directede la colonie de fusion sans la premiegravere eacutetape du modegravele deacutegrade bien la qualiteacute des solutionsnales trouveacutees Nous observons une nette diminution de la preacutecision du rappel de la F-mesureainsi que de la diversiteacute de la nouveauteacute et de preacutefeacuterences Ces reacutesultats nous permettent doncde conrmer que la premiegravere eacutetape de notre modegravele ougrave les 4 colonies travaillent simultaneacutementagrave obtenir des seacutequences speacutecialiseacutees dans leur objectif ameacuteliore bien la qualiteacute nale des recom-mandations dune maniegravere signicative Autrement dit les deux tactiques de fusion que nousavons deacuteveloppeacutees (fusion de seacutequences et colonie de fusion) permettent de trouver un compro-mis entre tous les objectifs de maniegravere plus ecace quand elles se basent sur les reacutesultats de la

97

Chapitre 4 Expeacuterimentations et reacutesultats

premiegravere eacutetape de notre modegravele

Expeacuterimentation alternative techniques de validation croiseacutee et de creacuteation degraphe alternative

Dans lexpeacuterimentation preacuteceacutedente nous avons deacutecideacute de seacuteparer les 500 utilisateurs en 5blocs de 100 ougrave agrave tour de rocircle 400 utilisateurs eacutetaient utiliseacutes pour la construction du grapheet 100 utilisateurs correspondaient agrave la base de test Ainsi le modegravele avait pour tacircche de pro-duire des seacutequences de recommandations baseacutees sur les sessions deacutecoute de ces 100 utilisateursUne fois que le modegravele avait produit sa seacutequence recommandeacutee la session deacutecoute initiale surlaquelle eacutetait baseacutee la recommandation eacutetait deacutevoileacutee au modegravele et le graphe eacutetait reconstruitpour en tenir compte Le but de ce fonctionnement eacutetait de simuler un fonctionnement reacuteel dunservice deacutecoute de musique Cependant un certain nombre deacutetudes du domaine de la recom-mandation de la litteacuterature scientique utilisent une meacutethode dieacuterente lors de la seacuteparationdes informations des utilisateurs pour reacutealiser une validation croiseacutee agrave 5 blocs Cette meacutethodeconsiste agrave peupler les 5 blocs non plus agrave partir dutilisateurs mais agrave partir de sessions deacutecoutedans chaque utilisateur Autrement dit au lieu davoir une base dapprentissage contenant 80des utilisateurs et une base de test contenant les derniers 20 dutilisateurs la base dapprentis-sage consiste en 80 des sessions deacutecoute de chaque utilisateur et la base de test correspond aux20 des sessions restantes Le but du modegravele est ici de recommander pour chaque utilisateurdes seacutequences correspondant agrave la base de test Par rapport agrave la premiegravere meacutethode le graphepossegravede donc en permanence 80 des sessions de tous les utilisateurs Cependant le graphe necontient pas les connaissances provenant de prols complets dutilisateurs Ces deux meacutethodessont toutes les deux valides mais proposent deux approches dieacuterentes concernant lexploitationdes donneacutees des utilisateurs et il est inteacuteressant de les comparer

Par ailleurs et comme nous lavons expliqueacute dans le chapitre 3 deacutecrivant notre modegravele AntRSla construction du graphe exploite les transitions trouveacutees dans les sessions deacutecoute des utilisa-teurs pour creacuteer un reacuteseau de ndivideuds et darecirctes repreacutesentant lensemble des donneacutees de la basedapprentissage Aucune emphase nest porteacutee speacuteciquement sur lutilisateur actif pour lequelle systegraveme est en train de construire des recommandations Cependant nous avons proposeacute dansle chapitre 3 une autre meacutethode de construction du graphe portant une emphase particuliegravere surlutilisateur actif Agrave chaque nouvel utilisateur traiteacute nous calculons ses k plus proches voisinsparmi les 499 utilisateurs restants Pour faire cela nous avons calculeacute la similariteacute cosine agrave partirdes preacutefeacuterences existantes de ces utilisateurs Autrement dit pour chaque utilisateur actif nousavons compareacute ses 80 des sessions deacutecoute de la base dapprentissage avec les 80 des sessionsdeacutecoute des 499 autres utilisateurs Les k utilisateurs les plus similaires sont ensuite utiliseacutespour construire le graphe avec la mecircme technique deacutecrite dans le chapitre 3 Lavantage est icide reacuteduire la taille du graphe dacceacuteleacuterer la dureacutee dexeacutecution et de potentiellement augmenterla qualiteacute des recommandations nales notamment en terme de similariteacute puisque cest le critegraverede seacutelection ici Cette variante de construction du graphe agrave partir des n plus proches voisins nestpossible quavec la technique de validation croiseacutee deacutecrite dans le paragraphe preacuteceacutedent puisquilest neacutecessaire davoir accegraves aux sessions deacutecoute des utilisateurs actifs ce qui nest pas le casavec la premiegravere expeacuterimentation de cette section

Dans la suite de la section nous allons reacutealiser la mecircme expeacuterimentation que preacuteceacutedem-ment avec ces deux modications (le changement du processus de validation croiseacutee et le grapheconstruit agrave partir de n plus proches utilisateurs en termes de similariteacute) puis nous allons preacute-

98

43 Expeacuterimentations sur le modegravele AntRS

Table 44 Expeacuterimentation AntRS multi-objectifs avec les modications de validation croiseacuteeet de creacuteation de graphe

Preacutecision Rappel F-mesure Similariteacute SIL Diversiteacute DR Nouveauteacute Preacutefeacuterences Couverture

AntRS grapheclassique (fusionde seacutequences)

0379 0147 0205 0942 0902 0058 0073 0748 0631 7168

AntRS grapheclassique (coloniede fusion)

0339 0176 0215 0943 09 0057 0085 072 0718 7168

AntRS graphe kvoisins (fusion deseacutequences)

0369 0149 0203 0941 0901 0059 0075 0737 0633 7168

AntRS graphe kvoisins (colonie defusion)

0329 0167 0206 0944 0905 0056 0081 0707 068 7168

senter les reacutesultats obtenus

Le Tableau 44 preacutesente les reacutesultats de cette deuxiegraveme expeacuterimentation Nous avons testeacute4 versions de notre modegravele Pour chacune de ces 4 versions la nouvelle technique de validationcroiseacutee a eacuteteacute utiliseacutee Comme pour lexpeacuterimentation suivante nous avons eacutegalement testeacute lesdeux tactiques de fusion de notre modegravele Quant aux modications portant sur la creacuteation dugraphe nous avons exeacutecuteacute notre modegravele selon 2 modaliteacutes avec la mecircme construction de grapheque lexpeacuterimentation preacuteceacutedente (graphe classique) et avec la prise en compte des k voisinsles plus similaires (graphe k voisins) On remarque deacutejagrave que les reacutesultats sont dune maniegraveregeacuteneacuterale relativement similaires agrave la premiegravere expeacuterimentation Les valeurs de preacutecision obte-nues sont plus eacuteleveacutees que pour lexpeacuterimentation preacuteceacutedente suggeacuterant que le modegravele produitdes recommandations plus proches des sessions deacutecoute des utilisateurs Cette augmentation depreacutecision est la conseacutequence logique du fait que 80 des sessions deacutecoute initiales sont connuesdu modegravele Ces reacutesultats sont cependant agrave nuancer avec la couverture qui est signicativementplus basse dans cette version de notre modegravele (7168 par rapport agrave 9692)

La tactique de fusion de seacutequence obtient une nouvelle fois la meilleure preacutecision par rapportagrave la tactique de colonie de fusion Cependant nous nobservons pas de nette dieacuterence entreles deux meacutethodes de construction du graphe Cette expeacuterimentation ne nous permet donc pasde valider lhypothegravese selon laquelle un graphe moins grand et construit agrave partir dutilisateurssimilaires agrave lutilisateur actif pourrait ameacuteliorer les recommandations nales Cependant lautreobjectif de cette expeacuterimentation qui eacutetait de deacutemontrer que notre modegravele obtient eacutegalementdes reacutesultats satisfaisants avec une meacutethode plus classique de validation croiseacutee est valideacutee Latechnique classique de creacuteation du graphe sans connaicirctre par avance 80 des seacutequences deacutecoutesdes utilisateurs reste cependant plus proche dun fonctionnement en conditions reacuteelles de notremodegravele

434 Optimisation des meacutetavariables de AntRS

Inuence du nombre dagents et diteacuterations sur la preacutecision des recommandations

Comme tous les systegravemes multi-agents AntRS est deacutependant du nombre dagents utiliseacutes etdes iteacuterations eectueacutees Un nombre trop faible dagents ou diteacuterations peut empecirccher leacutemer-gence dun comportement intelligent en raison dun manque dinteraction entre les agents Dansle mecircme temps il est eacutegalement crucial de ne pas augmenter aveugleacutement ces paramegravetres car ils

99

Chapitre 4 Expeacuterimentations et reacutesultats

aectent lineacuteairement le temps dexeacutecution de lalgorithme Nous avons ainsi reacutealiseacute des expeacuteri-mentations sur notre modegravele AntRS an de deacuteterminer un bon compromis entre performance ettemps dexeacutecution Dans la gure 411 la preacutecision moyenne des recommandations obtenues estpreacutesenteacutee en fonction du nombre dagents et diteacuterations par increacutementation de 50 allant de 50 agrave300 On observe comme attendu une leacutegegravere augmentation de la preacutecision suivant laccroissementdes agents et des iteacuterations sans toutefois que celle-ci ne soit majeure On remarque visuellementque la preacutecision obtenue atteint rapidement un plateau agrave partir de 100 agents et iteacuterations Cetteobservation a eacuteteacute conrmeacutee par un test de signicativiteacute statistique avec le test de WilcoxonDans un contexte de fonctionnement en ligne ougrave les utilisateurs sattendent agrave des recommanda-tions quasi immeacutediates laugmentation importante du temps dexeacutecution lieacutee agrave un nombre eacuteleveacutedagents et diteacuterations pour un gain minime de preacutecision nest pas recommandable Ce sontaussi ces valeurs de 100 agents et iteacuterations qui ont eacuteteacute utiliseacutees dans les expeacuterimentations de cechapitre

Figure 411 Inuence du nombre dagents et diteacuterations sur la preacutecision moyenne obtenuepar notre modegravele

Principe de fonctionnement et application dun algorithme geacuteneacutetique

Les meacutetavariables des algorithmes multi-agents ont une place importante dans la qualiteacute desreacutesultats obtenus Pour rappel et en plus du nombre diteacuterations et dagents dont nous avonsdeacutejagrave discuteacute dans la section preacuteceacutedente on peut lister

τ0 isin [0 1] quantiteacute de pheacuteromones deacuteposeacutee sur les arecirctes agrave linitialisation du modegravele q0 isin [0 1] gegravere la part dexploration et dexploitation des agents α isin [0 1] importance des pheacuteromones dans la prise de deacutecision des agents

100

43 Expeacuterimentations sur le modegravele AntRS

β isin [0 1] importance de lheuristique dans la prise de deacutecision des agents ρ isin [0 1] taux deacutevaporation des pheacuteromones

Les valeurs de ces 5 meacutetavariables ont eacuteteacute xeacutees agrave laide des expeacuterimentations preacuteliminairespreacutesenteacutees au deacutebut de ce chapitre dans la Section 422 Les valeurs de ces meacutetavariables ontpermis dobtenir des reacutesultats convaincants agrave la fois sur le modegravele ACS classique de Dorigo et surnotre modegravele ACS Cependant et an de maximiser le potentiel de notre modegravele AntRS nousavons voulu tester une optimisation automatique de ces meacutetavariables agrave laide dun algorithmegeacuteneacutetique Ces derniers font partie de la famille des algorithmes eacutevolutionnaires sinspirant de latheacuteorie de leacutevolution Le principe de ces algorithmes est de creacuteer des individus posseacutedant desgegravenes cest-agrave-dire des valeurs agrave des caracteacuteristiques preacute-deacutetermineacutees puis de tester ces individussur le problegraveme agrave optimiser Agrave la n dune iteacuteration les meilleurs individus transmettent unepartie de leurs gegravenes agrave leurs descendants Ainsi de geacuteneacuteration en geacuteneacuteration les gegravenes seacutelection-neacutes provenant des meilleurs individus permettent daugmenter la qualiteacute des reacutesultats Appliqueacuteagrave notre modegravele un gegravene correspond agrave des valeurs pour les 5 meacutetavariables agrave optimiser Cesvaleurs sont ensuite appliqueacutees agrave notre modegravele et testeacutees durant une exeacutecution complegravete dansles mecircmes conditions que les autres expeacuterimentations de ce chapitre Les reacutesultats sont ensuiteeacutevalueacutes selon les 4 meacutetriques correspondant agrave nos objectifs similariteacute diversiteacute nouveauteacute etpreacutefeacuterences Lutilisation dun algorithme geacuteneacutetique sur notre modegravele a cependant poseacute un pro-blegraveme majeur de temps dexeacutecution En eet chaque individu de chaque geacuteneacuteration a ducirc ecirctretesteacute sur une exeacutecution complegravete de notre modegravele Pour rappel une exeacutecution de notre modegravelecorrespond agrave 100 iteacuterations ougrave dans chacune dentre elles 100 agents se deacuteplacent pour trouverune seacutequence sur un graphe de plusieurs dizaines de milliers de ndivideuds et de plusieurs centainesde milliers darecirctes en moyenne Mecircme si la complexiteacute algorithmique est faible ducirce agrave la naturemecircme des modegraveles multi-agents la quantiteacute dopeacuterations agrave reacutesoudre est conseacutequente En plus delutilisation de serveurs de calculs deacutedieacutes une optimisation importante du code de AntRS a eacuteteacuteneacutecessaire pour pouvoir eectuer loptimisation des meacutetavariables avec un algorithme geacuteneacutetiquedans des temps raisonnables

Choix de lalgorithme geacuteneacutetique doptimisation

De nombreuses familles dalgorithmes geacuteneacutetiques ont eacuteteacute deacuteveloppeacutees depuis leur creacuteation agravelinstar des problegravemes algorithmiques complexes neacutecessitant des techniques doptimisation et dereacutesolution avanceacutees Il est donc neacutecessaire de correctement deacutenir le problegraveme agrave optimiser an dechoisir lalgorithme geacuteneacutetique le plus adapteacute agrave la tacircche AntRS est un modegravele multi-objectifs etles paramegravetres agrave optimiser sont les 4 objectifs de similariteacute diversiteacute nouveauteacute et preacutefeacuterencesIl est ainsi neacutecessaire dutiliser une technique parmi la famille des algorithmes eacutevolutionnairesmulti-objectifs (MOEA 51) Nous avons choisi lalgorithme NSGA-II 52 pour sa rapiditeacute et sonecaciteacute pour trouver de meilleurs solutions non-domineacutees agrave des problegravemes multi-objectifs clas-siques de la litteacuterature par rapport agrave dautres MOEA [Deb et al 2002]

Pour les mecircmes raisons que pour limpleacutementation des algorithmes de comparaison utiliseacutesdans cette section nous avons utiliseacute une librairie Java nommeacutee jMetal 53 [Durillo and Nebro2011] Cette librairie est speacutecialiseacutee dans limpleacutementation et la mise agrave disposition dune vingtaine

51 MOEA Multi-objective evolutionary algorithms

52 NSGA-II Non-dominated Sorting Genetic Algorithm 2

53 jMetal Metaheuristic Algorithms in Java

101

Chapitre 4 Expeacuterimentations et reacutesultats

Table 45 Expeacuterimentations preacutesentant AntRS avec les meacutetavariables empiriques et avec lesmeacutetavariables optimiseacutees via NSGA-II)

Preacutecision Rappel F-mesure Similariteacute SIL Diversiteacute DR Nouveauteacute Preacutefeacuterences Couverture

AntRS meacutetava-riables empiriques(fusion de seacute-quences)

0344 0131 01838 0947 0908 0053 0069 0741 061 9692

AntRS meacutetava-riables empiriques(colonie de fusion)

0288 0151 01836 0945 0905 0055 0082 0702 0612 9692

AntRS meacutetava-riables NSGA-II(fusion de seacute-quences)

0382 0153 0221 0953 091 0047 007 0762 0744 9692

AntRS meacutetava-riables NSGA-II(colonie de fusion)

0312 0174 0226 0946 0906 0054 0082 0703 0802 9692

Code de signicativiteacute statistique 0 0001 001 005 01 1

de MOEA permettant de les adapter agrave tous types de problegravemes multi-objectifs

Reacutesultats

La version du modegravele AntRS utiliseacutee est la mecircme que preacutesenteacutee dans le Chapitre 3 et danslexpeacuterimentation 433 Lalgorithme doptimisation NSGA-II a quant agrave lui eacuteteacute lanceacute sur unserveur de calculs deacutedieacute de leacutequipe KIWI et arrecircteacute agrave partir du moment ougrave 10 geacuteneacuterations de suitenameacutelioraient plus les reacutesultats obtenus Les valeurs obtenues pour les 5 meacutetavariables ont ensuiteeacuteteacute utiliseacutees dans une exeacutecution complegravete de AntRS an de mesurer limpact de loptimisationLalgorithme de comparaison PEH [Ribeiro et al 2014] inclut deacutejagrave dans son fonctionnement unMOEA nommeacute SPEA2 54 [Zitzler et al 2001] dont lobjectif est le mecircme que NSGA-II optimiserles recommandations en termes de similariteacute diversiteacute et nouveauteacute Nous ninclurons donc pasPEH dans les reacutesultats de cette derniegravere expeacuterimentation Outre les meacutetavariables lexeacutecution denotre modegravele sest deacuterouleacutee sous les mecircmes conditions que pour les expeacuterimentations preacuteceacutedentes

Le Tableau 45 preacutesente les reacutesultats obtenus Les deux premiegraveres lignes du tableau sont re-prises de lexpeacuterimentation principale AntRS multi-objectifs Section 433 pour plus de clarteacutePour rappel cette expeacuterimentation avait utiliseacute les meacutetavariables empiriques Les deux derniegravereslignes du tableau correspondent agrave AntRS avec les meacutetavariables optimiseacutees via le NSGA-II Lasignicativiteacute statistique de la dieacuterence des reacutesultats obtenus a eacuteteacute mesureacutee entre chaque paireayant la mecircme tactique de fusion (ie AntRS meacutetavariables empiriques (fusion de seacutequences)vs AntRS meacutetavariables NSGA-II (fusion de seacutequences) et AntRS meacutetavariables empiriques(colonie de fusion) vs AntRS meacutetavariables NSGA-II (colonie de fusion)) Les valeurs en grasindiquent les dieacuterences les plus notables entre les mecircmes versions de AntRS sans et avec opti-misation

Ces reacutesultats mettent principalement en exergue un net gain en preacutecision et rappel obtenuavec loptimisation des meacutetavariables Les valeurs obtenues pour ces meacutetriques sont similaires agravelexpeacuterimentation 44 ougrave le modegravele avait connaissance de 80 des seacutequences deacutecoutes des utili-sateurs On note eacutegalement des ameacuteliorations pour les meacutetriques de nouveauteacute et de preacutefeacuterencesmontrant que les seacutequences recommandeacutees eacutetaient agrave la fois plus proches des preacutefeacuterences de luti-

54 SPEA2 Strenght Pareto Evolutionary Algorithm 2

102

44 Conclusion

lisateur tout en introduisant parfois des musiques quil ne connaissait pas

Cependant il est important de nuancer ces reacutesultats Les gains obtenus mecircme sils sontstatistiquement signicatifs restent relativement peu eacuteleveacutes par rapport au temps neacutecessaire de-mandeacute par lalgorithme doptimisation De plus certaines meacutetriques comme la similariteacute ou ladiversiteacute nont que peu eacuteteacute aecteacutees par loptimisation En conclusion cette expeacuterimentation nousa montreacute quil eacutetait possible doptimiser les meacutetavariables de notre modegravele an dameacuteliorer cer-tains aspects des seacutequences recommandeacutees comme la preacutecision la nouveauteacute ou les preacutefeacuterencesToutefois le temps dexeacutecution dun tel processus doptimisation peut ecirctre prohibitif dans uncontexte dutilisation en ligne et en temps reacuteel

44 Conclusion

Dans ce Chapitre nous avons mis en pratique le modegravele multi-agents et multi-objectifs An-tRS Nous avons utiliseacute une base de donneacutees musicale provenant du site Deezer repreacutesentantun mois complet deacutecoutes en ligne Nous avons ensuite reacutealiseacute plusieurs expeacuterimentations por-tant chacune sur un aspect theacuteorique de AntRS La premiegravere expeacuterimentation preacutesenteacutee dans laSection 432 nous a permis de veacuterier que les colonies de notre modegravele permettent bien dobte-nir des recommandations de seacutequences speacutecialiseacutees dans les facteurs humains identieacutes dans leschapitres preacuteceacutedents Dans le cadre de ce travail nous avons testeacute de maniegravere isoleacutee 4 coloniescorrespondant agrave 4 facteurs humains speacuteciques la similariteacute la diversiteacute la nouveauteacute et lespreacutefeacuterences Les reacutesultats obtenus ont permis de prouver quil eacutetait possible de lier des facteurshumains agrave la recherche de chemins dans un graphe par des agents teacuteleacuteonomiques

La deuxiegraveme expeacuterimentation preacutesenteacutee dans la Section 433 sest appuyeacutee sur ces conclu-sions pour tester le modegravele AntRS dans son entiegravereteacute Le but de cette expeacuterimentation eacutetaittriple

1 Prouver que notre modegravele est capable de produire une seacutequence unique posseacutedant desaspects de chacun des 4 facteurs humains en utilisant les reacutesultats des colonies speacutecialiseacutees

2 Tester les performances des deux tactiques de notre modegravele (fusion de seacutequences et coloniede fusion) permettant de fusionner les seacutequences des colonies speacutecialiseacutees

3 Comparer les performances de AntRS avec dautres systegravemes de recommandations mono-objectif et multi-objectifs de la litteacuterature du domaine

Avec cette expeacuterimentation nous avons montreacute que AntRS eacutetait bien capable de syntheacutetiserdans une mecircme seacutequence les dieacuterents aspects humains consideacutereacutes De plus les seacutequences derecommandations produites par AntRS ont obtenu de meilleurs reacutesultats par rapport aux algo-rithmes de comparaison de leacutetat de lart La premiegravere tactique de fusion de seacutequences sest reacuteveacuteleacuteeecirctre plus ecace que la colonie de fusion pour obtenir un compromis entre les dieacuterents objectifs

Lexpeacuterimentation suivante preacutesenteacutee dans la Section 433 avait pour but de tester des va-riantes dans le fonctionnement de AntRS Au cours de cette thegravese nous avons reacutealiseacute et testeacutede multiples modications et variantes de notre modegravele de maniegravere empirique tant le fonction-nement du modegravele initial ACS de Dorigo est modulable Pour mettre en exergue un exemplede cette modulariteacute nous avons testeacute les performances de notre modegravele en modiant la basedapprentissage et la maniegravere dont le graphe eacutetait creacuteeacute Les reacutesultats obtenus ont mis en eacutevidence

103

Chapitre 4 Expeacuterimentations et reacutesultats

le potentiel deacutevolution et dadaptabiliteacute de AntRS agrave des travaux futurs

Enn nous nous sommes inteacuteresseacutes dans la Section 434 agrave loptimisation automatique desmeacutetavariables de notre modegravele Comme nous lavons illustreacute au deacutebut de ce chapitre avec les ex-peacuterimentations preacuteliminaires sur le modegravele ACS les meacutetavariables jouent un rocircle essentiel dans laqualiteacute des reacutesultats Ces derniegraveres gouvernent le comportement des agents comme par exempleleurs tendances agrave explorer lenvironnement ou au contraire agrave exploiter des chemins deacutejagrave connusAn de maximiser le potentiel de notre modegravele dans ce cadre applicatif nous avons utiliseacute lal-gorithme geacuteneacutetique doptimisation de problegravemes multi-objectifs NSGA-II sur 5 meacutetavariables deAntRS Le reacutesultat de cette optimisation a permis dameacuteliorer de maniegravere statistiquement signi-cative les performances de notre modegravele en termes de preacutecision rappel nouveauteacute et preacutefeacuterencesCependant la longueur du processus doptimisation limite pour le moment son application dansle contexte dune utilisation en temps reacuteel du modegravele

Le choix de la base de donneacutees musicale provenant de Deezer a permis de reacutealiser de nom-breuses expeacuterimentations et de tester dieacuterentes facettes de notre modegravele Cependant nousavons aussi rencontreacute beaucoup de problegravemes quant agrave la notion de progressiviteacute avec cette basede donneacutees et les reacutesultats obtenus nont pas eacuteteacute concluants concernant cette meacutetrique Nousdiscuterons de ce point et dautres perspectives dameacuteliorations dans la conclusion geacuteneacuterale decette thegravese

104

Chapitre 5

Conclusion et perspectives

51 Conclusion

Le domaine de la recommandation est en plein essor depuis maintenant une vingtaine dan-neacutees Durant cette peacuteriode la recommandation na cesseacute deacutevoluer an de sadapter agrave lexplosiondu nombre dutilisateurs et de la quantiteacute de donneacutees disponibles Nous pouvons distinguer troisaspects des recommandations modernes qui ont servi de l directeur dans cette thegravese Premiegrave-rement il y a encore 10 ans seulement la majoriteacute de la recherche avait pour but de maximiserla meacutetrique de preacutecision des reacutesultats des algorithmes il est aujourdhui admis quune bonnerecommandation neacutecessite aussi de satisfaire dautres meacutetriques comme la diversiteacute ou la nou-veauteacute Mecircme si la preacutecision reste centrale il est important de consideacuterer ces autres meacutetriquescar elles permettent de reacutepondre agrave une plus grande diversiteacute de situation chez les utilisateurs de-mandant des recommandations Deuxiegravemement la quantiteacute de donneacutees disponibles sur Interneta exploseacute tandis que lutilisation des systegravemes de recommandation sest tregraves largement deacutemocra-tiseacutee La diversiteacute des domaines applicatifs utilisant des systegravemes de recommandations est telleque lhyper-speacutecialisation dun systegraveme pour un seule domaine fait moins de sens quauparavantLes systegravemes de recommandations capables de sadapter rapidement agrave de multiples domainesapplicatifs sont donc aujourdhui particuliegraverement inteacuteressants Troisiegravemement la croissance etla complexication des donneacutees deacutecrivant les ressources et les utilisateurs permettent de propo-ser agrave ces derniers des recommandations plus complexes quauparavant Comme nous lavons ditdautres aspects que la preacutecision sont deacutejagrave exploiteacutes mais il est aussi possible de complexier lesrecommandations en les proposant par seacutequences et non plus par ressource unique En eet lanorme eacutetait avant de ne proposer agrave lutilisateur quune seule recommandation ou au mieux uneliste de recommandations au mecircme niveau les unes que les autres Or de nombreux domainescomme le-eacuteducation la musique ou encore le tourisme peuvent beacuteneacutecier de systegravemes capablesde recommander une seacutequence de ressources dans un ordre preacutecis Lutilisateur dun tel systegravemedispose donc dune seacutequence de ressources permettant datteindre potentiellement des objectifsqui ne seraient pas atteignables avec des recommandations simples ou en liste Ces trois pointseacutevoqueacutes ci-dessus constituent le cdivideur du travail de cette thegravese et nous allons maintenant rappelerles apports de notre travail sur ces trois points

1 Modegravele multi-objectifs En se basant sur larchitecture des colonies de fourmis notremodegravele AntRS permet dinteacutegrer autant de meacutetriques que voulues dans le processus degeacuteneacuteration de recommandations Dans ce travail nous en avons consideacutereacute 4 la similariteacutela diversiteacute la nouveauteacute et les preacutefeacuterences passeacutees Ces 4 meacutetriques sont inteacutegreacutees en

105

Chapitre 5 Conclusion et perspectives

tant que colonies dans notre modegravele et participent toutes agrave la construction de la seacutequencede recommandations Leur importance dans le processus de recommandation peut ecirctremoduleacutee an de mieux correspondre agrave chaque prol dutilisateur

2 Geacuteneacutericiteacute inter-domaine Dans le point preacuteceacutedent nous avons discuteacute de linteacutegrationde dieacuterentes meacutetriques dans les recommandations Comme nous lavons preacutesenteacute dansleacutetat de lart un certain nombre de modegraveles prennent deacutesormais en compte dieacuterentesmeacutetriques Cependant un des points forts de notre modegravele est la modulariteacute avec laquellenous pouvons lexeacutecuter Il est en eet possible denlever ou de rajouter des colonies agrave lademande Autrement dit nous sommes capable de changer agrave la voleacutee les facteurs humainsagrave consideacuterer pour construire les recommandations nales Outre ce point il est relati-vement simple de passer dun domaine applicatif agrave un autre Nous avons construit notremodegravele de sorte quil soit le plus geacuteneacuterique possible eacutetant donneacute que lors de sa conceptionnous navions pas encore deacutecideacute quelle base de donneacutees utiliser Ainsi la seule modica-tion neacutecessaire lors dun changement de domaine est dadapter le calcul de la distance dentre chaque ressource lors de la construction du graphe Apregraves cette modication le restede lalgorithme est le mecircme

3 Seacutequences de recommandation Eacutetant donneacute que notre modegravele AntRS se base sur lemodegravele des colonies de fourmis de Marco Dorigo les reacutesultats que nous obtenons se preacute-sentent sous le mecircme format que pour ce dernier Initialement dans les modegraveles proposeacutespar Dorigo les fourmis ont comme but de chercher un chemin parmi plusieurs possiblesdans un environnement repreacutesenteacute par un graphe et en empruntant des points de passagerepreacutesenteacutes par les ndivideuds du graphe Le reacutesultat obtenu est donc une suite de noeudavec un point de deacutepart un objectif de n et une seacuterie de points de passage dans unordre preacutecis entre les deux autrement dit une seacutequence Nous avons souhaiteacute garder ceprincipe de production naturelle de seacutequences et de ladapter agrave la recommandation Ainsien construisant avec attention le graphe an quil repreacutesente de la maniegravere la plus degravelepossible les liens preacutesents entre les ressources du domaine applicatif et en adaptant lecalcul de la distance d seacuteparant deux ndivideuds notre modegravele AntRS est capable de produiredes seacutequences avec des ressources varieacutees

Les deux premiers apports eacutenumeacutereacutes ci-dessus permettent de sadapter non seulement agrave denombreux prols utilisateurs gracircce aux dieacuterentes meacutetriques mais aussi agrave dieacuterents domainesapplicatifs gracircce agrave la simpliciteacute des changements agrave faire pour passer dun domaine agrave un autreLe troisiegraveme apport eacutenumeacutereacute permet quant agrave lui de proposer non plus des ressources uniques oudes listes de recommandations agrave lutilisateur nal mais bien des seacutequences posseacutedant un senscar baseacutees sur les habitudes de consommation des ressources des utilisateurs passeacutes

52 Perspectives

Dans ce travail nous avons reacutepondu aux probleacutematiques que nous avons deacutenies au deacutebutdu manuscrit mais nous pouvons cependant distinguer des pistes dameacuteliorations futures

Premiegraverement les seacutequences peuvent beacuteneacutecier dameacuteliorations notamment au niveau dela notion de progressiviteacute Pour le moment dans notre modegravele les seacutequences sont creacuteeacutees via

106

52 Perspectives

les agents fourmis parcourant le graphe agrave partir dun point de deacutepart jusquagrave un objectif Laprogressiviteacute des seacutequences est garantie par deux processus

1 La topologie du graphe qui prend en compte les seacutequences creacuteeacutees naturellement par lesutilisateurs lors de preacuteceacutedentes visites

2 La formule du calcul du meilleur chemin une fois les agents ayant termineacute de se deacuteplacersur le graphe

Nous avons exploreacute dautres pistes pour orir des seacutequences plus progressives aux utilisateursPar exemple en incluant une colonie deacutedieacutee uniquement agrave la progressiviteacute ou encore en modiantles calculs de distance totale de chemin Les tests que nous avons reacutealiseacutes nont cependant pasabouti agrave des reacutesultats concluants Nous attribuons ces reacutesultats au fait que le domaine de la mu-sique nest pas optimal pour utiliser ce genre de technique Quand bien mecircme il est courant pourles utilisateurs deacutecouter des musiques sous formes de playlists de reacutecentes eacutetudes ont montreacute quelordre dans lequel les musiques sont proposeacutees nest pas une caracteacuteristique prioritaire dans lasatisfaction de lutilisateur On peut par exemple citer les eacutetudes suivantes [Vall et al 2018 Vallet al 2019] ougrave les auteurs ont chercheacute agrave mesurer limportance de lordre dans lequel eacutetaient preacute-senteacutees les musiques dune playlist Les auteurs nobtiennent pas de dieacuterences de reacutesultats entreplusieurs expeacuterimentations ougrave lordre des musiques eacutetait maintenu ou lorsquil eacutetait rompu Lesauteurs concluent que lordre des musiques nest pas une variable cruciale pour la geacuteneacuteration au-tomatique de playlists Dautres domaines sont ainsi potentiellement plus agrave mecircme decirctre le sujetdeacutetudes plus approfondies sur la progressiviteacute comme par exemple les recommandations de par-cours dans des museacutees ou les recommandations de seacuteries de cours et dexercices dans le-eacuteducation

Une autre perspective dameacutelioration deacutecoulant du paragraphe preacuteceacutedent est lapplication denotre modegravele agrave un ou plusieurs autres domaines applicatifs Nous avons deacutejagrave mentionneacute dans cemanuscrit que nous avions consideacutereacute les domaines museacuteal et de le-eacuteducation en plus du domainemusical Ces deux autres domaines proposent chacun des deacutes uniques et pourraient proter deseacutequences de recommandations reacutepondant aux besoins speacuteciques de leurs utilisateurs Il a mal-heureusement eacutetait trop complexe de reacutecupeacuterer ou de creacuteer une base de donneacutees exploitable surces deux domaines durant cette thegravese Une expeacuterimentation est toutefois meneacutee actuellement enpartenariat avec le Museacutee des Beaux Arts de Nancy an de construire une base de donneacutees deschemins emprunteacutes par les visiteurs du museacutee ce qui permettra alors dappliquer notre modegravelean de proposer des parcours personnaliseacutes dans le museacutee

Une derniegravere perspective dameacutelioration reacuteside dans leacutevaluation des seacutequences geacuteneacutereacutees parnotre modegravele Notre but eacutetait de consideacuterer plusieurs facteurs humains pour geacuteneacuterer et eacutevaluernos recommandations tout en uniant leacutevaluation avec une seule meacutetrique de satisfaction Sinous avons reacuteussi agrave inteacutegrer plusieurs facteurs dans notre modegravele nous avons cependant rencon-treacute des problegravemes quant agrave lunication des eacutevaluations Lobjectif eacutetait de proposer une mesurede progressiviteacute permettant de mesurer la qualiteacute de la seacutequence recommandeacutee mais comme nouslavons expliqueacute nous navons pas obtenu de reacutesultats concluants au regard de la progressiviteacutedans notre base de donneacutees Ainsi la mesure de progressiviteacute optimale on proposeacutee et deacutetailleacuteedans la Section 345 na pas pu ecirctre testeacutee dans de bonnes conditions Mecircme si les expeacuterimenta-tions meneacutees dans ce travail nont pas pu exploiter cette mesure de progressiviteacute optimale nouspensons quelle pourrait agrave termes donner une indication geacuteneacuterale de la qualiteacute dune seacutequence deressources dans dautres domaines comme le-eacuteducation ou le tourisme

107

Chapitre 5 Conclusion et perspectives

Dun point de vue plus geacuteneacuteral sur le fonctionnement de notre modegravele AntRS certaines ameacute-liorations sont possibles si lon considegravere le fonctionnement du systegraveme dans des conditions reacuteelleset non plus pour une expeacuterimentation hors-ligne comme nous lavons fait dans ce travail Dans lecadre dune utilisation en conditions reacuteelles quelques modications du fonctionnement de notrealgorithme pourraient ameacuteliorer la satisfaction de lutilisateur Prenons lexemple dun utilisateurse connectant sur un site de diusion de musique et commenccedilant la lecture dune musique enparticulier Notre systegraveme sera capable agrave partir de ce point de deacutepart et des preacutefeacuterences passeacuteesde lutilisateur de creacuteer une seacutequence de musiques Cependant si lutilisateur ne clique pas surla recommandation de playlist ou eacutecoute une deuxiegraveme chanson complegravetement dieacuterente desrecommandations du systegraveme il serait inteacuteressant de pouvoir consideacuterer et inteacutegrer ces informa-tions dans le modegravele an que ce dernier puisse sadapter et satisfaire au mieux lutilisateur Deplus on voit bien linteacuterecirct de ces adaptations en temps reacuteel dans les domaines museacuteal (re-calculdun nouvel itineacuteraire de visite si lutilisateur ne suit pas la recommandation agrave linstar dunGPS par exemple) et de le-eacuteducation (adapter le contenu peacutedagogique en fonction du chemin delapprenant ou de ses reacutesultats) Une derniegravere remarque geacuteneacuterale concernant notre modegravele peutecirctre faite sur le temps dexeacutecution Malgreacute les optimisations reacutealiseacutees dans la derniegravere sectiondu chapitre preacuteceacutedent le temps dexeacutecution eacutetait relativement eacuteleveacute lors des expeacuterimentationsCependant les expeacuterimentations concernaient 100 utilisateurs agrave la fois et eacutetaient lanceacutees majo-ritairement sur un ordinateur portable Ainsi la recommandation en temps reacuteel dune seacutequencede ressources agrave un seul utilisateur peut ecirctre faite en temps reacuteel en utilisant un serveur deacutedieacute

Le domaine de la recommandation seacutelargit et se complexie chaque anneacutee agrave linstar du mondedans lequel nous vivons Devant la myriade de contenus accessibles sur Internet les utilisateurspeuvent plus que jamais beacuteneacutecier de recommandations intelligentes personnaliseacutees pertinenteset reacutepondant agrave leurs besoins Dans le futur les systegravemes dassistance aux utilisateurs devrontecirctre agrave la fois geacuteneacuteriques adaptables agrave tout types de contextes et toujours plus ecaces Cestdans cette direction que sinscrit le travail de cette thegravese et le modegravele AntRS

108

Bibliographie

[Adomavicius and Tuzhilin 2005] Adomavicius G and Tuzhilin A (2005) Toward the nextgeneration of recommender systems A survey of the state-of-the-art and possible extensionsIEEE Transactions on Knowledge amp Data Engineering (6) 734749

[Adomavicius and Tuzhilin 2011] Adomavicius G and Tuzhilin A (2011) Context-aware re-commender systems In Recommender systems handbook pages 217253 Springer

[Aggarwal et al 2016] Aggarwal C C et al (2016) Recommender systems Springer

[Agrawal et al 1995] Agrawal R Srikant R et al (1995) Mining sequential patterns Inicde volume 95 pages 314

[Alaya et al 2007] Alaya I Solnon C and Ghedira K (2007) Ant colony optimization formulti-objective optimization problems In Tools with Articial Intelligence 2007 ICTAI 200719th IEEE International Conference on volume 1 pages 450457 IEEE

[Angus 2007] Angus D (2007) Crowding population-based ant colony optimisation for themulti-objective travelling salesman problem In 2007 IEEE Symposium on ComputationalIntelligence in Multi-Criteria Decision-Making pages 333340 IEEE

[Angus and Woodward 2009] Angus D and Woodward C (2009) Multiple objective ant co-lony optimisation Swarm intelligence 3(1) 6985

[Antenucci et al 2018] Antenucci S Boglio S Chioso E Dervishaj E Kang S ScarlattiT and Dacrema M F (2018) Artist-driven layering and users behaviour impact on re-commendations in a playlist continuation scenario In Proceedings of the ACM RecommenderSystems Challenge 2018 page 4 ACM

[Aucouturier and Pachet 2002] Aucouturier J-J and Pachet F (2002) Scaling up music play-list generation In Proceedings IEEE International Conference on Multimedia and Expo vo-lume 1 pages 105108 IEEE

[Ausubel 1963] Ausubel D P (1963) The psychology of meaningful verbal learning

[Baeza-Yates et al 1999] Baeza-Yates R Ribeiro-Neto B et al (1999) Modern informationretrieval volume 463 ACM press New York

[Belkin and Croft 1992] Belkin N J and Croft W B (1992) Information ltering and infor-mation retrieval two sides of the same coin In Communications of the ACM Citeseer

[Bell and McMullen 2004] Bell J E and McMullen P R (2004) Ant colony optimizationtechniques for the vehicle routing problem Advanced engineering informatics 18(1) 4148

[Benbasat and Wang 2005] Benbasat I and Wang W (2005) Trust in and adoption of onlinerecommendation agents Journal of the association for information systems 6(3) 4

[Bennett et al 2007] Bennett J Lanning S et al (2007) The netix prize In Proceedingsof KDD cup and workshop volume 2007 page 35 New York

109

Bibliographie

[Bonabeau et al 1999] Bonabeau E Marco D d R D F Dorigo M Theacuteraulaz G The-raulaz G et al (1999) Swarm intelligence from natural to articial systems Number 1Oxford university press

[Borragraves et al 2014] Borragraves J Moreno A and Valls A (2014) Intelligent tourism recommen-der systems A survey Expert Systems with Applications 41(16) 73707389

[Boyer et al 2015] Boyer A Casanova G Roussanaly A and Ducreau F (2015) Periclesor how to assess and to improve quality in higher education

[Breese et al 2013] Breese J S Heckerman D and Kadie C (2013) Empirical analysis ofpredictive algorithms for collaborative ltering arXiv preprint arXiv 13017363

[Brooks 1991] Brooks R A (1991) Intelligence without reason

[Castagnos 2008] Castagnos S (2008) Modeacutelisation de comportements et apprentissage sto-chastique non superviseacute de strateacutegies dinteractions sociales au sein de systegravemes temps reacuteel derecherche et daccegraves agrave linformation PhD thesis Universiteacute Nancy II

[Castagnos and Boyer 2006] Castagnos S and Boyer A (2006) A clientserver user-basedcollaborative ltering algorithm Model and implementation In 17th European Conferenceon Articial Intelligence (ECAI 2006) pages 617621

[Castagnos et al 2013] Castagnos S Brun A and Boyer A (2013) Utiliteacute et perception dela diversiteacute dans les systegravemes de recommandation

[Castagnos et al 2010] Castagnos S Jones N and Pu P (2010) Eye-tracking product re-commenders usage In Proceedings of the fourth ACM conference on Recommender systemspages 2936 ACM

[Castagnos et al 2019] Castagnos S Marchal F Bertrand A Colle M and Mahmoudi D(2019) Inferring art preferences from gaze exploration in a museum In Adjunct Publicationof the 27th Conference on User Modeling Adaptation and Personalization pages 425430

[Castells et al 2015] Castells P Hurley N J and Vargas S (2015) Novelty and diversity inrecommender systems In Recommender Systems Handbook pages 881918 Springer

[Chen and Li 2019] Chen H and Li J (2019) Adversarial tensor factorization for context-aware recommendation In Proceedings of the 13th ACM Conference on Recommender Systemspages 363367

[Cheverst et al 2000] Cheverst K Davies N Mitchell K Friday A and Efstratiou C(2000) Developing a context-aware electronic tourist guide some issues and experiencesIn Proceedings of the SIGCHI conference on Human Factors in Computing Systems pages1724 ACM

[Chou et al 2005] Chou S-C Hsieh W-T Gandon F L and Sadeh N M (2005) Semanticweb technologies for context-aware museum tour guide applications In Advanced InformationNetworking and Applications 2005 AINA 2005 19th International Conference on volume 2pages 709714 IEEE

[Davis 1989] Davis F D (1989) Perceived usefulness perceived ease of use and user acceptanceof information technology MIS quarterly pages 319340

[Deb et al 2002] Deb K Pratap A Agarwal S and Meyarivan T (2002) A fast and elitistmultiobjective genetic algorithm Nsga-ii IEEE transactions on evolutionary computation6(2) 182197

[Deneubourg et al 1990] Deneubourg J-L Aron S Goss S and Pasteels J M (1990) Theself-organizing exploratory pattern of the argentine ant Journal of insect behavior 3(2) 159168

110

[Doerner et al 2004] Doerner K Gutjahr W J Hartl R F Strauss C and Stummer C(2004) Pareto ant colony optimization A metaheuristic approach to multiobjective portfolioselection Annals of operations research 131(1) 7999

[Dorigo 2001] Dorigo M (2001) Ant algorithms solve dicult optimization problems InEuropean Conference on Articial Life pages 1122 Springer

[Dorigo and Birattari 2010] Dorigo M and Birattari M (2010) Ant colony optimizationSpringer

[Dorigo and Birattari 2011] Dorigo M and Birattari M (2011) Ant colony optimization InEncyclopedia of machine learning pages 3639 Springer

[Dorigo et al 2006] Dorigo M Birattari M and Stutzle T (2006) Ant colony optimizationIEEE computational intelligence magazine 1(4) 2839

[Dorigo and Gambardella 1997] Dorigo M and Gambardella L M (1997) Ant colonies forthe travelling salesman problem biosystems 43(2) 7381

[Dorigo et al 1996] Dorigo M Maniezzo V Colorni A et al (1996) Ant system optimiza-tion by a colony of cooperating agents IEEE Transactions on Systems man and cyberneticsPart B Cybernetics 26(1) 2941

[Dorigo and Stuumltzle 2019] Dorigo M and Stuumltzle T (2019) Ant colony optimization overviewand recent advances In Handbook of metaheuristics pages 311351 Springer

[Drachsler et al 2015] Drachsler H Verbert K Santos O C and Manouselis N (2015)Panorama of recommender systems to support learning In Recommender systems handbookpages 421451 Springer

[Durillo and Nebro 2011] Durillo J J and Nebro A J (2011) jmetal A java framework formulti-objective optimization Advances in Engineering Software 42(10) 760771

[Ekstrand et al 2014] Ekstrand M D Harper F M Willemsen M C and Konstan J A(2014) User perception of dierences in recommender algorithms In Proceedings of the 8thACM Conference on Recommender systems pages 161168 ACM

[Ferber 1995] Ferber J (1995) Les systegravemes multi-agents Vers une intelligence collectiveintereditions 1995 Connaissances et compeacutetences requises Cette thegravese s adresse agrave des eacutetu-diants ayant un prol Intelligence ArticielleBase de Donneacutees et elle neacutecessite davoir descompeacutetences theacuteoriques dans les domaines 1

[Ferber and Weiss 1999] Ferber J and Weiss G (1999) Multi-agent systems an introductionto distributed articial intelligence volume 1 Addison-Wesley Reading

[Frolov and Oseledets 2017] Frolov E and Oseledets I (2017) Tensor methods and recom-mender systems Wiley Interdisciplinary Reviews Data Mining and Knowledge Discovery7(3) e1201

[Gambardella et al 1999] Gambardella L M Taillard Eacute and Agazzi G (1999) Macs-vrptw A multiple ant colony system for vehicle routing problems with time windows

[Gan et al 2020] Gan L Nurbakova D Laporte L and Calabretto S (2020) Enhancingrecommendation diversity using determinantal point processes on knowledge graphs In Pro-ceedings of the 43rd International ACM SIGIR Conference on Research and Development inInformation Retrieval pages 20012004

[Gavalas et al 2014] Gavalas D Konstantopoulos C Mastakas K and Pantziou G (2014)Mobile recommender systems in tourism Journal of network and computer applications39 319333

111

Bibliographie

[Goodenough et al 2017] Goodenough A E Little N Carpenter W S and Hart A G(2017) Birds of a feather ock together Insights into starling murmuration behaviour revealedusing citizen science PloS one 12(6) e0179277

[Goss et al 1989] Goss S Aron S Deneubourg J-L and Pasteels J M (1989) Self-organized shortcuts in the argentine ant Naturwissenschaften 76(12) 579581

[Gras et al 2016] Gras B Brun A and Boyer A (2016) Identifying grey sheep users incollaborative ltering a distribution-based technique In Proceedings of the 2016 Conferenceon User Modeling Adaptation and Personalization pages 1726 ACM

[Grasseacute 1959] Grasseacute P-P (1959) La reconstruction du nid et les coordinations interindi-viduelles chez bellicositermes natalensis etcubitermes sp la theacuteorie de la stigmergie Essaidinterpreacutetation du comportement des termites constructeurs Insectes sociaux 6(1) 4180

[Guo et al 2015] Guo G Zhang J Sun Z and Yorke-Smith N (2015) Librec A javalibrary for recommender systems In UMAP Workshops

[Han et al 2007] Han J Cheng H Xin D and Yan X (2007) Frequent pattern mining current status and future directions Data mining and knowledge discovery 15(1) 5586

[Harper and Konstan 2015] Harper F M and Konstan J A (2015) The movielens datasets History and context Acm transactions on interactive intelligent systems (tiis) 5(4) 119

[Herlocker et al 2004] Herlocker J L Konstan J A Terveen L G and Riedl J T (2004)Evaluating collaborative ltering recommender systems ACM Transactions on InformationSystems (TOIS) 22(1) 553

[Houmllldobler et al 1990] Houmllldobler B Wilson E O et al (1990) The ants Harvard UniversityPress

[Honey et al 1992] Honey P Mumford A et al (1992) The manual of learning styles

[Hu et al 2008] Hu Y Koren Y and Volinsky C (2008) Collaborative ltering for implicitfeedback datasets In 2008 Eighth IEEE International Conference on Data Mining pages263272 Ieee

[Iaquinta et al 2008] Iaquinta L De Gemmis M Lops P Semeraro G Filannino M andMolino P (2008) Introducing serendipity in a content-based recommender system In 2008Eighth International Conference on Hybrid Intelligent Systems pages 168173 IEEE

[Iredi et al 2001] Iredi S Merkle D and Middendorf M (2001) Bi-criterion optimizationwith multi colony ant algorithms In Evolutionary Multi-Criterion Optimization pages 359372 Springer

[Jameson et al 2015] Jameson A Willemsen M C Felfernig A de Gemmis M Lops PSemeraro G and Chen L (2015) Human decision making and recommender systems InRecommender Systems Handbook pages 611648 Springer

[Jannach et al 2016] Jannach D Kamehkhosh I and Bonnin G (2016) Biases in auto-mated music playlist generation A comparison of next-track recommending techniques InProceedings of the 2016 Conference on User Modeling Adaptation and Personalization pages281285 ACM

[Jawaheer et al 2010] Jawaheer G Szomszor M and Kostkova P (2010) Comparison ofimplicit and explicit feedback from an online music recommendation service In proceedingsof the 1st international workshop on information heterogeneity and fusion in recommendersystems pages 4751 ACM

112

[Jones 2010] Jones N (2010) User Perceived Qualities and Acceptance of Recommender Sys-tems The Role of Diversity PhD thesis EPFL

[Kaminskas and Bridge 2016] Kaminskas M and Bridge D (2016) Diversity serendipity no-velty and coverage A survey and empirical analysis of beyond-accuracy objectives in recom-mender systems ACM Trans Interact Intell Syst 7(1) 2 12 42

[Kardan et al 2014] Kardan A A Ebrahim M A and Imani M B (2014) A new perso-nalized learning path generation method Aco-map Indian Journal of Scientic Research5(1) 17

[King and Sumpter 2012] King A J and Sumpter D J (2012) Murmurations Current Bio-logy 22(4) R112R114

[Kolb and Fry 1974] Kolb D A and Fry R E (1974) Toward an applied theory of experientiallearning MIT Alfred P Sloan School of Management

[Konstan et al 1998] Konstan J A Riedl J Borchers A and Herlocker J L (1998) Re-commender systems A grouplens perspective In Recommender Systems Papers from the1998 Workshop (AAAI Technical Report WS-98-08) pages 6064 AAAI Press

[Koren 2008] Koren Y (2008) Factorization meets the neighborhood a multifaceted collabo-rative ltering model In Proceedings of the 14th ACM SIGKDD international conference onKnowledge discovery and data mining pages 426434 ACM

[Koren et al 2009] Koren Y Bell R and Volinsky C (2009) Matrix factorization techniquesfor recommender systems Computer (8) 3037

[Kuhlthau 1991] Kuhlthau C C (1991) Inside the search process Information seeking fromthe users perspective Journal of the American society for information science 42(5) 361371

[Kurilovas et al 2015] Kurilovas E Zilinskiene I and Dagiene V (2015) Recommending sui-table learning paths according to learners preferences Experimental research results Com-puters in Human Behavior 51 945951

[lHuillier 2018] lHuillier A (2018) Modeacuteliser la diversiteacute au cours du temps pour comprendrele contexte de lutilisateur dans les systegravemes de recommandation PhD thesis

[LHuillier et al 2014] LHuillier A Castagnos S and Boyer A (2014) Understanding usagesby modeling diversity over time In 22nd Conference on User Modeling Adaptation andPersonalization volume 1181

[Logan 2002] Logan B (2002) Content-based playlist generation Exploratory experimentsIn ISMIR

[Lops et al 2011] Lops P De Gemmis M and Semeraro G (2011) Content-based recom-mender systems State of the art and trends In Recommender systems handbook pages73105 Springer

[Mahmood and Ricci 2009] Mahmood T and Ricci F (2009) Improving recommender sys-tems with adaptive conversational strategies In Proceedings of the 20th ACM conference onHypertext and hypermedia pages 7382 ACM

[March 1991] March J G (1991) Exploration and exploitation in organizational learningOrganization science 2(1) 7187

[McGinty and Smyth 2003] McGinty L and Smyth B (2003) On the role of diversity inconversational recommender systems In Proceedings of the 5th International Conference onCase-based Reasoning Research and Development ICCBR03 pages 276290

113

Bibliographie

[McNee et al 2006] McNee S M Riedl J and Konstan J A (2006) Being accurate is notenough how accuracy metrics have hurt recommender systems In CHI06 extended abstractson Human factors in computing systems pages 10971101 ACM

[Merkle et al 2002] Merkle D Middendorf M and Schmeck H (2002) Ant colony optimi-zation for resource-constrained project scheduling IEEE transactions on evolutionary compu-tation 6(4) 333346

[Mokatren et al 2018] Mokatren M Kuik T and Shimshoni I (2018) Exploring the po-tential of a mobile eye tracker as an intuitive indoor pointing device A case study in culturalheritage Future Generation Computer Systems 81 528541

[Nurbakova et al 2018] Nurbakova D Laporte L Calabretto S and Gensel J (2018) Re-commandation de seacutequences dactiviteacutes lors deacutevegravenements distribueacutes

[Oard et al 1998] Oard D W Kim J et al (1998) Implicit feedback for recommendersystems In Proceedings of the AAAI workshop on recommender systems pages 8183

[Osche et al 2019a] Osche P-E Castagnos S and Boyer A (2019a) Antrs Recommendinglists through a multi-objective ant colony system In European Conference on InformationRetrieval pages 229243 Springer

[Osche et al 2019b] Osche P-E Castagnos S and Boyer A (2019b) From music to museum Applications of multi-objective ant colony systems to real world problems In Adaptive andLearning Agents Workshop at AAMAS (ALA 2019)

[Osche et al 2016] Osche P-E Castagnos S Napoli A and Naudet Y (2016) Walk theline toward an ecient user model for recommendations in museums In Semantic and SocialMedia Adaptation and Personalization (SMAP) 2016 11th International Workshop IEEE

[Oster 1981] Oster G (1981) E 0 wilson 1978 caste and ecology in the social insects Mo-nographs in Population Biology 12 1352

[Qiu et al 2015] Qiu J Lin Z and Li Y (2015) Predicting customer purchase behavior inthe e-commerce context Electronic commerce research 15(4) 427452

[Quadrana et al 2018] Quadrana M Cremonesi P and Jannach D (2018) Sequence-awarerecommender systems ACM Computing Surveys (CSUR) 51(4) 136

[Resnick et al 1994] Resnick P Iacovou N Suchak M Bergstrom P and Riedl J (1994)Grouplens an open architecture for collaborative ltering of netnews In Proceedings of the1994 ACM conference on Computer supported cooperative work pages 175186 ACM

[Reynolds 1987] Reynolds C W (1987) Flocks herds and schools A distributed behavioralmodel volume 21 ACM

[Ribeiro et al 2014] Ribeiro M T Ziviani N Moura E S D Hata I Lacerda A andVeloso A (2014) Multiobjective pareto-ecient approaches for recommender systems ACMTrans Intell Syst Technol 5(4) 53 153 20

[Ricci et al 2015] Ricci F Rokach L and Shapira B (2015) Recommender Systems Hand-book Springer US

[RISK 2002] RISK U (2002) Draft standard for learning object metadata IEEE standard1484(1)

[Rubtsov et al 2018] Rubtsov V Kamenshchikov M Valyaev I Leksin V and IgnatovD I (2018) A hybrid two-stage recommender system for automatic playlist continuation InProceedings of the ACM Recommender Systems Challenge 2018 page 16 ACM

114

[Russell and Norvig 2016] Russell S J and Norvig P (2016) Articial intelligence a modernapproach Malaysia Pearson Education Limited

[Salton 1989] Salton G (1989) Automatic text processing The transformation analysis andretrieval of Reading Addison-Wesley 169

[Salton and McGill 1986] Salton G and McGill M J (1986) Introduction to modern infor-mation retrieval

[Sammut and Webb 2010] Sammut C and Webb G I editors (2010) Mean Absolute Errorpages 652652 Springer US Boston MA

[Schlunz 2011] Schlunz E B (2011) Decision support for generator maintenance scheduling inthe energy sector PhD thesis Stellenbosch Stellenbosch University

[Schnabel et al 2018] Schnabel T Bennett P N Dumais S T and Joachims T (2018)Short-term satisfaction and long-term coverage Understanding how users tolerate algorithmicexploration In Proceedings of the Eleventh ACM International Conference on Web Search andData Mining pages 513521

[Semet et al 2003] Semet Y Lutton E and Collet P (2003) Ant colony optimisation fore-learning Observing the emergence of pedagogic suggestions In Swarm Intelligence Sympo-sium 2003 SIS03 Proceedings of the 2003 IEEE pages 4652 IEEE

[Shani and Gunawardana 2011] Shani G and Gunawardana A (2011) Evaluating recommen-dation systems In Recommender systems handbook pages 257297 Springer

[Shardanand and Maes 1995] Shardanand U and Maes P (1995) Social information ltering Algorithms for automating word of mouth In Chi volume 95 pages 210217 Citeseer

[Silva et al 2009] Silva A R D Lages W S and Chaimowicz L (2009) Boids that see Using self-occlusion for simulating large groups on gpus Computers in Entertainment (CIE)7(4) 51

[Simon 1997] Simon H A (1997) Models of bounded rationality Empirically grounded econo-mic reason volume 3 MIT press

[Smyth and McClave 2001] Smyth B and McClave P (2001) Similarity vs diversity InInternational Conference on Case-Based Reasoning pages 347361 Springer

[Stuumltzle and Hoos 2000] Stuumltzle T and Hoos H H (2000) Maxmin ant system Futuregeneration computer systems 16(8) 889914

[Su and Khoshgoftaar 2009] Su X and Khoshgoftaar T M (2009) A survey of collaborativeltering techniques Advances in articial intelligence 2009 4

[Tesoriero et al 2008] Tesoriero R Gallud J A Lozano M and Penichet V M R (2008) Alocation-aware system using rd and mobile devices for art museums In Fourth InternationalConference on Autonomic and Autonomous Systems (ICAS08) pages 7681 IEEE

[Tesoriero et al 2014] Tesoriero R Gallud J A Lozano M and Penichet V M R (2014)Enhancing visitors experience in art museums using mobile technologies Information SystemsFrontiers 16(2) 303327

[Tintarev et al 2017] Tintarev N Lo C and Liem C (2017) Sequences of diverse songrecommendations An exploratory study in a commercial system In Proceedings of the 25thConference on User Modeling Adaptation and Personalization pages 391392 ACM

[Twardowski 2016] Twardowski B (2016) Modelling contextual information in session-awarerecommender systems with neural networks In Proceedings of the 10th ACM Conference onRecommender Systems pages 273276 ACM

115

Bibliographie

[Vall et al 2018] Vall A Quadrana M Schedl M and Widmer G (2018) The impor-tance of song context and song order in automated music playlist generation arXiv preprintarXiv 180704690

[Vall et al 2019] Vall A Quadrana M Schedl M and Widmer G (2019) Order contextand popularity bias in next-song recommendations International Journal of Multimedia In-formation Retrieval 8(2) 101113

[Van den Berg et al 2005] Van den Berg B Van Es R Tattersall C Janssen J ManderveldJ Brouns F Kurvers H and Koper R (2005) Swarm-based sequencing recommendationsin e-learning In Intelligent Systems Design and Applications 2005 ISDA05 Proceedings 5thInternational Conference on pages 488493 IEEE

[Vargas and Castells 2011] Vargas S and Castells P (2011) Rank and relevance in noveltyand diversity metrics for recommender systems In Proceedings of the fth ACM conferenceon Recommender systems pages 109116 ACM

[Veacuteron and Levasseur 1989] Veacuteron E and Levasseur M (1989) Ethnographie de lexposition lespace le corps et le sens Centre Georges Pompidou Bibliothegraveque publique dinformation

[Volkovs et al 2018] Volkovs M Rai H Cheng Z Wu G Lu Y and Sanner S (2018)Two-stage model for automatic playlist continuation at scale In Proceedings of the ACMRecommender Systems Challenge 2018 page 9 ACM

[Wang et al 2012] Wang X Rosenblum D and Wang Y (2012) Context-aware mobile musicrecommendation for daily activities In Proceedings of the 20th ACM international conferenceon Multimedia pages 99108 ACM

[Weiss 2013] Weiss G (2013) Multiagent systems MIT press

[Yang et al 2017] Yang B Lei Y Liu J and Li W (2017) Social collaborative ltering bytrust IEEE transactions on pattern analysis and machine intelligence 39(8) 16331647

[Yang et al 2018] Yang H Jeong Y Choi M and Lee J (2018) Mmcf Multimodal colla-borative ltering for automatic playlist continuation In Proceedings of the ACM RecommenderSystems Challenge 2018 page 11 ACM

[Yang and Wu 2009] Yang Y J and Wu C (2009) An attribute-based ant colony system foradaptive learning object recommendation Expert Systems with Applications 36(2) 30343047

[Yoshimura et al 2014] Yoshimura Y Sobolevsky S Ratti C Girardin F Carrascal J PBlat J and Sinatra R (2014) An analysis of visitors behavior in the louvre museum a studyusing bluetooth data Environment and Planning B Planning and Design 41(6) 11131131

[Yu and Riedl 2012] Yu H and Riedl M O (2012) A sequential recommendation approachfor interactive personalized story generation In Proceedings of the 11th International Confe-rence on Autonomous Agents and Multiagent Systems-Volume 1 pages 7178 InternationalFoundation for Autonomous Agents and Multiagent Systems

[Zhang 2013] Zhang L (2013) The denition of novelty in recommendation system Journalof Engineering Science amp Technology Review 6(3)

[Zhao et al 2014] Zhao G Lee M L and Wynne H (2014) Utilizing purchase intervals inlatent clusters for product recommendation In Proceedings of the 8th Workshop on SocialNetwork Mining and Analysis page 4 ACM

[Ziegler et al 2005] Ziegler C-N McNee S M Konstan J A and Lausen G (2005) Im-proving recommendation lists through topic diversication In Proceedings of the 14th inter-national conference on World Wide Web pages 2232 ACM

116

[Zitzler et al 2001] Zitzler E Laumanns M and Thiele L (2001) Spea2 Improving thestrength pareto evolutionary algorithm TIK-report 103

117

Bibliographie

118

Reacutesumeacute

Les systegravemes de recommandations repreacutesentent un thegraveme de recherche fondamental agrave linter-section entre plusieurs grandes disciplines telles que lapprentissage automatique linteractionhomme-machine et les sciences cognitives Ils constituent en outre un cadre applicatif ambitieuxpour la communauteacute des chercheurs en Intelligence Articielle de par leur tregraves grande complexiteacuteet les nombreuses contraintes quils geacutenegraverent

Lobjectif de ces systegravemes est dameacuteliorer les interactions entre le grand public et les sys-tegravemes de recherche et daccegraves agrave linformation Il est en eet devenu dicile dans un contexte demasse de donneacutees heacuteteacuterogegravenes didentier les ressources les plus pertinentes Il sagit dassisterles utilisateurs dans leurs explorations (que cela soit dans un environnement virtuel ou physique)mais eacutegalement de proposer des ressources susceptibles de les inteacuteresser mais quils nauraientpas consulteacutees spontaneacutement

Les systegravemes actuels ont largement prouveacute leur valeur ajouteacutee et reposent sur des techniquesdapprentissage varieacutees (numeacuterique ou symbolique superviseacute ou non etc) [Castagnos 2008]Neacuteanmoins ils sourent encore de limitations lorsquil sagit de faire des recommandations deseacutequences (recommandations ditems dans un ordre preacutecis pouvant deacutependre des preacute-requis dela progressiviteacute requise du contexte des contraintes de temps etc) Certains modegraveles tels quele modegravele DANCE [Castagnos 2015] integravegrent cette dimension temporelle en suivant en tempsreacuteel leacutevolution en diversiteacute des ressources consulteacutees par les utilisateurs pour mieux comprendrele contexte dexploration Dans [Bonnin 2010] lauteur propose eacutegalement un modegravele temporelcapable de deacutetecter des motifs de consultations freacutequents dans un historique de consultationsan de fournir des recommandations de ressources a priori lieacutees agrave un mecircme contexte Neacuteanmoinssi la modeacutelisation temporelle et spatiale a eacuteteacute rendue possible [Zheng 2015] les modegraveles de leacutetatde lart sinteacuteressant agrave lordre dans lequel les recommandations doivent ecirctre faites ou agrave la qualiteacuteglobale dune seacutequence de recommandations sont encore trop rares

Dans le cadre de cette thegravese nous nous attacherons agrave deacutenir un nouveau formalisme etun cadre meacutethodologique permettant (1) la deacutenition de facteurs humains menant agrave la prisede deacutecision et agrave la satisfaction des utilisateurs (2) la construction dun modegravele geacuteneacuterique etmulti-critegraveres (contraintes physiques ou temporelles diversiteacute progressiviteacute etc) inteacutegrant cesfacteurs humains dans le but de recommander des ressources pertinentes sinscrivant dans uneseacutequence coheacuterente (3) une eacutevaluation holistique de la satisfaction utilisateur vis-agrave-vis de sonparcours de recommandations Leacutevaluation des recommandations tous domaines confondus sefait pour lheure recommandation par recommandation chaque meacutetrique deacutevaluation prise in-deacutependamment (preacutecision diversiteacute nouveauteacute couverture ) Il sagira de proposer un cadreplus complet mesurant leacutevolutiviteacute et la compleacutetude du parcours

Un tel modegravele de recommandations multi-critegraveres preacutesente de nombreux cadres applicatifs Agravetitre dexemple il peut ecirctre utiliseacute dans le cadre de leacutecoute de musique en ligne avec la recom-mandation de playlists adaptatives (recommandation de seacutequences de musique pour faire eacutevoluerlambiance dans un lieu tel quun bar pour susciter une certaine progressiviteacute de leacutemotion res-

119

sentie par le public ou pour sadapter aux attentes compleacutementairessimilairesdieacuterentes dungroupe) Il peut eacutegalement ecirctre utile pour adapter le parcours de recommandation aux progregraves delapprenant et au sceacutenario peacutedagogique de lenseignant dans un contexte de-eacuteducation Citonsaussi le domaine touristique ougrave ce modegravele pourrait inteacutegrer les contraintes spatiales et tempo-relles dun environnement physique (villes museacutees etc)

Mots-cleacutes Systegravemes de recommandation Systegravemes multi-agents Modeacutelisation utilisateur

120

Abstract

Recommender systems are a fundamental research topic at the intersection of several majordisciplines such as machine learning human-computer interaction and cognitive sciences Theyalso constitute an ambitious application framework for the community of researchers in ArticialIntelligence by their great complexity and the numerous constraints they generate

The purpose of these systems is to improve the interaction between the general audience andthe systems of search and access to information It has become dicult to identify the mostrelevant items in the context of big data The goal is thus to assist users in their explorations(whether in a virtual or physical environment) but also to propose items that may interest thembut that they would not consult spontaneously

Current systems have largely proven their added value and are based on various machinelearning techniques (numerical or symbolic supervised or not etc) [Castagnos 2008] Neverthe-less they still suer from limitations when making recommendations of sequences (recommendingitems in a specic order may depend on requirements progressiveness context time constraintsetc) Some models such as the DANCE model [Castagnos 2015] integrate this temporal di-mension by following in real time the evolution in diversity of resources consulted by users tobetter understand the exploration context In [Bonnin 2010] the author also proposes a temporalmodel capable of detecting frequent consultation patterns in a history of consultations in orderto provide a priori resource recommendations related to the same context Nevertheless whiletemporal and spatial modeling have been made possible [Zheng 2015] state-of-the-art modelsthat focus on sequence recommendations or on the overall quality of the sequence are still too rare

In the framework of this thesis we will focus on dening a new formalism and a method-ological framework allowing (1) the denition of human factors leading to decision making anduser satisfaction (2) the construction of a generic and multi-criteria model (physical or tem-poral constraints diversity progressiveness etc) integrating these human factors in order torecommend relevant resources in a coherent sequence (3) a holistic evaluation of user satisfac-tion with its recommendation path The evaluation of recommendations all domains includedis currently done recommendation by recommendation with each evaluation metric taken inde-pendently (accuracy diversity novelty coverage ) Thus we expect a more comprehensiveevaluation framework measuring the progressiveness and the completeness of the path

Such a multi-criteria recommendation model has many application frameworks As an exam-ple it can be used in the context of online music listening with the recommendation of adaptiveplaylists (recommendation of music sequences to change the atmosphere in a place such as a barto raise or lower the emotion felt by the audience progressively or to adapt to the complemen-tarysimilardierent expectations of a group) It can also be useful to adapt the recommendationpath to the learners progress and the teachers pedagogical scenario in an e-education contextLet us also mention the tourism eld where this model could integrate the spatial and temporalconstraints of a physical environment (cities museums etc)

Keywords Recommender systems Multi-agent systems User modeling

121

122

123

  • Introduction
    • Introduction
    • Preacuteambule
    • Contributions
      • SP1 les facteurs agrave prendre en compte pour satisfaire les utilisateurs
      • SP2 la conception de seacutequences de recommandations en accord avec les facteurs seacutelectionneacutes
      • SP3 et SP4 la creacuteation dun modegravele geacuteneacuterique prenant en compte plusieurs meacutetriques et produisant des seacutequences
        • Plan de la thegravese
          • Eacutetat de lart
            • Les systegravemes de recommandation
              • Le filtrage par contenu
              • Le filtrage collaboratif
              • Les actions des utilisateurs
              • Discussion et limites des systegravemes classiques
                • Les facteurs humains agrave prendre en compte dans la recommandation
                  • La similariteacute
                  • La diversiteacute
                  • La nouveauteacute
                  • Discussion
                    • La recommandation en seacutequence
                      • Deacutefinition et geacuteneacuteraliteacutes sur les seacutequences
                      • Domaines dapplication des modegraveles seacutequentiels
                      • Discussion
                        • Les systegravemes multi-agents
                          • Deacutefinition
                          • Preacutesentation de deux systegravemes multi-agents reacuteactifs
                          • Ant Colony System
                          • Discussion sur le modegravele ACS
                            • Utilisation et eacutevolution reacutecentes des algorithmes de colonies de fourmis
                              • Les algorithmes de colonies de fourmis dans les systegravemes de recommandation
                              • Les algorithmes de colonies de fourmis multi-objectifs
                              • Discussion sur lutilisation de loptimum de Pareto
                                • Discussion geacuteneacuterale
                                  • Notre modegravele de recommandation multi-objectifs AntRS
                                    • Introduction
                                    • Fonctionnement geacuteneacuteral du modegravele
                                    • Graphe
                                    • Objectifs
                                      • Similariteacute
                                      • Diversiteacute
                                      • Nouveauteacute
                                      • Preacutefeacuterences
                                      • Progressiviteacute
                                        • Tactiques de fusion
                                          • Colonie de fusion
                                          • Fusion de seacutequences
                                          • Conclusion
                                              • Expeacuterimentations et reacutesultats
                                                • Introduction
                                                • Expeacuterimentations preacuteliminaires portant sur le modegravele ACS initial
                                                  • Preacutesentation et inteacuterecircts de ces premiegraveres expeacuterimentations
                                                  • Expeacuterimentations preacuteliminaires sur le modegraveles ACS
                                                  • Conclusion
                                                    • Expeacuterimentations sur le modegravele AntRS
                                                      • Base de donneacutees utiliseacutee
                                                      • AntRS mono-objectif expeacuterimentations sur chaque colonie isoleacutee
                                                      • AntRS multi-objectifs expeacuterimentations sur lensemble des colonies simultaneacutement et sur les tactiques de fusion
                                                      • Optimisation des meacutetavariables de AntRS
                                                        • Conclusion
                                                          • Conclusion et perspectives
                                                            • Conclusion
                                                            • Perspectives
                                                              • Bibliographie
Page 2: Recommanding sequences in a multidimensional space

AVERTISSEMENT

Ce document est le fruit dun long travail approuveacute par le jury de soutenance et mis agrave disposition de lensemble de la communauteacute universitaire eacutelargie Il est soumis agrave la proprieacuteteacute intellectuelle de lauteur Ceci implique une obligation de citation et de reacutefeacuterencement lors de lrsquoutilisation de ce document Dautre part toute contrefaccedilon plagiat reproduction illicite encourt une poursuite peacutenale Contact ddoc-theses-contactuniv-lorrainefr

LIENS Code de la Proprieacuteteacute Intellectuelle articles L 122 4 Code de la Proprieacuteteacute Intellectuelle articles L 3352- L 33510 httpwwwcfcopiescomV2legleg_droiphp httpwwwculturegouvfrcultureinfos-pratiquesdroitsprotectionhtm

Ecole doctorale IAEM Lorraine

Recommandations en sequences dansun espace multidimensions

THESE

presentee et soutenue publiquement le 26 fevrier 2021

pour lrsquoobtention du

Doctorat de lrsquoUniversite de Lorraine

(mention informatique)

par

Pierre-Edouard Osche

Composition du jury

President Laurent Vigneron Professeur Universite de Lorraine

Rapporteurs Sylvie Calabretto Professeur INSA de LyonLaurent Vercouter Professeur INSA de Rouen

Directrice Anne Boyer Professeur Universite de Lorraine

Co-Directeur Sylvain Castagnos Maıtre de Conferences Universite de Lorraine

Laboratoire Lorrain de Recherche en Informatique et ses Applications mdash UMR 7503

Mis en page avec la classe thesul

Remerciements

Ce manuscrit de thegravese est le fruit dun long travail de recherche qui a eacuteteacute riche en enseigne-ments Durant ces anneacutees jai beaucoup appris tant du point de vue professionnel que personnelplus que je naurais imagineacute avant de commencer cette thegravese Pour tout cela je souhaite remer-cier les personnes qui mont entoureacute durant cette peacuteriode

Je tiens tout dabord agrave particuliegraverement remercier ma directrice Anne Boyer et mon co-directeur Sylvain Castagnos avec qui jai eu la chance de pouvoir travailler durant toute cettethegravese Anne ma apporteacute son expeacuterience et son recul dans le domaine de la recherche et Sylvainma guideacute et soutenu dans chacune des eacutetapes de ce travail Jai beaucoup appreacutecieacute travailleravec vous et je vous remercie encore une fois ici pour vos conseils aviseacutes votre patience votrebonne humeur et pour tout ce que jai pu apprendre agrave vos cocircteacutes

Je remercie Sylvie Calabretto et Laurent Vercouter qui ont rapporteacute ma thegravese et qui ontaccepteacute de faire partie du jury de thegravese Leurs remarques pertinentes mont donneacute un recul etune conance nouvelle en mon travail Je remercie Laurent Vigneron qui a apporteacute un regardexteacuterieur et bienveillant sur mon travail pendant ces anneacutees de thegravese et qui a eacutegalement accepteacutede faire partie du jury comme examinateur

Je remercie aussi leacutequipe KIWI dans son ensemble De nombreuses ideacutees de ce travail sont lefruit de discussions avec les membres de leacutequipe dont certains sont devenus pour moi des amisproches

Je remercie enn ma famille et mes amis leur soutien ma donneacute la motivation de terminerce travail dans cette peacuteriode dicile de pandeacutemie et disolation sociale Tout particuliegraverementje remercie Rose et Ragnar pour leur douce preacutesence quotidienne

i

ii

Sommaire

Chapitre 1

Introduction 1

11 Introduction 1

12 Preacuteambule 4

13 Contributions 8

131 SP1 les facteurs agrave prendre en compte pour satisfaire les utilisateurs 9

132 SP2 la conception de seacutequences de recommandations en accord avec les

facteurs seacutelectionneacutes 9

133 SP3 et SP4 la creacuteation dun modegravele geacuteneacuterique prenant en compte plusieurs

meacutetriques et produisant des seacutequences 9

14 Plan de la thegravese 10

Chapitre 2

Eacutetat de lart 11

21 Les systegravemes de recommandation 12

211 Le ltrage par contenu 12

212 Le ltrage collaboratif 13

213 Les actions des utilisateurs 13

214 Discussion et limites des systegravemes classiques 14

22 Les facteurs humains agrave prendre en compte dans la recommandation 15

221 La similariteacute 17

222 La diversiteacute 19

223 La nouveauteacute 20

224 Discussion 21

23 La recommandation en seacutequence 22

231 Deacutenition et geacuteneacuteraliteacutes sur les seacutequences 22

232 Domaines dapplication des modegraveles seacutequentiels 26

233 Discussion 30

iii

Sommaire

24 Les systegravemes multi-agents 31

241 Deacutenition 31

242 Preacutesentation de deux systegravemes multi-agents reacuteactifs 33

243 Ant Colony System 38

244 Discussion sur le modegravele ACS 40

25 Utilisation et eacutevolution reacutecentes des algorithmes de colonies de fourmis 43

251 Les algorithmes de colonies de fourmis dans les systegravemes de recommandation 43

252 Les algorithmes de colonies de fourmis multi-objectifs 47

253 Discussion sur lutilisation de loptimum de Pareto 50

26 Discussion geacuteneacuterale 50

Chapitre 3

Notre modegravele de recommandation multi-objectifs AntRS 53

31 Introduction 54

32 Fonctionnement geacuteneacuteral du modegravele 54

33 Graphe 55

34 Objectifs 60

341 Similariteacute 63

342 Diversiteacute 64

343 Nouveauteacute 64

344 Preacutefeacuterences 66

345 Progressiviteacute 67

35 Tactiques de fusion 70

351 Colonie de fusion 71

352 Fusion de seacutequences 72

353 Conclusion 72

Chapitre 4

Expeacuterimentations et reacutesultats 73

41 Introduction 74

42 Expeacuterimentations preacuteliminaires portant sur le modegravele ACS initial 74

421 Preacutesentation et inteacuterecircts de ces premiegraveres expeacuterimentations 74

422 Expeacuterimentations preacuteliminaires sur le modegraveles ACS 78

423 Conclusion 84

43 Expeacuterimentations sur le modegravele AntRS 84

431 Base de donneacutees utiliseacutee 84

432 AntRS mono-objectif expeacuterimentations sur chaque colonie isoleacutee 89

iv

433 AntRS multi-objectifs expeacuterimentations sur lensemble des colonies si-

multaneacutement et sur les tactiques de fusion 93

434 Optimisation des meacutetavariables de AntRS 99

44 Conclusion 103

Chapitre 5

Conclusion et perspectives 105

51 Conclusion 105

52 Perspectives 106

Bibliographie 109

v

Sommaire

vi

Table des gures

21 Preacutesentation scheacutematiseacutee du calcul de la preacutecision et du rappel en fonction desressources trouveacutees par rapport agrave lensemble des ressources disponibles (creacuteditimage Datamok UserWalber) 15

22 Vue densemble du fonctionnement dun systegraveme de recommandation sensible auxseacutequences (source [Quadrana et al 2018]) 25

23 Scheacutema repreacutesentant linteraction entre un agent et lenvironnement dans lequel ileacutevolue [Russell and Norvig 2016] 32

24 Simulation de boids ougrave lon peut voir les agents se deacuteplaccedilant dans la mecircme di-rection agrave une certaine distance les uns des autres dans un environnement simuleacute[Reynolds 1987] 35

25 Illustration dun chemin creacuteeacute par des fourmis appartenant agrave lespegravece des fourmisleacutegionnaires (creacutedit photo Mehmet Karatay) 36

26 Exemple de descente de gradient ougrave lon peut voir lexploration au deacutebut avec undeacuteplacement rapide puis lexploitation ensuite vers la solution trouveacutee ( creacuteditimage Joris Gillis 41

27 Illustration de lexpeacuterience des ponts binaires par Jean-Louis Deneubourg (a)Apregraves un certain temps les fourmis choisissent majoritairement une des deuxvoies possibles (b) [Deneubourg et al 1990] 41

28 Scheacutema du dispositif expeacuterimental utiliseacute pour veacuterier si les fourmis sont biencapables demprunter rapidement la voie la plus courte lorsque leur sont preacutesenteacutesdes choix qualitativement dieacuterents [Goss et al 1989] 42

29 Front de Pareto dun problegraveme de minimisation de deux variables f1 et f2 Toutesles solutions sur cette frontiegravere sont optimales (source Wikipedia) 48

31 Graphe repreacutesentant leacutevolution exponentielle du nombre darecirctes selon le nombrede sommets existants dans un graphe complet 57

32 Graphe repreacutesentant leacutevolution lineacuteaire du nombre darecirctes selon le nombre desommets voulus dans un graphe creacuteeacute avec dieacuterentes valeurs de d 60

41 Diagramme de ux repreacutesentant le deacuteroulement de lalgorithme ACS proposeacute par[Schlunz 2011] 76

42 Deux exemples de congurations expeacuterimentales dieacuterentes permettant chacune detester la capaciteacute des fourmis agrave trouver le plus court chemin dans un evironnement[Goss et al 1989] 77

43 Illustration de lexpeacuterience des ponts binaires par Jean-Louis Deneubourg (a)Apregraves un certain temps les fourmis choisissent majoritairement une des deuxvoies possibles (b) [Deneubourg et al 1990] 78

vii

Table des gures

44 Repreacutesentation graphique de lExpeacuterimentation 11 meneacutee sur le modegravele ACS gracircceagrave la bibliothegraveque Java GraphStream Le ndivideud repreacutesenteacute par un carreacute rouge cor-respond au deacutepart le ndivideud repreacutesenteacute par un carreacute bleu repreacutesente larriveacutee lesndivideuds ronds noirs repreacutesentent des points de passage possible les nombres noirsaccoleacutes aux arecirctes repreacutesentent la distance pour parcourir larecircte les nombresviolets repreacutesentent le taux de pheacuteromones deacuteposeacutees sur larecircte 79

45 Reacutesultats obtenus apregraves 30 iteacuterations sur lExpeacuterimentation 11 Agrave gauche laconguration nale du graphe agrave droite le pourcentage dagents fourmis ayantemprunteacutes les deux chemins 80

46 Reacutesultats obtenus apregraves 30 iteacuterations sur lExpeacuterimentation 12 Comme les agentsse basent principalement sur lheuristique qui est partout eacutegale ils oscillent entreles deux chemins sans en privileacutegier un 81

47 Reacutesultats obtenus apregraves 30 iteacuterations sur lExpeacuterimentation 13 Les agents ex-ploitent ici les arecirctes ayant le plus de pheacuteromones Tregraves rapidement tous les agentsutilisent le mecircme chemin 82

48 Conguration nale du graphe pour lExpeacuterimentation 2 apregraves 30 iteacuterations Lesagents ont en majoriteacute bien seacutelectionneacute le chemin le plus court lt 0 1 3 4 9 gt 82

49 Exemple de graphe de lExpeacuterimentation 3 agrave la n des 50 iteacuterations Ces graphessont geacuteneacutereacutes aleacuteatoirement 83

410 Exemple de deacutetection de sessions dans la base de donneacutees Lheure agrave laquelleest lanceacutee chaque musique (ici en bas dans le scheacutema) ainsi que sa dureacutee sontenregistreacutees Si lutilisateur ne relance pas de musique pendant 15 minutes apregravesla n de sa derniegravere eacutecoute alors la session en cours est termineacutee et une nouvellesession est commenceacutee agrave la prochaine musique lanceacutee 87

411 Inuence du nombre dagents et diteacuterations sur la preacutecision moyenne obtenue parnotre modegravele 100

viii

Chapitre 1

Introduction

11 Introduction

Les systegravemes de recommandation existent depuis maintenant plus de deux deacutecennies[Resnick et al 1994] et ont pris leur essor avec la deacutemocratisation dInternet et de laccegraves agravelinformation Le but dun systegraveme de recommandation est comme son nom lindique de recom-mander des ressources agrave lutilisateur pour laiguiller parmi la masse dinformations disponibles Leterme de ressource peut faire reacutefeacuterence agrave un produit une information un lm une musique etcCes ressources doivent correspondre agrave ce quattend lutilisateur pour reacutepondre agrave ses attentesLagrave ougrave dautres meacutethodes daide agrave lutilisateur comme les moteurs de recherche proposerontune liste de sites Internet relatifs agrave une question geacuteneacuterale (ex la requecircte lms super-heacuterosreacutesultera en une liste des lms de super-heacuteros les plus connus etou reacutecents) un systegraveme derecommandation proposera quant agrave lui une reacuteponse plus speacutecique agrave un besoin plus preacutecis (ex un systegraveme recommandera agrave un utilisateur de voir le dernier lm de super-heacuteros du studio Marvelcar ce dernier a appreacutecieacute tous les lms reacutealiseacutes par ce studio speacutecique ces derniegraveres anneacutees) Uneautre speacuteciciteacute majeure des systegravemes de recommandation reacuteside dans le fait que ces derniersreacutepondent agrave un besoin de lutilisateur qui naura pas forceacutement eacuteteacute exprimeacute en amont par cedernier Contrairement aux moteurs de recherche qui se contentent de reacutepondre agrave une requecircte delutilisateur les systegravemes de recommandation proposent quant agrave eux des informations de maniegraverepro-active au moment le plus opportun Un des deacutes majeurs des systegravemes de recommandationen plus de proposer des recommandations au bon moment est de reacuteussir agrave modeacuteliser ce quelutilisateur souhaite reacuteellement alors que les seules donneacutees disponibles proviennent des traceslaisseacutees par les utilisateurs lors des preacuteceacutedentes interactions avec le systegraveme (consultation depages achat de produits visionnage de lms etc) Les systegravemes de recommandation apportentune reacuteelle plus-value par rapport agrave dautres meacutethodes (comme les moteurs de recherche) carlaide proposeacutee se veut tregraves personnaliseacutee selon les preacutefeacuterences de chaque utilisateur Cet objectifde personnalisation entraicircne cependant une complexication du problegraveme car il est neacutecessaire dedeacutenir et de prendre en compte les facteurs humains sous-jacents agrave la satisfaction de lutilisateurlors de la recherche dinformation Nous allons maintenant nous inteacuteresser plus particuliegraverementaux dieacuterentes techniques employeacutees par les systegravemes de recommandation

Les systegravemes de recommandation existent depuis plus de deux deacutecennies et mecircme si les tech-niques ont eacutevolueacute le principe fondamental reste le mecircme identier les besoins et les preacutefeacuterencesdun utilisateur pour lui proposer des ressources adapteacutees Pour ce faire la premiegravere eacutetape estde reacutecolter des informations agrave propos de lutilisateur dans le but didentier ses preacutefeacuterences

1

Chapitre 1 Introduction

Les informations reacutecolteacutees sont deacutependantes du domaine dans lequel est deacuteployeacute le systegraveme derecommandation Sur un site de-commerce le systegraveme pourra par exemple utiliser les produitsconsulteacutes par lutilisateur ainsi que les eacuteventuelles notes sur les produits quil a acheteacute Un sitedeacutecoute de musique exploitera quant agrave lui les titres eacutecouteacutes par lutilisateur ainsi que son com-portement durant leacutecoute (est-ce quil a eacutecouteacute le titre jusquau bout etc)

Durant ces deux deacutecennies dexistence les systegravemes de recommandation ont changeacute pouraccompagner leacutevolution des usages dInternet Les premiegraveres geacuteneacuterations de systegravemes eacutetaientnaturellement adapteacutees aux ressources peu nombreuses et complexes typiques du deacutebut de legraveredInternet Cest agrave cette eacutepoque que les deux grandes cateacutegories de systegravemes de recommandationse sont dieacuterencieacutees agrave savoir le ltrage collaboratif [Resnick et al 1994] et le ltrage par contenu[Belkin and Croft 1992] Dans le ltrage collaboratif les preacutefeacuterences des utilisateurs du systegravemesont utiliseacutees (eg pour un site de recommandation de lms les notes donneacutees par les utilisa-teurs du site sur les lms quils ont vu) Ainsi le systegraveme proposera agrave lutilisateur souhaitant desrecommandations les ressources appreacutecieacutees des autres utilisateurs qui lui sont similaires suivantlhypothegravese selon laquelle les preacutefeacuterences dun ensemble dutilisateurs similaires sont coheacuterentesentre elles Dans le ltrage par contenu les caracteacuteristiques des ressources sont utiliseacutees (egpour un site de recommandation de lms genre acteurs anneacutee de sortie ) Ainsi le systegravemeproposera agrave lutilisateur les ressources similaires agrave celles quil a appreacutecieacutees preacuteceacutedemment Pen-dant longtemps ces deux techniques ont eacuteteacute eacutevalueacutees sur la mesure de preacutecision Pour calculercette mesure les preacutedictions du systegraveme de recommandation sont directement confronteacutees auxdonneacutees reacuteelles recueillies avec de vrais utilisateurs Par exemple un systegraveme calcule quun uti-lisateur pourrait donner agrave un lm une note de 4 sur 5 indiquant quil pourrait eectivementappreacutecier ce lm et quil serait inteacuteressant de lui recommander Cette note calculeacutee de 45 estensuite compareacutee avec la note reacuteelle que cet utilisateur a donneacute agrave ce lm speacutecique note quiavait auparavant eacuteteacute cacheacutee au systegraveme de recommandation pendant les calculs Plus la note preacute-dite et la note reacuteelle sont proches et plus le systegraveme va ecirctre jugeacute preacutecis [Konstan et al 1998]Cette preacutecision peut se mesurer via dieacuterentes meacutetriques comme par exemple lerreur moyenneabsolue qui calcule la deacuteviation entre ce qua preacutedit le systegraveme et les preacutefeacuterences reacuteelles de luti-lisateur [Sammut and Webb 2010] Cette meacutethode bien quintuitive a tendance agrave enfermer lesutilisateurs dans leurs preacutefeacuterences deacutejagrave eacutetablies puisque cest preacuteciseacutement de cette maniegravere queles performances du systegraveme sont jugeacutees Ainsi dans le cas du ltrage par contenu si lutilisateuravait appreacutecieacute par le passeacute un type de ressources particulier le systegraveme tendait agrave lui recomman-der plus de ressources de ce type

Un autre problegraveme provenant de leacutevolution des usages peut ecirctre souleveacute ici Agrave lorigineles systegravemes de recommandation se concentraient dans quelques domaines particuliers commepar exemple les lms ou les produits de sites commerciaux Les recommandations eacutetaient alorspreacutesenteacutees agrave lutilisateur sous forme de ressources uniques ou de liste de ressources similairesCette maniegravere de preacutesenter les recommandations est encore tregraves courante aujourdhui alors queles usages ont eacutevolueacute et que les systegravemes de recommandation sont preacutesents dans un nombre deplus en plus grand de domaines ougrave recevoir une liste de ressources nest pas forceacutement adapteacutePour conclure sur cette partie il est clair que les systegravemes de recommandation ont eacutevolueacute depuisleur creacuteation Cependant des problegravemes demeurent quant agrave leacutevaluation de leurs performances etla satisfaction de lutilisateur nal ainsi que pour la preacutesentation des reacutesultats agrave lutilisateur nal

Prenons maintenant deux exemples qui vont servir agrave illustrer ce propos dans le chapitre Lepremier exemple se concentre sur le problegraveme de leacutevaluation par la preacutecision dans le domaine de

2

11 Introduction

le-commerce Consideacuterons un utilisateur qui consulte depuis quelques temps des appareils photo-graphiques sur un site de vente en ligne Le systegraveme de recommandation deacutetecte ce comportementet calcule les produits les plus similaires disponibles sur le site agrave savoir dautres appareils pho-tographiques Apregraves secirctre deacutecideacute lutilisateur achegravete son appareil et satisfait le reccediloit chez luiquelques jours plus tard Lors de ses prochaines connexions au site de vente en ligne le sys-tegraveme de recommandation proposera encore agrave lutilisateur des appareils photographiques car cesont eectivement toujours ces produits qui correspondent le plus agrave ses preacutefeacuterences mecircme silutilisateur nen a maintenant plus besoin Ce premier exemple montre le problegraveme relatif agrave lasur-utilisation de la preacutecision comme mesure de la performance Si les premiegraveres recommanda-tions baseacutees sur la preacutecision pouvaient ecirctre utiles pour lutilisateur on voit bien quune fois lachateectueacute cette mesure nest plus adapteacutee Des recommandations sur des nouveaux produits pour-raient par exemple ici se reacuteveacuteler inteacuteressantes pour lutilisateur Une autre ameacutelioration possiblepourrait ecirctre la prise en compte de la temporaliteacute Des recommandations dappareils photogra-phiques pourraient ecirctre utiles agrave lutilisateur mais peut-ecirctre dans plusieurs mois ou anneacutees et nonpas directement apregraves son achatOn voit bien ici que le systegraveme de recommandation ne peut passe contenter de la seule mesure de preacutecision et pourrait beacuteneacutecier de lutilisation dautres mesures

Prenons maintenant un deuxiegraveme exemple dans le domaine de le-education pour illustrer lesproblegravemes que peut apporter la preacutesentation des recommandations sous forme de liste agrave lutili-sateur nal Un utilisateur sest inscrit reacutecemment sur un site proposant des cours en ligne caril souhaite apprendre la programmation en Java Il consulte ainsi un cours sur les bases de laprogrammation en Java et le termine avec succegraves Le systegraveme de recommandation du site calculeun certain nombre de ressources eacuteducatives similaires au cours quil vient de suivre et les pro-pose sous forme de liste Lutilisateur se voit donc proposer en tecircte de liste dautres cours pourdeacutebutants en Java ainsi que quelques cours pour deacutebutants dans dautres langages de program-mation dans le reste de la liste Lutilisateur aurait davantage proteacute dune recommandation deplusieurs ressources eacuteducatives sadaptant agrave son niveau et proposant une augmentation de ladiculteacute pour quil poursuive son apprentissage illustrant linteacuterecirct de ne pas uniquement pro-poser des recommandations sous forme de liste On remarque une nouvelle fois que la prise encompte dautres mesures auraient ameacutelioreacute la qualiteacute des recommandations temporaliteacute priseen compte du niveau de lutilisateur diversiteacute des cours proposeacutes etc

Ces deux exemples mettent en exergue la complexiteacute du domaine de la recommandation tantles besoins des utilisateurs peuvent ecirctre varieacutes et complexes agrave satisfaire La satisfaction de lutili-sateur nal est lobjectif central de tout systegraveme de recommandation tout en eacutetant un problegravemeouvert et complexe En eet la satisfaction dun utilisateur nest pas binaire mais continue (unutilisateur nest pas soit satisfait soit non satisfait mais sera plutocirct satisfait de la recommanda-tion agrave un certain degreacute) Nous proposons donc ici daborder ce problegraveme sous un autre angle comment ameacuteliorer la qualiteacute des recommandations fournies agrave lutilisateur dans le but dobtenirde lutilisateur nal une plus haute satisfaction Les deux exemples ci-dessus illustrent leetpotentiellement neacutefaste de proposer des recommandations innaproprieacutees cest-agrave-dire qui ne sa-tisfont pas les besoins de lutilisateur au moment ougrave celui-ci les reccediloit En eet un utilisateur agravequi lon propose de maniegravere reacutecurrente des recommandations innaproprieacutees sera de plus en plusmeacuteant quant agrave la capaciteacute du systegraveme de produire des recommandations adapteacutees agrave ses besoinsau moment t De la mecircme maniegravere un mauvais systegraveme de recommandation ne sera pas utileagrave lutilisateur pour satisfaire ses besoins Il a eacuteteacute prouveacute que ces deux notions de conance etdutiliteacute diminuent chez lutilisateur face agrave un systegraveme de recommandation ne les satisfaisant pas[Benbasat and Wang 2005] Agrave terme ce genre de recommandations peut amener lutilisateur agrave

3

Chapitre 1 Introduction

ne plus utiliser le systegraveme sil ne perccediloit pas la valeur ajouteacutee de celui-ci Les exemples preacuteceacute-dents donnent aussi quelques pistes sur la maniegravere dameacuteliorer la qualiteacute des recommandationsEn eet on peut remarquer que mecircme si les propositions eacutetaient satisfaisantes du point de vueinterne du systegraveme elles ne leacutetaient pas du point de vue externe de lutilisateur Cette contra-diction peut sexpliquer par le fait que le systegraveme ne prend simplement pas assez en compte lesfacteurs deacuteterminant les besoins de lutilisateur Un systegraveme reacuteussissant agrave mieux modeacuteliser unutilisateur et prenant en compte les facteurs les plus importants pour ce dernier dans le processusde recommandation permettrait de mieux satisfaire ses besoins La probleacutematique scientiqueprincipale de cette thegravese peut donc se formuler ainsi

SP0 Comment ameacuteliorer la qualiteacute des recommandations faites aux utili-sateurs

Sinteacuteresser agrave la qualiteacute des recommandations implique de sinteacuteresser agrave leacutevaluation de cesderniegraveres Dans la prochaine section nous deacutetaillerons les deacutes et enjeux de cette probleacutematiqueet son lien avec leacutevaluation puis nous deacutenirons plusieurs sous-probleacutematiques permettant dyapporter des reacuteponses

12 Preacuteambule

Lameacutelioration de la qualiteacute des recommandations des utilisateurs est un vaste sujet auquelil est possible de reacutepondre de multiples faccedilons Il est dabord neacutecessaire de se demander ce quesignie ameacuteliorer la qualiteacute dans cette question Nous avons vu jusquagrave maintenant quun sys-tegraveme de recommandation mesure classiquement la qualiteacute de ses reacutesultats selon une meacutetrique lapreacutecision Cependant la satisfaction de lutilisateur nest pas forceacutement en accord avec cette me-sure comme cela a eacuteteacute illustreacute dans lexemple des appareils photographiques ougrave malgreacute un scorede preacutecision potentiellement tregraves haut lutilisateur peut ne pas ecirctre satisfait des propositionsdu systegraveme La satisfaction de lutilisateur nal peut ecirctre eacutevalueacutee de deux maniegraveres dieacuterentesPremiegraverement elle peut ecirctre mesureacutee directement via un systegraveme deacutevaluation des recommanda-tions ougrave lon demande par exemple agrave lutilisateur de noter la recommandation qui vient de luiecirctre proposeacutee Deuxiegravemement elle peut ecirctre mesureacutee indirectement en observant le comporte-ment de lutilisateur apregraves lui avoir fourni la recommandation [Shani and Gunawardana 2011]Si ce dernier consulte ou consomme la ressource recommandeacutee plutocirct quune autre il est raison-nable de faire lhypothegravese quil est satisfait par cette recommandation cest ce quon appellele taux dacception des recommandations dun systegraveme par rapport agrave un utilisateur Ces deuxmeacutethodes deacutevaluation permettent davoir une ideacutee de la correacutelation entre les meacutetriques internesdu systegraveme et la satisfaction reacuteelle de lutilisateur Il est plus simple de se baser sur des me-sures internes pour eacutevaluer un systegraveme comme la preacutecision plutocirct que sur des mesures externescomme par exemple la satisfaction reacuteelle de lutilisateur eacutetant donneacute que celle-ci demande demettre le systegraveme en ligne et de leacutevaluer apregraves un certain temps dutilisation Leacutevaluation surles seules performances du systegraveme est appeleacutee eacutevaluation hors ligne tandis que leacutevaluation enconditions reacuteelles est appeleacutee eacutevaluation en ligne [Shani and Gunawardana 2011] Leacutevaluationhors ligne mecircme si potentiellement moins apte agrave juger de la satisfaction de lutilisateur oretout de mecircme de nombreux avantages Elle permet premiegraverement de reacutealiser des expeacuteriencesrapidement et agrave bas coucircts eacutetant donneacute quil ny a pas besoin dattendre que les utilisateurs seservent du systegraveme Elle permet ensuite dutiliser des bases de donneacutees deacutejagrave creacuteeacutees permettantaux chercheurs de se concentrer uniquement sur la conception du systegraveme de recommandation(comme par exemple la tregraves connue base de donneacutees MovieLens qui rassemble un grand nombre

4

12 Preacuteambule

deacutevaluations de lms par des utilisateurs sous la forme de notes [Resnick et al 1994]) Ennelle permet de comparer les performances de dieacuterentes techniques de maniegravere objective en lesappliquant agrave un mecircme jeu de donneacutees Autrement dit leacutevaluation en ligne permet dobtenirdes reacutesultats provenant directement dutilisateurs dans un contexte reacuteel mais est tregraves couteuseen temps et en ressource Leacutevaluation hors ligne est quant agrave elle peu couteuse en temps et enressources et permet de reacutealiser autant dexpeacuterimentations que neacutecessaire Dans le contexte decette thegravese ougrave la question de la qualiteacute des recommandations est centrale ces deux meacutethodesdeacutevaluations possegravedent chacune des avantages et des inconveacutenients et seront discuteacutees dans lechapitre deacutedieacutee aux expeacuterimentations du manuscrit

Lameacutelioration de la qualiteacute des recommandations est un point crucial de nos jours tant lessystegravemes de recommandation sont omnipreacutesents dans notre monde Presque tous les grands sitescommerciaux sont deacutesormais doteacutes dun systegraveme de ce genre dans le but de garder lutilisateurplus longtemps sur leur site (Youtube 1 Deezer 2 Netix 3) de le satisfaire pour quil revienne agraveson prochain achat voire mecircme de susciter chez lui de nouvelles envies gracircce agrave la caracteacuteristiquede ces systegravemes decirctre force de proposition (Amazon 4) Les entreprises commerciales ne sontpas les seules agrave exploiter le potentiel des systegravemes de recommandations Les eacutecoles et universiteacutescommencent elles aussi agrave se doter de systegravemes de recommandation permettant aux eacutetudiants desauto-former en utilisant les vastes ressources eacuteducatives mises agrave disposition par celles-ci [Drachs-ler et al 2015] [Boyer et al 2015] De la mecircme maniegravere le domaine de lheacuteritage culturel etdu tourisme seacutequipe petit agrave petit dapplications smartphone permettant aux touristes perdusdevant les possibiliteacutes oertes par certains lieux de culture une aide automatiseacutee et personnaliseacutee[Borragraves et al 2014]

Devant lexplosion de la populariteacute des systegravemes de recommandation devant la complexiteacutegrandissante des ressources agrave recommander et devant laugmentation du nombre dutilisateurs deces systegravemes un constat a eacuteteacute fait proposer constamment des ressources similaires par rapportaux preacutefeacuterences de lutilisateur nest plus susant [McNee et al 2006] De nouvelles eacutetudes etexpeacuterimentations ont montreacute que proposer des recommandations selon dautres modaliteacutes que lapreacutecision pouvait ecirctre beacuteneacuteque Citons ici la mesure de diversiteacute qui a eacuteteacute deacutenie par [Smythand McClave 2001] comme eacutetant linverse de la similariteacute entre deux ressources Ainsi plus deuxressources sont similaires entre elles et moins elles seront diverses et vice versa Proposer desrecommandations plus diversieacutees permet deacuteviter aux utilisateurs de recevoir toujours les mecircmesrecommandations similaires agrave leurs preacutefeacuterences ou encore daugmenter le nombre des ressourcespouvant ecirctre recommandeacutees agrave un utilisateur (cette proportion entre ressources existantes et res-sources pouvant ecirctre recommandeacutees est appeleacutee la couverture dun systegraveme) Citons aussi lamesure de nouveauteacute qui fait quant agrave elle reacutefeacuterence agrave une ressource qui na jamais eacuteteacute vue parlutilisateur [Castells et al 2015] La nouveauteacute permet de remplir un des buts principaux dunsystegraveme de recommandation agrave savoir faire deacutecouvrir agrave lutilisateur des ressources quil nauraitpeut-ecirctre pas trouveacutees sans le systegraveme Il est cependant important de preacuteciser que lapport deces mesures dans les systegravemes de recommandation est aussi discuteacute Par exemple [Ekstrandet al 2014] ont montreacute que si la diversiteacute eacutetait correacuteleacutee positivement avec la satisfaction desutilisateurs ce neacutetait pas le cas de la nouveauteacute Les auteurs expliquent que cette correacutelationneacutegative pourrait ecirctre due au fait quun systegraveme proposant beaucoup de ressources nouvelles sans

1 https wwwyoutubecom2 https wwwdeezercom3 https wwwnetixcom4 https wwwamazoncom

5

Chapitre 1 Introduction

lien avec les preacutefeacuterences de lutilisateur serait mal vu par ce dernier Les auteurs suggegraverent ainside ne pas inteacutegrer de ressources issues de la meacutetrique de nouveauteacute aux nouveaux utilisateurspour leur laisser le temps davoir conance dans le systegraveme avant eacuteventuellement dinteacutegrer dela nouveauteacute dans les recommandations agrave mesure que lutilisateur shabitue au systegraveme

Il apparaicirct donc important dinclure plusieurs critegraveres dans le calcul les recommandationstout en eacutequilibrant ces dieacuterentes recommandations selon lutilisateur Cependant cet eacutequilibreest loin decirctre eacutevident agrave trouver alors que les informations disponibles sur les ressources et les uti-lisateurs sont souvent limiteacutees et que certaines de ces meacutetriques semblent opposeacutees les unes auxautres comme par exemple la similariteacute et la diversiteacute De plus cet eacutequilibre est non seulementameneacute agrave changer selon chaque utilisateur mais il peut aussi varier selon les attentes dun mecircmeutilisateur Ce dernier souhaitera par exemple deacutecouvrir les ressources les plus populaires dansun premier temps apregraves secirctre inscrit sur un site Apregraves avoir consulteacute ces ressources ce mecircmeutilisateur souhaitera peut-ecirctre deacutecouvrir des ressources moins populaires ou plus reacutecentes Il estdonc important de pouvoir modier limportance de chacun de ces facteurs agrave tout moment lorsde la recommandation

Reprenons maintenant le premier exemple de lintroduction sur les appareils photographiquesen proposant cette fois-ci une solution gracircce aux dieacuterentes meacutetriques expliciteacutees ci-dessus Unutilisateur arrive sur un site de vente en ligne et commence agrave consulter du mateacuteriel photogra-phique Le systegraveme neacutetant pas encore certain du but de lutilisateur ses recommandations sontrelativement diverses Apregraves un certain temps lutilisateur qui a aneacute ses recherches sur desappareils photographiques se voit proposer dautres types dappareils similaires agrave celui quil esten train de consulter dans le but de lui faire deacutecouvrir des alternatives possibles Le systegravemedeacutetecte nalement que lutilisateur est sur le point de se deacutecider Il propose alors une liste derecommandations plus diverses permettant agrave lutilisateur deectuer un dernier tour dhorizongeacuteneacuteral avant lachat et de conrmer son choix [Castagnos et al 2010] Apregraves secirctre deacutecideacute aveclaide du systegraveme lutilisateur achegravete son appareil Lors de ses prochaines connexions sur le sitede vente en ligne le systegraveme de recommandation ne proposera peu ou plus dappareils photo-graphiques Agrave la place lutilisateur se verra recommander du mateacuteriel photographique dont ilpourrait maintenant avoir lutiliteacute comme un eacutetui de protection ou encore dieacuterents objectifsLe systegraveme lui recommandera aussi de nouveaux produits quil na encore jamais consulteacute dansle but de lui faire deacutecouvrir la grande varieacuteteacute des produits vendus par le site comme par exempledu mateacuteriel informatique On peut voir ici linteacuterecirct dinteacutegrer de nouveaux facteurs comme ladiversiteacute dans la recommandation La variation du niveau de diversiteacute au cours du temps et enfonction du contexte permet dans cet exemple dameacuteliorer la qualiteacute de la recommandationnale en sadaptant plus nement aux besoins de lutilisateur et en laidant agrave des moments cleacutescomme juste avant ou apregraves son achat Lajout dun facteur comme la diversiteacute permet de plusdeacuteviter la scleacuterose des recommandations passeacute un certain temps cest-agrave-dire la recommandationdes mecircmes ressources en boucle agrave un utilisateur Ce pheacutenomegravene se produit ineacutevitablement dansun systegraveme baseacute uniquement sur la preacutecision ougrave les ressources recommandeacutees nissent toutes parecirctre deacutejagrave connues de lutilisateur ou trop similaires agrave ses goucircts Ce problegraveme peut en fait ecirctreconsideacutereacute comme du sur-apprentissage dans le sens ougrave le systegraveme est tellement speacutecialiseacute sur lespreacutefeacuterences de lutilisateur que quelques ressources obtiennent un tregraves haut score de preacutecisionet sont recommandeacutees en permanence Lintroduction de nouveaux facteurs permettant dautresmaniegraveres de calculer des recommandations ainsi que des variations dimportance entre ces fac-teurs au cours du temps peuvent reacuteduire ce problegraveme

6

12 Preacuteambule

De cet exemple la premiegravere probleacutematique scientique permettant de reacutepondre agrave la questiongeacuteneacuterale poseacutee agrave la n de lintroduction peut ecirctre deacutenie comme suit

SP1 Quels sont les facteurs agrave prendre en compte pour satisfaire les uti-lisateurs et comment adapter leur importance au cas par cas pour chaqueutilisateur

Comme nous lavons eacutevoqueacute preacuteceacutedemment les systegravemes de recommandation se sont gran-dement deacutemocratiseacutes et existent deacutesormais dans la plupart des domaines ougrave se trouvent denombreuses ressources mises agrave disposition de nombreux utilisateurs et ce quelque soit le typede ces ressources Classiquement un systegraveme de recommandation va calculer par divers moyensles ressources que lutilisateur pourraient le plus appreacutecier Le reacutesultat de cette opeacuteration est biensouvent une valeur reacuteelle dutiliteacute ou dinteacuterecirct comprise dans lintervalle [0 1] associeacutee agrave chaqueressource ougrave 1 correspond agrave la preacutediction selon laquelle lutilisateur devrait tregraves fortement appreacute-cier la ressource en question et inversement Ainsi les n ressources ayant les plus hautes valeurssont recommandeacutees agrave lutilisateur Certains domaines comme le-commerce se satisfont tregraves biende recommandations proposeacutees de cette maniegravere sous forme de listes Cependant dautres do-maines comme le-eacuteducation ou le tourisme beacuteneacutecieraient de recommandations proposeacutees auxutilisateurs sous la forme dune seacutequence Nous deacutenissons ici une seacutequence comme une suiteordonneacutee de ressources posseacutedant un deacutebut une n un but et eacuteventuellement une ou plusieurscontrainte(s) agrave respecter lors de sa creacuteation Cette deacutenition implique entre autres de deacutenir ceque signie la notion dordre dans la seacutequence Un ordre correspond agrave un agencement particulierde ressources permettant datteindre le but rechercheacute de maniegravere optimiseacutee Reprenons main-tenant le deuxiegraveme exemple de lintroduction sur le site de-eacuteducation en ajoutant cette fois-cila notion de seacutequence an dillustrer son inteacuterecirct Un utilisateur sest inscrit reacutecemment sur unsite proposant des cours en ligne car il souhaite apprendre la programmation en Java Cepen-dant et avant de commencer le site lui propose de fournir quelques informations sur son objectifeacuteducatif Ainsi lutilisateur explicite lobjectif quil souhaite atteindre (apprendre les bases deJava) ainsi que le temps dont il dispose (exprimeacute par exemple ici sous la forme dun nombre nde ressources eacuteducatives voulues pour atteindre lobjectif) Avec ces informations le systegraveme derecommandation du site va calculer parmi toutes les ressources eacuteducatives disponibles lesquellescorrespondent aux besoins de lutilisateur Le niveau de diculteacute de ces ressources seacutelectionneacuteesest ensuite calculeacute par le systegraveme gracircce agrave leurs caracteacuteristiques Enn le systegraveme construit uneseacutequence de taille n ougrave la place de chaque ressource eacuteducative deacutepend de son niveau de diculteacutede maniegravere agrave ce que lutilisateur deacutebute avec la ressource la moins complexe puis progresse avecdes ressources abordant des notions de plus en plus avanceacutees La seacutequence creacuteeacutee va donc luipermettre datteindre son objectif gracircce agrave des cours agrave la diculteacute croissante tout en respectantla contrainte de temps imposeacutee

Avec cet exemple nous pouvons maintenant expliciter les deuxiegraveme et troisiegraveme probleacutema-tiques scientiques

SP2 Connaissant les facteurs humains agrave prendre en compte (SP1) com-ment passer dune recommandation unitaire agrave une seacutequence de recomman-dations

7

Chapitre 1 Introduction

SP3 Connaissant les facteurs humains agrave prendre en compte (SP1) com-ment les combiner dans un mecircme modegravele permettant de faire varier leurimportance les uns par rapport aux autres agrave tout moment

Le domaine de la recommandation est en plein essor et mecircme si des problegravemes subsistentencore actuellement des solutions existent pour y reacutepondre comme lont illustreacute les exemples ci-dessus La compreacutehension des besoins des utilisateurs la prise en consideacuteration de la dimensiontemporelle et dobjectifs multiples et parfois antagonistes dans le processus de recommandationsont deacutesormais les objectifs principaux du domaine de la recommandation et cest au sein dece mouvement que cette thegravese sinscrit De plus les nouveaux domaines applicatifs souvrantagrave la recommandation (eg le-eacuteducation le tourisme ) sont agrave la fois une chance et un deacute une chance car il devient possible dassister lutilisateur dans un panel de plus en plus grand desituations un deacute dans le sens ougrave les modegraveles doivent ecirctre assez geacuteneacuteriques pour sadapter agravecette grande varieacuteteacute de situations possibles Une derniegravere probleacutematique scientique est toutefoisneacutecessaire dans le cadre de cette thegravese pour compleacuteter ce tour dhorizon Il est en eet neacutecessairede pouvoir quantier agrave quel point SP1 et SP2 ameacuteliorent la qualiteacute des recommandations Nousavons vu dans les exemples preacuteceacutedents que cette qualiteacute neacutetait pas une notion simple agrave mesurermais il est pourtant neacutecessaire de satteler agrave ce problegraveme pour quantier les performances dunmodegravele La 3egraveme et derniegravere probleacutematique de cette thegravese peut donc ecirctre exprimeacutee ainsi

SP4 Comment eacutevaluer les seacutequences produites en SP2 et SP3

Leacutevaluation des recommandations est au cdivideur des nouveaux deacutes eacutevoqueacutes preacuteceacutedemment Ledomaine de la recommandation est intimement lieacute agrave lecirctre humain et il est important de ne plusuniquement se concentrer sur une seule mesure comme la preacutecision Lecirctre humain est complexedans ses besoins et leacutevaluation des recommandations doit reeacuteter cette complexiteacute

13 Contributions

Dans cette thegravese une reacuteponse agrave eacuteteacute apporteacutee agrave chacune des probleacutematiques scientiques eacutenon-ceacutees ci-dessus Ces contributions scientique ont fait lobjet de trois publications

Workshop international SMAP 5 Walk the line Toward an ecient user model

for recommendations in museums [Osche et al 2016] Confeacuterence internationale ECIR 6 AntRS Recommending lists through a multi-

objective ant colony system [Osche et al 2019a] Workshop international ALA 7 organiseacute avec la confeacuterence internationale AAMAS 8

From Music to Museum Applications of Multi-Objective Ant Colony Sys-

tems to Real World Problems [Osche et al 2019b]

Dans la suite de cette section un aperccedilu plus en deacutetail des reacuteponses apporteacutees aux probleacute-matique scientique est donneacute

5 SMAP International Workshop on Semantic Media Adaptation and Personalization

6 ECIR European Conference on Information Retrieval http ecir2019org7 ALA Adaptive and Learning Agents

8 AAMAS International Conference on Autonomous Agents and Multiagent Systems

8

13 Contributions

131 SP1 les facteurs agrave prendre en compte pour satisfaire les utilisateurs

Pour reacutepondre agrave la premiegravere probleacutematique scientique SP1 nous avons seacutelectionneacute un en-semble de quatre critegraveres deacutevaluation repreacutesentant au mieux les besoins de lutilisateur Cescritegraveres ont eacuteteacute choisis car ils apparaissent dans la litteacuterature scientique comme eacutetant lieacutes agravela satisfaction nale de lutilisateur Ils repreacutesentent un panel inteacuteressant de facteurs humainsimportants pour les utilisateurs mais il est important de noter que ce choix nest pas exhaustifComme nous lavons mentionneacute le nombre de facteurs humains rentrant en compte dans la prisede deacutecision est potentiellement inni et varie en fonction de lutilisateur Nous avons donc choisices quatre critegraveres car ils sont les plus eacutetudieacutes dans la litteacuterature mais le but de cette thegravese estde pouvoir inteacutegrer de nouveaux critegraveres de faire varier leur importance si neacutecessaire et de lestraiter comme un problegraveme doptimisation multi-critegraveres Ces quatre critegraveres nous permettentde nous situer par rapport aux travaux existants de la litteacuterature tout en eacutetablissant un modegravelegeacuteneacuterique capable de sadapter agrave de multiples besoins Voici ces quatre critegraveres

1 La similariteacute garantissant agrave lutilisateur des recommandations similaires aux ressourcesquil appreacutecie deacutejagrave

2 La diversiteacute permettant dorir de la varieacuteteacute dans les recommandations

3 La nouveauteacute proposant agrave lutilisateur des ressources quil ne connaicirct et quil nauraitpeut-ecirctre jamais trouveacute lui-mecircme

4 Les preacutefeacuterences orant agrave lutilisateur la possibiliteacute de revoir les ressources quil a deacutejagraveaimeacute par le passeacute

132 SP2 la conception de seacutequences de recommandations en accord avec

les facteurs seacutelectionneacutes

La notion de seacutequence est centrale pour comprendre son inteacuterecirct dans le paysage actuel dessystegravemes de recommandation ainsi que pour ecirctre capable den geacuteneacuterer Dans ce travail nousavons proposeacute une meacutethode permettant de garantir des transitions optimales entre ressourcesau sein dune seacutequence Nous avons ensuite mis en pratique ces contributions dans un jeu dedonneacutees existant provenant de Deezer un site deacutecoute de musique en ligne Ce jeu de donneacuteescorrespond agrave un mois deacutecoutes de titres par plusieurs milliers dutilisateurs et possegravede desinformations sur les titres ainsi que sur les utilisateurs Gracircce agrave ce jeu de donneacutees nous avonspu extraire des seacutequences deacutecoutes et nous avons utiliseacute ces seacutequences reacuteelles comme eacutevaluationpour notre systegraveme Nous avons enn creacuteeacute un modegravele permettant de geacuteneacuterer des seacutequences de lataille voulue posseacutedant un point de deacutepart et darriveacutee deacutenis

133 SP3 et SP4 la creacuteation dun modegravele geacuteneacuterique prenant en compte

plusieurs meacutetriques et produisant des seacutequences

Apregraves avoir deacuteni les meacutetriques agrave utiliser la maniegravere de les calculer et apregraves avoir deacuteni lanotion de seacutequence et la maniegravere de les construire nous avons deacuteveloppeacute un modegravele reacuteunissantlensemble de ces caracteacuteristiques Pour cela nous nous sommes inspireacutes de solutions deacuteveloppeacuteespendant des millions danneacutees par la seacutelection naturelle pour reacutesoudre des problegravemes dexplora-tion et doptimisation de chemins dans la nature Il existe en eet tout un domaine de recherchedeacutedieacute agrave la modeacutelisation informatique de systegravemes vivants complexes et agrave lapplication de cesmodegraveles agrave des problegravemes complexes humains les Systegravemes Multi-Agents [Ferber and Weiss1999] Nous avons utiliseacute lun de ces systegravemes inspireacute des colonies de fourmis pour reacutepondre agrave

9

Chapitre 1 Introduction

notre probleacutematique [Dorigo et al 1996] [Dorigo et al 2006] Dans la nature il a eacuteteacute observeacute queles fourmis empruntaient la plupart du temps le plus court chemin possible entre leur fourmiliegravereet une source de nourriture Une fourmi prise seacutepareacutement na pas des capaciteacutes cognitives tregravesdeacuteveloppeacutees avec ses quelques centaines de milliers de neurones seulement Cependant linter-action entre toutes les fourmis de la fourmiliegravere produit ce quon appelle un eet deacutemergenceLinteraction danimaux simples (ou dagents si lon parle dun systegraveme informatique) provoqueleacutemergence dune intelligence collective capable de reacutesoudre des problegravemes dont la complexiteacute deacute-passe la somme des capaciteacutes des individus [Bonabeau et al 1999] Cest bien ce pheacutenomegravene quiest agrave ldivideuvre lors de loptimisation de la distance dun chemin par toutes les fourmis dune four-miliegravere Nous reviendrons plus en deacutetail sur lensemble des meacutecanismes permettant leacutemergencede cette intelligence collective dans ce manuscrit An de reacutepondre agrave notre probleacutematique nousavons deacuteveloppeacute un modegravele ougrave une multitude dagents tregraves simples (correspondant aux fourmis)sont deacuteployeacutes dans un graphe ougrave les sommets repreacutesentent les ressources dun domaine applicatifet ougrave les arecirctes repreacutesentent les liens entre ces ressources (correspondant agrave lenvironnement agraveparcourir pour les fourmis) An dinteacutegrer les quatre meacutetriques discuteacutees ci-dessus nous avonscreacuteeacute dieacuterentes colonies posseacutedant chacune leurs agents speacutecialiseacutes dans loptimisation dune desmeacutetriques De par le pheacutenomegravene dintelligence collective les agents produisent des seacutequencesoptimiseacutees dans le graphe pouvant ecirctre recommandeacutees agrave lutilisateur Cette approche apporteainsi des solutions aux problegravemes souleveacutes par les probleacutematiques scientiques sus-mentionneacutes

Nous sommes capables de prendre en compte les dieacuterentes meacutetriques expliciteacutees dans unseul et mecircme modegravele De plus nous produisons des solutions repreacutesentant un compromisentre des objectifs parfois divergents entre eux (similariteacute et diversiteacute)

Dans la nature les fourmis creacuteent un chemin entre leur fourmiliegravere et la source de nourri-ture Nous utilisons cette aptitude inheacuterente an de creacuteer des seacutequences entre une ressourcede deacutepart (la fourmiliegravere) et une ressource darriveacutee (la nourriture)

Ladaptation aux changements de lenvironnement est rapide (nouvel utilisateur nouvelleressource suppression dune ressource etc) De la mecircme maniegravere que dans la nature lesfourmis sont capables de retrouver un autre chemin optimiseacute si le premier venait agrave ecirctrebloqueacute par une branche venant de tomber par exemple

Notre modegravele est souple car il permet de modier le poids de chaque meacutetrique dans laseacutequence nale permettant de sadapter agrave chaque utilisateur

Il est possible dajouter ou denlever des colonies agrave la voleacutee dans le systegraveme permettantde sadapter rapidement agrave dieacuterents domaines applicatifs et agrave dieacuterents objectifs

14 Plan de la thegravese

La suite de ce manuscrit se preacutesente ainsi dans le chapitre 2 nous preacutesenterons les travaux dela litteacuterature portant sur les dieacuterents facteurs humains utiliseacutes dans les systegravemes de recomman-dation les approches existantes de recommandations en seacutequences et les systegravemes multi-agentsDans le chapitre 3 nous preacutesenterons notre modegravele et son fonctionnement en deacutetail Ensuitenous preacutesenterons les reacutesultats obtenus par ce modegravele dans le domaine applicatif de leacutecoute demusique en ligne dans le chapitre 4 Enn nous conclurons et discuterons des perspectives de cetravail dans le chapitre 5

10

Chapitre 2

Eacutetat de lart

Sommaire

21 Les systegravemes de recommandation 12

211 Le ltrage par contenu 12

212 Le ltrage collaboratif 13

213 Les actions des utilisateurs 13

214 Discussion et limites des systegravemes classiques 14

22 Les facteurs humains agrave prendre en compte dans la recommandation 15

221 La similariteacute 17

222 La diversiteacute 19

223 La nouveauteacute 20

224 Discussion 21

23 La recommandation en seacutequence 22

231 Deacutenition et geacuteneacuteraliteacutes sur les seacutequences 22

232 Domaines dapplication des modegraveles seacutequentiels 26

233 Discussion 30

24 Les systegravemes multi-agents 31

241 Deacutenition 31

242 Preacutesentation de deux systegravemes multi-agents reacuteactifs 33

243 Ant Colony System 38

244 Discussion sur le modegravele ACS 40

25 Utilisation et eacutevolution reacutecentes des algorithmes de colonies de four-

mis 43

251 Les algorithmes de colonies de fourmis dans les systegravemes de recomman-

dation 43

252 Les algorithmes de colonies de fourmis multi-objectifs 47

253 Discussion sur lutilisation de loptimum de Pareto 50

26 Discussion geacuteneacuterale 50

11

Chapitre 2 Eacutetat de lart

Dans cet eacutetat de lart nous allons tout dabord nous pencher sur le fonctionnement dessystegravemes de recommandation classiques ainsi que sur leurs limites Nous allons ensuite eacutetudierquelques reacuteponses agrave ces limites proposeacutees par la litteacuterature et discuter des ameacuteliorations possibles

21 Les systegravemes de recommandation

Les systegravemes de recommandation ont pour but principal de proposer aux utilisateurs desressources adapteacutees agrave leurs attentes Une ressource peut ecirctre un document une page web unemusique un lm un livre un objet un cours etc Pour eectuer une recommandation une hy-pothegravese simple a eacuteteacute exploiteacutee par les premiers systegravemes les preacutefeacuterences passeacutees dun utilisateurpeuvent ecirctre utiliseacutees pour preacutedire les preacutefeacuterences futures de ce mecircme utilisateur Cette hypothegravesesest deacuteclineacutee dans les deux approches principales des systegravemes de recommandation que sont leltrage par contenu [Belkin and Croft 1992 Lops et al 2011] et le ltrage collaboratif [Resnicket al 1994] La principale dieacuterence entre ces deux approches repose sur lexploitation de dieacute-rents types des donneacutees le ltrage par contenu utilise les informations descriptives caracteacuterisantles utilisateurs et les ressources du systegraveme tandis que le ltrage collaboratif exploite uniquementles interactions entre utilisateurs et ressources comme les consultations ou les votes [Aggarwalet al 2016] Ces deux familles ont par la suite donneacute naissance a de nombreuses techniquesque nous naborderons pas ici Toutes peuvent cependant ecirctre rapporteacutees agrave lune ou lautre deces familles ou agrave une combinaison des deux Dans la suite de cette section nous reviendronsrapidement sur ces deux familles qui ont marqueacute les deacutebuts des systegravemes de recommandationet qui regroupent agrave elles seules un grand nombre darticles de la litteacuterature du domaine Cetteintroduction aux systegravemes de recommandation servira aussi agrave preacutesenter quelques concepts-cleacuteslieacutes agrave ces systegravemes

211 Le ltrage par contenu

Le ltrage par contenu est une des deux approches majeures dans les systegravemes de recomman-dation [Belkin and Croft 1992 Lops et al 2011] Le but dun systegraveme de ltrage par contenu estde proposer des recommandations agrave lutilisateur uniquement en fonction des caracteacuteristiques desressources appreacutecieacutees Ce genre de systegraveme va donc enregistrer les actions de lutilisateur sur lesressources quil a consulteacutees dans le but de trouver dautres ressources quil pourrait appreacutecierCette meacutethode de fonctionnement implique deux principes

1 Le systegraveme doit pouvoir enregistrer les actions de lutilisateur dans le systegraveme 9 Le sys-tegraveme doit ensuite pouvoir interpreacuteter ces dieacuterentes actions an decirctre capable deacutevalueragrave quel point un utilisateur appreacutecie la ressource sur laquelle il a eectueacute des actions Nousdiscuterons de ces actions et des maniegraveres de les interpreacuteter plus en deacutetail dans la suitede cette section

2 Le systegraveme doit pouvoir comparer des ressources entre elles an de deacuteterminer lesquellespourraient ecirctre appreacutecieacutees par lutilisateur en fonction de son historique de consultationsPour reacutealiser cela il est neacutecessaire que les ressources soient deacutecrites par ce que lon appelledes meacuteta-donneacutees cest-agrave-dire des donneacutees deacutecrivant dautres donneacutees ou comme ici desdonneacutees deacutecrivant des ressources Il est dusage de deacutenir ou dutiliser des standards pour

9 Des exemples dactions possibles consulter une ressource donner une note agrave une ressource acheter uneressource bannir une ressource pour ne plus la voir placer une ressource dans ses favoris etc

12

21 Les systegravemes de recommandation

les meacuteta-donneacutees an de deacutecrire toutes les ressources de la mecircme maniegravere et eacuteventuelle-ment de pouvoir partager ou utiliser des bases de donneacutees utilisant les mecircmes standardsOn peut par exemple citer le Learning Object Metadata qui est un standard utiliseacute ene-eacuteducation pour deacutecrire des ressources eacuteducatives [RISK 2002] Des domaines commele web seacutemantique ou les systegravemes agrave base dontologie ont comme but de structurer cesdonneacutees descriptives lorsquelles ne le sont initialement pas

Le ltrage par contenu a lavantage de pouvoir fournir des recommandations agrave un utilisateurmecircme sil est le seul agrave utiliser le systegraveme tant que ce dernier possegravede des informations sur lesressources consulteacutees Cependant la qualiteacute des recommandations deacutependra directement de laqualiteacute de ces informations Si les actions de lutilisateur ou les descriptions de ressources sontinsusantes un systegraveme de ltrage par contenu ne sera pas capable de proposer de recommanda-tions de grande qualiteacute Une autre limite majeure de ce genre de systegraveme reacuteside dans le manquede nouveauteacute En eet apregraves un certain temps les recommandations proposeacutees par le systegravemeont un risque de scleacuterose provoqueacute par un manque de nouvelles informations dans le systegraveme

212 Le ltrage collaboratif

La deuxiegraveme approche majeure des systegravemes de recommandation est donc le ltrage colla-boratif [Resnick et al 1994] Cette technique utilise les preacutefeacuterences des autres utilisateurs dusystegraveme sur les ressources pour estimer les preacutefeacuterences de lutilisateur Lhypothegravese sous-jacentea cette meacutethode est quil est possible de preacutedire les preacutefeacuterences dun utilisateur en eacutetudiant ce quedautres utilisateurs similaires en termes de preacutefeacuterences ont aimeacute Si beaucoup de ces utilisateurssimilaires ont appreacutecieacute une ressource alors il est probable que lutilisateur appreacutecie aussi cetteressource Cette meacutethode repose ici aussi sur deux principes

1 Comme pour le ltrage par contenu il faut dabord pouvoir collecter les actions de nom-breux utilisateurs sur les ressources du systegraveme an den deacuteterminer leurs preacutefeacuterences

2 Le systegraveme doit ensuite deacuteterminer les utilisateurs les plus similaires agrave lutilisateur enterme de preacutefeacuterences avec pour but nal de lui recommander des ressources quil na pasencore consulteacute et qui sont appreacutecieacutees par ces utilisateurs similaires

Le ltrage collaboratif permet par rapport au ltrage par contenu de proposer des recom-mandations agrave lutilisateur sans forceacutement connaicirctre le contenu des ressources recommandeacutees Eneet le systegraveme ne manipule que des preacutefeacuterences geacuteneacuterales souvent repreacutesenteacutees numeacuteriquementpar une note associeacutee agrave une ressource et agrave un utilisateur En dautres termes le ltrage col-laboratif sinteacuteresse agrave lusage qui est fait des ressources et non aux ressources en elles-mecircmesUne fois ces preacutefeacuterences eacutetablies ce genre de systegraveme peut donc sadapter agrave des domaines ougraveles ressources sont dieacuterentes Cependant il est aussi neacutecessaire davoir agrave disposition un grandnombre dutilisateurs ainsi que leurs preacutefeacuterences an de pouvoir utiliser ce genre de systegravemecorrectement

213 Les actions des utilisateurs

Comme nous lavons deacutecrit plus haut peu importe le type de systegraveme de recommandationutiliseacute il est neacutecessaire de reacutecolter les actions des utilisateurs an dobtenir une eacutevaluation desressources quils ont consulteacutees Cette eacutevaluation prend la plupart du temps la forme dune noter entiegravere variant de 1 agrave 5 ou dune valeur continue r isin [0 1] ougrave dans les deux cas une preacutefeacuterence

13

Chapitre 2 Eacutetat de lart

marqueacutee correspond agrave une valeur haute et inversement Dune maniegravere geacuteneacuterale on nommeretours les informations reacutecupeacutereacutees par un systegraveme sur un utilisateur permettant daboutir agravecette note Dans les systegravemes de recommandation on peut distinguer deux types de retours le retour explicite et le retour implicite Le retour explicite est le plus simple des deux puisquilcorrespond agrave la situation ougrave lutilisateur fournit naturellement de lui-mecircme la note associeacutee agrave uneressource quil a consulteacutee Cette maniegravere de proceacuteder est courante dans le-commerce ou dansle divertissement ougrave les utilisateurs peuvent geacuteneacuteralement noter de 1 agrave 5 le produit quils ontacheteacute ou encore le lm quils ont vu Cette meacutethode permet dacceacuteder agrave leacutevaluation reacuteelle delutilisateur et agrave ses preacutefeacuterences orant de maniegravere directe des donneacutees de haute qualiteacute [Korenet al 2009] Agrave linverse le retour implicite repreacutesente les traces laisseacutees par lutilisateur lors desa preacutesence dans le systegraveme Ces traces ne sont pas directement des eacutevaluations ou des notes maisrepreacutesentent bien les dieacuterentes possibiliteacutes dactions quore un systegraveme agrave ses utilisateurs Cesactions diegraverent donc selon le domaine dapplication du systegraveme Pour un site web de-commerceles actions pourront ecirctre la consultation dune page la consultation dune che produit la misedun produit dans le panier ou encore lachat dun produit Pour un site web deacutecoute de musiqueles actions pourront ecirctre leacutecoute dune musique en entier larrecirct de leacutecoute dune musique avantla n la consultation de la page dun artiste etc On voit bien ici que les actions possiblessont deacutependantes du domaine mais aussi que toutes les actions nont pas la mecircme importanceni la mecircme signication On peut en eet supposer quun utilisateur appreacuteciera davantage unproduit sil lachegravete que sil consulte seulement sa page On retrouve cette distinction dans [Oardet al 1998] ougrave les auteurs deacutenissent trois cateacutegories permettant de grouper les actions de mecircmeimportance ensemble (1 consultation de la ressource 2 conservation de la ressource 3 partagede la ressource) On peut aussi citer [Castagnos 2008] qui dune maniegravere plus geacuteneacuterale proposeune meacutethode permettant de calculer linteacuterecirct preacutesumeacute dun utilisateur pour une ressource selonles types dactions eectueacutees par lutilisateur et leurs importances respectives An de conclurecette section il est important de preacuteciser que mecircme si le retour explicite semble plus deacutesirablepour les systegravemes de recommandation il a eacuteteacute montreacute que ces deux types de retours apportentdes informations dieacuterentes et quil peut justement ecirctre inteacuteressant de les prendre tous les deuxen compte [Jawaheer et al 2010]

214 Discussion et limites des systegravemes classiques

Dans les deux approches de recommandation preacutesenteacutees ci-dessus le problegraveme et la solutionsont fondamentalement les mecircmes Le problegraveme peut se formuler ainsi comment estimer linteacuterecirctr qua un utilisateur u sur une ressource i encore non consulteacutee en se basant sur les connaissancesincomplegravetes repreacutesenteacutees par le prol de lutilisateur u Le prol de lutilisateur est incompletcar les informations sur ses preacutefeacuterences proviennent uniquement des interactions que ce dernier aeu avec le systegraveme Autrement dit il nest pas possible de connaicirctre les facteurs ayant abouti auxactions de lutilisateur puisque ces derniegraveres sont le fruit des meacutecanismes de raisonnement internede lutilisateur Il nest par exemple pas possible de savoir reacuteellement pourquoi un utilisateur adonneacute la note de 5 sur 5 agrave un lm Est-ce parce quil considegravere que cest le meilleur lm quil a vude sa vie et quil aimerait deacutecouvrir plus de lms de ce genre Ou bien est-ce parce que cest unlm quil a vu dans un contexte particulier et que mecircme sil la beaucoup aimeacute il ne souhaiteraitpas revoir des lms similaires aujourdhui Il existe ainsi probablement une multitude de facteursjouant dans les actions que nous eectuons et il nest pas possible de tous les appreacutehender Devantce constat la solution adopteacutee par les deux approches est la mecircme se baser sur les preacutefeacuterencesconnues de lutilisateur pour extrapoler ses preacutefeacuterences futures potentielles Cependant et commenous lavons vu dans lexemple de lintroduction sur les appareils photo il est aiseacute de concevoir

14

22 Les facteurs humains agrave prendre en compte dans la recommandation

des situations ougrave les preacutefeacuterences et actions passeacutees dun utilisateur ne sont pas forceacutement lesmeilleurs indicateurs de ses besoins actuels ou futurs

22 Les facteurs humains agrave prendre en compte dans la recom-

mandation

Comme nous lavons vu dans la section preacuteceacutedente la performance des premiers systegravemes derecommandation a eacuteteacute mesureacutee avec les outils du domaine de la recherche dinformation Parmiceux-ci on peut citer la preacutecision et le rappel qui sont deux mesures permettant de jauger la per-tinence des ressources seacutelectionneacutees en les comparant avec lensemble des ressources disponiblesLa Figure 21 preacutesente bien la maniegravere dont ces deux mesures sont calculeacutees 10

Figure 21 Preacutesentation scheacutematiseacutee du calcul de la preacutecision et du rappel en fonction desressources trouveacutees par rapport agrave lensemble des ressources disponibles (creacutedit image Datamok UserWalber)

Plusieurs raisons peuvent expliquer pourquoi les systegravemes de recommandations ont initiale-ment emprunteacute des techniques venant de la recherche dinformation et en voici trois parmi lesplus eacutevidentes Premiegraverement les systegravemes de recommandation sont agrave la croiseacutee de plusieurs

10 httpsfrwikipediaorgwikiPreacutecision_et_rappel

15

Chapitre 2 Eacutetat de lart

disciplines parmi lesquelles entre autres la recherche dinformation [Adomavicius and Tuzhilin2005] Ce domaine a beaucoup utiliseacute et utilise toujours les mesures de preacutecision et de rappel[Salton 1989] il est donc naturel que les premiers systegravemes de recommandation aient utiliseacuteces mesures de performance Deuxiegravemement tregraves tocirct dans le domaine des systegravemes de recom-mandation des corpus de donneacutees ont eacuteteacute mis agrave disposition de tous tel que MovieLens 11 gracircceagrave GroupLens [Resnick et al 1994] Ces corpus de donneacutees ont beaucoup aideacute le domaine enpermettant agrave tous les chercheurs de mesurer la performance de leurs algorithmes en les com-parant avec les reacutesultats obtenus par dautres eacutetudes de la litteacuterature sur les mecircmes donneacuteesLa populariteacute toujours haute du corpus MovieLens depuis maintenant 25 ans illustre linteacuterecirctscientique de partager des donneacutees initiales Cependant lutilisation principale des meacutetriquesde preacutecision pour eacutevaluer la performance des premiers systegravemes de recommandation a meacutecani-quement pousseacute les autres auteurs voulant comparer leurs algorithmes agrave utiliser eux aussi cesmecircmes meacutetriques rareacuteant potentiellement le travail sur dautres meacutetriques Troisiegravemement lemesure de la performance des algorithmes en fonction de la preacutecision megravene forceacutement agrave la creacutea-tion dalgorithmes de plus en plus performants dans ce domaine Les chercheurs sont en eet plusenclins agrave deacutevelopper des algorithmes optimisant la mesure de preacutecision si la performance de lamajoriteacute des algorithmes existants est mesureacutee via cette meacutetrique Ce point mecircme sil est lieacute aupreacuteceacutedent nest pas agrave neacutegliger et explique en partie la concentration des premiers systegravemes surla meacutetrique de preacutecision La recherche dans le domaine de linformatique est compeacutetitive et lesrevues scientiques accepteront plus facilement de publier un article montrant quun algorithmeobtient de meilleures performances sur une meacutetrique bien connue plutocirct quune eacutetude reposantsur dautres meacutetriques moins communes

Apregraves ces explications donnant quelques raisons systeacutemiques de lutilisation de la preacutecisioncomme mesure deacutevaluation il est neacutecessaire de nuancer ce constat La preacutecision a beaucoup eacuteteacuteutiliseacutee car avant toute chose elle est au cdivideur des systegravemes de recommandation et doit doncecirctre consideacutereacutee par tous ces systegravemes Le but de lutilisation de la preacutecision est dobtenir desrecommandations proches de ce que lutilisateur a deacutejagrave consulteacute et donc appreacutecie deacutejagrave Il est im-portant de preacuteciser aussi ici que malgreacute les critiques faites dans le paragraphe preacuteceacutedent sur cettemesure il est indispensable de la conserver et de lutiliser lors du processus de recommandationUn utilisateur souhaite avant tout se voir proposer des ressources pertinentes et il convient pourun systegraveme dutiliser la preacutecision pour arriver agrave cet objectif Il est cependant neacutecessaire de ne pasuniquement consideacuterer la preacutecision pour produire de bonnes recommandations et nous allons levoir dans la suite de cette section

Nous venons de voir quelques-unes des raisons de lomnipreacutesence de leacutevaluation par la preacuteci-sion au deacutebut des systegravemes de recommandation Nous allons maintenant eacutetudier les conseacutequencesque la sur-utilisation de la preacutecision a pu avoir sur les utilisateurs en se basant agrave la fois sur lalitteacuterature et sur des constatations empiriques Pour comprendre les limites de cette meacutetrique ilest tout dabord neacutecessaire de sinteacuteresser agrave ce que repreacutesente une recommandation preacutecise pourlutilisateur nal Nous lavons vu preacuteceacutedemment plus un modegravele sapproche des preacutefeacuterences deacutejagraveconnues dun utilisateur et plus il obtiendra de bonnes performances dans les meacutetriques mesurantla preacutecision Dans la pratique cela se traduit par le systegraveme proposant agrave lutilisateur nal desressources souvent deacutejagrave connues de celui-ci ou a minima des ressources tregraves proches de ce quilaime deacutejagrave [McNee et al 2006] Un utilisateur dun site de recommandation de lms indiquantquil a aimeacute le premier lm Star Wars se verra probablement recommander une liste de tous les

11 httpsgrouplensorgdatasetsmovielens

16

22 Les facteurs humains agrave prendre en compte dans la recommandation

lms Star Wars suivants Intuitivement on voit bien que ces recommandations ne seront proba-blement pas satisfaisantes pour lutilisateur bien queacutetant les plus preacutecises possibles par rapportagrave ses preacutefeacuterences Ces lms sont anciens connus et il ny a donc que tregraves peu de chances pour quelutilisateur nen ait pas deacutejagrave connaissance On peut imaginer que lutilisateur aurait souhaiteacuteque le systegraveme lui propose des lms de science-ction ou de guerre spatiale reacutecents ou du moinsquil ne connaissait pas encore Plus que de ne pas ecirctre utiles ce genre de recommandations peutmecircme deacutegrader linteacuterecirct et la conance que lutilisateur porte au systegraveme En eet un utilisa-teur recevant beaucoup de recommandations inutiles ou deacutejagrave connues de la part dun systegravemenira par ne plus lui accorder de limportance Cet argument peut ecirctre rapprocheacute du TechnologyAcceptance Model de Fred Davis sur la maniegravere dont les utilisateurs appreacutehendent une technolo-gie [Davis 1989] et notamment sur la notion dutiliteacute perccedilue qui fait reacutefeacuterence agrave la tendancequont les personnes agrave utiliser une technologie si cela leur permet de reacutealiser plus ecacementleur tacircche en cours (comme par exemple trouver un bon lm ou deacutecouvrir une nouvelle musique)Pour conclure il semble eacutevident que de nouvelles maniegraveres de concevoir et deacutevaluer les systegravemesde recommandation sont neacutecessaires Dans la suite de cette section nous allons voir commentlinteacutegration de facteurs humains suppleacutementaires dans le processus de recommandation et lamise en place de nouvelles maniegraveres deacutevaluer la qualiteacute des recommandations nales doiventpermettre de palier les problegravemes eacutevoqueacutes preacuteceacutedemment

221 La similariteacute

Comme nous lavons vu dans la section preacuteceacutedente limportance de la similariteacute dans lessystegravemes de recommandation est eacutevidente tant ces derniers ont longtemps eu comme but principalde proposer des ressources proches autrement dit similaires de ce quappreacuteciait deacutejagrave lutilisateurNous avons vu que la preacutecision a beaucoup eacuteteacute utiliseacutee pour eacutevaluer ces systegravemes mais il eacutetaitaussi neacutecessaire de deacuteterminer agrave quel point des ressources etou des utilisateurs eacutetaient prochesles uns des autres En eet les approches les plus utiliseacutees comme le ltrage collaboratif ou leltrage par contenu neacutecessitent souvent de deacuteterminer un ensemble dutilisateurs ou un ensemblede ressources proches des goucircts de lutilisateur Pour ce faire ces systegravemes vont utiliser desmeacutetriques permettant de juger la similariteacute de deux variables entre elles On retrouve parmi cesmeacutetriques le coecient de correacutelation de Pearson qui calcule la correacutelation lineacuteaire r entre deuxvariables agrave laide de leur covariance Cette correacutelation peut ecirctre appliqueacutee agrave des prols utilisateurs[Shardanand and Maes 1995] posseacutedant des eacutevaluations communes sur des ressources LEacutequation21 deacutecrit son calcul pour deux prols utilisateurs ux et uy

ruxuy =

sumn1 (uxi minus ux)times (uyi minus uy)radicsumn

1 (uxi minus ux)2 timessumn

1 (uyi minus uy)2(21)

ougrave n est le nombre de co-consultations des deux prols utilisateurs ux et uy uxi est une noteindividuelle du prol de lutilisateur ux et ux est la moyenne des notes dans le prol ux Classi-quement les eacutevaluations des ressources co-consulteacutees sont consideacutereacutees pour calculer la correacutelationde Pearson dont la valeur r isin [minus1 1] ougrave une valeur proche de 1 signie une correacutelation posi-tive entre les utilisateurs (autrement dit une forte similariteacute entre les deux) minus1 une correacutelationneacutegative (autrement dit une forte dissimilariteacute entre les deux utilisateurs) et 0 une absence decorreacutelation lineacuteaire entre les deux prols 12

12 Une valeur de correacutelation de Pearson r = 0 signie uniquement une absence de correacutelation lineacuteaire entre lesdeux variables eacutetudieacutees Il est cependant possible quune correacutelation non lineacuteaire existe entre ces deux variables

17

Chapitre 2 Eacutetat de lart

On peut aussi citer la tregraves utiliseacutee similariteacute cosinus permettant de calculer langle formeacute pardeux vecteurs Cette ideacutee a dabord eacuteteacute proposeacutee dans le domaine de la recherche dinformationan de comparer deux documents repreacutesenteacutes sous forme de vecteurs doccurrences de mots[Salton and McGill 1986] Cette mesure a ensuite eacuteteacute adapteacutee pour le ltrage collaboratif enremplacant les documents par les utilisateurs les mots par les ressources et les occurrences parles votes [Breese et al 2013] 13 Le calcul de la similariteacute cosinus est preacutesenteacute dans lEacutequation22

Cosine_Similarity(u1 u2) =

sumu1u2radicsumu21radicsum

u22(22)

ougrave comme pour le coecient de correacutelation de Pearson on considegravere uniquement les eacuteva-luations des ressources co-consulteacutees par les deux utilisateurs dans le calcul Beaucoup dautresmesures de similariteacute existent dans le cadre de la comparaison de deux variables entre elles etchacune possegravede des avantages et des inconveacutenients Lensemble de ces mesures ont cependantpour point commun de mesurer la similariteacute entre deux ressources uniquement et on peut tou-tefois apporter quelques critiques agrave ce genre de mesures En eet [McNee et al 2006] critiquejustement le fait que les mesures classiques calculent geacuteneacuteralement la preacutecision de chaque res-source recommandeacutee une par une Cependant limmense majoriteacute des recommandations sontproposeacutees via des listes agrave lutilisateur et non via une seule ressource On peut le voir chez tousles grands sites utilisant un systegraveme de recommandation tels que Netix 14 Youtube 15 Ama-zon 16 Deezer etc Cette maniegravere de calculer la preacutecision ressource par ressource peut provoquerleacutemergence de listes de recommandations posseacutedant des ressources toutes similaires entre ellesLe site de recommandation de lms proposant agrave un utilisateur la liste de tous les lms Star Warssoure de ce problegraveme Toutes ces recommandations sont preacutecises et similaires par rapport auxpreacutefeacuterences de lutilisateur mais les meacutetriques classiques ne donnent aucune indication sur ledegreacute de similariteacute de ces recommandations entre elles dans la liste proposeacutee agrave lutilisateur Unemaniegravere de mitiger ce problegraveme est de calculer la similariteacute non plus ressource par ressourcemais pour la liste entiegravere La similariteacute intra-liste permet justement de calculer agrave quel point lesressources dune liste sont similaires entre elles [Ziegler et al 2005] La similariteacute de chaque pairede ressources est calculeacutee et la moyenne est ensuite calculeacutee pour obtenir agrave une valeur uniquemesurant agrave quel point la liste dans son ensemble possegravede des ressources similaires entre elles

ILS(u) =

sumijisinL

sumikisinLij 6=ik sim(ij ik)

2(23)

ougrave ILSu est la similariteacute intra-liste dun utilisateur u ij et ik sont deux ressources de laliste recommandeacutee L et sim(ij ik) est la similariteacute des deux items ij et ik similariteacute pouvantecirctre calculeacutee dieacuteremment selon la meacutethode utiliseacutee (similariteacute cosinus similariteacute de Jaccardetc) Cette maniegravere de proceacuteder est inteacuteressante car premiegraverement elle deacutenote avec les mesuresclassiques et permet de proposer une liste plus homogegravene plaisante pour lutilisateur et nonplus uniquement sur les performances pures des systegravemes Deuxiegravemement le fait de consideacutererla liste de recommandations comme un tout et non plus uniquement comme des ressourcesaligneacutees les unes agrave la suite des autres permet de se rapprocher de la notion de seacutequence dontnous allons parler dans la suite de cette section Enn larticle de [McNee et al 2006] dont

13 Il est agrave noter quune variante de la mesure de similariteacute cosine sappliquant aux ressources et non auxutilisateurs a aussi eacuteteacute deacuteveloppeacutee14 httpswwwnetixcom15 httpswwwyoutubecom16 httpswwwamazoncom

18

22 Les facteurs humains agrave prendre en compte dans la recommandation

est tireacutee cette reacuteexion marque un tournant dans le domaine des systegravemes de recommandationavec la critique de la sur-utilisation de la similariteacute et linteacutegration dautres facteurs humainsToutefois dans le contexte de cette thegravese ce constat doit ecirctre nuanceacute En eet la similariteacute a eacuteteacutela meacutetrique reine pendant plusieurs anneacutees dans le domaine de la recommandation pour mesurerla performance des modegraveles Cette omnipreacutesence a provoqueacute lessor dun nouveau pan de larecherche portant sur dautres facteurs humains et dautres meacutetriques deacutevaluation Neacuteanmoinsla similariteacute reste une meacutetrique centrale dans la mesure des performances dun algorithme etdans la qualiteacute perccedilue des recommandations des utilisateurs comme lont montreacute les multitudesdeacutetudes utilisant principalement cette meacutetrique Il est donc naturel que cette meacutetrique soitinteacutegreacute dans notre modegravele comme un objectif Notre approche se veut cependant multi-objectifset nous allons preacutesenter dans la suite de cette section les autres objectifs agrave consideacuterer

222 La diversiteacute

La diversiteacute est une des meacutetriques ayant attireacute le plus lattention de la communauteacute scien-tique des recommandations ces derniegraveres anneacutees La diversiteacute est au cdivideur du changement deparadigme du domaine et larticle de McNee amp al justement intituleacute Being accurate is not en-ough how accuracy metrics have hurt recommender systems 17 repreacutesente bien ce changement[McNee et al 2006] Dans cet article les auteurs expliquent que jusqualors la majoriteacute desrecherches seacutetaient eacutetroitement concentreacutees sur lameacutelioration de la preacutecision des systegravemes Ilssoutiennent cependant que cet eacutetat de fait a nui au domaine en nencourageant pas les recherchesallant dans dautres directions et a aussi nui aux utilisateurs car les recommandations les pluspreacutecises ne sont pas forceacutement les meilleures pour ces derniers Mecircme si ce constat a eacuteteacute fait il y aplus dune deacutecennie la preacutecision est toujours tregraves utiliseacutee dans le domaine des recommandationsPar conseacutequent il nest pas rare de trouver des eacutetudes tregraves reacutecentes se deacutemarquant encore enprocircnant lutilisation dautres mesures [Gan et al 2020]

La diversiteacute et la similariteacute sont deux mesures extrecircmement lieacutees et ont souvent eacuteteacute deacutecritesensemble La similariteacute intra-liste preacutesenteacutee dans la section preacuteceacutedente est un exemple de ce lienpuisque cette mesure permet de faire varier le taux de similariteacute ou inversement de diversiteacutedune liste de ressources Dans [Smyth and McClave 2001] les auteurs soutiennent lideacutee quelorsque plusieurs ressources sont proposeacutees il est important de mesurer agrave la fois la similariteacutede chacune de ces ressources par rapport agrave la cible (pouvant ecirctre par exemple un modegraveleutilisateur) mais aussi la diversiteacute de chacune de ces ressources entre elles Le deacute revient alorsagrave ameacuteliorer la diversiteacute des ressources entre elles sans compromettre leur similariteacute par rapport agravela cible Les auteurs deacutenissent ainsi la diversiteacute dun ensemble de ressources (i1 in) commela dissimilariteacute moyenne entre toutes les paires de ressources illustreacute dans lEacutequation 24 ougrave ladissimilariteacute est deacutenie comme eacutetant linverse de la similariteacute

Diversity(i1 in) =

sumi=1n

sumj=1n(1minus Similarity(ii ij))

n2 lowast (nminus 1)

(24)

Il existe plusieurs interpreacutetations et deacutenitions de la diversiteacute dans les systegravemes de recom-mandation mais nous nutiliserons ici que la plus reacutepandue vue ci-dessus la diversiteacute sappliqueagrave un ensemble de ressources et correspond agrave la mesure moyenne de la dissimilariteacute par rapportagrave chacune dentre elles Pour compleacutementer cette deacutenition qui permet dintroduire une valeurgeacuteneacuterale de diversiteacute pour une liste de ressources nous pouvons preacutesenter ici la notion de diversiteacute

17 Ecirctre preacutecis nest pas susant comment les mesures de preacutecision ont nui aux systegravemes de recommandation

19

Chapitre 2 Eacutetat de lart

relative RD 18 qui consiste agrave calculer lapport en diversiteacute de chaque ressource i agrave un ensemblede ressources C 19 [Smyth and McClave 2001] La RD permet dobserver les changements dansla diversiteacute de la liste au moment mecircme de sa construction agrave chaque fois que le systegraveme ajouteune nouvelle ressource agrave la liste deacutejagrave existante La maniegravere de la calculer est expliqueacutee danslEacutequation 25

RD(i C) =

0 si C = sum

i=1m(1minus Similarity(i cj))

m sinon

(25)

La diversiteacute est aujourdhui reconnue comme une mesure importante agrave prendre en comptedans les systegravemes de recommandation car permettant dameacuteliorer la satisfaction de lutilisateur[Jones 2010] Cependant il est important de savoir utiliser la diversiteacute agrave bon escient et au bonmoment Comme lexemple donneacute dans lintroduction agrave propos des appareils photos le montraitlinteacuterecirct de la diversiteacute dans la recommandation deacutepend de nombreux facteurs comme lutilisa-teur son ancienneteacute dans le systegraveme le contexte de sa visite le moment de la recommandationetc Certains travaux se sont ainsi concentreacutes sur la dimension temporelle de la diversiteacute et surlimpact que cette derniegravere avait selon le contexte de la recommandation On peut citer [Mc-Ginty and Smyth 2003] dont leurs travaux portent sur le rocircle de la diversiteacute dans les systegravemesde recommandation conversationnels 20 et sur linteacuterecirct dapporter de la diversiteacute dans ce genrede systegravemes Les auteurs ont ainsi montreacute que lajout de diversiteacute durant le processus de re-commandation eacutetait beacuteneacuteque pour lutilisateur Cependant ils ont aussi montreacute que mecircme silinteacuterecirct de la diversiteacute est indeacuteniable il nest pas forceacutement justieacute dintroduire de la diversiteacuteagrave chaque recommandation sous peine de nuire agrave lecaciteacute du systegraveme [Castagnos et al 2013]De la mecircme maniegravere on peut rappeler les travaux de [Castagnos et al 2010] prouvant quilest beacuteneacuteque pour lutilisateur de se voir proposer des recommandations diverses juste avant unachat sur un site de-commerce

223 La nouveauteacute

La nouveauteacute est un facteur humain qui sous la mecircme impulsion que la diversiteacute est ap-parue comme une reacuteponse possible au problegraveme de la sur-utilisation de la preacutecision Mecircme siles deux mesures de diversiteacute et de nouveauteacute sont lieacutees il convient de ne pas les confondreLa nouveauteacute dune ressource se deacutenit geacuteneacuteralement par rapport aux autres ressources deacutejagraveconsulteacutees par lutilisateur La notion de diversiteacute sapplique quant agrave elle agrave un ensemble deressources en deacuteterminant si elles sont diverses les unes par rapport aux autres [Castells et al2015] La nouveauteacute reacutepond de plus agrave un besoin bien speacutecique de lutilisateur En eet etcomme lexpliquent [Vargas and Castells 2011] dans la majoriteacute des sceacutenarios le but dune re-commandation est de faire deacutecouvrir agrave lutilisateur des ressources quil naurait pas deacutecouvertesautrement Les auteurs preacutecisent aussi que la nouveauteacute est une caracteacuteristique importante dansun systegraveme de recommandation car elle contribue agrave diminuer la preacutevisibiliteacute des recommanda-tions et donc agrave maintenir linteacuterecirct des utilisateurs pour le systegraveme En partant de ce principeles recommandations eacutevidentes ne sont pas forceacutement de grande utiliteacute mecircme si elles possegravedentun haut niveau de preacutecision avec les preacutefeacuterences de lutilisateur On peut illustrer ce point en

18 RD pour Relative Diversity19 C pour Class soit classeensemble de ressources20 Un systegraveme de recommandation conversationnel consiste en un systegraveme interactif qui va dialoguer avec

lutilisateur sous la forme deacutechange de propositions et de critiques de ces propositions par ce dernier [Mahmoodand Ricci 2009]

20

22 Les facteurs humains agrave prendre en compte dans la recommandation

citant le classique exemple du fan de musique rock qui apregraves avoir eacutecouteacute quelques musiquesde lalbum Dark Side of the Moon de Pink Floyd se voit recommander le reste des musiquesde lalbum En terme de preacutecision la recommandation est quasi parfaite mais lutiliteacute dunetelle recommandation peut laisser agrave deacutesirer On retrouve le mecircme constat chez [Zhang 2013] ougravelomnipreacutesence de la preacutecision et de ses mesures y est critiqueacutee Les auteurs proposent ainsi unedeacutenition de la nouveauteacute en deacutenissant les trois caracteacuteristiques quune ressource doit posseacutederpour ecirctre consideacutereacutee comme nouvelle pour un utilisateur

1 Inconnue la ressource doit ecirctre inconnue de lutilisateur

2 Satisfaisante la ressource doit ecirctre satisfaisante par rapport aux besoins de lutilisateur

3 Dissimilaire la ressource doit ecirctre dissimilaire aux autres ressources que lutilisateur ap-preacutecie

En utilisant les 3 caracteacuteristiques eacutenonceacutees ci-dessus les auteurs ont ensuite proposeacute deacutevaluerla nouveauteacute dune ressource i pour un utilisateur u comme preacutesenteacute dans lEacutequation 34

Novelty(i u) = p(i|unknown u) middot dis(i prefu) middot p(i|like u) (26)

ougrave p(i|unknown u) est la probabiliteacute que lutilisateur u ne connaisse pas la ressource idis(i prefu) est la dissimilariteacute entre i et lensemble des ressources consulteacutees par lutilisateur etp(i|like u) est la probabiliteacute que u appreacutecie i On retrouve ainsi dans cette maniegravere de mesurerla nouveauteacute les 3 caracteacuteristiques mises en avant par [Zhang 2013] pour que le score de nou-veauteacute dune ressource soit haut elle doit ecirctre pour lutilisateur agrave la fois inconnue satisfaisanteet dissimilaire avec ce quil a lhabitude de voir

De reacutecentes eacutetudes ont exploreacute plus avant le lien entre nouveauteacute et satisfaction de lutilisateurNous pouvons citer ici [Schnabel et al 2018] ougrave les auteurs ont testeacute limpact de nouvellesrecommandations par rapport agrave lexploitation des preacutefeacuterences deacutejagrave connues des utilisateurs Ilsen concluent quune petite dose de nouveauteacute permet dameacuteliorer la satisfaction de lutilisateurmais que trop de ressources nouvelles nuisent fortement agrave sa satisfaction

224 Discussion

Au travers de ces quelques exemples un changement de vision dans le domaine de la re-commandation a eacuteteacute illustreacute Dun domaine ougrave la majeure partie des eacutetudes eacutetait initialementconcentreacutee sur la maximisation dune seule meacutetrique la preacutecision [Ricci et al 2015] nous avonsvu que de plus en plus de travaux sinteacuteressaient agrave dautres maniegraveres de proposer des recomman-dations Ainsi on peut deacutesormais trouver pleacutethore deacutetudes tentant de trouver des compromisentre plusieurs des facteurs discuteacutes ci-dessus comme la preacutecision et la diversiteacute [Ziegler et al2005 LHuillier et al 2014] ou encore entre la preacutecision la seacuterendipiteacute 21 et la nouveauteacute [Ka-minskas and Bridge 2016] Ces nouvelles maniegraveres de proceacuteder ont pour but didentier lesfacteurs explicatifs de la satisfaction des utilisateurs an de les prendre en compte dans des mo-degraveles plus complexes et plus geacuteneacuteraux

Il est cependant important de noter que outre ceux citeacutes dans les sections preacuteceacutedentes denombreux autres facteurs humains ont eacuteteacute eacutetudieacutes dans la litteacuterature pour reacutepondre au problegraveme

21 La notion de seacuterendipiteacute fait reacutefeacuterence agrave lheureuse deacutecouverte soit le fait de deacutecouvrir par hasard quelquechose dinteacuteressant qui naurait potentiellement pas eacuteteacute deacutecouvert sans aide [Iaquinta et al 2008]

21

Chapitre 2 Eacutetat de lart

de la satisfaction utilisateur et de la sur-utilisation de la preacutecision On peut citer la seacuterendipiteacutela couverture le contexte la personnaliteacute de lutilisateur Nous avons fait le choix de nous ba-ser sur 4 facteurs couramment dans la litteacuterature an de tester la probleacutematique de cette thegravesesur la recommandation multi-objectifs La multitude de facteurs humains eacutetudieacutes ces derniegraveresanneacutees pour enrichir les recommandations soulignent agrave quel point il est important de nos joursde penser des modegraveles geacuteneacuteriques capables dinteacutegrer de nouveaux facteurs humains agrave la demande

Cette premiegravere grande section de leacutetat de lart a montreacute que le domaine de la recommanda-tion est passeacute dun problegraveme doptimisation mono-objectif agrave un problegraveme doptimisation multi-objectifs Un systegraveme de recommandation agrave lheure actuelle se doit de prendre en compte lesfacteurs humains tels que ceux preacutesenteacutes dans les sections preacuteceacutedentes an decirctre performant etcapable de satisfaire le plus grand nombre de type dutilisateurs dans le maximum de situationspossibles Cest dans ce contexte multi-objectif que cette thegravese se positionne Dans la deuxiegraveme etderniegravere grande section de cet eacutetat de lart nous allons preacutesenter et comparer dieacuterentes maniegraveresde proposer des recommandations agrave lutilisateur la recommandation unitaire la recommanda-tion en liste et la recommandation en seacutequences Nous allons notamment nous attarder sur leslistes et les seacutequences car elles sont les plus agrave mecircmes de fournir des recommandations complexesinteacutegrant de multiples objectifs

23 La recommandation en seacutequence

231 Deacutenition et geacuteneacuteraliteacutes sur les seacutequences

Pour comprendre linteacuterecirct des seacutequences il est neacutecessaire de sattarder sur les listes En eetdegraves les premiers systegravemes de recommandation les utilisateurs se sont la plupart du temps vuproposer soit des ressources uniques soit des listes de ressources On peut deacutenir une liste ainsi

Dans le domaine de la recommandation une liste est un ensemble de res-sources ordonneacutees selon un ou plusieurs critegraveres orant agrave lutilisateur lechoix de consulter ces ressources indeacutependamment les unes des autres

Preacutesenter une liste de recommandations a ainsi pour but de proposer les ressources ayantobtenu le score le plus haut selon un ou plusieurs critegraveres choisis par le systegraveme pour produiredes recommandations Comme nous lavons vu dans la section preacuteceacutedente un des critegraveres les plusutiliseacutes eacutetait originellement la preacutecision Lautre speacuteciciteacute dune liste est dorir agrave un utilisateurplusieurs ressources adapteacutees agrave ses preacutefeacuterences agrave un temps t Ainsi le but nest pas moins desatisfaire lobjectif agrave moyenlong terme de lutilisateur que de simplement lui proposer une listede ressources alternatives adapteacutees agrave son prochain choix Autrement dit le but dune liste derecommandations est de satisfaire les besoins dun utilisateur au temps t+ 1 (soit agrave sa prochaineaction) Le format des listes a donc souvent eacuteteacute utiliseacute car il permet agrave la fois de maximiser leschances de satisfaire lutilisateur tout en tirant parti des meacutecanismes internes de production derecommandations geacuteneacuterant la plupart du temps des listes de ressources de la plus preacutecise agrave lamoins preacutecise pour chaque utilisateur Ce mode de repreacutesentation de par sa capaciteacute agrave pro-poser des alternatives se rapproche deacutejagrave un peu plus du cadre de notre travail doptimisationmulti-critegraveres contrairement aux recommandations unitaires Il nest donc pas question ici deremettre en cause linteacuterecirct dutiliser des listes de ressources comme format de recommandationsces derniegraveres eacutetant adapteacutees agrave de nombreux domaines dapplication De tregraves populaires sites

22

23 La recommandation en seacutequence

de-commerce ou de divertissement utilisent dailleurs principalement des recommandations parlistes comme Netix Youtube ou encore Amazon Un client sur un site de-commerce pourrapar exemple ecirctre satisfait de se voir proposer par le systegraveme une liste darticles similaires agrave sesrecherches an de laider dans son choix Cependant certains domaines peuvent ne pas beacuteneacuteciervoire ecirctre desservis par ce format de recommandation On peut ici agrave nouveau rappeler lexempledirecteur de lintroduction agrave ce sujet ougrave un apprenant se voyait proposer une liste de ressourceseacuteducatives toutes similaires au cours quil avait deacutejagrave suivi sans tenir compte de sa progression nide ses objectifs De la mecircme maniegravere un visiteur dun museacutee ne sera pas forceacutement satisfait de sevoir proposer une liste de 10 divideuvres dart similaires agrave ce quil vient de voir mais potentiellementeacuteparpilleacutees dans tous le museacutee Dans ces deux exemples on devine bien que dautres maniegraveresde proposer les recommandations seraient beacuteneacuteques Cest ici que lon peut deacutenir la notion deseacutequence qui pourrait permettre de reacutepondre agrave des situations ougrave une liste de ressources nest passusante pour satisfaire lutilisateur et ougrave la composante temporelle entre en ligne de compte

Dans le domaine de la recommandation une seacutequence est une suite de res-sources permettant datteindre un ou plusieurs objectifs speacutecieacutes ou nonpar lutilisateur (eg une compeacutetence speacutecique la sortie dun museacutee unapprentissage des recommandations diverses pour un parcours eacuteclectiqueetc) Une seacutequence possegravede donc un deacutebut une n et une progression deacute-nie sous forme dun ordonnancement temporel Une seacutequence est reacutegiepar les objectifs agrave atteindre ces derniers eacutetant speacutecique au domaine et agravelutilisateur

Une seacutequence peut donc ecirctre vue comme une liste ameacutelioreacutee de ressources prenant uncompte un nombre plus grand de variables et une dimension temporelle dans le but de mieuxsatisfaire lutilisateur Nous allons ici deacutetailler la notion de progression qui est importante dansune seacutequence Le principe dune seacutequence reacuteside dans lexistence dau moins un objectif agrave at-teindre et cest ce qui la dieacuterencie dune liste Comme nous lavons vu une liste de ressourcesna pas fondamentalement dobjectif agrave atteindre si ce nest satisfaire lutilisateur agrave t + 1 en luiproposant des ressources adapteacutees De part la notion dobjectif agrave atteindre une seacutequence a pourbut de satisfaire les besoins de lutilisateur non plus agrave t + 1 mais agrave t + n Il nest donc plusquestion daider lutilisateur pour sa prochaine action mais bien daider lutilisateur agrave atteindreun objectif plus complexe qui neacutecessitera n actions ou paliers intermeacutediaires Avec ces deux deacute-nitions on se rend bien compte que les notions de liste et de seacutequence ne sont pas opposeacutees maiscompleacutementaires Certains domaines ne neacutecessitent pas forceacutement lutilisation de seacutequences carlutilisateur naura pas dobjectif agrave moyenlong terme agrave satisfaire (ex la recherche dun lmsur une plateforme de videacuteos agrave la demande) tandis que dans dautres domaines une liste serainsusante pour satisfaire lutilisateur (ex e-eacuteducation heacuteritage culturel playlist musicale)De la mecircme maniegravere il nest pas neacutecessaire de recommander des seacutequences agrave un utilisateur si cedernier na pas dobjectif agrave atteindre et souhaite simplement une aide pour sa prochaine actionet ce mecircme si le domaine dapplication est propice agrave lutilisation de seacutequences

Linteacuterecirct des seacutequences na pas eacutechappeacute aux chercheurs du domaine des systegravemes de recom-mandation qui les ont consideacutereacute comme eacutetant un moyen suppleacutementaire permettant de mieuxsatisfaire lutilisateur Cette prise de conscience sest dailleurs deacutemocratiseacutee au mecircme momentque la prise en compte des facteurs humains autre que la preacutecision dans larticle deacutejagrave citeacute preacute-ceacutedemment [McNee et al 2006] Ainsi on peut lire en 2004 dans le tregraves complet article sur

23

Chapitre 2 Eacutetat de lart

leacutevaluation des systegravemes de recommandation de [Herlocker et al 2004] une liste des tacircchesusuelles que doivent reacutealiser ces systegravemes Dans cette liste se trouve entre autres une reacuteexiondes auteurs sur la recommandation de seacutequences dans le cadre de lutilisation dun site deacutecoutede musiques en ligne

[] Cependant le deacute que repreacutesente le fait de passer dune recommandation dune seulemusique agrave une recommandation dune seacutequence de musiques satisfaisante dans son ensemblenous a intrigueacute Cette mecircme tacircche peut sappliquer agrave la recommandation darticles de recherchean dappreacutehender un domaine (lire cette introduction puis lire cette eacutetude ) Alors que ledomaine de la recherche dinformation a exploreacute le timing et les seacutequences dachat de produitsnous navons connaissance daucun systegraveme de recommandation ou de recherche sattelant direc-tement agrave la reacutesolution de cette tacircche (ie la recommandation en seacutequences)

Les auteurs expliquent donc clairement ici que la recommandation de seacutequences mecircme sielle navait pas encore eacuteteacute traiteacutee agrave leacutepoque eacutetait un point inteacuteressant agrave deacutevelopper et pouvaitsatisfaire des besoins speacuteciques comme la recommandation de musiques en ligne ou encore lac-quisition de nouvelles connaissances en ligne La premiegravere partie de leur reacuteexion qui na pas eacuteteacutetraduite ici sur les speacuteciciteacutes des recommandations musicales sera eacutetudieacutee plus en deacutetail dans lechapitre suivant Mecircme si les recommandations de ressources uniques ou de listes de ressourcessont resteacutees tregraves largement majoritaires dans le domaine quelques travaux se sont tout de mecircmeatteleacutes au problegraveme des seacutequences Il est tout dabord neacutecessaire de distinguer deux utilisationsde la notion de seacutequence dans la litteacuterature lutilisation de seacutequences deacutejagrave existantes en entreacuteedun systegraveme et la production de seacutequences en sortie dun systegraveme Dans la suite de cette sec-tion nous allons eacutetudier ces deux maniegraveres de proceacuteder ainsi que leurs avantages et inconveacutenients

Comme nous lavons vu dans la majoriteacute des cas les systegravemes de recommandation se basentsur la matrice deacutevaluations utilisateurs times ressources pour preacutedire les ressources encore nonconsulteacutees pouvant inteacuteresser lutilisateur Cependant mecircme si elle permet lapplication de nom-breuses et puissantes meacutethodes de preacutediction que nous ne deacutetaillerons pas ici 22 lutilisationdune matrice ne permet pas en leacutetat de tenir compte de lordre dans lequel les ressources onteacuteteacute consulteacutees ni de distinguer les variances agrave court ou moyen-terme des prols utilisateurs [Qua-drana et al 2018] De la mecircme maniegravere une cellule de cette matrice rui repreacutesente uniquementune eacutevaluation r dun utilisateur u sur une ressource i pouvant cacher une reacutealiteacute plus complexeougrave un utilisateur a consulteacute plusieurs fois cette ressource au cours du temps potentiellement dansdieacuterents contextes et avec une eacutevaluation dieacuterente agrave chaque fois Pour remeacutedier agrave ce problegravemedes approches agrave base de tenseurs ont eacuteteacute proposeacutees permettant dutiliser plusieurs matrices re-preacutesentant dieacuterents moments ou critegraveres dans le prol de lutilisateur [Frolov and Oseledets2017] Il est donc clair que les seacutequences de consultation contiennent des informations richespouvant ecirctre exploiteacutees dans un systegraveme de recommandation Lexploitation de lordre des res-sources dans des seacutequences nest cependant pas nouvelle et provient principalement du domainede la recherche dinformation [Agrawal et al 1995] Aujourdhui on retrouve lexploitation delordre des seacutequences dans de nombreux autres domaines comme la fouille de motifs seacutequentielsou encore la reconnaissance de la parole [Han et al 2007] Lexplosion des services proposeacutes parla deacutemocratisation dInternet et du numeacuterique en geacuteneacuteral ces derniegraveres anneacutees a ameneacute la recom-mandation agrave sadapter agrave de nombreux domaines ougrave lordre dans lequel les utilisateurs reacutealisent

22 On peut par exemple citer les techniques de factorisation de matrice qui dominent le domaine [Koren et al2009]

24

23 La recommandation en seacutequence

des actions a de limportance Ces systegravemes de recommandation portant une attention particu-liegravere aux seacutequences sont regroupeacutes sous le terme de systegravemes de recommandation sensiblesaux seacutequences (sequence-aware recommender system) [Quadrana et al 2018] Dans leur tourdhorizon du domaine les auteurs proposent une vue densemble de la maniegravere dont un systegravemede recommandation sensible aux seacutequences fonctionne agrave laide dun scheacutema en 3 parties preacutesenteacutepar la Figure 22

Figure 22 Vue densemble du fonctionnement dun systegraveme de recommandation sensible auxseacutequences (source [Quadrana et al 2018])

Dans la Figure 22 on peut donc bien distinguer 3 parties distinctes dans le fonctionnementinterne dun systegraveme de recommandation sensible aux seacutequences

1 Les entreacutees les entreacutees se caracteacuterisent par des donneacutees relatives aux actions eectueacuteespar les utilisateurs du systegraveme Ces actions doivent ecirctre classeacutees selon lordre dans lequelelles ont eacuteteacute eectueacutees par chaque utilisateur an de pouvoir exploiter toutes les infor-mations disponibles (si les actions ne sont pas reccedilues de maniegravere ordonneacutee ces derniegraveresdoivent au minimum ecirctre associeacutees agrave un timestamp agrave une date preacutecise pour pouvoir ecirctrereacute-ordonneacutees et traiteacutees dans le bon ordre par le systegraveme de recommandation)

2 Le processus de recommandation le processus de recommandation est geacuteneacuteralementdieacuterent des systegravemes de recommandation classiques utilisant des matrices 23 mais leprincipe geacuteneacuteral reste le mecircme utiliser lensemble des informations fournies par les entreacuteespour produire des recommandations adapteacutees agrave lutilisateur nal On retrouve dans cettepartie les tacircches purement lieacutees agrave la recommandation la prise en compte des facteurshumains du contexte eacuteventuellement des contraintes sil y en a etc Dans la Figure 22les auteurs distinguent 4 types de tacircches lieacutees aux systegravemes de recommandation sensiblesaux seacutequences Nous discuterons de ces 4 tacircches dans la suite de ce manuscrit lors de lapreacutesentation du modegravele et des expeacuterimentations meneacutees pour le tester

23 Mecircme si quelques modegraveles utilisant agrave la fois des seacutequences et des meacutethodes de factorisation de matrices onteacuteteacute proposeacutes ces derniegraveres anneacutees [Yu and Riedl 2012 Zhao et al 2014 Twardowski 2016 Chen and Li 2019]

25

Chapitre 2 Eacutetat de lart

3 Les sorties les auteurs distinguent ici deux types de sorties possibles Le premier typede sortie concerne dabord les listes ordonneacutees de ressources que nous avons deacutejagrave expli-citeacutees auparavant dans ce manuscrit Une liste aura pour but de proposer agrave lutilisateurun ensemble de ressources ordonneacutees de la meilleure agrave la moins bonne selon une ou plu-sieurs meacutetriques speacuteciques Une liste propose dans les faits un ensemble dalternatives dechoix possibles que le systegraveme met agrave disposition de lutilisateur an que ce dernier puissechoisir une (ou eacuteventuellement plusieurs) ressource(s) parmi toutes celles proposeacutees Cepremier type de sortie est donc identique aux systegravemes de recommandation classiques Ledeuxiegraveme type de sortie concerne les seacutequences de ressources Contrairement aux listesconsistant en un ensemble dalternatives les ressources dune seacutequence ont pour but decirctretoutes consulteacutees dans lordre donneacute par le systegraveme Lagrave ougrave pour les listes une recomman-dation consiste en une ressource pour les seacutequences une recommandation consiste en unesuite de ressources agrave consulter dans lordre proposeacute Ainsi une seacutequence peut ecirctre consi-deacutereacutee comme une unique recommandation de la mecircme maniegravere que dans une liste chaqueressource est une recommandation unique

232 Domaines dapplication des modegraveles seacutequentiels

Comme nous lavons expliqueacute auparavant il est eacutevident que certains domaines dapplicationssont adapteacutes aux systegravemes de recommandation sensibles aux seacutequences comme par exemple lamusique ou le tourisme [Nurbakova et al 2018] Inversement certains domaines semblent moinsbeacuteneacutecier de tels systegravemes Le domaine de le-commerce est un cas particulier dans le sens ougraveil a vu un grand nombre de ces systegravemes y ecirctre testeacutes quand bien mecircme il semble agrave premiegraverevue ecirctre moins adapteacutes aux seacutequences Deux raisons peuvent expliquer cet eacutetat de fait Premiegrave-rement il a statistiquement eacuteteacute prouveacute que la tregraves grande majoriteacute des clients consultant un sitede-commerce ne le font en reacutealiteacute que dans le but de trouver un seul produit speacutecique avantde quitter le site [Qiu et al 2015] Deuxiegravemement le domaine de le-commerce est geacuteneacuteralementtregraves repreacutesenteacute dans les systegravemes de recommandation [Quadrana et al 2018] potentiellement ducircaux forts inteacuterecircts nanciers et agrave lancienneteacute de lutilisation de ce domaine dapplication Dansla suite de cette section nous allons nous inteacuteresser agrave quelques exemples de systegravemes sensiblesaux seacutequences dans les domaines de la musique et du tourisme an dillustrer leacutetat du domaineainsi que les directions potentielles pour de futurs travaux

Dans le domaine musical

Le domaine de la musique est un deacuteboucheacute naturel des systegravemes de recommandation sinteacute-ressant aux seacutequences autant quand il sagit dexploiter les seacutequences creacuteeacutees par les utilisateursque lorsquil sagit den produire en sortie dun systegraveme Cet eacutetat de fait sexplique par la speacuteci-citeacute du domaine musical ougrave les utilisateurs eacutecoutent tregraves souvent plusieurs musiques les unes agravela suite des autres Ces utilisateurs produisent des seacutequences signicatives de par leurs eacutecoutes etpeuvent ecirctre demandeurs de seacutequences de musiques ou playlists adapteacutees agrave leurs preacutefeacuterences Ilnest donc pas eacutetonnant de trouver degraves le deacutebut des anneacutees 2000 dans la litteacuterature des travauxportant sur ce sujet Les travaux de leacutepoque souraient cependant dun certain nombre de pro-blegravemes comme un manque de personnalisation et dexpressiviteacute ou encore des diculteacutes pourgeacuterer le grand nombre de musiques des catalogues en ligne problegravemes qui ont par la suite eacuteteacutereacutesolus avec la production de nouveaux systegravemes et laugmentation de la puissance de calcul desmachines [Aucouturier and Pachet 2002] On peut cependant aussi trouver des eacutetudes dont le

26

23 La recommandation en seacutequence

but eacutetait dexploiter les caracteacuteristiques speacuteciques du domaine musical pour proposer des adap-tations des techniques classiques de recommandation utiliseacutees dans le-commerce [Logan 2002]Plus reacutecemment le domaine des recommandations musicales a beaucoup gagneacute en populariteacutecomme lillustre le ceacutelegravebre ACM RecSys Challenge dont leacutedition 2018 en partenariat avec Spo-tify 24 sest porteacutee sur la musique avec comme challenge de creacuteer un systegraveme capable de prolongerdes playlists deacutejagrave existantes 25 Au total plus de 100 eacutequipes ont participeacute agrave ce deacute et plus de15 articles ont eacuteteacute publieacutes Voici un court reacutesumeacute des 4 approches ayant eacuteteacute les plus performantes

[Volkovs et al 2018] ont proposeacute un modegravele en deux eacutetapes baseacute sur des meacutethodes deltrage collaboratif utilisant la factorisation de matrice (Weighted Regularized Matrix Fac-torization[Hu et al 2008]) et de renforcement de gradient (gradient boosting) La premiegravereeacutetape est optimiseacutee pour reacutecupeacuterer rapidement une liste de musiques candidates tandisque le deuxiegraveme stage reacuteordonne ces musiques en maximisant la preacutecision au deacutebut de laliste ainsi creacuteeacutee [Rubtsov et al 2018] ont proposeacute une approche relativement similaireavec un modegravele posseacutedant aussi deux eacutetapes la premiegravere utilisant des techniques de l-trage collaboratif pour seacutelectionner des candidats potentiels et la deuxiegraveme utilisant uneplaylist avec ces candidats agrave laide de techniques de renforcement de gradient

[Yang et al 2018] ont proposeacute un modegravele multimodal de ltrage collaboratif en deuxparties utilisant chacune des reacuteseaux de neurones (autoencoder pour la premiegravere partie etreacuteseau neuronal convolutif pour la deuxiegraveme partie) Le but des auteurs eacutetait de prendreen compte 3 des problegravemes les plus communs aux systegravemes de recommandation musicauxagrave savoir (1) le problegraveme du deacutemarrage agrave froid (2) les biais de populariteacute ougrave des musiquesse retrouvent soit dans la plupart des playlists soit dans tregraves peu dentre elles (3) et ennle contexte de la playlist originale (autrement dit le fait dutiliser les preacutefeacuterences agrave courtterme de lutilisateur dans la session deacutecoute en cours pour continuer du mieux possiblela playlist)

[Antenucci et al 2018] ont proposeacute une approche mecirclant agrave la fois des techniques de l-trage collaboratif et de ltrage par contenu Les preacutedictions de ces dieacuterentes techniquessont ensuite agreacutegeacutees ensemble dans le but de maximiser la qualiteacute de la recommandation

On peut remarquer que ces 4 approches ayant obtenu les 4 premiegraveres places de la compeacute-tition possegravedent des points communs et orent des perspectives inteacuteressantes sur la maniegraverede concevoir des systegravemes de recommandation performants dans ce domaine Premiegraverementon remarque que toutes ces approches sont relativement complexes et utilisent des meacutethodesvarieacutees pour la recommandation (ltrage collaboratif ltrage par contenu factorisation de ma-trice reacuteseaux neuronaux gradient boosting etc) prouvant que les systegravemes de recommandationperformants utilisent plus que jamais des techniques hybrides Deuxiegravemement chacune de ces 4approches propose un modegravele en deux parties La premiegravere partie est geacuteneacuteralement utiliseacutee pourseacutelectionner un certain nombre de candidats parmi les 22 millions de musiques disponibles quiavaient eacuteteacute mises agrave disposition et ce an de limiter lespace de recherche et donc le temps decalcul La deuxiegraveme partie consiste en la creacuteation de la playlist nale baseacutee sur les candidats deacutejagraveseacutelectionneacutes Cette partie peut potentiellement ecirctre plus complexe dun point de vue algorith-mique car lespace de recherche est beaucoup plus restreint quinitialement

Par ailleurs chacune de ces 4 approches a aussi tenteacute de prendre en compte un maximum

24 https wwwspotifycom25 http wwwrecsyschallengecom2018

27

Chapitre 2 Eacutetat de lart

dinformations an de satisfaire au mieux lutilisateur (caracteacuteristiques des musiques preacutecisiondiversiteacute contexte de la playlist initiale utilisation de la session deacutecoute en cours) validantainsi lapproche deacuteveloppeacutee depuis le deacutebut de ce manuscrit qui consiste agrave prendre en compte unmaximum dobjectifs associeacutes agrave des facteurs humains dans la recommandation Cette constata-tion se retrouve aussi chez [Jannach et al 2016] ougrave les auteurs expliquent que le but des systegravemesde recommandation dans le domaine de la musique est dacqueacuterir et dexploiter des informationssuppleacutementaires agrave propos des musiques an de comprendre le thegraveme sous-jacent des playlistscreacuteeacutees par les utilisateurs [] Le but ultime serait ainsi de concevoir de nouvelles approchesalgorithmiques qui seraient explicitement conccedilues pour creacuteer des playlists correspondant agrave une ouplusieurs caracteacuteristiques signicatives pour lutilisateur En dehors des facteurs humains deacutejagravedeacuteveloppeacutes au deacutebut de cette section (similariteacute diversiteacute nouveauteacute) les auteurs explicitentces caracteacuteristiques signicatives comme pouvant aussi ecirctre lhomogeacuteneacuteiteacute de la playlist dansson ensemble ou encore les transitions entre chacune des musiques dune playlist Le but seraitdonc ici de reacuteussir agrave creacuteer des playlists semblables agrave ce quun ecirctre humain pourrait faire tout entenant compte au maximum des besoins en similariteacute diversiteacute et nouveauteacute [Quadrana et al2018] deacuteveloppent aussi cette ideacutee en expliquant quun systegraveme de recommandation musical peutsoit proposer des musiques correspondant dune maniegravere geacuteneacuterale au thegraveme de la playlist soitproposer une playlist avec un ordre speacutecique permettant de garantir des transitions douces entrechaque musique comme par exemple une augmentation graduelle du tempo Les notions de pro-gression et de transitions douces dans une playlist correspondent agrave la deacutenition dune seacutequencedonneacutee plus haut dans le manuscrit et sont donc particuliegraverement inteacuteressantes dans le cadre decette thegravese Il est cependant agrave noter que dans le domaine des recommandations musicales undeacutebat est reacutecemment apparu sur limportance de lordre des musiques dans les recommandationsde playlist En eet une eacutetude exploratoire reacutecente a montreacute que si les utilisateurs jugent posi-tivement un systegraveme recommandant des musiques diverses et nouvelles ces derniers ne portaientque peu dinteacuterecirct agrave lordre dans lequel les musiques eacutetaient proposeacutees (voire dans certains casne percevaient mecircme pas dordre speacutecique dans les recommandations) [Tintarev et al 2017]Mecircme si cette eacutetude na porteacute que sur 20 participants les reacutesultats obtenus sont inteacuteressantset soulignent agrave quel point chaque domaine agrave des particulariteacutes propres dont il est neacutecessairede tenir compte pour la conception dun systegraveme de recommandation sensible aux seacutequencesPour renforcer encore cette derniegravere constatation nous allons nous inteacuteresser dans la prochainesous-section aux systegravemes de recommandation touristiques

Dans le domaine touristique

Le domaine du tourisme a lui aussi vu sa populariteacute croicirctre dans la litteacuterature gracircce agrave lexplo-sion des teacuteleacutephones portables et tablettes orant un nouveau support pour les recommandationsDe la mecircme maniegravere que pour le domaine de la musique le tourisme a vu ses premiegraveres appli-cations de recommandation apparaicirctre au deacutebut des anneacutees 2000 Dans [Cheverst et al 2000]par exemple les auteurs ont deacuteveloppeacute un guide mobile permettant daider les visiteurs de laville de Lancaster en leur fournissant des informations contextuelles (localisation date heure dela journeacutee ouvertures et fermetures dattractions heures de visites etc) ainsi quen proposantau visiteur plusieurs services comme avoir plus dinformations sur un monument ou geacuteneacuterer unparcours prenant en compte ces informations contextuelles Cette eacutetude a permis de proposer unstandard dans la recommandation touristique comme la prise en compte du contexte et eacutetaittregraves complegravete pour son eacutepoque mecircme si lon peut critiquer labsence dun modegravele utilisateurne permettant pas de prendre en compte les besoins speacuteciques de chaque visiteur Toujours audeacutebut des anneacutees 2000 nous pouvons aussi citer [Chou et al 2005] dont les auteurs ont modeacuteliseacute

28

23 La recommandation en seacutequence

agrave laide dun systegraveme de repreacutesentation de connaissances (OWL pour Web Ontology Language)les inteacuterecircts dun visiteur ainsi que les divideuvres dun museacutee dans un systegraveme de recommandationproposant des parcours Il est agrave noter que dans cette eacutetude les auteurs ont pu prouver que letemps passeacute par un visiteur devant un objet eacutetait positivement correacuteleacute avec son appreacuteciationpositive sur cet objet Le terme objet est utiliseacute ici car les auteurs ont reacutealiseacute cette expeacuteriencesur un site proposant des vecirctements et non dans le museacutee comme le reste de leur application

Plus reacutecemment les systegravemes de recommandation touristiques de ces derniegraveres anneacutees ontproteacute des nombreuses avanceacutees technologiques leur donnant plus de possibiliteacutes quant agrave la lo-calisation de lutilisateur et agrave laide personnaliseacutee dans des lieux autrefois complexes agrave atteindreEn eet la deacutemocratisation des smartphones recevant tous un signal GPS de bonne qualiteacute per-met deacutesormais agrave des applications de connaicirctre relativement preacuteciseacutement la position dun visiteurtant quil est dehors Dune maniegravere geacuteneacuterale les systegravemes utilisant des donneacutees geacuteographiquesdans le processus de recommandation sont regroupeacutes sous le terme systegravemes de recommandationsensibles agrave la position (Location-Aware Recommender Systems (LARS)) Pour les systegravemes derecommandation destineacutes agrave ecirctre utiliseacutes agrave linteacuterieur dun bacirctiment ougrave le signal GPS ne peutpas passer (comme un museacutee par exemple) il existe maintenant plusieurs solutions eacutetudieacutees etdeacuteveloppeacutees dans le domaine de recherche des systegravemes de localisation en interne comme parexemple le Wi-Fi [Tesoriero et al 2014] les puces RFID 26 [Tesoriero et al 2008] les senseursde proximiteacute Bluetooth [Yoshimura et al 2014] et mecircme le geacuteomagneacutetisme 27 Les moyens tech-niques permettant de localiser preacuteciseacutement un visiteur ou de lui fournir des recommandations agravedistance via une application ne seront pas deacutetailleacutes ici Cependant il est important de prendreen compte ces problegravemes lorsque lon passe dun domaine agrave un autre Mecircme si lobjectif est lemecircme agrave savoir recommander les meilleures seacutequences agrave un utilisateur dun systegraveme les moyenstechniques agrave mettre en divideuvre ainsi que les caracteacuteristiques agrave prendre en compte pour produire debonnes recommandations peuvent drastiquement changer Ainsi alors que certains systegravemes derecommandations musicaux commencent depuis quelques anneacutees agrave prendre en compte le contextede lutilisateur quand cela est possible [Wang et al 2012] les systegravemes deacuteployeacutes dans le domainedu tourisme doivent neacutecessairement tenir compte du contexte de lutilisateur au minimum pourpouvoir le guider activement [Adomavicius and Tuzhilin 2011 Gavalas et al 2014] De la mecircmemaniegravere les modegraveles utilisateurs requis dans les recommandations touristiques diegraverent de ceuxdes autres domaines Il est par exemple important de prendre en compte la maniegravere dont lesvisiteurs se deacuteplacent physiquement agrave la fois pour proposer des recommandations satisfaisantesdun point de vue individuel mais aussi pour avoir une vision globale de la foule et de ses ef-fets sur les individus Ainsi [Veacuteron and Levasseur 1989] ont reacutealiseacute une eacutetude ethnographiqueau centre Pompidou montrant que les visiteurs pouvaient ecirctre classeacutes en 4 cateacutegories selon leurmaniegravere de se deacuteplacer tandis que [Yoshimura et al 2014] ont observeacute pendant 3 semaines lecomportement de plus de 27000 visiteurs au museacutee du Louvre permettant de discerner 2 typesde visiteurs selon la dureacutee de leur visite ainsi que linuence de la foule sur les comportements

Ces deux eacutetudes toujours tregraves utiliseacutees aujourdhui reacutevegravelent que le domaine des recomman-dations touristiques possegravede des speacuteciciteacutes quil est important de prendre en compte an decorrectement modeacuteliser le comportement de lutilisateur et de lui fournir des recommandationspertinentes Dune maniegravere geacuteneacuterale et peut-ecirctre encore plus que dans dautres domaines la

26 Acronyme de Radio-Frequency IDentication deacutesignant lutilisation de radio-eacutetiquettes adheacutesives permet-tant de recevoir et de reacutepondre agrave des signaux agrave courte distance27 IndoorAtlas

29

Chapitre 2 Eacutetat de lart

recommandation de points dinteacuterecircts physiques neacutecessite une attention toute particuliegravere agrave uncertain nombre de caracteacuteristiques quant agrave la modeacutelisation de lutilisateur parmi lesquelles onpeut citer [Osche et al 2016]

Le style de visite repreacutesente le style de visite de lutilisateur en rapport avec les deuxeacutetudes citeacutees ci-dessus [Veacuteron and Levasseur 1989 Yoshimura et al 2014]

Le niveau de fatigue repreacutesente agrave quel point lutilisateur est mentalement etouphysiquement fatigueacute

Les preacutefeacuterences implicites repreacutesente les preacutefeacuterences sur les ressources deacuteduites ducomportement de lutilisateur

La toleacuterance agrave la distance repreacutesente agrave quel point lutilisateur souhaite se deacuteplacer La toleacuterance agrave la foule repreacutesente agrave quel point lutilisateur est deacuterangeacute par les autres

visiteurs autour de lui La toleacuterance agrave la preacutecision repreacutesente le souhait de lutilisateur concernant la balance

entre recommandations preacutecises et recommandations diverses La toleacuterance agrave lintrusion technologique repreacutesente agrave quelle freacutequence lutilisateur

souhaite recevoir des recommandations du systegraveme Le niveau de controcircle repreacutesente le niveau de choix que lutilisateur attend cest-agrave-

dire le nombre dalternatives proposeacutees

Outre ces points relatifs agrave la modeacutelisation de lutilisateur il est aussi important de prendreen compte lenvironnement dans lequel il se trouve comme par exemple la geacuteographie du lieu etses contraintes les distances physiques entre les points dinteacuterecircts les donneacutees meacuteteacuteorologiquesles horaires douvertures et de fermetures sil y en a etc

Mecircme si agrave premiegravere vue le domaine touristique semble dieacuterent du domaine musical denombreux points communs peuvent ecirctre trouveacutes comme par exemple la gestion de la distance(distance physique entre deux points dinteacuterecircts ou distance matheacutematiques entre deux ressourcesles preacutefeacuterences implicites les divers niveaux de toleacuterances etc) Dans la prochaine section nousallons discuter des points communs entre ces dieacuterents domaines et des caracteacuteristiques quunmodegravele se voulant geacuteneacuterique et multi-domaines se doit de posseacuteder

233 Discussion

Cette section a eu pour but de preacutesenter un certain nombre de travaux lieacutes de pregraves ou de loinagrave la notion de seacutequence Nous avons vu que dans le domaine des recommandations musicales lacreacuteation ou la continuation de playlists sont des objectifs de plus en plus consideacutereacutes par les cher-cheurs Ce domaine sy precircte en eet tregraves bien car la majoriteacute des utilisateurs eacutecoutent plusieursmusiques les unes agrave la suite des autres permettant dexploiter linformation contenue dans cesseacutequences deacutejagrave existantes et de tenter den creacuteer de nouvelles De la mecircme maniegravere le rapidetour dhorizon du domaine des recommandations touristiques a permis de mettre en exerguemecircme sil existe des dieacuterences notables avec le domaine musical dont il faut tenir compte unobjectif principal commun consideacuterer le maximum de donneacutees pertinentes disponibles (compor-tements preacuteceacutedents des utilisateurs informations sur les ressources caracteacuteristiques personnellesde chaque utilisateur etc) dans le but de produire des seacutequences adapteacutees agrave chaque utilisateurLes eacutetudes de ces domaines ont permis de faire ressortir 5 directions majeures dans la conceptiondun tel systegraveme de recommandation

1 Les approches les plus performantes actuellement semblent geacuteneacuteralement composeacutees de

30

24 Les systegravemes multi-agents

deux parties distinctes La premiegravere partie consiste en une preacute-seacutelection avec pour but dediminuer lespace de recherche en seacutelectionnant une liste de candidats potentiels tandisque dans la deuxiegraveme partie une seacutequence est produite en utilisant les meilleurs candidatspreacute-seacutelectionneacutes dans leacutetape 1

2 Ces approches ne se limitent plus uniquement agrave lutilisation de techniques provenantdes systegravemes de recommandation classiques mais mecirclent deacutesormais dieacuterentes techniquesprovenant de divers domaines de la recherche en informatique

3 Les seacutequences deacutejagrave creacuteeacutees en amont par les utilisateurs peuvent ecirctre utiliseacutees an dexploi-ter les informations quelles contiennent et produire en aval des seacutequences plus conformesagrave ce quun ecirctre humain ferait

4 Le mouvement geacuteneacuteral des eacutetudes produites ces derniegraveres anneacutees va dans le sens dune priseen compte conjointe et toujours plus importante de facteurs et caracteacuteristiques humains

5 Un systegraveme geacuteneacuterique permettant de produire des seacutequences personnaliseacutees quelque soit ledomaine reste possible mais ce dernier devra ecirctre susamment modulable pour sadapteraux dieacuterences bien reacuteelles entre tous les domaines concerneacutes

Dans la suite de cette section nous allons nous concentrer sur un domaine de linformatiquedont les meacutethodes saccordent avec lensemble des points eacutevoqueacutes ci-dessus les systegravemes multi-agents et plus particuliegraverement les algorithmes de colonies de fourmis Cest dans le cadre de ceparadigme que nous reacutepondrons aux probleacutematiques de cette thegravese

24 Les systegravemes multi-agents

241 Deacutenition

Les systegravemes multi-agents deacutesignent lensemble des systegravemes ougrave de nombreux agents co-opegraverent dans le but de reacutesoudre un problegraveme trop complexe pour un agent seul [Ferber andWeiss 1999 Weiss 2013] Un agent dans sa deacutenition la plus large repreacutesente toute entiteacute pou-vant percevoir son environnement agrave travers ses senseurs et pouvant agir dans cet environnementavec ses actuateurs [Russell and Norvig 2016] comme le preacutesente la Figure 23

Selon cette deacutenition limmense majoriteacute des ecirctres vivants robots machines et programmesinformatiques peuvent ecirctre consideacutereacutes comme des agents Nous allons aner petit agrave petit cettedeacutenition an de rentrer dans le cadre speacutecique des systegravemes multi-agents Un premier eacuteleacutementpouvant ecirctre ajouteacute est la notion de rationaliteacute Un agent rationnel est un agent dont le com-portement est le bon eacutetant donneacute un environnement speacutecique dans lequel il eacutevolue Avoir lebon comportement autrement dit eectuer une bonne seacutequence dactions implique de deacutenirun but preacutecis ainsi quune maniegravere deacutevaluer les seacutequences dactions que lagent eectue commepar exemple la maximisation dune fonction dutiliteacute An de reacutealiser des actions dans son en-vironnement un agent a besoin de pouvoir prendre des deacutecisions de lui-mecircme Il existe dans lalitteacuterature deux types dagents repreacutesentant deux conceptions dieacuterentes pour la reacutesolution dunproblegraveme [Ferber 1995]

Le premier type dagent est appeleacute agent cognitif et fait reacutefeacuterence agrave des agents pos-seacutedant une repreacutesentation symbolique du monde avec laquelle ils peuvent appliquer desraisonnements Ces agents possegravedent donc une repreacutesentation interne de leur environ-nement et sont capables dinteragir entre eux de maniegravere sophistiqueacutee Ce type dagent

31

Chapitre 2 Eacutetat de lart

Figure 23 Scheacutema repreacutesentant linteraction entre un agent et lenvironnement dans lequel ileacutevolue [Russell and Norvig 2016]

correspond plus geacuteneacuteralement agrave une approche cognitive qui a pour but de faire commu-niquer et coopeacuterer des systegravemes experts classiques [ougrave] chaque agent dispose dune base deconnaissance comprenant lensemble des informations et des savoir-faire neacutecessaires agrave lareacutealisation de sa tacircche et agrave la gestion des interactions avec les autres agents et avec sonenvironnement [Ferber and Weiss 1999]

Le deuxiegraveme type dagent nommeacute agent reacuteactif ne possegravede pas de repreacutesentation sym-bolique du monde et est donc limiteacute par ses propres perceptions Ces agents et leursinteractions sont geacuteneacuteralement moins complexes que les agents cognitifs Ce type dagentcorrespond plus geacuteneacuteralement agrave une approche reacuteactive qui quant agrave elle preacutetend quil nestpas neacutecessaire que les agents soient intelligents individuellement pour que le systegraveme aitun comportement global intelligent Des meacutecanismes de reacuteaction aux eacuteveacutenements ne pre-nant en compte ni une explicitation des buts ni des meacutecanismes de planication peuventalors reacutesoudre des problegravemes qualieacutes de complexes [Ferber and Weiss 1999]

En plus de ces deux types dagents dieacuterencieacutes par leur repreacutesentation du monde Ferberpropose un autre type de distinction sur les comportements ces derniers peuvent ecirctre teacuteleacuteono-miques cest-agrave-dire dirigeacutes vers des buts explicites ou bien reacuteexes cest-agrave-dire reacutegis par lesperceptions Ces 4 dieacuterents types dagents peuvent se combiner comme illustreacute dans le Tableau21

Nous allons plus particuliegraverement nous inteacuteresser ici aux agents reacuteactifs et agrave leurs dieacuterencesavec les agents cognitifs Malgreacute leur relative simpliciteacute les interactions entre agents reacuteactifsexistent bien Mais contrairement aux agents cognitifs elles seectuent au travers de lenvi-ronnement geacuteneacuteralement par des traces laisseacutees dans ce dernier comme des donneacutees visuellesolfactives auditives etc Lagrave ougrave les agents cognitifs raisonnent avant de prendre une deacutecisionles agents reacuteactifs ne font que reacuteagir agrave des stimuli externes Ils possegravedent bien des senseurs ande deacutetecter leur environnement et des actuateurs pour agir mais leur fonctionnement reste tregraves

32

24 Les systegravemes multi-agents

Agents cognitifs Agents reacuteactifsTeacuteleacuteonomiques Agents intentionnels Agents pulsionnels

Reacuteexes Agents modules Agents tropiques

Table 21 Description des dieacuterents types dagents selon leur relation au monde et selon leursconduites [Ferber 1995]

simple par rapport aux agents cognitifs La relative simpliciteacute de ces agents est inteacuteressante carelle sinscrit dans un changement de paradigme par rapport agrave la vision classique des lintelligencearticielle dans le domaine de linformatique En eet le domaine de lintelligence articielleexiste depuis pregraves de 60 ans maintenant et agrave lorigine les systegravemes intelligents creacuteeacutes dans cedomaine pour reacutesoudre des problegravemes lont eacuteteacute selon une approche dite top-down cest-agrave-direde haut en bas avec les notions de penseacutee et de raison au centre de ces systegravemes Ainsi cessystegravemes manipulaient les connaissances agrave laide de symboles et de regravegles et navaient aucune in-teraction ni avec leur environnement ni avec dautres systegravemes intelligents Cest ce quon appellecommuneacutement la Good Old Fashioned Articial Intelligence Depuis les anneacutees 1990 une autreapproche est apparue pour eacutetudier lintelligence et creacuteer des systegravemes intelligents lapprochebottom-up soit de bas en haut dont certains systegravemes tregraves populaires sinspirent de systegravemesbiologiques incarneacutes dans un environnement et pouvant communiquer entre eux Cest dans cemouvement que sinscrivent les systegravemes multi-agents et comme le dit Rodney A Brooks dansson article justement intituleacute Intelligence without Reason [Brooks 1991]

Les comportements intelligents peuvent ecirctre geacuteneacutereacutes sans laide de systegravemes de raisonne-ment explicites

Lintelligence est une proprieacuteteacute eacutemergente de certains systegravemes complexes apparaissantparfois sans quelle nait de raison speacutecique dapparaicirctre

Une premiegravere implication de la simpliciteacute des agents reacuteactifs est quil est neacutecessaire de faireinteragir un certain nombre de ces agents pour pouvoir solutionner des problegravemes Lagrave ougrave unagent cognitif peut potentiellement ecirctre tregraves complexe et capable de solutionner des problegravemesprincipalement par lui-mecircme (en deacuteleacuteguant ou coopeacuterant parfois avec dautres agents) un agentreacuteactif seul nen sera pas capable de par sa simpliciteacute Cependant cette simpliciteacute ore aussides avantages dans le sens ougrave il est aiseacute de comprendre de programmer ou de modier cesagents Apregraves cette partie theacuteorique nous allons voir dans la sous-section suivante deux modegravelesmulti-agents an dillustrer la maniegravere dont ils fonctionnent reacuteellement Ces deux systegravemes nouspermettrons par la suite de tirer quelques conclusions sur leur utiliteacute dans le cadre de cette thegravese

242 Preacutesentation de deux systegravemes multi-agents reacuteactifs

Nous avons pour le moment seulement deacutecrit le principe des modegraveles multi-agents et lesagents pouvant les composer Cependant ces systegravemes ne puisent pas leur origine uniquementdans linformatique Beaucoup de systegravemes multi-agents sinspirent agrave lorigine de comportementsdanimaux ou dinsectes observeacutes en milieu naturel par des eacutethologues En eet certaines espegravecesanimales semblent agir en groupe de maniegravere tregraves intelligente sans quil ny ait de meneur ou sansquun individu pris seacutepareacutement ne soit speacutecialement intelligent On parle alors dauto-organisationet deacutemergence de lintelligence quand une masse dindividus peu intelligents se coordonne ainsidans la nature Ce pheacutenomegravene a eacuteteacute eacutetudieacute par le biologiste franccedilais Pierre-Paul Grasseacute en 1959

33

Chapitre 2 Eacutetat de lart

et a eacuteteacute nommeacute stigmergie [Grasseacute 1959] La stigmergie est le meacutecanisme par lequel des agentsvont se synchroniser et travailler ensemble dans un but commun sans quaucun nait lideacutee agravelavance de laction agrave faire ou nait le plan nal de la construction agrave reacutealiser (une fourmiliegravereou un nid de termites par exemple) Pour deacutecrire le pheacutenomegravene de stigmergie agrave ldivideuvre chezcertains animaux Pierre-Paul Grasseacute explique ainsi Louvrier ne dirige pas son travail maisil est guideacute par lui Cette phrase signie quun agent na pas dintention et dideacutee de ce quildoit faire mais quil sait cependant exactement quoi faire au moment ougrave il est preacutesent devant letravail Cette capaciteacute sexplique par le fait que les individus sont geacuteneacutetiquement preacuteprogrammeacutespour eectuer certaines tacircches [Oster 1981] Cest de cette maniegravere que des espegraveces ne posseacutedantquune tregraves faible intelligence individuelle comme les fourmis ou les termites sont capables deproduire des constructions extrecircmement grandes et sophistiqueacutees On peut par exemple citer uneespegravece nommeacutee la fourmi coupe-feuille du Texas aussi appeleacutee fourmi champignonniste dontles individus vivent dans de grandes colonies de plusieurs millions dindividus et cultivent deschampignons dans des piegraveces souterraines doteacutees dune structure particuliegravere et dune aeacuterationspeacutecique destineacutee agrave favoriser la pousse du champignon [Houmllldobler et al 1990] La cleacute de lacapaciteacute de ces animaux agrave agir de la bonne maniegravere face agrave tel ou tel stimulus reacuteside dans lADNmecircme de lespegravece faccedilonneacute par des millions danneacutees deacutevolution Cest ainsi quune ouvriegraverevaquera agrave ses tacircches jusquagrave ce quun pan de mur de son nid seondre et que devant ce nouveaustimulus elle deacuteploie une nouvelle panoplie de comportements approprieacutes agrave la situation agrave laquelleelle fait soudainement face Ces exemples deacutemontrent que lintelligence est bien preacutesente dans cessystegravemes biologiques vivants et dans la suite de cette section nous allons donner deux exemplesde modeacutelisation de ces systegravemes biologiques en systegravemes multi-agents dans linformatique

Murmuration deacutetourneaux le modegravele des boids

Les eacutetourneaux repreacutesentent une famille dune quinzaine despegraveces doiseaux et vivent surles 5 continents Ces oiseaux se regroupent parfois dans la nature sous forme de nueacutees pouvantcontenir des dizaines de milliers dindividus La raison de ces murmurations nest pas encoreconnue avec certitude mais des theacuteories existent expliquant par exemple que ces regroupementspermettraient une plus grande chance de survie face aux preacutedateurs [King and Sumpter 2012]ou bien que le regroupement et la haute densiteacute dindividus leur permettraient de se reacutechauerdurant les peacuteriodes les plus froides de lanneacutee [Goodenough et al 2017] Ce pheacutenomegravene est beau-coup eacutetudieacute car tous les oiseaux semblent se deacuteplacer dans la mecircme direction et modient leurtrajectoire en mecircme temps sans quaucun oiseau ne se touche en vol ce qui est remarquable eacutetantdonneacute le nombre dindividus et la vitesse agrave laquelle ils volent Malgreacute cette complexiteacute il ny apas doiseau meneur deacutecidant de la direction agrave prendre et un individu seul na pas la capaciteacuteintellectuelle susante pour planier ce genre de deacuteplacements complexes dans un environne-ment en 3 dimensions On retrouve bien lagrave les caracteacuteristiques dun systegraveme multi-agents ougrave desagents simples provoquent de par leurs interactions un comportement intelligent et complexedeacutepassant de loin les capaciteacutes dun individu seul Le domaine des systegravemes multi-agents sestdonc inteacuteresseacute agrave creacuteer un modegravele permettant agrave laide de simulations informatiques de recreacuteer lesmumurations deacutetourneaux Ce modegravele ougrave les agents sont appeleacutes des boids 28 permet dobtenirinformatiquement des murmurations dagents dans un environnement simuleacute gracircce agrave trois regraveglesimplanteacutees dans chaque agent donneacutees ici par ordre de prioriteacute [Reynolds 1987]

28 Le terme boid provient de la contraction de lexpression bird-oid object et signiant objet ressemblant agrave unoiseau

34

24 Les systegravemes multi-agents

1 Eacutevitement des collisions eacuteviter les collisions avec les agents se trouvant agrave proximiteacuteSi un agent est trop proche seacuteloigner dans une autre direction

2 Coordination de la vitesse aller agrave la mecircme vitesse que les agents se trouvant agraveproximiteacute

3 Centrage rester le plus proche possible des autres agents se trouvant agrave proximiteacute sansdeacuteclencher la regravegle deacutevitement de collision

Ces trois regravegles sont donc exeacutecuteacutees par les agents en permanence de la plus prioritaire agravela moins prioritaire et permettent dobtenir virtuellement un comportement de murmurationougrave tous les agents restent proches les uns des autres et changent de direction ensemble commemontreacute dans la Figure 24 Ce modegravele a par exemple eacuteteacute utiliseacute dans lindustrie du divertissementpour simuler des foules coheacuterentes dans des jeux videacuteos ou des lms [Silva et al 2009]

Figure 24 Simulation de boids ougrave lon peut voir les agents se deacuteplaccedilant dans la mecircme directionagrave une certaine distance les uns des autres dans un environnement simuleacute [Reynolds 1987]

Le fourragement des fourmis algorithme de colonies de fourmis

Un autre exemple de systegraveme biologique complexe ougrave lon peut observer leacutemergence duneintelligence collective est le comportement des fourmis dans la nature Dans la section preacuteceacutedentenous avons deacutejagrave vu que par un meacutecanisme de stigmergie certains insectes sociaux comme lesfourmis ou les termites eacutetaient capables de construire des structures tregraves complexes Un autrepheacutenomegravene dauto-organisation a eacuteteacute observeacute lors du fourragement 29 des fourmis de lespegravece de lafourmi dArgentine En eet les ouvriegraveres de cette espegravece se deacuteplacent de maniegravere aleacuteatoire auxalentours de la fourmiliegravere jusquagrave trouver une source de nourriture Une fois que des fourmis onttrouveacute de la nourriture elles retournent agrave la fourmiliegravere Apregraves un certain temps de plus en plusdouvriegraveres se dirigent vers cette source de nourriture jusquagrave ce quun chemin de fourmis allantde la fourmiliegravere jusquagrave la nourriture se forme Ce chemin a cependant la particulariteacute decirctreoptimiseacute en termes de distance agrave parcourir et dobstacles agrave eacuteviter de sorte que les ouvriegraveres em-pruntent eectivement le plus court chemin possible entre leur nid et la nourriture [Deneubourg

29 Le fourragement deacutesigne le comportement des fourmis recherchant de la nourriture et revenant avec celle-ciagrave la fourmiliegravere

35

Chapitre 2 Eacutetat de lart

et al 1990] La Figure 25 donne un exemple de ce agrave quoi peut ressembler un de ces chemins unefois emprunteacute par beaucoup dindividus Ce comportement est remarquable quand on le replacedans le contexte des individus qui en sont agrave lorigine Les ouvriegraveres ne font pas plus de 1 ou 2centimegravetre(s) de long et peuvent couvrir des distances jusquagrave 100 megravetres an de trouver de lanourriture Lenvironnement dans lequel elles se deacuteplacent est complexe joncheacute dobstacles eteacutevolue en permanence alors quelles nont quun sens de lorientation limiteacute et une faible capaciteacutede traitement ducirce agrave leur tregraves petit nombre de neurones (environ 250000)

Figure 25 Illustration dun chemin creacuteeacute par des fourmis appartenant agrave lespegravece des fourmisleacutegionnaires (creacutedit photo Mehmet Karatay)

An de comprendre les meacutecanismes permettant leacutemergence de ce comportement intelligentdes expeacuterimentations ont eacuteteacute meneacutees en laboratoire avec de petites colonies de fourmis dansun environnement controcircleacute [Goss et al 1989] Voici donc le principe de fonctionnement de lacreacuteation de chemins optimiseacutes chez les fourmis

1 Des fourmis se deacuteplacent aleacuteatoirement autour de la colonie agrave la recherche de nourriture

2 Quand une fourmi trouve de la nourriture elle retourne du mieux possible agrave la fourmiliegravereen deacuteposant des pheacuteromones

3 Dautres fourmis attireacutees par ces pheacuteromones vont avoir tendance agrave suivre ce cheminLes nouvelles fourmis atteignant la nourriture vont elles aussi revenir agrave la fourmiliegravere endeacuteposant des pheacuteromones

4 Les fourmis reacuteussissant agrave revenir plus rapidement avec des chemins plus courts agrave la four-miliegravere vont redeacuteposer plus rapidement de nouvelles pheacuteromones eacutetant donneacute quellesmettront moins de temps pour faire des allers-retours entre la nourriture et la fourmi-liegravere

5 Agrave linverse les fourmis ayant emprunteacute des chemins plus longs vont deacuteposer de nouvellespheacuteromones moins rapidement puisquelles mettront plus de temps agrave faire leurs allers-retours

6 Petit agrave petit le chemin le plus court va ecirctre emprunteacute par de plus en plus de fourmisdeacuteposant chacune des pheacuteromones renforccedilant de plus en plus ce mecircme chemin

36

24 Les systegravemes multi-agents

7 Les chemins les plus longs sont peu agrave peu abandonneacutes dautant plus que les pheacuteromonesseacutevaporent avec le temps renforccedilant encore plus les chemins fortement emprunteacutes

8 Au bout dun certain temps seul le chemin le plus court est emprunteacute par la majoriteacute desfourmis

9 Quelques fourmis ne prennent cependant pas ce chemin permettant la recherche de nou-velles sources de nourriture ou de nouveaux chemins En eet si jamais le chemin em-prunteacute par la majoriteacute des individus se voit perturbeacute par un nouvel obstacle (un arbrevenant de tomber par exemple) alors ces quelques fourmis pourront eacuteventuellement trou-ver le nouveau meilleur chemin le plus court et le cycle de renforcement recommencera

Comme pour les murmurations deacutetourneaux on retrouve bien les caracteacuteristiques de lauto-organisation dans un systegraveme multi-agents aucun meneur nest preacutesent les agents suivent seule-ment quelques regravegles simples permettant leacutemergence dun comportement deacutepassant les capaciteacutescognitives de lespegravece Ces regravegles ont eacuteteacute deacutecrites de maniegravere formelle par Marco Dorigo durant sathegravese dans un modegravele appeleacute Ant System (AS) permettant de recreacuteer le comportement des four-mis au sein dune simulation informatique [Dorigo et al 1996] Dans ce modegravele lenvironnementest repreacutesenteacute par un graphe dont les sommets sont les points dinteacuterecircts ougrave lagent peut se rendreet dont les arecirctes sont les chemins disponibles permettant de se deacuteplacer de point en point Agravechaque arecircte (i j) est associeacutee deux valeurs numeacuteriques la premiegravere repreacutesentant la distanceagrave parcourir pour se deacuteplacer du sommet i au sommet j la deuxiegraveme repreacutesentant la quantiteacutede pheacuteromones preacutesente sur cette arecircte Un agent se trouvant agrave un sommet i a connaissancede lensemble des sommets Vi accessibles directement agrave partir de i Pour deacutecider quelle arecircteemprunter lagent prend en compte la distance et la quantiteacute de pheacuteromones associeacutees agrave chaquearecircte Une fois que lagent a atteint un sommet speacutecique deacutesigneacute agrave lavance comme objectif ildeacutepose des pheacuteromones sur chacune des arecirctes emprunteacutees La quantiteacute de pheacuteromones deacuteposeacuteeest deacutependante de la longueur du chemin emprunteacute de sorte quun agent ayant trouveacute un chemincourt deacuteposera plus de pheacuteromones quun agent ayant trouveacute un chemin plus long Ce cycle peutensuite recommencer avec une multitude dagents jusquagrave ce quune solution eacutemerge de la mecircmemaniegravere que pour les fourmis dans la nature Marco Dorigo a dans la suite de ses travaux deacuteve-loppeacute dautres modegraveles ayant tous comme base le modegravele AS mais posseacutedant quelques variationsou ajouts orant une plus grande varieacuteteacute doutils pour reacutesoudre les nombreux problegravemes de larecherche en informatique Dans les faits le modegravele original AS a aujourdhui pratiquement dis-paru au prot de ses descendants et cest pour cette raison que nous nallons pas ici deacutetailler plusavant le modegravele AS [Dorigo and Birattari 2010] Tous ces dieacuterents modegraveles sont maintenantregroupeacutes sous le nom de Ant Colony Optimization (ACO) [Dorigo and Birattari 2011] Cesderniers ont eacuteteacute exploiteacutes dans de nombreux domaines de la recherche scientique pour reacutesoudredes problegravemes varieacutes On peut par exemple citer trois de ces problegravemes tregraves connus et eacutetudieacutesen informatique de par leur complexiteacute qui ont chacun vu des solutions leur ecirctre trouveacutees gracircceagrave ACO

Le problegraveme du voyageur de commerce [Dorigo and Gambardella 1997] Le problegraveme des tourneacutees de veacutehicules [Bell and McMullen 2004] Le problegraveme de gestion de projet agrave contraintes de ressources [Merkle et al 2002]

Dans la prochaine section nous allons nous inteacuteresser plus particuliegraverement agrave lun des modegravelesde la famille ACO nommeacute Ant Colony System (ACS) Nous allons voir son fonctionnement deacutetailleacuteet expliquer les speacuteciciteacutes qui le rendent particuliegraverement inteacuteressant dans le cadre de cette thegravese

37

Chapitre 2 Eacutetat de lart

243 Ant Colony System

Le modegravele ACS possegravede plusieurs modications majeures par rapport au modegravele initial ASnotamment par rapport aux meacutecanismes lieacutes aux pheacuteromones et agrave la prise de deacutecision des agents[Dorigo and Birattari 2010] Premiegraverement seul lagent ayant trouveacute le meilleur chemin est au-toriseacute agrave deacuteposer des pheacuteromones sur les arecirctes quil a emprunteacute alors que dans AS tous les agentsdeacuteposaient des pheacuteromones Deuxiegravemement et pour contrer la relatif manque de pheacuteromones en-gendreacute par cette premiegravere modication les agents possegravedent un nouveau comportement appeleacutemise agrave jour locale de pheacuteromones (locale pheromone update) consistant en la mise agrave jour despheacuteromones par chaque agent sur la derniegravere arecircte emprunteacutee durant la construction dun che-min Cette mise agrave jour sarticule autour dun seuil de pheacuteromones speacutecieacute comme meacutetavariableavant lexeacutecution du programme Si une arecircte traverseacutee par un agent possegravede une quantiteacute depheacuteromones infeacuterieure agrave ce seuil alors lagent deacutepose des pheacuteromones Agrave linverse si la quantiteacutede pheacuteromone sur cette arecircte est supeacuterieure au seuil alors lagent retire une certaine quantiteacute depheacuteromones En dautres termes dans ACS degraves quun agent emprunte une arecircte il met agrave jourla quantiteacute de pheacuteromones sur cette arecircte et ce quelle que soit la qualiteacute du chemin quil est entrain de construire Marco Dorigo explique lui-mecircme les avantages que possegravede ACS par rapportagrave dautres versions existantes [Dorigo and Birattari 2011]

ACS permet de diversier lexploration eectueacutee par les agents pendant une iteacuterationde lalgorithme en diminuant la quantiteacute des pheacuteromones sur les arecirctes les plusutiliseacutees les agents suivants sont encourager agrave se deacuteplacer sur dautres arecirctes moinsexploreacutees permettant de diversier les solutions trouveacutees agrave la n dune iteacuterationCette meacutecanique rend moins probable le fait que plusieurs agents puissent produiredes solutions identiques durant une iteacuteration

Une autre modication du modegravele ACS par rapport au modegravele AS concerne le deacuteplacementdes agents Il est maintenant possible gracircce agrave une nouvelle meacutetavariable de donner limportancesouhaiteacutee entre les pheacuteromones et la distance lors du processus de choix de la prochaine arecircte agraveemprunter par un agent Dans le reste de cette sous-section nous allons expliquer les principalesformules reacutegissant le comportement des agents et la mise agrave jour des pheacuteromones dans ACS

Regravegle de transition deacutetat - la regravegle de transition (state transition rule) deacutetat utilise laregravegle proportionnelle pseudo-aleacuteatoire (pseudo-random proportional rule) ougrave une variable aleacutea-toire q isin [0 1] est compareacutee agrave une meacutetavariable q0 an de deacutecider si lagent courant va explorerle graphe ou sil va exploiter la connaissance produite par les autres agents avant lui En dautrestermes il est possible deacutequilibrer avec cette variable limportance des pheacuteromones et de la dis-tance lors du choix des arecirctes q0 = 0 entraicircne lexploration du graphe en tenant uniquementcompte de la distance associeacutee aux arecirctes tandis que q0 = 1 correspond agrave un comportement derenforcement pur via les pheacuteromones sans aucune exploration LEacutequation 27 permet de choisirentre lexploitation de la connaissance ou lexploration du graphe donnant plus de latitude aumodegravele ACS par rapport agrave AS

Exploitation (Equation 28) si q le q0Exploration biaiseacutee (Equation 29) si q ge q0

(27)

LEacutequation 28 repreacutesente lexploitation directe du graphe ougrave la meilleure arecircte est toujourschoisie

arg maxlisinVi ταil middot η

βil (28)

38

24 Les systegravemes multi-agents

ougrave Vi est lensemble des sommets accessibles depuis le sommet i τil isin [0 1] est la quantiteacute depheacuteromones deacuteposeacutee sur larecircte (i l) par les agents preacuteceacutedents ηil est linformation heuristique delarecircte (i l) α et β sont deux meacutetavariables repreacutesentant respectivement le poids des pheacuteromoneset celui de lheuristique dans le calcul Lheuristique ηil repreacutesente classiquement linformationrelative agrave la distance seacuteparant les sommets i et l et sera deacutecrite apregraves

Il est agrave noter quon ne parle pas ici de pure exploration mais dexploration biaiseacutee dans lesens ougrave les meilleures arecirctes ont une probabiliteacute plus eacuteleveacutee decirctre seacutelectionneacutees Lexpressionmeilleure arecircte est ici deacutenie comme le produit de lheuristique avec la quantiteacute de pheacuteromonesassocieacutees agrave cette arecircte LEacutequation 29 correspond agrave lexploration biaiseacutee du graphe

pij =

ταij middot η

βijsum

lisinViταil middot η

βil

si j isin Vi

0 sinon

(29)

Mise agrave jour globale des pheacuteromones - Apregraves chaque iteacuteration cest-agrave-dire apregraves que tousles agents aient termineacute leur chemin seul lagent qui a trouveacute le meilleur chemin est autoriseacute agravemettre agrave jour le niveau de pheacuteromones τij sur chaque arecircte (i j) quil a emprunteacute

τij =

(1minus ρ) middot τij + ρ middot∆τij si (i j) appartient au meilleur chemin

τij sinon(210)

ougrave ρ est le taux deacutevaporation des pheacuteromones et ∆τij = 1Lbest ougrave Lbest est la longueur dumeilleur chemin

Mise agrave jour locale des pheacuteromones - Un autre ajout du modegravele ACS par rapport aumodegravele AS est la mise jour locale des pheacuteromones Eacutetant donneacute que seul lagent ayant trouveacute lemeilleur chemin deacutepose des pheacuteromones dans ACS (contrairement agrave tous les agents proportion-nellement agrave la qualiteacute de leur solution dans AS) tregraves peu de pheacuteromones sont deacuteposeacutes avec laregravegle de mise agrave jour globale des pheacuteromones Pour contrer ce problegraveme tous les agents mettentagrave jour la quantiteacute de pheacuteromones agrave chaque arecircte emprunteacutee lors de la construction du chemincomme deacutecrit dans lEacutequation 211

τij = (1minus ρ) middot τij + ρ middot τ0 (211)

ougrave τ0 est le niveau de pheacuteromones placeacute sur chaque arecircte du graphe agrave linitialisation du modegravele

Information heuristique - linformation heuristique ηij repreacutesente linformation que lafourmi possegravede a priori sur une arecircte (i j) Dans lalgorithme ACS linformation heuristiqueest calculeacutee en se basant sur la distance entre les deux sommets i et j de larecircte (i j) plus lesdeux sommets sont eacuteloigneacutes lun de lautre et plus la valeur de ηij sera basse indiquant agrave unagent situeacute sur le sommet i quil nest a priori pas inteacuteressant pour lui demprunter larecircte (i j)LEacutequation 212 deacutecrit comment obtenir la valeur de linformation heuristique ηij de larecircte (i j)

ηij =1

dij (212)

ougrave dij est la distance entre les sommets i et j

39

Chapitre 2 Eacutetat de lart

244 Discussion sur le modegravele ACS

Dans cette sous-section nous allons revenir sur un des principes de lalgorithme ACS laregravegle proportionnelle pseudo-aleacuteatoire et son importance danc le fonctionnement du modegraveleCette regravegle comme deacutetailleacutee ci-dessus permet de geacuterer leacutequilibre dans lexploration et lex-ploitation de maniegravere semi-aleacuteatoire (ie avec une variable aleacuteatoire servant agrave xer le seuil debasculement dun comportement vers lautre) Cette dualiteacute explorationexploitation est bienconnue des systegravemes de recherche et de creacuteation de connaissances [March 1991] en voici leurdeacutenition

Lexploration est deacutenie comme eacutetant lexpeacuterimentation avec de nouvelles alternatives sanstenir compte de la connaissance du domaine Les reacutesultats obtenus via cette tactique sont incer-tains mais peuvent aussi aboutir agrave de nouveaux et potentiellement meilleurs reacutesultats que ceuxdeacutejagrave deacutecouverts

Lexploitation quant agrave elle est deacutenie comme le perfectionnement et lextension de reacute-sultats deacutejagrave connus Les reacutesultats obtenus via cette tactique sont plutocirct certains et preacutevisiblesCependant un processus trop axeacute sur lexploitation aura des diculteacutes agrave trouver de tregraves bonnessolutions agrave un problegraveme et aura tendance agrave deacutevelopper la premiegravere solution trouveacutee mecircme sidautres solutions de meilleures qualiteacutes pourraient ecirctre deacutecouvertes en explorant plus avant les-pace de recherche

Il est donc important de trouver un eacutequilibre entre lexploration de lespace de recherchepour trouver de nouvelles solutions et lexploitation permettant daner ces solutions Dautresmeacutethodes dexploration et de deacutecouverte de solutions dans un espace de recherche proposent destechniques speacuteciques pour solutionner ce problegraveme On peut par exemple citer la meacutethode dela descente du gradient consistant agrave minimiser une fonction reacuteelle dans un espace de rechercheCette meacutethode procegravede par iteacuterations successives et se deacuteplace dabord de maniegravere importantedans lespace de recherche an dexplorer un maximum de solutions Puis une fois quune bonnesolution est trouveacutee la meacutethode va diminuer son deacuteplacement dans lespace de recherche andaner la solution trouveacutee La descente de gradient utilise donc une approche ougrave lexplorationest dabord privileacutegieacutee puis petit agrave petit se dirige vers de lexploitation comme illustreacute dans laFigure 26

On pourrait penser agrave premiegravere vue que lexploitation autrement dit le fait que lagent prennela meilleure arecircte disponible agrave chaque choix sorant agrave lui permettrait dobtenir les meilleursreacutesultats En eet le but est ici de trouver le meilleur chemin soit le plus court chemin dans lecadre dune distance euclidienne dun sommet a agrave un sommet b Le fait de permettre agrave lagentde ne pas forceacutement prendre la meilleure arecircte lors de la construction du chemin est donc relati-vement contre-intuitif On peut cependant lever cette intuition avec une seacuterie dexpeacuterimentationsprovenant de la litteacuterature et des observations meneacutees sur les fourmis dans la nature Jean-LouisDeneubourg dont nous avons deacutejagrave parleacute au deacutebut de cette section a beaucoup eacutetudieacute le compor-tement des fourmis en milieu reacuteel et la modeacutelisation de leur processus deacutecisionnel collectif Il aainsi proposeacute en 1990 une expeacuterience appeleacutee le pont binaire [Deneubourg et al 1990] pouvantecirctre reacutesumeacutee ainsi le nid dune colonie de fourmis est seacutepareacutee dune source de nourriture par deuxchemins de longueurs identiques Pour ramener la nourriture au nid les fourmis peuvent doncemprunter lune de ces deux voies sans conseacutequence sur la longueur du chemin total Au deacutepartles fourmis empruntent les deux voies sans distinctions puis une fois un certain temps passeacute

40

24 Les systegravemes multi-agents

Figure 26 Exemple de descente de gradient ougrave lon peut voir lexploration au deacutebut avecun deacuteplacement rapide puis lexploitation ensuite vers la solution trouveacutee ( creacutedit image JorisGillis

une des voies est privileacutegieacutee par rapport agrave lautre et la majoriteacute des fourmis lempruntent Cecomportement est la conseacutequence des pheacuteromones deacuteposeacutees par les fourmis au bout de quelquestemps une des deux voies est emprunteacutee par plus de fourmis que lautre et comme les four-mis deacuteposent des pheacuteromones et sont attireacutees par celles-ci cette dieacuterence saccentue jusquagrave cequune voie soit majoritairement emprunteacutee Il est agrave noter que ce comportement de renforcementnest pas forceacutement vrai pour toutes les espegravece de fourmis dans la nature Cependant cest surce principe que Deneubourg a modeacuteliseacute les eacutequations deacuteterminant le choix eectueacutee par chaquefourmi Ces eacutequations sont agrave la base mecircme des modegraveles ACO deacuteveloppeacutes par Dorigo quelquesanneacutees plus tard Le dispositif de lexpeacuterience des ponts binaires est preacutesenteacute par la Figure 27

Figure 27 Illustration de lexpeacuterience des ponts binaires par Jean-Louis Deneubourg (a)Apregraves un certain temps les fourmis choisissent majoritairement une des deux voies possibles (b)[Deneubourg et al 1990]

Une autre expeacuterimentation du mecircme genre a eacuteteacute reacutealiseacutee par la mecircme eacutequipe de chercheurs ougraveles fourmis doivent se deacuteplacer dun point A agrave un point B en choisissant parmi dieacuterentes voiespossibles [Goss et al 1989] Le dispositif expeacuterimental contient cependant une dieacuterence notable

41

Chapitre 2 Eacutetat de lart

avec lexpeacuterience initiale dans le sens ougrave les dieacuterentes voies ne font pas la mecircme longueurComme le montre la Figure 28 pour aller du nid jusquagrave la nourriture les fourmis disposentdun chemin ougrave deux embranchements similaires sont proposeacutes Chacun de ces embranchementspossegravede une voie courte et une voie longue La fourmi a donc 4 choix agrave eectuer lors dun aller-retour pour partir de son nid et ramener de la nourriture Au deacutebut de lexpeacuterimentation lesfourmis ont besoin de 5 agrave 10 minutes pour explorer leur environnement et trouver la nourritureTous les chemins sont dabord choisis de maniegravere aleacuteatoire puis quelques minutes plus tard etde maniegravere abrupte le meacutecanisme de renforcement rentre en jeu et les voies les plus courtes sontprivileacutegieacutees Une trentaine de minutes apregraves le deacutebut de lexpeacuterimentation les fourmis empruntentmajoritairement le chemin le plus court

Figure 28 Scheacutema du dispositif expeacuterimental utiliseacute pour veacuterier si les fourmis sont biencapables demprunter rapidement la voie la plus courte lorsque leur sont preacutesenteacutes des choixqualitativement dieacuterents [Goss et al 1989]

Alors que la premiegravere expeacuterience a montreacute que les fourmis possegravedent bien un meacutecanismedexploration aleacuteatoire menant au choix puis au renforcement dune des deux voies possibles ladeuxiegraveme expeacuterience montre que les fourmis sont bien capables de choisir le chemin le plus courtlorsquelles sont confronteacutees agrave deux voies possibles ayant des distances dieacuterentes Une critiquepeut ecirctre formuleacutee dans le sens ougrave ces deux expeacuterimentations se sont deacuterouleacutees en laboratoireavec un dispositif expeacuterimental relativement petit (quelques dizaines de centimegravetres pour allerdu nid agrave la nourriture) De par la taille reacuteduite des dispositifs les expeacuterimentations ne duraientgeacuteneacuteralement pas plus dune trentaine de minutes Durant ce laps de temps relativement courtle meacutecanisme deacutevaporation des pheacuteromones ne pouvait pas entrer en jeu car les pheacuteromonesnavaient pas le temps de seacutevaporer

Ces deux expeacuteriences sont inteacuteressantes et illustrent chacune des capaciteacutes fondamentalesdes fourmis dans la nature quant agrave leur deacuteplacement et agrave leur survie Jean-Louis Deneubourg[Deneubourg et al 1990] et Marco Dorigo [Dorigo 2001] ont montreacute comment il eacutetait possible dereproduire ces comportements via des simulations informatiques Dans la tradition des systegravemesmulti-agents les principes permettant de modeacuteliser ces comportements sont relativement simpleset comme montreacute dans la section preacuteceacutedente seules quelques eacutequations susent agrave obtenir unemodeacutelisation de la reacutealiteacute et leacutemergence de comportements intelligents Dans la suite de cettesection nous allons voir quelques exemples dutilisation dalgorithmes provenant des modegraveles

42

25 Utilisation et eacutevolution reacutecentes des algorithmes de colonies de fourmis

ACO dans les systegravemes de recommandation

25 Utilisation et eacutevolution reacutecentes des algorithmes de colonies

de fourmis

Nous avons vu dans les sections preacuteceacutedentes que les algorithmes de colonies de fourmis onteacuteteacute utiliseacutees dans des problegravemes connus comme le voyageur de commerce les tourneacutees de veacutehi-cules ou la gestion de projet agrave contraintes Chacun de ces exemples a la particulariteacute decirctre unproblegraveme doptimisation ougrave le but est de minimiser une distance agrave parcourir ou un temps dexeacute-cution avec certaines contraintes ce qui correspond bien au but premier des ACO La versatiliteacutedes systegravemes multi-agents leur a permis de sadapter dans des domaines comme les systegravemesde recommandation et ils ont particuliegraverement eacuteteacute exploiteacute pour le-eacuteducation Dans la suite decette section nous allons eacutetudier quelques applications des algorithmes de la famille des ACOdans ce domaine particulier

251 Les algorithmes de colonies de fourmis dans les systegravemes de recomman-

dation

Lune des premiegraveres applications des ACO dans le domaine des systegravemes de recommandationa eacuteteacute proposeacutee par [Semet et al 2003] dans le-education Le but de leacutetude eacutetait de recomman-der des cours et des exercices agrave des lyceacuteens avec lobjectif peacutedagogique dameacuteliorer leur reacuteussitescolaire Cette eacutetude est inteacuteressante car en plus de proposer une modication des modegraveles ACOpour la recommandation elle a eacuteteacute reacutealiseacutee en partenariat avec Paraschool 30 une entreprise deacute-dieacutee agrave lapprentissage en ligne pour les lyceacuteens franccedilais permettant aux auteurs de tester leurmodegravele Dans ce dernier le domaine peacutedagogique est repreacutesenteacute par un graphe valueacute ougrave les som-mets sont des items peacutedagogiques et les arcs sont les liens hypertextes ougrave des probabiliteacutes depassage sont associeacutees Les eacutetudiants sont repreacutesenteacutes par des agents se deacuteplaccedilant dans le grapheen laissant des pheacuteromones sur les arcs quils suivent Chaque page de cours ou dexercice (re-preacutesenteacute par un sommet unique dans le graphe) est doteacute dun bouton NEXT amenant leacutetudiantvers un nouveau cours selon une arecircte choisie par lalgorithme selon les facteurs suivants

Poids peacutedagogique W cest la valeur principale de chaque arecircte Il est impleacutementeacutecomme une variable globale accessible agrave tous les agents W est manuellement deacuteni enamont par les professeurs et reegravete limportance des arecirctes venant dun sommet particulier(ie cet exercice est important apregraves la leccedilon x donc W = 0 8 la leccedilon y nest pas tregravesimportante apregraves la leccedilon x donc W = 0 3)

Pheacuteromones S and F S repreacutesente la pheacuteromone de succegraves tandis que F repreacutesente lapheacuteromone deacutechec S est increacutementeacutee quand les eacutetudiants ont reacuteussi agrave compleacuteter lexercicecorrespondant et inversement pour F Ces pheacuteromones sont associeacutees agrave larecircte qui ameneacute lagent au sommet courant mais aussi aux preacuteceacutedents sommets emprunteacutes avec unequantiteacute de plus en plus reacuteduite limiteacutee agrave 4 sommets en arriegravere Le but est de repreacutesenterle fait que le reacutesultat dun exercice deacutepend de lensemble du parcours emprunteacute et nondu dernier sommet uniquement 31 Les pheacuteromones seacutevaporent aussi au fur et agrave mesure

30 http wwwparaschoolcom31 Cette meacutethode est similaire dans son fonctionnement agrave la technique de reacutetropropagation du gradient dans

lapprentissage des reacuteseaux de neurones

43

Chapitre 2 Eacutetat de lart

chaque jour Historique personnel H cest une variable propre agrave chaque sommet visiteacute pour chaque

agent Quand un eacutetudiant valide le module peacutedagogique associeacute au sommet alors la valeurh associeacutee agrave ce sommet particulier est eacutegale agrave 0 5 quand un eacutetudiant eacutechoue le modulepeacutedagogique alors h = 0 75 Cette valeur est ensuite utiliseacutee comme facteur multiplicatifpour reacuteduire la probabiliteacute de visiter le sommet agrave nouveau Si le sommet est revisiteacute Hest agrave nouveau multiplieacute par ces mecircmes valeurs H seacutevapore avec le temps pour tendrevers 1 symbolisant le fait que plus le temps passe et plus un eacutetudiant aura tendance agraveoublier le module peacutedagogique visiteacute

Pour chaque arc a une tness value est calculeacutee selon lEacutequation f(a) = H(ω1W + ω2S minusω3F ) ougrave ω1 ω2 et ω3 sont les poids permettant de moduler limportance des 3 facteurs pris encompte Plus la valeur de f(a) est haute et plus larc sera consideacutereacute attractif Un arc sera doncattractif quand

son ndivideud darriveacutee na jamais eacuteteacute visiteacute ou na pas eacuteteacute visiteacute depuis longtemps (H rarr 1) il est pleacutebisciteacute par les professeurs (W important) il y a une atmosphegravere de succegraves autour de cet arc (S important) peu deacutechecs ont eu lieu pregraves de cet arc (F faible)

An de choisir le prochain arc pour leacutetudiant le systegraveme seacutelectionne aleacuteatoirement un cer-tain nombre darcs possibles et garde celui posseacutedant la plus haute valeur f(a) La seacutelection dunsous-ensemble darcs permet de varier un minimum les recommandations et deacuteviter de proposertout le temps les arcs les plus attractifs

Les auteurs proposent donc ici une adaptation complegravete des ACO pour un systegraveme de recom-mandation dans le-eacuteducation tout en inteacutegrant des principes peacutedagogiques importants Luti-lisation de plusieurs types de pheacuteromones et de dieacuterentes valuations sur les arecirctes du graphepermettent dentrevoir le potentiel et ladaptabiliteacute des algorithmes ACO Quelques critiquespeuvent cependant ecirctre proposeacutees

Une premiegravere critique possible est quil nexiste pas de modegravele utilisateur prenant en compteles caracteacuteristiques personnelles de chaque eacutetudiant (notes niveau style dapprentissage) Pos-seacuteder et utiliser un modegravele par eacutetudiant pourrait permettre agrave lalgorithme de mieux sadapteraux cas particuliers nombreux dans le domaine des systegravemes de recommandation [Gras et al2016] Dans cet article les auteurs montrent que les techniques classiques de ltrage collaboratifnarrivent pas agrave bien deacutetecter les utilisateurs atypiques 32 alors quil est possible de deacutetecter etde satisfaire ces derniers avec des techniques speacuteciques

Une autre critique possible concerne le fait que les professeurs doivent au preacutealable eacutevaluerles chemins possibles agrave partir de chaque sommet sous la forme du poids peacutedagogique W Ce faitreacutevegravele que lexpeacuterimentation na pas utiliseacute un grand nombre de ressources peacutedagogiques (ce quiest le cas car le graphe utiliseacute par les auteurs ne posseacutedait que 20 ndivideuds et 47 arecirctes soit 20ressources peacutedagogiques) Dans la pratique cette meacutethode nest pas adapteacutee pour trois raisonsmajeures Premiegraverement il est dicilement concevable deacutevaluer manuellement la probabiliteacute de

32 Les utilisateurs atypiques (Grey Sheep Users) sont des utilisateurs posseacutedant des preacutefeacuterences dieacuterentes dela majoriteacute des autres utilisateurs du systegraveme

44

25 Utilisation et eacutevolution reacutecentes des algorithmes de colonies de fourmis

passage de chaque arecircte dans des domaines deacutepassant les quelques dizaines de ressources Deuxiegrave-mement lutilisation dexperts du domaine comme les professeurs dans le-eacuteducation nest pasforceacutement possible selon le domaine consideacutereacute Qui peut par exemple juger de la qualiteacute destransitions agrave partir dune musique speacutecique Troisiegravemement un tel modegravele nest que dicile-ment transfeacuterable en leacutetat dun domaine applicatif agrave un autre pour les raisons eacutevoqueacutees ci-dessus

Inteacuteressons-nous maintenant agrave une autre eacutetude dans le-eacuteducation qui propose une solutionpour permettre une plus grande personnalisation des recommandations Dans leur article [Kurilo-vas et al 2015] utilisent eux aussi les ACO avec comme but de fournir des seacutequences composeacutees demodules dapprentissage aux eacutetudiants en fonction de leur style dapprentissage Des recherchesont montreacute quil existait de grands styles dapprentissage et que les apprenants posseacutedaient despreacutefeacuterences pour certains styles plus que dautres Les auteurs utilisent ici la cateacutegorisation en 4grands styles proposeacutee par [Honey et al 1992] 33 Ainsi les agents ne sont deacutesormais plus tousidentiques mais possegravedent un ou plusieurs style(s) dapprentissage preacutefeacutereacute(s) et la mise agrave jourdes pheacuteromones est elle aussi modieacutee an de prendre en compte ces preacutefeacuterences Ainsi un agentpreacutefeacuterera un chemin composeacute de modules dapprentissage correspondant agrave son ou ses propre(s)style(s) dapprentissage et deacuteposera plus de pheacuteromones le cas eacutecheacuteant Ces changements reegravetentune volonteacute de personnalisation des recommandations sinscrivant dans le reacutecent changement deparadigme du domaine des systegravemes de recommandation ougrave les preacutefeacuterences des utilisateurs sontde plus en plus prises en compte Il est neacuteanmoins agrave noter pour cette eacutetude quil est neacutecessairede faire passer un long questionnaire pour deacutenir les styles dapprentissage des apprenants avantde pouvoir utiliser le systegraveme De plus ces styles dapprentissage sont xes et ne peuvent plusecirctre modieacutes apregraves le deacutemarrage du systegraveme empecircchant potentiellement un apprenant deacutevoluerdans sa maniegravere dapprendre

Lideacutee de modier le modegravele ACO pour prendre en compte plusieurs types dutilisateurs aaussi eacuteteacute exploiteacutee dans une autre eacutetude en e-eacuteducation par [Kardan et al 2014] Cette eacutetude a lemecircme but que la preacuteceacutedente agrave savoir recommander des seacutequences personnaliseacutees eacuteducatives avecACO mais les auteurs proposent une autre solution tout aussi inteacuteressante Ils se basent ainsi surla theacuteorie de David Ausubel selon laquelle lapprentissage est faciliteacute lorsque lapprenant peutmettre en relation les nouveaux concepts quil est en train de deacutecouvrir avec ce quil connaicirct deacutejagrave[Ausubel 1963] Les auteurs proposent un algorithme en deux parties

1 Les apprenants sont dabord eacutevalueacutes avec des items de tests correspondant chacun agrave unou plusieurs concepts devant ecirctre appris An de deacuteterminer le degreacute de familiariteacute agraveun concept par un apprenant le score quil a obtenu agrave chaque item de test est utiliseacuteen combinaison avec le degreacute de lien entre les concepts et chaque item pour creacuteer unematrice learners times concepts Lalgorithme des k-means est ensuite utiliseacute an de diviserles apprenants en groupes ayant les mecircmes familiariteacutes avec les concepts

2 lalgorithme ACO est appliqueacute avec autant de groupes dagents speacuteciques quil y a degroupes dapprenants deacutecouverts preacuteceacutedemment avec les k-means Ainsi un chemin opti-mal est trouveacute pour chaque groupe permettant de naviguer parmi tous les concepts dansun ordre preacutecis et speacutecique au degreacutes de familiariteacute de chaque groupe Autrement dit lesystegraveme recommande pour chaque groupe dapprenants une seacutequence eacuteducative person-naliseacutee en fonction de ses connaissances initiales

33 Activist Theorist Pragmatist Reector

45

Chapitre 2 Eacutetat de lart

On retrouve donc ici lideacutee de creacuteer dieacuterents types dagents pour reacutesoudre dieacuterents pro-blegravemes Cette constatation nest pas eacutetonnante dans le sens ougrave lorsquil sagit doptimisationun seul groupe dagents peut sure agrave optimiser une variable unique comme par exemple la dis-tance En revanche dans le domaine des systegravemes de recommandation il nest pas envisageablede proposer la mecircme recommandation agrave tous les utilisateurs Au contraire lapproche agrave privi-leacutegier est de pouvoir sadapter au cas par cas agrave chaque utilisateur et de prendre en compte sespreacutefeacuterences pour lui proposer une solution adapteacutee On peut dailleurs eacutemettre deux critiques decette eacutetude agrave la lumiegravere de cette analyse Premiegraverement mecircme si le modegravele propose un certaindegreacute de personnalisation sa granulariteacute nest encore pas assez ne puisquil traite des groupesdindividus et non un individu unique Ensuite il ny a encore une fois pas de moyen pour unapprenant de changer dynamiquement de groupe eacutetant donneacute que ces derniers doivent ecirctre creacuteeacutesen amont du processus de recommandation

Toujours dans la famille des algorithmes ACO nous pouvons eacutegalement citer le modegraveleAttribute-based Ant Colony System qui est similaire aux derniers modegraveles deacutecrits ci-dessus touten proposant un degreacutes de personnalisation plus n [Yang and Wu 2009] Les auteurs utilisentle modegravele dapprentissage de Kolb [Kolb and Fry 1974] an dassigner agrave chaque ressource eacuteduca-tive et agrave chaque apprenant deux attributs les deacutecrivant (type dapprentissage de la ressourcedelapprenant et niveau de compeacutetence de la ressourcede lapprenant) Les agents possegravedent aussices attributs puisquils correspondent aux apprenants Les auteurs calculent ensuite un niveaude correspondance entre lapprenant et la ressource eacuteducative permettant de juger de la qualiteacutedu chemin trouveacute Finalement la seacutequence dont les ressources eacuteducatives la composant corres-pondent le plus aux caracteacuteristiques de lagent est recommandeacutee agrave lapprenant Ce travail estinteacuteressant car il pousse encore un peu plus la personnalisation des recommandations Cependanton commence agrave remarquer ici que la neacutecessiteacute de personnaliser toujours plus les recommandationscommence agrave complexier de maniegravere importante les systegravemes proposeacutes Nous discuterons plusen deacutetail de ce point dans la conclusion de cette section

Prenons enn une derniegravere eacutetude dans le domaine de le-eacuteducation qui sest particuliegravere-ment inteacuteresseacutee agrave la notion de seacutequence et dobjectif agrave atteindre pour lapprenant [Van den Berget al 2005] En eet les auteurs expliquent que les plateformes deacuteducation en ligne proposentde plus en plus datteindre des objectifs peacutedagogiques de haut niveau (eg acqueacuterir une com-peacutetence speacutecique posseacuteder un certain niveau de connaissance dans un domaine ) tout enlaissant les apprenants libres de suivre les modules quils souhaitent Cependant cette exibiliteacutede fonctionnement complexie les programmes de ces plateformes et peut amener agrave labandondes apprenants Pour remeacutedier agrave ce problegraveme les auteurs proposent un systegraveme de guidage desapprenants utilisant ACO baseacute sur la speacutecication au preacutealable de plusieurs concepts pour chaqueapprenant

Le but de lapprenant cest la description du niveau de compeacutetence que lapprenant veutatteindre)

Le parcours le plan pour atteindre le but de lapprenant deacutecrit comme une seacuterie deseacutequences de ressources eacuteducatives Les plateformes dapprentissage en ligne proposentsouvent elles-mecircmes des parcours via lesquels les apprenants peuvent atteindre leur but

La position de lapprenant repreacutesente lensemble des ressources eacuteducatives ayant eacuteteacutecompleacuteteacutees par lapprenant

Autrement dit an de pouvoir satisfaire un apprenant il est neacutecessaire de savoir quel est

46

25 Utilisation et eacutevolution reacutecentes des algorithmes de colonies de fourmis

le but quil souhaite atteindre la maniegravere dont il veut latteindre et sa position actuelle Cestrois informations sont primordiales pour comprendre la trajectoire dun utilisateur et pour ecirctrecapable de lui recommander une seacutequence adapteacutee agrave ses besoins

Nous avons vu dans cette section le potentiel des algorithmes de colonies de fourmis pour larecommandation Neacuteanmoins la premiegravere partie de leacutetat de lart a montreacute agrave quel point il eacutetaitimportant pour les systegravemes actuels de pouvoir prendre en compte plusieurs facteurs humainsan de satisfaire au mieux les utilisateurs Dans la section suivante nous allons nous inteacuteresseragrave la maniegravere dont les algorithmes de colonies de fourmis sont capables de minimiser non plus unseul objectif (la distance) mais bien plusieurs objectifs pouvant ecirctre opposeacutes les uns aux autres

252 Les algorithmes de colonies de fourmis multi-objectifs

En parallegravele du deacuteveloppement des algorithmes de colonies de fourmis mono-objectif dans lalitteacuterature une partie de la communauteacute scientique sest inteacuteresseacutee aux algorithmes de coloniesde fourmis multi-objectifs dans le but de reacutesoudre de nouvelles classes de problegravemes En eetles algorithmes ACO ont agrave lorigine eacuteteacute conccedilus pour minimiser une valeur souvent repreacutesenteacuteepar la notion de distance Cependant de nombreux problegravemes neacutecessitent la minimisation demultiples valeurs en parallegravele an dobtenir une solution On peut par exemple citer les variantesmulti-objectifs de problegravemes vus dans la section preacuteceacutedente

Le problegraveme du voyageur de commerce multi-objectifs (multi-objective travelling salesmanproblem) ougrave la distance agrave minimiser ainsi que le temps de voyage sont les deux objectifsagrave minimiser (avec lintroduction de contraintes de circulation rendant certains cheminsplus ou moins longs agrave emprunter)

Le problegraveme de la tourneacutee de veacutehicules avec fenecirctre de temps (vehicle routing problem withtime windows) ougrave en plus de minimiser le nombre de veacutehicules utiliseacutes et le trajet totalparcouru par ceux-ci les clients doivent ecirctre livreacutes dans une certaine fenecirctre de temps

Dans le cas de ces deux problegravemes ainsi que pour beaucoup de problegravemes multi-objectifstraiteacutes dans la litteacuterature scientique les objectifs agrave minimiser sont souvent incompatibles entreeux dans le sens ougrave minimiser un objectif speacutecique tend agrave peacutenaliser un ou plusieurs des autresobjectifs Prenons comme exemple le problegraveme du voyageur de commerce multi-objectifs Le butest de trouver le plus court chemin dun point A agrave un point B non seulement dun point devue de la distance parcourue mais aussi du temps neacutecessaire pour faire le chemin Cependantminimiser la distance parcourue impliquera potentiellement demprunter des chemins encombreacutesrallongeant le temps de voyage En dautres termes minimiser lobjectif de distance parcouruepeut deacutegrader lobjectif de temps Inversement optimiser lobjectif de temps demanderait po-tentiellement dutiliser des chemins moins emprunteacutes mais plus longs deacutegradant ainsi lobjectifde minimisation de la distance totale parcourue Ces problegravemes ougrave loptimisation dun objectifaecte les performances des autres objectifs ne possegravedent souvent pas de solution optimale Eneet dans un problegraveme mono-objectif plus un algorithme reacuteussira agrave minimiser cet objectif etmeilleure sera la solution Un problegraveme mono-objectif possegravede donc une solution optimale ougravelobjectif agrave optimiser possegravede une valeur minimale et corollairement il est possible de classerles solutions trouveacutees en fonction de cette valeur Autrement dit pour deux solutions dieacuterentess1 s2 devant minimiser la valeur v pour le mecircme problegraveme si vs1 lt vs2 alors s1 est strictementune meilleure solution que s2 Pour les problegravemes multi-objectifs il nest pas directement possiblede deacuteterminer si une solution est meilleure quune autre Lexemple du voyageur de commerce

47

Chapitre 2 Eacutetat de lart

multi-objectifs avec la distance d et le temps t illustre bien ce fait comment deacuteterminer si une

solution s1 =

d = 13 kmt = 23 mn

est meilleure quune autre solution s2 =

d = 11 kmt = 26 mn

Devant

la multitude de solutions possibles sans moyen direct de les classer il est utile de consideacutererle concept doptimum de Pareto Le principe de Pareto a dabord eacuteteacute inventeacute dans le domainesocio-eacuteconomique pour deacutecrire la distribution de pouvoir et de richesses au sein dune populationIl a ensuite eacuteteacute eacutetendu avec la notion doptimum de Pareto deacutecrivant lensemble des solutionsagrave un problegraveme multi-objectifs ougrave il nest pas possible dameacuteliorer un des objectifs sans deacutegraderles autres 34 Toutes les solutions Pareto-optimales agrave un problegraveme sont donc eacutequivalentes entreelles (mecircme si elles sont bien toutes dieacuterentes les unes des autres) et sont strictement meilleuresque toutes les autres solutions non optimales agrave ce mecircme problegraveme (aussi appeleacutees solutions do-mineacutees) La Figure 29 illustre lespace des solutions sur un problegraveme de minimisation de deuxvariables On remarque la preacutesence dune frontiegravere aussi appeleacute front de Pareto ougrave toutes lessolutions sont optimales

Figure 29 Front de Pareto dun problegraveme de minimisation de deux variables f1 et f2 Toutesles solutions sur cette frontiegravere sont optimales (source Wikipedia)

On peut trouver dans la litteacuterature des exemples de reacutesolution de problegravemes multi-objectifsavec ACO utilisant le concept de Pareto [Alaya et al 2007] proposent un algorithme geacuteneacuteriquebaseacute sur le MAX-MIN Ant System 35 ougrave les nombres de colonies et de structures de pheacuteromonesvarient en fonction du nombre dobjectifsm agrave optimiser Les auteurs proposent ainsi plusieurs va-riantes de leur algorithme ayant des paramegravetres dieacuterents (nombres de colonies de pheacuteromonesde fourmis de cycles et valeur des meta-paramegravetres) Ces dieacuterentes versions sont ensuite testeacuteesavec le problegraveme du sac-agrave-dos multi-objectifs 36 et montrent que la version posseacutedant 1 seulecolonie et m pheacuteromones obtient les meilleurs reacutesultats Outre les reacutesultats obtenus ce travailest inteacuteressant car il propose plusieurs strateacutegies dieacuterentes pour pouvoir adapter les algorithmes

34 On peut deacutecliner ce concept en socio-eacuteconomie ougrave le but est deacutetudier les richesses dune socieacuteteacute an quellessoient reacuteparties selon une solution optimale de Pareto entre toutes les personnes Ce concept a cependant deslimites que nous verrons par la suite35 Le MAX-MIN Ant System [Stuumltzle and Hoos 2000] est une version dieacuterente de lalgorithme initial de

Marco Dorigo posseacutedant deux dieacuterences majeures avec ce dernier seule la fourmi ayant reacutealiseacutee le meilleurparcours peut mettre agrave jour les pheacuteromones du chemin emprunteacute et la quantiteacute de pheacuteromones est limiteacute dans unintervalle speacutecique sur chaque arc36 Le plus souvent reacutefeacuterenceacute dans la litteacuterature en anglais via lacronyme MOKP Multi-Objective Knapsack

Problem

48

25 Utilisation et eacutevolution reacutecentes des algorithmes de colonies de fourmis

ACO aux problegravemes multi-objectifs agrave savoir

Traces de pheacuteromones 2 strateacutegies existent lorsquun problegraveme possegravede plusieurs objec-tifs La premiegravere est de nutiliser quun seul type de pheacuteromones Dans ce cas la quantiteacutede pheacuteromones deacuteposeacutee par les fourmis est deacutenie par une agreacutegation des dieacuterents objec-tifs La deuxiegraveme strateacutegie consiste agrave utiliser plusieurs pheacuteromones Dans ce cas chaqueobjectif est geacuteneacuteralement associeacute agrave une colonie de fourmis unique chacune posseacutedant sonpropre type de pheacuteromones

Deacutenition des heuristiques encore une fois 2 strateacutegies existent pour la partie heuristiqueUne premiegravere solution consiste agrave agreacuteger tous les objectifs en une seule heuristique Unedeuxiegraveme solution consiste agrave consideacuterer chaque objectif seacutepareacutement Dans ce cas il y ageacuteneacuteralement une colonie par objectif

Mise-agrave-jour des pheacuteromones lors de la mise agrave jour des pheacuteromones il est neacutecessaire dedeacutecider sur quelle solution des pheacuteromones doivent ecirctre deacuteposeacutees Une premiegravere possibi-liteacute est de reacutecompenser les meilleures solutions agrave chaque objectif Une seconde possibiliteacuteest de reacutecompenser toutes les solutions appartenant agrave lensemble des solutions Pareto-optimales

Le concept doptimisation multi-objectifs est aussi utiliseacute pour reacutesoudre des problegravemes sansutiliser des algorithmes de type ACO Ces travaux sont inteacuteressants dans le cadre de cette thegravesecar ils peuvent orir un point de comparaison aux modegraveles deacuteveloppeacutes dans le chapitre suivantougrave le but est le mecircme mais la technique utiliseacutee pour y parvenir est dieacuterente Nous allons main-tenant voir plus en deacutetails le travail de [Ribeiro et al 2014] ougrave les auteurs ont proposeacute deuxmeacutethodes de recommandation multi-objectifs sans utiliser dalgorithmes de type ACO

Pareto-ecient ranking dans cette premiegravere meacutethode le principe est ici de re-preacutesenter chaque ressource recommandable agrave un point dans un espace agrave n dimensionsappeleacute le user-interest space Un point dans cet espace est repreacutesenteacute par n coordon-neacutees [c1 c2 cn] ougrave chacune repreacutesente un score de pertinence de la ressource pourlutilisateur estimeacute par dieacuterents algorithmes Les points situeacutes agrave la frontiegravere de Paretocorrespondent aux cas ougrave aucune Pareto-ameacutelioration nest possible dans les dieacuterentesdimensions

Pareto-Ecient Hybridization (PEH) dans cette deuxiegraveme meacutethode le principe estdassocier chaque ressource avec une valeur de pertinence unique pour lutilisateur Cettevaleur est elle-mecircme estimeacutee par une combinaison lineacuteaire des scores de pertinence obtenuspar n dieacuterents algorithmes de recommandation existants (ie αtimesc1+βtimesc2+ +θtimescn)Dans cette tactique lespace appeleacute objective space comporte 3 dimensions ougrave chaquepoint correspond aux niveaux de preacutecision de diversiteacute et de nouveauteacute atteint par unetechnique dhybridation possible Le but est de chercher les poids (ie α β θ) pourlesquels lhybridation des dieacuterents algorithmes permet dobtenir le meilleur reacutesultat pourlutilisateur Il est ensuite possible de moduler cette hybridation an de correspondre aumieux aux prioriteacutes de lutilisateur au moment de la recommandation (eg pour un utilisa-teur reacutecent le systegraveme pourrait proposer des ressources pertinentes et classiques pour luiprouver linteacuterecirct du systegraveme de recommandation tandis que pour un utilisateur ancienil pourrait ecirctre inteacuteressant de privileacutegier la diversiteacute et la nouveauteacute an de lui apporterde nouvelles ressources quil ne connaicirct pas encore)

Selon les auteurs la premiegravere meacutethode permet de trouver un ordonnancement partiel entre

49

Chapitre 2 Eacutetat de lart

les ressources tout en eacutevitant les ressources positionneacutees aux positions extrecircmes de la frontiegravere dePareto La deuxiegraveme meacutethode quant agrave elle utilise la frontiegravere de Pareto pour trouver des hybri-dations capable de sadapter aux demandes et dorir des recommandations eacutetant simultaneacutementpertinentes en termes de preacutecision de diversiteacute et de nouveauteacute Dans le cadre de cette thegravese ladeuxiegraveme technique pareto-ecient hybridization (PEH) est particuliegraverement inteacuteressante carelle correspond aux probleacutematiques poseacutees au chapitre preacuteceacutedent De plus cet article est agrave lafois reacutecent est beaucoup reacutefeacuterenceacute dans la litteacuterature scientique de par la qualiteacute des solutionsproposeacutees Ainsi nous preacuteciserons le fonctionnement de lalgorithme PEH proposeacute par [Ribeiroet al 2014] et nous utiliserons ses reacutesultats comme comparaison pour eacutevaluer les performancesde notre modegravele dans la chapitre preacutesentant les expeacuterimentations meneacutees et les reacutesultats obtenus

253 Discussion sur lutilisation de loptimum de Pareto

Dans ces derniegraveres pages nous nous sommes attardeacutes sur lutilisation du concept doptimumde Pareto dans la litteacuterature Cependant mecircme si lutilisation de cette technique est courantepour reacutesoudre des problegravemes multi-objectifs elle nest pas forceacutement la plus adapteacutee selon lessituations rencontreacutees et les solutions attendues On peut deacutenombrer au moins quatre problegravemesengendreacutes par lutilisation du concept de Pareto

1 Comme le souligne [Iredi et al 2001] lutilisation du front de Pareto est utile lorsquilnest pas possible dordonner limportance des dieacuterents objectifs du problegraveme Lorsquecela est possible des poids sont attribueacutes agrave chacun des objectifs et il devient possible declasser les dieacuterentes solutions obtenues selon ces poids

2 Il est neacutecessaire decirctre capable de geacuteneacuterer beaucoup de solutions pour un problegraveme donneacutean de pouvoir deacuteterminer les solutions Pareto-optimales et les solutions domineacutees

3 Une solution Pareto-optimale nest pas forceacutement une solution inteacuteressante pour le pro-blegraveme Un exemple connu illustre ce fait une socieacuteteacute ougrave un seul homme possegravede lensembledes richesses est optimale car partager ces richesses entraicircnerait la reacuteduction du bien-ecirctredau moins un individu

4 Si le problegraveme exige le choix dune solution le front de solutions Pareto-optimales nepermet pas a priori de faire un choix eacutetant donneacute que toutes les solutions du front sonteacutequivalentes les unes aux autres Le problegraveme dispose alors dun ensemble de solutions lereacutesolvant et non dune seule solution

Le dernier point ci-dessus est eacutegalement eacutevoqueacute dans [Dorigo and Birattari 2010] ougrave lesauteurs expliquent que deux maniegraveres de reacutesoudre les problegravemes multi-objectifs existent dans lalitteacuterature soit il est possible de classer les objectifs par ordre dimportance ou eacuteventuellementde combiner tous les objectifs en un seul gracircce agrave une somme pondeacutereacutee soit les preacutefeacuterences ou lespoids a priori ne sont pas connus et dans ce cas il est inteacuteressant de deacuteterminer un ensemblede solutions Pareto optimales Dans le cadre dun systegraveme de recommandation et comme nouslavons illustreacute dans la Section 22 il est possible destimer les besoins des utilisateurs danschacune des dimensions eacutevalueacutees (diversiteacute nouveauteacute preacutecision ) et donc de moduler leurimportance en amont de la recommandation (eg en leur attribuant des poids par exemple)

26 Discussion geacuteneacuterale

Dans cet eacutetat de lart nous avons fait un tour dhorizon du domaine de la recommandationet de son eacutevolution au cours de ces derniegravere anneacutees Avec la deacutemocratisation dInternet de plus

50

26 Discussion geacuteneacuterale

en plus dutilisateurs ont eacuteteacute ameneacutes agrave utiliser ces systegravemes et aujourdhui ils accompagnentlimmense majoriteacute des grands sites web et prennent une place de plus en plus importante Cettedeacutemocratisation a permis la mise en relief des besoins toujours plus varieacutes des utilisateurs et amontreacute que les systegravemes mono-objectif baseacutes uniquement sur la preacutecision des recommandationsneacutetaient plus susants Agrave la lumiegravere de ce constat nous nous sommes particuliegraverement inteacute-resseacutes aux techniques permettant de prendre en compte le plus de dimensions possibles dans lesbesoins des utilisateurs que nous avons appeleacutes facteurs humains Les travaux de la litteacuteraturedu domaine preacutesenteacutes dans cette section ont permis de mettre en exergue un certain nombre depoints inteacuteressants qui seront utiliseacutes pour reacutepondre aux probleacutematiques de cette thegravese ils sontreacutesumeacutes dans la liste suivante

[Dorigo and Birattari 2011] les auteurs ont preacutesenteacute dieacuterents modegraveles dalgorithmes defourmis permettant de reacutesoudre un grand nombre de problegravemes Ces modegraveles sont inteacuteres-sants notamment de par leur capaciteacute de reacutesoudre des problegravemes multi-objectifs complexesgracircce aux notions dintelligence collective et deacutemergence Ils sont utiliseacutes dans dieacuterentsdomaines dapplication (optimisation recommandation) ils sont tregraves modulables etorent de nombreuses possibiliteacutes pour les probleacutematiques de cette thegravese

[Semet et al 2003] cette eacutetude est lune des premiegraveres agrave proposer lutilisation de plusieurspheacuteromones dieacuterentes dans les ACO dans le cadre dun systegraveme de recommandation dansle-education Ces dieacuterents pheacuteromones eacutetaient chacun destineacutes agrave reacutesoudre une facettedu problegraveme Ce travail a neacuteanmoins aussi montreacute les limites de la creacuteation manuelle dungraphe sur lequel appliquer les ACO deacutemontrant linteacuterecirct davoir une meacutethode automa-tique de creacuteation et de valuation dun graphe repreacutesentant le domaine dapplication et sesressources

[Kurilovas et al 2015] les auteurs ont deacutemontreacute dans cette eacutetude linteacuterecirct de pouvoircateacutegoriser les utilisateurs dun systegraveme an de personnaliser davantage les recommanda-tions mais elle a aussi montreacute le besoin de pouvoir modier en cours de fonctionnementces cateacutegories pour ne pas enfermer les utilisateurs dans les mecircmes recommandations

[Kardan et al 2014] les auteurs ont ici montreacute lutilisation de plusieurs types dagentsdieacuterents qui chacun cherchaient dieacuterentes solutions Cette technique est proche de luti-lisation des dieacuterents types de pheacuteromones de [Semet et al 2003] et permet de chercherdes solutions plus varieacutees agrave des problegravemes complexes

[Yang and Wu 2009] cette eacutetude utilise les modegraveles ACO dans le-education en eacutetoantencore le niveau de personnalisation pour chaque utilisateur Elle illustre cependant leproblegraveme courant ougrave lameacutelioration de la personnalisation des recommandations reacutesultesouvent dans laugmentation de la complexiteacute du modegravele

[Van den Berg et al 2005] cet article propose de recommander des seacutequences de res-sources eacuteducatives agrave des apprenants Il illustre linteacuterecirct de deacutenir une seacutequence de recom-mandation avec des buts peacutedagogiques agrave atteindre un objectif nal et un point de deacutepartougrave lutilisateur se trouve actuellement

[Ribeiro et al 2014] ce dernier article nutilise pas les ACO mais une hybridation de plu-sieurs algorithmes permettant de proposer des recommandations de ressources pertinentespour chaque utilisateur sur 3 dimensions (preacutecision diversiteacute nouveauteacute) Il propose doncde reacutesoudre un problegraveme similaire agrave celui poseacute dans cette thegravese mais avec une techniquedieacuterente des travaux preacutesenteacutes preacuteceacutedemment il sera par conseacutequent une solide base decomparaison pour mesurer les performances dun algorithme de type ACO

Dune maniegravere geacuteneacuterale cette revue des travaux sur les algorithmes de colonies de fourmis

51

Chapitre 2 Eacutetat de lart

ont montreacute leur puissance de reacutesolution de problegravemes varieacutes et leur modulariteacute Cependant nousavons aussi constateacute ici une tendance geacuteneacuterale ces derniegraveres anneacutees agrave complexier toujours plusle modegravele initial et les agents le composant illustrant un certain eacuteloignement avec la philosophiedes modegraveles multi-agents Celle-ci repose sur la reacutesolution de problegravemes complexes gracircce agrave laproprieacuteteacute de leacutemergence et de lauto-organisation dagents simples reacutegis par des regravegles simplesCette complexication deacutecoule cependant de la direction prise par le domaine des systegravemes de re-commandation ces derniegraveres anneacutees avec la deacutemocratisation de nombreuses mesures deacutevaluationtelles que la diversiteacute la nouveauteacute etc Dans la suite de cette thegravese nous eacutetudierons la maniegraveredont il est possible de combiner la neacutecessaire complexication des recommandations an decirctrele plus pertinent possible pour lutilisateur et la simpliciteacute inheacuterente aux modegraveles multi-agents

En conclusion nale de cet eacutetat de lart nous pouvons deacutenir deux enjeux qui guiderontla suite de ce travail la recommandation multi-objectifs et la recommandation enseacutequences Le but de cette thegravese est donc de sinscrire agrave lintersection de ces deux enjeux gracircceagrave un modegravele de colonies de fourmis multi-objectifs qui sera deacutecrit dans le chapitre suivant

52

Chapitre 3

Notre modegravele de recommandationmulti-objectifs AntRS

Sommaire

31 Introduction 54

32 Fonctionnement geacuteneacuteral du modegravele 54

33 Graphe 55

34 Objectifs 60

341 Similariteacute 63

342 Diversiteacute 64

343 Nouveauteacute 64

344 Preacutefeacuterences 66

345 Progressiviteacute 67

35 Tactiques de fusion 70

351 Colonie de fusion 71

352 Fusion de seacutequences 72

353 Conclusion 72

53

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

31 Introduction

Apregraves cet eacutetat des lieux de la recherche sur les systegravemes de recommandation il peut ecirctre utilede rappeler ici les principaux objectifs que nous nous sommes xeacutes pour ecirctre satisfaits par notremodegravele multi-objectifs de recommandation de seacutequences

Ecirctre susamment geacuteneacuterique pour quil puisse ecirctre utiliseacute dans plusieurs domaines touten sadaptant aux diverses contraintes et eacutevolutions de lenvironnement de ces domaines

Permettre de prendre des facteurs humains Pouvoir geacuterer dimportantes quantiteacute de donneacutees cest-agrave-dire ecirctre capable de produire des

recommandations satisfaisantes dans un grand espace de recherche Produire des recommandations sous forme de seacutequences

Tous ces objectifs sont neacutecessaires pour produire un modegravele reacutepondant aux probleacutematiqueseacutenonceacutees dans lintroduction de ce manuscrit Le modegravele que nous avons conccedilu prend inspirationdes modegraveles de colonies de fourmis preacutesenteacutes dans leacutetat de lart et plus particuliegraverement dela variante ACS (Ant Colony System) car cette version possegravede des qualiteacutes intrinsegraveques im-portantes notamment sa capaciteacute supeacuterieure dexploration de lenvironnement pour reacutepondreaux probleacutematiques poseacutees Pour rappel les avantages du modegravele ACS ont eacuteteacute deacutetailleacutes dans laSection 243 En se basant sur Dans la suite de ce chapitre nous deacutetaillerons le fonctionnementgeacuteneacuteral du modegravele dans la Section 32 Ensuite nous preacutesenterons la creacuteation du graphe dansla Section 33 et les facteurs humains consideacutereacutes et leur inteacutegration dans la Section 34 Nousdeacutetaillerons par la suite les deux tactiques de fusion des reacutesultats pour la recommandation naledans la Section 35 et enn nous discuterons du modegravele dans son ensemble

32 Fonctionnement geacuteneacuteral du modegravele

Dans le chapitre preacuteceacutedent sur leacutetat de lart nous avons preacutesenteacute dans la Section 243 lemodegravele ACS de Dorigo et son fonctionnement [Dorigo and Birattari 2010] Notre modegravele sinspiredACS dans le sens ougrave nous reprenons les grandes eacutetapes de ce dernier tout en ladaptant aucontexte et aux contraintes des systegravemes de recommandation Pour rappel voici lalgorithme 1de haut niveau sur lequel se base le fonctionnement de lensemble des algorithmes des ACO

Algorithm 1 Meacutetaheuristique Ant Colony Optimization

Initialisation des paramegravetres et des pheacuteromoneswhile conditions darrecircts non atteintes doConstruction des solutionsRecherche Locale (optionnelle)Mise agrave jour des pheacuteromones

end while

Chaque version existante des ACO a introduit des variations dans une ou plusieurs deseacutetapes centrales de lalgorithme La variante ACS a par exemple introduit la mise agrave jour localedes pheacuteromones dans la derniegravere eacutetape UpdatePheromones Notre modegravele suit cette philosophieen prolongeant les travaux de Dorigo agrave travers une variante multi-colonies et multi-objectifs quenous avons nommeacute AntRS Avant de deacutenir plus en deacutetail ces modications dans le reste duchapitre voici lalgorithme 2 modieacute correspondant au fonctionnement de notre modegravele

54

33 Graphe

Algorithm 2 AntRS

Initialisation des paramegravetres et des pheacuteromonesCreacuteation du grapheInitialisation des dieacuterentes colonieswhile conditions darrecircts non atteintes doConstruction des solutions pour chaque colonieMise agrave jour locale et globale des pheacuteromones modieacutee

end whileFusion des dieacuterentes solutionsRecommandation

Dans notre modegravele inspireacute dACS nous pouvons distinguer un certain nombre dapports quiseront approfondis dans la suite de ce chapitre La creacuteation du graphe prend ainsi une placepreacutepondeacuterante en amont de lexeacutecution de lalgorithme an de pouvoir repreacutesenter correctementle domaine dapplication et ses ressources De plus alors que dans les modegraveles initiaux de Dorigoune seule colonie de fourmis avait pour but de trouver des solutions notre modegravele possegravedeplusieurs colonies travaillant chacune agrave optimiser un objectif (ie un aspect correspondant agraveun facteur humain) de la recommandation nale Ces dieacuterentes colonies constituent le cdivideurde notre approche et seront expliqueacutees en deacutetail Enn apregraves la convergence dune solutiondans chacune des colonies (ie un chemin dans le graphe correspondant agrave une seacutequence deressources dans un ordre preacutecis) un dernier processus de fusion de ces solutions a lieu an dene proposer agrave lutilisateur nal quune seule seacutequence orant le meilleur compromis entre lesdieacuterents objectifs de chaque colonie Apregraves cette derniegravere eacutetape la recommandation peut ecirctreproposeacutee agrave lutilisateur Dans la suite de ce chapitre ces dieacuterentes eacutetapes seront deacutetailleacutees ande mettre en exergue le fonctionnement de notre modegravele

33 Graphe

La premiegravere eacutetape de fonctionnement du modegravele est la creacuteation du graphe Celui-ci repreacute-sente lenvironnement dans lequel les agents eacutevoluent Dans ce contexte les ndivideuds repreacutesententles ressources du domaine (musiques oeuvres dart contenu peacutedagogique etc) tandis que lesarecirctes sont les chemins permettant dacceacuteder agrave ces ressources Les agents se deacuteplacent ainsi dendivideuds en ndivideuds en empruntant des arecirctes Le processus de creacuteation du graphe nest souvent quepeu deacutetailleacute dans la litteacuterature pour plusieurs raisons Premiegraverement un certain nombre deacutetudesse focalisent sur un jeu de test composeacute de peu de ressources limitant linteacuterecirct de deacutevelopperdes tactiques eacutelaboreacutees de creacuteation dun graphe Cela peut ecirctre ducirc agrave la simpliciteacute dutiliser unpetit jeu de donneacutees aux limites poseacutees par le domaine dapplication ou encore agrave la diculteacute dereacutecolter des donneacutees Par exemple si le but est de deacutevelopper un systegraveme de recommandationdans un museacutee contenant 100 divideuvres dart le graphe repreacutesentant le domaine sera relativementpeu complexes (ie 100 ndivideuds et quelques centaines ou milliers darecirctes) De la mecircme maniegraverelorsque le jeu de donneacutees est limiteacute en taille il est possible pour des experts du domaine decreacuteer et de valuer manuellement les arecirctes entre les dieacuterentes ressources comme cela a eacuteteacute faitdans [Semet et al 2003] Cependant la conception dun algorithme permettant de construire latopologie du graphe de maniegravere automatique possegravede agrave la fois des avantages et des inconveacutenients

55

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

Avantages Inconveacutenientsbull La conception algorithmique du graphepermet de sadapter rapidement agrave dieacute-rents domaines applicatifs ayant dieacuterentstypes et nombres de ressources

bull La qualiteacute dun graphe produit automa-tiquement deacutepend fortement de la qualiteacutede son algorithme et peut potentiellementecirctre moins pertinent quun graphe creacutee parun expert du domaine

bull Il devient possible dinteacutegrer untregraves grand nombre de ressources du do-maine applicatif si cela est neacutecessaire (parexemple toutes les musiques dun sitedeacutecoute de musiques en ligne)

bull La prise en compte dun grand nombrede ressources a pour conseacutequence daug-menter signicativement le temps de calculde lalgorithme travaillant sur ce graphe enaval

bull Lintervention dexperts humains ne de-vient plus neacutecessaire pour creacuteer la topolo-gie du graphe et valuer ses arecirctes

bull Lalgorithme de creacuteation automatiquedu graphe doit capturer les informationsdun domaine et les reeacuteter dans la topolo-gie du graphe (ie pourquoi une ressourceest lieacutee par une arecircte agrave une autre etc)

Le but de cette section sera donc de deacutetailler lalgorithme de creacuteation du graphe ainsi que lesreacuteponses proposeacutees aux inconveacutenients eacutenonceacutes ci-dessus

Avant de preacutesenter la meacutethode de creacuteation du graphe il est important de discuter de ceque repreacutesente ce graphe dans le modegravele ACO et de son pendant pour les fourmis Une desdieacuterences principales entre le comportement reacuteel des fourmis dans la nature et les simulationsinformatiques des algorithmes ACO reacuteside dans la deacutenition de lespace de recherche Les four-mis reacuteelles eacutevoluent dans un espace de recherche continu sans aucun point de repegravere ni cheminpreacute-eacutetabli Les fourmis sont en outre libres dexplorer lenvironnement ougrave bon leur semble Lesagents simuleacutes avec ACO sont quant agrave eux limiteacutes agrave un espace de recherche discret (le graphe)et ne peuvent se mouvoir quagrave certains points dinteacuterecircts (les sommets) en empruntant certainschemins deacutejagrave eacutetablis (arecirctes) Cette simplication de lespace de recherche est neacutecessaire agrave la foispour reacuteduire la complexiteacute de lalgorithme et pour permettre de repreacutesenter des domaines dap-plication posseacutedant des ressources connues contrairement agrave un environnement naturel inconnuet potentiellement inni du point de vue dune fourmi Cependant les algorithmes ACO ontavant tout un but de simulation du comportement de ces fourmis An de combiner agrave la fois lescontraintes dune simulation informatique avec le comportement reacuteel observeacute des fourmis dansla creacuteation du graphe plusieurs solutions sont possibles

Lun des moyens les plus simples pour approcher le comportement reacuteel des fourmis dansla nature consiste agrave creacuteer des arecirctes entre chaque sommet du graphe dans le but de creacuteer unenvironnement ougrave lagent simuleacute pourra se deacuteplacer ougrave il veut en empruntant le chemin quildeacutesire Le graphe creacuteeacute serait ainsi complet Neacuteanmoins cette approche nest pas reacutealiste pour deuxraisons principales Premiegraverement lenvironnement peut contenir des obstacles infranchissablespour des fourmis et elles ne peuvent donc pas se deacuteplacer partout Dans un graphe cela setraduirait par une absence darecircte entre deux sommets Deuxiegravemement cette solution est aussipeu pratique degraves que le nombre de sommets deacutepasse plusieurs centaines car le nombre darecirctesn creacuteeacutees se calcule avec |E| = n(nminus1)

2 Le nombre darecirctes dun graphe de 100 sommets est doncde 4950 tandis que pour un graphe de 1000 sommets ce nombre atteint deacutejagrave 499500 comme lemontre la Figure 31 Cette augmentation exponentielle nest eacutevidemment pas envisageable degraveslors que lon traite de domaines pouvant posseacuteder plusieurs dizaines de milliers de ressources agrave

56

33 Graphe

repreacutesenter dans le graphe

Figure 31 Graphe repreacutesentant leacutevolution exponentielle du nombre darecirctes selon le nombrede sommets existants dans un graphe complet

Un des objectifs de cette thegravese eacutetant dappliquer notre modegravele agrave un domaine applicatif reacuteelposseacutedant de tregraves nombreuses ressources la creacuteation dun graphe complet neacutetait pas une op-tion Nous avons donc opteacute pour une approche plus reacutealiste dans la creacuteation du graphe ande diminuer sa taille et les temps de calculs potentiels Pour reacutealiser cette tacircche nous navonsque deux solutions possibles supprimer des sommets etou supprimer des arecirctes La premiegraverepossibiliteacute a rapidement eacuteteacute eacutecarteacutee car supprimer des sommets aecte directement la qualiteacutedes solutions trouveacutees en faisant meacutecaniquement baisser la mesure de couverture du systegraveme derecommandation cest-agrave-dire la capaciteacute qua un systegraveme agrave recommander toutes les ressourcesdun domaine De plus il nest pas eacutevident de justier la suppression de certains sommets parrapport agrave dautres Chaque sommet du graphe repreacutesentant une ressource unique du domainedapplication la suppression de certains sommets ne pourrait se faire que par la creacuteation de regraveglesgeacuteneacuterales Une solution possible pourrait ecirctre par exemple de ne pas inteacutegrer dans le graphe lesressources nayant jamais eacuteteacute consulteacutees ou nayant pas eacuteteacute consulteacutees lors des 6 derniers moisCependant on voit bien que ces regravegles ne sont pas forceacutement adapteacutees agrave chaque utilisateur etont un grand risque de supprimer des ressources que ces derniers auraient pu appreacutecier Nousavons donc preacutefeacutereacute la deuxiegraveme solution supprimer des arecirctes Cette meacutethode a lavantage degarder lensemble des ressources du domaine recommandables par le systegraveme tout en reacuteduisantgrandement la complexiteacute du graphe 37 La question sest donc poseacutee didentier les arecirctes agraveseacutelectionner le but eacutetant de permettre au systegraveme de proposer des recommandations agrave la foisqualitatives adapteacutees mais aussi potentiellement nouvelles agrave lutilisateur tout en reacuteduisant lataille du graphe Pour ce faire nous avons formuleacute deux hypothegraveses aidant agrave la seacutelection desarecirctes

37 Tant quil y a un chemin dans le graphe permettant de se deacuteplacer dun sommet quelconque vers tous lesautres sommets alors toutes les ressources peuvent theacuteoriquement ecirctre recommandeacutees par le systegraveme

57

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

1 Les seacutequences de ressources deacutejagrave consulteacutees par le passeacute contiennentdes informations sur le comportement des utilisateurs qui peuventecirctre exploiteacutees pour la topologie du graphe

2 Les seacutequences de ressources deacutejagrave consulteacutees par les utilisateurs au-paravant ne sont pas toujours les meilleures possibles et auraient puecirctre ameacutelioreacutees avec des recommandations pertinentes

La premiegravere hypothegravese H1 se justie par le fait que lutilisateur est le premier agrave connaicirctreses envies ses besoins et les ressources qui le satisferaient le plus agrave un moment t [Jones 2010]Il est donc neacutecessaire de consideacuterer ces seacutequences de consultations passeacutees an de comprendrelutilisation que font les utilisateurs des ressources du domaine La deuxiegraveme hypothegravese se justiequant agrave elle par le fait quun utilisateur ne peut pas dans la majoriteacute des cas avoir une vue den-semble de toutes les ressources dun domaine Il est en eet courant pour un site de e-commerceou deacutecoute de musiques de posseacuteder plusieurs dizaines de milliers de ressources La deuxiegravemehypothegravese H2 se base donc sur le problegraveme fondamental que les systegravemes de recommandationessaient de reacutesoudre agrave savoir aider les utilisateurs agrave faire les meilleurs choix possibles dans desenvironnements toujours plus complexes et vastes Cette discussion sur les deacutes ameneacutes par cesdeux hypothegraveses nous amegravene agrave consideacuterer le travail dHerbert Simon qui a eacuteteacute deacutecoreacute dun prixnobel deacuteconomie et dun prix Turing Ce dernier a theacuteoriseacute et nommeacute le problegraveme de rationaliteacutelimiteacutee devant des contraintes alteacuterant et limitant les capaciteacutes dun individu (domaine tropvaste manque dinformation etc) il est preacutefeacuterable de se diriger vers des solutions satisfaisantesplutocirct quoptimales [Simon 1997] En reacuteponse agrave ce problegraveme les utilisateurs procegravedent donc paressais-erreurs pour reacutepondre agrave leurs besoins de maniegravere empirique [Jameson et al 2015] Les seacute-quences dinteractions creacuteeacutees par les utilisateurs durant ces processus contiennent donc beaucoupdinformations exploitables par un systegraveme de recommandation mais aussi beaucoup de bruitset dapproximations [Kuhlthau 1991 Castagnos et al 2010] La philosophie de notre modegraveleest les reacuteponses que nous apportons aux problegravemes ci-dessus sont inspireacutees par cette theacuteorie

An de prendre en compte ces deux hypothegraveses nous proposons dans la suite de cette sectionune meacutethode permettant de creacuteer un graphe orienteacute en se basant agrave la fois sur les seacutequencespasseacutees des utilisateurs ainsi que sur la creacuteation de nouvelles arecirctes Lobjectif est dexploiterles informations contenues dans les seacutequences passeacutees des utilisateurs mais aussi de garantirune certaine seacuterendipiteacute du systegraveme de recommandation via la creacuteation de nouvelles arecirctes Lapremiegravere eacutetape de ce processus est de creacuteer un sommet par ressource du domaine Ensuite pourconstruire les arecirctes reliant ou non ces sommets nous calculons les poids associeacutes aux nombrede co-consultations preacutesentes dans lensemble des seacutequences de consultations passeacutees Autrementdit quand un utilisateur consulte une ressource A puis une ressource B directement apregraves nousconsideacuterons que la transition A rarr B est une co-consultation Pour deacuteterminer si une arecircte estconstruire entre deux sommets nous calculons ensuite le poids de la co-consultation cest-agrave-direle nombre de fois quelle apparaicirct dans les seacutequences des utilisateurs En fonction de ce poidsdeux opeacuterations sont reacutealiseacutees

1 Toutes les co-consultations posseacutedant un poids supeacuterieur agrave seuil speacutecique sont ajouteacuteescomme arecirctes orienteacutees dans le graphe reliant les deux sommets concerneacutes Le seuil estdeacutetermineacute de maniegravere empirique car il est deacutependant de chaque domaine et de la base dedonneacutees utiliseacutees

2 En dessous du seuil seules certaines co-consultations sont seacutelectionneacutees pour devenir des

58

33 Graphe

arecirctes selon un processus inteacutegrant une part daleacuteatoire que nous deacutetaillerons dans la suitede cette section

Ces deux opeacuterations permettent de peupler le graphe darecirctes correspondant agrave la fois agrave toutesles transitions les plus eectueacutees par les utilisateurs ainsi quagrave certaines des transitions moinsusiteacutees par ces derniers Apregraves ces deux opeacuterations le graphe possegravede donc un certain nombredarecirctes reliant ses sommets mais rien ne garantit que chaque sommet est bien relieacute au reste dugraphe (si par exemple un sommet repreacutesente une ressource tregraves peu consulteacutee du domaine) Deplus et malgreacute la deuxiegraveme opeacuteration mitigeant cet eet les transitions tregraves usiteacutees (entre desressources populaires par exemple) seront sur-repreacutesenteacutees avec cette meacutethode de constructionCette sur-repreacutesentation produira forceacutement en aval des solutions que lon pourrait qualier declassique dans le sens ougrave elles reprendraient en majoriteacute ces transitions tregraves utiliseacutees et connuesdes utilisateurs An de limiter cet eet et de sassurer que tous les sommets sont bien connecteacutesau graphe une troisiegraveme et derniegravere opeacuteration est eectueacutee

3 Pour chaque sommet si un certain niveau de connectiviteacute nest pas atteint autrement ditsi le sommet possegravede moins darecirctes quun seuil xeacute agrave lavance alors des arecirctes aleacuteatoiressont ajouteacutees an datteindre ce seuil

Cette troisiegraveme opeacuteration permet de sassurer quaucun sommet repreacutesentant une ressourcepeu consulteacutee ne soit laisseacute sans connexion avec le reste du graphe Ainsi chaque sommet pos-seacutedera un certain niveau de connectiviteacute aussi appeleacute degreacute avec le reste du graphe Le grapheainsi obtenu apregraves ces 3 opeacuterations possegravede dans sa topologie agrave la fois les liens les plus usiteacutes parles utilisateurs ainsi que des liens aleacuteatoires permettant la creacuteation de recommandations poten-tiellement nouvelles Lensemble du processus de creacuteation du graphe est repris dans lEacutequation31 ci-dessous

(1) si tij ge m alors creacuteer eij(2) si tij lt m et q lt tij ougrave q isin [min til log(max til)] alors creacuteer eij(3) si deg(i) lt d alors choisir un sommet k aleacuteatoire

et creacuteer eik jusquagrave deg(i) = d

(31)

(1) et (2) sappliquent pour chaque co-consultation tandis que (3) sapplique pour chaque som-met du graphe eij repreacutesente larecircte entre les sommets i et j tij est le poids de la co-consultationde la ressource i vers la ressource j par les utilisateurs dans les seacutequences de consultations passeacuteesm est le seuil au-dessus duquel les co-consultations sont automatiquement ajouteacutees au graphecomme arecirctes q isin [min til log(max til)] est une variable aleacuteatoire uniformeacutement distribueacutee danslintervalle deacutecrit min til est le nombre minimal de co-consultations entre la ressource i et toutesles autres ressources l isin Vi ougrave au moins une co-consultation a eacuteteacute trouveacutee deg(i) est le degreacutedu ndivideud i dans le graphe et d est un paramegravetre speacuteciant le degreacute minimal de connectiviteacute quedoit posseacuteder chaque sommet dans le graphe nal Il est agrave noter quagrave ce stade du processus decreacuteation du graphe les arecirctes ne sont pas valueacutees car les valeurs attribueacutees aux arecirctes varientpour chaque utilisateur Ce processus sera deacutetailleacute dans la suite de la section

Avec cette technique de construction la taille du graphe deacutepend deacutesormais principalementde la variable d deacutenissant le degreacute minimal de connectiviteacute agrave atteindre (en plus du nombrede sommets comme preacuteceacutedemment) La Figure 32 ci-dessous repreacutesente leacutevolution du nombredarecirctes uniquement en fonction de la variable d Dans la pratique le nombre darecirctes sera

59

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

supeacuterieur aux nombres preacutesenteacutes dans la gure eacutetant donneacute que les deux premiegraveres eacutetapes de lacreacuteation du graphe ajoutent des arecirctes en fonction des transitions trouveacutees dans les consultationspasseacutees des utilisateurs

Figure 32 Graphe repreacutesentant leacutevolution lineacuteaire du nombre darecirctes selon le nombre desommets voulus dans un graphe creacuteeacute avec dieacuterentes valeurs de d

Ce processus de construction de graphe a pour double objectif dexploiter les informationsdes seacutequences des utilisateurs et de creacuteer de nouvelles seacutequences possibles Il existe potentiel-lement une inniteacute de creacuteer un graphe agrave partir des ressources dont nous disposons et il esteacutevident que la topologie du graphe a une inuence importante sur les reacutesultats possibles carle graphe repreacutesente lentiegravereteacute de lenvironnement dans lequel les agents vont eacutevoluer Le pro-cessus de construction que nous avons deacutecrit nest quune maniegravere parmi dautres daboutir agraveun graphe Cependant nous faisons lhypothegravese que la combinaison darecirctes repreacutesentant desco-consultations aux poids importants darecirctes repreacutesentant certaines co-consultations moinspreacutesentes et darecirctes creacuteant de nouvelles transitions permet de capturer linformation preacutesentedans le domaine tout en garantissant une certaine seacuterendipiteacute avec leacutemergence possible nouvellesseacutequences

34 Objectifs

Une fois le graphe creacuteeacute le modegravele peut ecirctre appliqueacute sur ce dernier an de produire des recom-mandations Dans cette section nous allons deacutenir comment fonctionne le modegravele pour produiredes recommandations agrave partir du graphe ainsi que les facteurs humains ie les objectifs quilcherche agrave satisfaire

Comme nous lavons vu dans le chapitre preacuteceacutedent sur leacutetat de lart il est deacutesormais lar-gement admis que la mesure de preacutecision seule nest pas susante pour produire de bonnesrecommandations aux utilisateurs Dautres facteurs humains doivent ecirctre consideacutereacutes pour satis-faire la plus grande varieacuteteacute dutilisateurs et de contextes possible Nous proposons donc de deacutenirun ensemble de 4 facteurs humains parmi les plus eacutetudieacutes dans la litteacuterature et de les prendre encompte dans notre modegravele de recommandation Ces facteurs humains seront par la suite appe-

60

34 Objectifs

leacutes objectifs car pour notre modegravele ces facteurs humains sont en eet consideacutereacutes comme desobjectifs agrave atteindre et agrave maximiser Les voici accompagneacutee dune courte description

1 Similariteacute recommander des ressources similaires agrave ce que lutilisateur a aimeacute par lepasseacute

2 Diversiteacute recommander des ressources diverses par rapport agrave ce que lutilisateur a aimeacutepar le passeacute

3 Nouveauteacute recommander des ressources nouvelles que lutilisateur ne connaicirct pas en-core

4 Preacutefeacuterences recommander des ressources que lutilisateur a deacutejagrave appreacutecieacute dans le passeacute

La similariteacute et les preacutefeacuterences sont proches des notions de preacutecision et de rappel mais diegraverenttoutefois dans le sens ougrave lon ne cherche pas agrave reproduire exactement les mecircmes seacutequences quelutilisateur a consulteacute mais agrave lui recommander des seacutequences pouvant le satisfaire Ces objectifsrepreacutesentent des facteurs humains important dans la creacuteation dune bonne recommandationIls seront deacutetailleacutes dans la suite de cette section Agrave ces 4 objectifs concernant les ressourcesrecommandeacutees nous ajoutons un cinquiegraveme objectif sinteacuteressant quant agrave lui agrave la maniegravere dontsont proposeacutees les recommandations agrave un utilisateur

5 Progressiviteacute recommander une seacutequence de ressources de sorte que la transition entrechacune de ces ressources soit uide et adapteacutee aux preacutefeacuterences de lutilisateur

Ces 5 objectifs consideacutereacutes sont tous transposables dans dieacuterents domaines applicatifs ga-rantissant la geacuteneacutericiteacute de cette approche Cependant il est eacutevident que dun domaine applicatifagrave lautre certaines dieacuterences peuvent justier la mise en avant dun objectif plutocirct quun autreDe la mecircme maniegravere les besoins et preacutefeacuterences pour ces objectifs peuvent varier dun utilisateuragrave un autre au sein du mecircme domaine Pour reacutepondre agrave ces deux problegravemes nous expliqueronsaussi dans cette section comment adapter limportance de chaque objectif Il est aussi importantde consideacuterer le fait que nous nous appuyons sur ces objectifs car ils sont les plus freacutequemmentciteacutes dans la litteacuterature Lobjectif est de deacutemontrer que notre modegravele est capable de produiredes seacutequences satisfaisant les objectifs consideacutereacutes Ce faisant nous montrons par la mecircme occa-sion que les objectifs peuvent ecirctre adapteacutes enleveacutes ou ajouteacutes En eet on pourrait tregraves bienconsideacuterer dautres objectifs (personnaliteacute point de congestion si lon est dans un museacutee etc)En dautres termes le but est de deacutemontrer la geacuteneacutericiteacute de notre modegravele

Avant de deacutetailler comment calculer ces objectifs nous allons expliquer ici comment les in-teacutegrer dans le modegravele Le but de notre modegravele est de proposer des recommandations orant unbon compromis entre les dieacuterents objectifs ougrave limportance de ces derniers peut ecirctre ajusteacutees agravevolonteacute Pour ce faire notre modegravele doit ecirctre capable de transformer ces objectifs listeacutes plus hauten valeurs pouvant ecirctre chireacutees et optimiseacutees Autrement dit notre modegravele a pour but de reacute-soudre un problegraveme de recommandation multi-objectifs Le choix des algorithmes ACO est ici dusens eacutetant donneacutes ces besoins speacuteciques En eet nous avons montreacute dans leacutetat de lart que lemodegravele ACS faisant partie des ACO eacutetait capable de reacutesoudre des problegravemes posseacutedant plusieursobjectifs comme par exemple avec le vehicle routing problem with time windows [Gambardellaet al 1999] ou encore avec le multi-objective travelling salesman problem [Angus 2007] Devantla complexiteacute et les dimensions toujours croissantes des problegravemes agrave reacutesoudre en informatique lesapproches multi-dimensionnelles des algorithmes ACO se sont multiplieacutees ces derniegraveres anneacutees

61

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

[Doerner et al 2004 Alaya et al 2007 Angus and Woodward 2009 Dorigo and Stuumltzle 2019]Mecircme si chacune de ces approches a pour but de reacutesoudre un problegraveme multi-objectif la maniegraveredy arriver est dieacuterente tant les algorithmes ACO sont modulaires Pour rappel notre problegravemeconsiste en la recommandation de seacutequences agrave partir dun graphe et prenant en compte plusieursobjectifs pouvant potentiellement ecirctre incompatible entre eux Il est important dinsister sur cedernier point an de comprendre la solution mise en place dans notre modegravele Les objectifs quenous avons deacutecrits ci-dessus peuvent en eet ecirctre incompatibles les uns avec les autres quandbien mecircme le but est de geacuteneacuterer une recommandation posseacutedant un certain eacutequilibre parmi cha-cun dentre eux Lobjectif de preacutefeacuterences dont le but est de proposer des ressources deacutejagrave connueset appreacutecieacutees ainsi que lobjectif de nouveauteacute dont le but est de proposer des ressources en-core non connues sont par exemple en contradiction claire Chaque objectif traiteacute seacutepareacutementproduira potentiellement des recommandations mutuellement exclusives et pourtant il peut ecirctreinteacuteressant de proposer agrave lutilisateur une seacutequence de recommandations posseacutedant ces deux as-pects speacuteciques Partant de ce constat nous avons deacutecideacute dinteacutegrer chaque objectif comme unecolonie dieacuterente dans le modegravele ACS Ainsi nos 4 premiers objectifs (similariteacute diversiteacute nou-veauteacute preacutefeacuterences) seront repreacutesenteacutes par 4 colonies dans notre modegravele tandis que le cinquiegravemeobjectif la progressiviteacute sera quant agrave lui traiteacute agrave part eacutetant donneacute quil concerne la structure dela recommandation et non les ressources recommandeacutees en elles-mecircmes

Inteacutegrer ces objectifs par le biais de plusieurs colonies a neacutecessiteacute quelques changements danslalgorithme ACS Dans le modegravele initial les agents dune seule colonie se deacuteplacent sur le graphedont chacune des arecirctes est valueacutee en fonction de la distance seacuteparant les 2 sommets la consti-tuant Le but des agents est ensuite de se deacuteplacer sur ce graphe an de trouver le plus courtchemin dun sommet A agrave un sommet B agrave laide des pheacuteromones quils y deacuteposent Une fois quunesolution eacutemerge comme eacutetant la meilleure gracircce au meacutecanisme de stigmergie lalgorithme peutsarrecircter et la meilleure solution est retenue

La philosophie derriegravere cette solution deacutecoule des principes mecircme des systegravemes multi-agentsLeacutetat de lart du chapitre preacuteceacutedent la montreacute lapproche multi-agent pour la reacutesolution deproblegravemes est agrave la fois simple eacuteleacutegante et ecace Dautres solutions auraient eacuteteacute possiblescomme par exemple complexier les agents en leur ajoutant de nouveaux comportementS maisnous avons voulu garder lessence des systegravemes multi-agents reacuteactifs leacutemergence de comporte-ments intelligents de par les interactions entre agents tregraves simples An de rester aussi procheque possible des principes de base de lalgorithme nous avons voulu converser le fonctionnementgeacuteneacuteral des colonies et de la deacutecouverte de solutions sur le graphe tout en les adaptant agrave notrecontexte Pour ce faire nous avons jouer sur la maniegravere dont se deacutenit et se calcule la notionde distance dans le graphe Dans les algorithmes ACO la distance d associeacutee agrave chaque arecirctedu graphe repreacutesente comme son nom lindique la distance physique neacutecessaire pour aller dunsommet agrave lautre de larecircte Cette distance ne demande a priori pas de calcul et est simple-ment deacuteduite ou mesureacutee de lenvironnement repreacutesenteacute par le graphe Elle est ensuite utiliseacuteepour calculer lheuristique ηij comme montreacute dans lEacutequation 212 (pour rappel lheuristiquese calcule ainsi ηij = 1

dij) Nous navons pas modieacute le calcul de ηij mais nous avons modieacute

le sens de la distance d qui le compose Au lieu de repreacutesenter la distance physique entre deuxsommets d repreacutesente dans notre modegravele une distance calculeacutee entre deux ressources sa valeureacutetant directement deacutependante de lobjectif de la colonie Prenons un exemple pour illustrer lamaniegravere dont cette distance peut varier entre deux sommets pour dieacuterentes colonies

62

34 Objectifs

Supposons un systegraveme de recommandation dans le domaine museacuteal dont le but est de proposerdes parcours composeacutes de dieacuterentes peintures Le museacutee possegravede entre autres deux tableauxde Vincent van Gogh appartenant agrave la seacuterie des Tournesols Ces tableaux sont tous les deux desnatures mortes repreacutesentant un vase et 15 tournesols ils ont tous les deux eacuteteacute peints en 1889 les palettes de couleurs et le style sont quasi similaires Dans le graphe les sommets A et Brepreacutesentent ces deux tableaux et (AB) repreacutesente larecircte les reliant Pour toutes les raisonseacutevoqueacutees ci-dessus on peut raisonnablement penser que ces deux ressources sont tregraves similairesentre elles La distance dsimilarit de la colonie axeacutee sur la similariteacute sera donc faible indiquant auxagents que les deux sommets sont eectivement proches lun de lautre et favorisant le passagepar cette arecircte pour minimiser la distance totale de la solution Agrave linverse la colonie relativeagrave la diversiteacute aura agrave traverser une plus longue distance ddiversit entre les deux sommets commeces derniers sont tregraves similaires entre eux Agrave travers ces exemples sont illustreacutees les dieacuterencespossibles dans le calcul de la distance d en fonction de lobjectif consideacutereacute La conseacutequence agrave celaest que mecircme si la topologie du graphe peut rester la mecircme pour tous les objectifs le calculdes distances et la valuation des arecirctes seront quant agrave eux dieacuterents selon lobjectif Le reste decette section propose une maniegravere de calculer ces distances pour chaque objectif

341 Similariteacute

Cest lun des facteurs humains les plus importants des systegravemes de recommandation et il estpris en compte par limmense majoriteacute de ces systegravemes En eet un des objectifs majeurs dunsystegraveme de recommandation est de proposer des ressources similaires agrave celles que lutilisateura aimeacute auparavant ou proche des ressources quil consultait reacutecemment La similariteacute est unecaracteacuteristique bien connue et largement utiliseacutee dans la litteacuterature Nous adheacuterons au principeselon lequel un systegraveme de recommandation ne peut pas la neacutegliger et doit linclure pour produiredes recommandations satisfaisantes Cependant la similariteacute ne devrait pas non plus ecirctre lapierre angulaire de chaque systegraveme de recommandation comme elle la eacuteteacute par le passeacute Le butde cette colonie est donc de trouver une liste avec des eacuteleacutements aussi proches que possible dece que lutilisateur appreacutecie ou est en train de consulter Il existe de nombreuses meacutethodespour calculer la similariteacute entre deux ressources Dune maniegravere geacuteneacuterale les ressources dundomaine sont deacutecrites par des meacutetadonneacutees numeacuteriques textuelles binaires etc Le format deces meacutetadonneacutees est entiegraverement deacutependant de chaque domaine applicatif Nous avons deacutecideacutede geacuteneacuteraliser ce problegraveme et de le consideacuterer comme une comparaison entre deux vecteursNous avons ensuite deacutecideacute dutiliser la mesure de la similariteacute cosinus entre ces deux vecteurs depar sa populariteacute dans la litteacuterature scientique et sa pertinence quand aux donneacutees dont nousdisposons [Su and Khoshgoftaar 2009] La maniegravere dimpleacutementer cette similariteacute dun point devue applicatif deacutepend des meacutetadonneacutees disponibles Dans le cas de donneacutees non numeacuteriques il estpossible dobtenir des valeurs numeacuteriques de similariteacute agrave partir de listes ou de valeurs qualitatives[lHuillier 2018] De mecircme dautres maniegravere de calculer la similariteacute peuvent ecirctre utiliseacutees enfonction de leur pertinence par rapport au domaine applicatif Dans notre contexte geacuteneacuteralisteet an de deacuteterminer la valeur de la distance d associeacutee agrave chaque arecircte du graphe nous avonstout dabord calculeacute la similariteacute cosinus entre les deux ressources repreacutesenteacutees par les sommetsPlus formellement pour une arecircte (i j) la similariteacute de ses deux ressources sij est calculeacutee avecla similariteacute cosinus entre les deux vecteurs des caracteacuteristiques descriptives C des ressources iet j comme montreacute dans lEacutequation 32

sij =1

sim(Ci Cj)(32)

63

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

ougrave Ci repreacutesentent les caracteacuteristiques de la ressource i Le terme de caracteacuteristiques estgeacuteneacuterique et peut inclure toutes les meacutetadonneacutees exploitables de domaine applicatif sur une res-source Comme expliqueacute plus haut ces caracteacuteristiques sont donc deacutependantes de chaque basede donneacutees et de chaque domaine dapplication Nous avons ici geacuteneacuteraliseacute ces donneacutees avec laformalisation suivante chaque ressource (ou item) i du domaine dapplication est deacutecrite par ncaracteacuteristiques c comme suit Ci = c1 c2 cn

Dans lexemple donneacute plus haut avec les deux tableaux de van Gogh nous avons expliqueacute quela distance seacuteparant deux sommets sur le graphe repreacutesentait intuitivement leur eacuteloignementselon lobjectif consideacutereacute Ainsi pour la similariteacute deux sommets repreacutesentant des ressourcessimilaires verront larecircte les reliant posseacuteder une faible distance et inversement Le but est icidecirctre le plus proche possible du fonctionnement du modegravele initial ougrave une petite distance entredeux sommets repreacutesentent eectivement une petite distance physique entre ces deux points(par exemple deux points geacuteographiques proches lun de lautre) La similariteacute cosinus produitcependant une valeur comprise entre [0 1] ne correspondant pas agrave la valuation des arecirctes dansle modegravele initial An de convertir cette similariteacute s isin [0 1] en distance d isin [1 +infin] nous avonssimplement utiliseacute linverse multiplicatif d = 1

s Ainsi et agrave linstar du modegravele initial de Dorigoune distance proche de 1 associeacutee agrave une arecircte (i j) signie que les deux ressources i et j sontsimilaires

342 Diversiteacute

Ce facteur est souvent preacutesenteacute en mecircme temps que la similariteacute eacutetant donneacute quils sont tousdeux lieacutes agrave la distance ou agrave la correacutelation entre les ressources consulteacutees par lutilisateur etses recommandations Mais contrairement agrave la similariteacute la diversiteacute illustre agrave quel point deuxeacuteleacutements sont dissemblables lun par rapport agrave lautre La similariteacute et la diversiteacute se complegravetentdans la mesure ougrave elles sont toutes deux neacutecessaires pour adapter le systegraveme de recommandationaux besoins des dieacuterents utilisateurs [Jones 2010] Nous avons choisi dutiliser linterpreacutetationclassique consistant agrave consideacuterer la diversiteacute comme linverse de la similariteacute La diversiteacute divijentre deux ressources i et j est donc obtenue en calculant linverse de la similariteacute entre i etj comme indiqueacute dans Eacutequation 33 De la mecircme maniegravere que pour la similariteacute nous avonsensuite utiliseacute linverse multiplicatif de la diversiteacute pour obtenir une distance d isin [1 +infin]

divij =1

1minus sim(Ci Cj)(33)

Toutefois cette seule mesure ne capture pas lensemble de la diversiteacute dune seacutequence Destravaux de la litteacuterature ont eacuteteacute meneacutes sur les seacutequences et les dieacuterentes maniegraveres de les ca-racteacuteriser On peut citer la diversiteacute relative (RD Relative Diversity) qui permet de mesurerlapport de chaque ressource ajouteacutee agrave une seacutequence existante en cours de construction ou encorela similariteacute intra-liste (ILS Intra-List Similarity) qui est la moyenne des similariteacutes cosinusde toutes les ressources composant une seacutequence [Ziegler et al 2005] Nous navons pas utiliseacuteces deux mesures agrave ce stade de notre modegravele mais nous les exploiteront an de mesurer lesperformances de notre modegravele

343 Nouveauteacute

Ce facteur humain repreacutesente les ressources encore non connues de lutilisateur Il peut sagirde nouvelles ressources reacutecemment ajouteacutees au systegraveme ou de ressources plus anciennes mais

64

34 Objectifs

moins populaires que lutilisateur na pas consulteacutees Selon le domaine dapplication etou selonlancienneteacute de lutilisateur les ressources non consulteacutees peuvent ne constituer quune faible par-tie des ressources totales (eg dans un petit museacutee ne posseacutedant que quelques dizaines ddivideuvres)comme elles peuvent aussi repreacutesenter limmense majoriteacute des ressources totales (eg sur des sitesdeacutecoute de musiques en ligne qui ont souvent des catalogues de plusieurs centaines de milliers demusiques disponibles) La nouveauteacute ne doit cependant pas ecirctre confondue avec la diversiteacute carles ressources consideacutereacutees comme nouvelles peuvent ecirctre soit similaires soit dieacuterentes de cellesque lutilisateur aime habituellement La nouveauteacute est une caracteacuteristique importante dans unsystegraveme de recommandation car elle permet deacuteviter un deacutesinteacuterecirct potentiel des utilisateurs an-ciens En eet apregraves un certain temps passeacute agrave produire des recommandations un systegraveme peutavoir tendance agrave enfermer lutilisateur dans les mecircmes recommandations agrave linstar dun algo-rithme dapprentissage automatique trop bien entraicircneacute 38 Ce problegraveme dans les systegravemes derecommandation reacutesulte en une trop grande preacutevisibiliteacute des ressources recommandeacutees [Vargasand Castells 2011] Lintroduction de la nouveauteacute permet entre autres de mitiger ce problegravemeet de produire des recommandations inattendues agrave lutilisateur

An de deacuteterminer si une ressource est nouvelle ou pas pour un utilisateur en particuliernous avons utiliseacute le travail de Zhang [Zhang 2013] qui a deacuteni la nouveauteacute comme une mesurecomposeacutee de trois caracteacuteristiques

1 Unknown (notion dinconnue) repreacutesente si la ressource est connue ou non de lutilisa-teur

2 Satisfactory (satisfaction) repreacutesente si la ressource est aimeacutee ou non par lutilisateur

3 Dissimilarity (dissimilariteacute) repreacutesente si la ressource est dissimilaire aux autres res-sources connues par lutilisateur

Lauteur a ensuite proposeacute deacutevaluer formellement la nouveauteacute dune ressource i pour luti-lisateur u en proposant lEacutequation 34

Novelty(i u) = p(i|unknown u) middot dis(i prefu) middot p(i|like u) (34)

ougrave p(i|unknown u) est la probabiliteacute que lutilisateur u ne connaisse pas la ressource idis(i prefu) est la dissimilariteacute entre i et les ressources consulteacutees par lutilisateur et p(i|like u)est la probabiliteacute que lutilisateur u appreacutecie la ressource i Cette eacutequation est inteacuteressante maisdans le contexte de ce travail les notions de satisfaction et de dissimilariteacute de lutilisateur enversla ressource i sont proches des autres objectifs de notre modegravele agrave savoir respectivement pour lasatisfaction par lobjectif de diversiteacute et pour la dissimilariteacute par les deux objectifs de similariteacuteet de preacutefeacuterences Nous avons donc deacutecideacute de reacuteduire lEacutequation 34 agrave lEacutequation 35 an deacuteviterune redondance entre les objectifs

p(i|unknown u) = minuslog(1minus popi) (35)

ougrave popi est la populariteacute de la ressource i La notion de populariteacute est ici volontairement lais-seacutee geacuteneacuterale car largement deacutependante du domaine dapplication et des ressources consideacutereacuteesEn eet la populariteacute peut prendre la forme dun nombre de vues dun nombre deacutecoutes dunevaleur calculeacutee de maniegravere interne par des sites dune comparaison entre les consultations des

38 Cest le problegraveme statistique classique de lovertting ou du surentrainement souvent rencontreacute dans ledomaine de lapprentissage automatique

65

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

ressources etc On peut toutefois consideacuterer que cette valeur sera geacuteneacuteralement numeacuterique

Il est important ici de preacuteciser un point de dieacuterence important avec les deux autres objectifsqui ont eacuteteacute vu jusquagrave preacutesent Dans les eacutequations ci-dessus on peut en eet remarquer que lecalcul de la distance se fait non plus en consideacuterant deux ressources mais uniquement avec uneressource et le prol de lutilisateur Ainsi une arecircte du graphe ne repreacutesente plus la distanceentre les deux sommets la composant mais la distance neacutecessaire pour atteindre le sommet selonchaque utilisateur Autrement dit lagrave ougrave jusquagrave maintenant la distance associeacutee agrave larecircte (AB)repreacutesentait la distance entre le sommet A et le sommet B (la similariteacute ou la diversiteacute entreA et B) cette distance repreacutesente maintenant la distance de lutilisateur avec ce sommet BLe sommet dorigine ne rentre plus en compte dans le calcul de la distance dune arecircte maisuniquement son sommet de destination Par conseacutequent toutes les arecirctes arrivant agrave un sommetunique posseacutederont la mecircme valuation Les calculs de valuation des arecirctes du graphe sont doncmoins nombreux mais en contrepartie il est neacutecessaire de recalculer ces valuations pour chaqueutilisateur eacutetant donneacute quelles deacutependent maintenant du prol de ce dernier

344 Preacutefeacuterences

Le facteur que nous avons appeleacute preacutefeacuterences correspond aux ressources que lutilisateur aparticuliegraverement appreacutecieacutees dans le passeacute Cet objectif bien quassez proche de la similariteacute aupremier abord exprime un autre aspect dune recommandation satisfaisante que nous pensonsimportant En eet le but nest pas ici de recommander des ressources proches et potentiellementnouvelles de ce que lutilisateur connaicirct deacutejagrave comme la similariteacute mais bien de lui reproposer desressources quil a deacutejagrave consulteacutees et aimeacutees par le passeacute Autrement dit cet objectif cherche agraverecommander agrave lutilisateur les ressources les plus en accord avec ses preacutefeacuterences (ses ressourcespreacutefeacutereacutees) sans essayer de faire des preacutedictions Par conseacutequent le but de lobjectif de simila-riteacute est de proposer agrave lutilisateur des ressources proches de ce que lutilisateur a consulteacute ouconsulte mais il nest pas possible de savoir si ce dernier va reacuteellement appreacutecier ces recomman-dations Il est par exemple commun dappreacutecier une musique particuliegravere dun artiste et de nepas aimer les autres musiques appartenant pourtant au mecircme album Toutes les musiques de cetalbum sont tregraves similaires les unes aux autres (mecircme artiste mecircme date de sortie mecircme albumprobablement mecircme genre) elles auraient donc de tregraves hautes valeurs de similariteacute entre ellesmais lutilisateur qui se verrait proposer le reste de lalbum jugerait ces recommandations nonsatisfaisantes Lobjectif de preacutefeacuterences favorisera quant agrave lui les ressources connues et aimeacuteespar lutilisateur et pourrait donc recommander dans cette situation uniquement la musique quelutilisateur appreacutecie

Le but des agents de la colonie preacutefeacuterences est donc de trouver un chemin ougrave les ressourcessont connues et aimeacutees de lutilisateur On peut dores et deacutejagrave lister deux conseacutequences agrave cefait Tout dabord nous nous retrouvons dans le mecircme cas de gure que pour lobjectif denouveauteacute ougrave une arecircte du graphe ne repreacutesente plus la distance entre ses deux sommets maisla distance neacutecessaire pour atteindre le sommet darriveacutee Ensuite il est neacutecessaire de deacutenir desmoyens de calculer les preacutefeacuterences des utilisateurs envers les ressources mises agrave leur dispositionComme nous lavons vu dans leacutetat de lart il y a deux grandes maniegraveres de calculer linteacuterecirctdun utilisateur envers une ressource avec des retours explicites (eg notes sur les ressourcesbouton jaime et je naime pas) avec des retours implicites (eg temps passeacute agrave consulterles ressources nombre de consultations) 39 La nature des retours va donc eacutenormeacutement varier

39 Ces deux types de retours ne sont pas redondants mais plutocirct compleacutementaires Lorsque cela est possible

66

34 Objectifs

selon le domaine dapplication mais nous pouvons tout de mecircme formaliser la maniegravere dont ilssont consideacutereacutes Chaque information collecteacutee par le systegraveme concernant le comportement dunutilisateur doit ecirctre prise en compte Plus preacuteciseacutement chaque interaction directe ou indirectequun utilisateur peut avoir avec une ressource doit ecirctre inteacutegreacutee dans lestimation de son inteacuterecirctsur cette ressource Soit Cu lensemble de tous les types dinteractions possibles quun utilisateuru peut avoir avec les ressources du systegraveme cui repreacutesente alors la somme des interactions dunmecircme type c dun utilisateur u sur une ressource i Voici un rapide exemple toujours dans ledomaine musical an dillustrer ces derniers points

Cu eacutecouter une musique noter une musique passer une musique avant la n mettre unemusique dans sa playlist

cui pourrait par exemple renseigner sur le fait que lutilisateur u agrave eacutecouter la musiquei 15 fois

An dagreacuteger tous les types dinteractions possibles dans une unique valeur dinteacuterecirct dunutilisateur envers une ressource nous avons utiliseacute la formule proposeacutee par Castagnos [Castagnosand Boyer 2006] et deacutecrite dans lEacutequation 36

presumed interestui = vmin +

sumcisinC

(w(c) middot c(ui))sumcisinC

w(c)middot (vmax minus vmin)

cmax(36)

ougrave c(u i) correspond aux valeurs normaliseacutees donneacutees agrave la ressource i par lutilisateur u agravechaque type dinteraction c w(c) est le poids ou limportance de chaque type dinteraction cvmin et vmax sont les valeurs minimales et maximales attendues pour linteacuterecirct preacutesumeacute et cmaxest la valeur maximale que c(u i) peut prendre peu importe le critegravere c consideacutereacute

Linteacuterecirct de cette colonie peut ecirctre discuteacute selon les domaines dapplications auquel le mo-degravele est appliqueacute Lexemple preacuteceacutedant portant sur la musique illustre bien linteacuterecirct dinteacutegrerun tel facteur humain dans un systegraveme de recommandations En eet il est rare de neacutecou-ter quune seule fois une musique que lon appreacutecie Comme lont montreacute divers travaux il estbeaucoup plus courant deacutecouter plusieurs fois ses musiques preacutefeacutereacutees parfois de suite parfois agravedieacuterents moments de la journeacutee parfois sur plusieurs semaines mois ou anneacutees etc [lHuillier2018][Jones 2010] Lideacutee davoir une colonie deacutedieacutee agrave la revisite de ressources deacutejagrave consulteacuteespeut ecirctre eacutetendue agrave dautres domaines a priori moins eacutevidents que la musique Cet objectif depreacutefeacuterences peut par exemple ecirctre inteacuteressant dans le domaine de le-eacuteducation ougrave une ressourceeacuteducative peut avoir eacuteteacute consulteacutee par un utilisateur sans pour avoir eacuteteacute comprise (apregraves avoirpasseacute une eacutevaluation sur les thegravemes de cette ressource par exemple) Dans ce cas il peut ecirctreinteacuteressant de recommander une nouvelle fois agrave lutilisateur cette ressource an quil puisse mieuxla comprendre En conclusion lobjectif de preacutefeacuterences est certes plus speacutecique agrave certains do-maines que les autres objectifs plus geacuteneacuteralistes preacutesenteacutes jusquagrave maintenant mais nous pensonsneacuteanmoins quil a sa place dans le modegravele notamment pour les possibiliteacutes quil apporte dansces domaines dapplication speacuteciques

345 Progressiviteacute

Le concept de la progressiviteacute fait partie inteacutegrante du but de notre modegravele qui est de trouveret de recommander une bonne seacutequence de ressources Contrairement agrave la majoriteacute des systegravemes

il est beacuteneacuteque de les prendre tous les deux en comptes pour estimer linteacuterecirct de lutilisateur

67

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

de recommandation actuels nous ne souhaitons pas proposer quune simple liste agrave lutilisateurnal mais bien une seacutequence construite dans un but posseacutedant un deacutebut une n et une progres-sion entre ses divers eacuteleacutements An de bien faire la dieacuterence entre une liste et une seacutequence derecommandation voici 3 exemples dans 3 domaines dapplications dieacuterents

Listes

1 Musique Les musiques les plus similaires aux derniegraveres eacutecoutes voire agrave la toutederniegravere eacutecoute de lutilisateur sans ordre particulier

2 Museacutee Des divideuvres dart correspondant agrave ce que lutilisateur vient de voir Si lecritegravere principal de la creacuteation de liste est la similariteacute les ressources de celles-ci neseront pas forceacutement adapteacutees agrave la topologie du museacutee ou agrave sa sceacutenographie

3 E-eacuteducation Des ressources eacuteducatives sans ordre particulier (cours videacuteos expli-catives exercices) tous proches de ce que lutilisateur eacutetait en train de consulter

Seacutequences

1 Musique Une playlist de musiques proposant par exemple les titres dun mecircmeartiste selon leur date de sortie ou bien posseacutedant un tempo de plus en plus rythmeacuteou encore proposant une transition douce dun style de musical agrave un autre

2 Museacutee Un chemin composeacute de plusieurs divideuvres dart prenant compte de la distancephysique entre chaque divideuvre an davoir un parcours adapteacute au museacutee et en inteacutegrantune progression dans les divideuvres proposeacutees (par date styles auteurs etc)

3 E-eacuteducation Une seacutequence composeacutee de ressources eacuteducatives adapteacutees au niveauactuel de lutilisateur et agrave son objectif inteacutegrant des cours et des exercices proposantune progression mesureacutee (ni trop rapide ni trop lente) entre chaque ressources eacuteduca-tives de la seacutequences

Comme le montrent ces exemples lideacutee geacuteneacuterale derriegravere la recommandation de seacutequencesest de proposer une suite de ressources eacutetant toutes en lien les unes avec les autres et posseacutedantune progression sur un ou plusieurs critegraveres Cette progression se manifeste alors par de leacutegegraverestransitions entre chaque ressource an de faire avancer petit agrave petit la seacutequence vers un but Lebut est donc ici de parvenir agrave construire une seacutequence dont la progression nest ni trop lenteni trop rapide mais adapteacutee agrave lutilisateur et agrave son but Nous donnons agrave cet objectif le nom deprogressiviteacute optimale o Cette meacutetrique est utiliseacutee an de sassurer que les agents de la colo-nie de progressiviteacute trouvent un chemin dans le graphe ougrave chaque sommet seacutelectionneacute ore unebonne progressiviteacute par rapport agrave son preacutedeacutecesseur et agrave son successeur Pour ce faire nous avonscalculeacute la valeur de o en prenant en compte une ressource de deacutepart et une ressource darriveacuteerepreacutesenteacutee dans le graphe par deux sommets speacuteciques

Colonie de progressiviteacute

Le concept de progressiviteacute est lieacute agrave notre objectif de construire une bonne seacutequence deressources Contrairement agrave la majoriteacute des systegravemes de recommandation nous ne souhaitonspas seulement recommander une liste de ressources mais une seacutequence ayant un deacutebut unen et un ordre speacutecique Comme indiqueacute preacuteceacutedemment dans un museacutee une bonne seacutequencerecommandeacutee pourrait consister en des divideuvres dart lieacutees dune maniegravere ou dune autre (ie du

68

34 Objectifs

mecircme artiste ou de la mecircme peacuteriode) et situeacutees agrave proximiteacute les unes des autres Une telle seacutequencepourrait ensuite progresser lentement vers un autre artiste ou une section dieacuterente du museacuteeNotre objectif est donc de recommander une seacutequence qui ne progresse ni trop lentement ni troprapidement cest ce que nous appelons la progressiviteacute optimale o Cette meacutetrique est utiliseacuteepour sassurer que chaque ressource ore une bonne progressiviteacute par rapport agrave ses preacutedeacutecesseurset successeurs Pour ce faire nous avons calculeacute o sur la base des premier et dernier eacuteleacutementsdune seacutequence donneacutee pour un utilisateur speacutecique comme le montre lEacutequation 37

on =czn minus can

s(37)

ougrave on est la valeur de progressiviteacute optimale de la n-iegraveme caracteacuteristique dune seacutequencespeacutecique czn est la n-iegraveme caracteacuteristique de la derniegravere ressource z de la seacutequence czn estidentique pour la premiegravere ressource de la seacutequence et s est le nombre de ressources de la seacute-quence LEacutequation 37 sera appliqueacutee pour les caracteacuteristiques de la ressource m ce qui donneun vecteur de taille m de valeurs de progressiviteacute optimales (o1 o2 middot middot middot om) pour la seacutequencespeacutecique Ce vecteur sera ensuite utiliseacute dans le calcul de la distance dun bord (i j) pour lacolonie de progressiviteacute Cette meacutethode implique de disposer de caracteacuteristiques numeacuteriques pourappliquer leacutequation comme par exemple le tempo dune piste musicale ou la date dune divideuvredart

La valeur optimale o de la progressiviteacute est alors utiliseacutee pour calculer la distance d entredeux ndivideuds du graphe dans lEacutequation 38

dij =

msumnwon middot

cjnminuscinon

msumnwon

(38)

ougrave m est le nombre de caracteacuteristiques de la ressource consideacutereacutee on est la valeur de pro-gressiviteacute optimale de la n-iegraveme caracteacuteristiques de la ressource won est le poids de la n-iegravemecaracteacuteristique pour lutilisateur deacutependant de ses preacutefeacuterences et cjn est la valeur de la n-iegravemecaracteacuteristique de la ressource j

LEacutequation 38 produit une valeur de distance dij isin [minusinfin +infin] En fonction de lintervallede d nous pouvons deacuteduire que

dij isin [minusinfin 0] les caracteacuteristiques de la ressource j vont dans la direction inverse parrapport agrave la valeur de progressiviteacute optimale o

dij isin [0 1] la progression est trop lente par rapport agrave la valeur o attendue dij = 1 la progression est ideacuteale dij isin [1 +infin] la progression trop rapide

Dans un souci dhomogeacuteneacuteisation des distances entre toutes les colonies et pour respecterle modegravele initial ACS ougrave d repreacutesentait une distance physique nous avons souhaiteacute garder ladistance d isin [1 +infin] Pour ce faire nous avons donc reacutealiseacute une opeacuteration de transformationlorsque dij lt 1 preacutesenteacutee dans lEacutequation 39

69

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

Si dij isin

[minusinfin 0] alors dij = |dij |

[0 1] alors dij =1

dij

(39)

Inteacutegration compleacutementaire de la progressiviteacute dans le calcul de la distance parcou-rue des agents

Dans la section preacuteceacutedente nous avons deacutecrit le fonctionnement dune colonie deacutedieacutee agrave laprogressiviteacute Cependant nous soutenons le fait que la progressiviteacute ne doit pas ecirctre lapanagedune seule colonie mais doit ecirctre preacutesente dans toutes les colonies La progressiviteacute doit avoirune place preacutepondeacuterante dans les seacutequences que notre modegravele construit car cest une notionfondamentale dans la dieacuterence entre une liste de recommandation et une seacutequence de recom-mandation

An de renforcer la progressiviteacute des seacutequences construites par toutes les colonies nous pro-posons une version modieacutee de la mise agrave jour globale des pheacuteromones deacutecrite dans lEacutequation210 Dans lalgorithme initial ACS Lbest est la longueur du plus court chemin trouveacute par unagent Cette valeur est une simple somme de la distance associeacutee agrave chaque arecircte du meilleurchemin Cette valeur est ensuite utiliseacutee dans le calcul deacuteterminant la quantiteacute de pheacuteromonesagrave ajouter sur chaque arecircte du chemin Ainsi plus un chemin est court plus les arecirctes le com-posant sont reacutecompenseacutees par une plus grande quantiteacute de pheacuteromones Ce meacutecanisme est aucdivideur du renforcement de bonnes solutions et de leacutemergence de comportements intelligents Ande maximiser les seacutequences posseacutedant une progression constante nous avons modieacute le calcul deLbest pour inteacutegrer une notion de progressiviteacute Pour ce faire nous nutilisons plus simplementla distance dune arecircte mais aussi sa deacuteriveacutee comme montreacute dans lEacutequation 310

Lbest =sumeisinE

de +

sumeisinE

partde

|E|(310)

ougrave E est lensemble des arecirctes du meilleur chemin et de est la distance associeacutee agrave larecircte eAvec cette eacutequation modieacutee du calcul de la distance totale dun chemin nous peacutenalisons lesgrandes dieacuterences de distance entre des arecirctes successives tout en continuant de favoriser leschemins les plus courts En dautres termes lobjectif des agents est maintenant de trouver deschemins agrave la fois courts et progressifs les uns par rapport aux autres

35 Tactiques de fusion

Dans les sections preacuteceacutedentes nous avons deacutecrit 4 facteurs humains 4 objectifs agrave optimiserpar notre modegravele ainsi quun cinquiegraveme objectif de contrainte de construction des seacutequencesChacun de ces 4 premiers objectifs est associeacute agrave une colonie de fourmis speacutecique dont le but estde trouver un chemin dans le graphe Par conseacutequent apregraves cette premiegravere eacutetape il existe autantde chemins ou de seacutequences de ressources que de colonies dans le modegravele Le but est cependantde ne proposer agrave la n quune seule recommandation agrave lutilisateur Chaque seacutequence repreacutesentedonc ideacutealement une partie de la recommandation nale de lutilisateur An de construire cetteseacutequence nale il eacutetait neacutecessaire de fusionner ces dieacuterentes seacutequences provenant des coloniesen une seacutequence de recommandation unique Pour reacutesoudre ce problegraveme de nombreuses maniegraverede proceacuteder existent Dans la suite de cette section nous avons exploreacute deux tactiques de fusion

70

35 Tactiques de fusion

que nous allons preacutesenter

351 Colonie de fusion

La premiegravere tactique pour fusionner les dieacuterentes seacutequences produites preacuteceacutedemment a natu-rellement eacuteteacute dutiliser le mecircme modegravele que pour la premiegravere eacutetape agrave savoir une colonie speacuteciquedont les agents se deacuteplacent sur un graphe pour trouver une solution Cette colonie est cependantdieacuterente des preacuteceacutedentes pour deux raisons principales

Premiegraverement le graphe sur lequel cette colonie opegravere na aucun inteacuterecirct agrave contenir lensemblede toutes les ressources existantes du domaine Nous consideacuterons ici que la premiegravere eacutetape dumodegravele eectue une seacutelection dun certain nombre de ressources speacuteciques agrave chaque colonie Cesressources peuvent ensuite ecirctre utiliseacutees pour creacuteer un second graphe posseacutedant beaucoup moinsde ndivideuds sur lequel la colonie de fusion pourra chercher une solution Nous avons utiliseacute toutesles ressources seacutelectionneacutees dans la premiegravere eacutetape en tant que ndivideuds du nouveau graphe Nousavons ensuite ajouteacute des arecirctes agrave chaque paire conseacutecutives de ressources dans les seacutequences de lapremiegravere eacutetape an de conserver les meilleurs chemins trouveacutes par les agents Enn nous avonsajouteacute des arecirctes aleacuteatoires en suivant la mecircme meacutethode que deacutecrite au deacutebut de ce chapitre dansla creacuteation du graphe principal en Eacutequation 31 Le but de ces arecirctes aleacuteatoires est le mecircme quepreacuteceacutedemment agrave savoir permettre aux agents dexplorer de nouveaux chemins potentiels Cettepremiegravere tactique reprend donc les points principaux de la creacuteation du graphe principal

Deuxiegravemement et contrairement agrave la premiegravere eacutetape ougrave toutes les colonies avaient un butpreacutecis la colonie de fusion na pas pour vocation doptimiser une caracteacuteristique speacutecique Aucontraire cette colonie a pour essence de regrouper au mieux dans une solution unique les reacute-sultats speacuteciques trouveacutes auparavant Pour ce faire la colonie de fusion utilise lensemble desfacteurs humains preacutesenteacutes preacuteceacutedemment dans une somme pondeacutereacutee an dattribuer aux arecirctesune distance d prenant en compte tous les objectifs Le calcul de cette distance est preacutesenteacuteci-dessous dans lEacutequation 311

dij =sum

colisincoloniesw(col) middot dij(col) (311)

ougrave w(col) est le poids repreacutesentant limportance estimeacutee de lobjectif de la colonie col dansla recommandation nale Nous proposons ici de calculer les poids moyens de chaque objectif(similariteacute diversiteacute nouveauteacute et preacutefeacuterences) sur les derniegraveres n sessions dactiviteacute de lutilisa-teur Par exemple un utilisateur nayant eacutecouteacute que lalbum Wish you were here des Pink Floyddurant ses derniegraveres sessions deacutecoute se verra attribuer des poids forts pour la similariteacute et lespreacutefeacuterences Inversement les poids des objectifs de diversiteacute et de nouveauteacute seront faibles

Cette meacutethode permet dobtenir limportance relative de chacun des objectifs dans lhisto-rique de consultations reacutecent de lutilisateur En faisant varier n il est aussi possible de fairevarier la taille de lhistorique pris en compte Ainsi une valeur de n faible concernera uniquementles derniegraveres interactions de lutilisateur avec le systegraveme tandis quune valeur de n eacuteleveacutee pren-dra en compte agrave la fois lhistorique reacutecent et plus ancien La variation de la fenecirctre dhistoriquepeut ainsi apporter un comportement dieacuterent du modegravele pour dieacuterents types dutilisateurs(utilisateur reacutecent ou ancien peu actif ou tregraves actif etc)

71

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

352 Fusion de seacutequences

Nous avons souhaiteacute impleacutementer une deuxiegraveme tactique de fusion an davoir un point decomparaison avec la colonie de fusion Dans cette deuxiegraveme tactique nous avons eacutegalement cal-culeacute le poids w(col) de chaque objectif sur lhistorique n de lutilisateur de la mecircme maniegravereque dans lEacutequation 311 Ces poids ont ensuite eacuteteacute utiliseacutes dans la construction dune seacutequencenale ressource par ressource Pour ce faire nous avons reacuteunis toutes les ressources composantles seacutequences des colonies speacutecialiseacutees dans un ensemble agrave la maniegravere dun sac de mots Puis agravechaque iteacuteration lapport de chacune des ressources restantes agrave la seacutequence nale a eacuteteacute mesureacuteet la meilleure ressource a eacuteteacute ajouteacutee Les iteacuterations sont stoppeacutees lorsquil nest plus possibledameacuteliorer la seacutequence nale De la mecircme maniegravere que pour la tactique preacuteceacutedente lapportde chaque ressource agrave la seacutequence de recommandation peut ecirctre mesureacute de multiple maniegraveresDe la mecircme maniegravere que dans lEacutequation 311 nous avons choisi de calculer limportance dechaque objectif de la seacutequence nale en construction puis de choisir les ressources permettantde sapprocher des poids correspondant agrave lhistorique n de lutilisateur

353 Conclusion

Dans ce chapitre nous avons preacutesenteacute le fonctionnement de notre modegravele de recommanda-tion multi-objectifs AntRS Notre modegravele sinspire de lalgorithme multi-agents ACS de MarcoDorigo Au lieu de trouver le plus court chemin dans un graphe agrave laide dune colonie dagentsfourmis nous utilisons 4 colonies en parallegravele qui chacune maximise un aspect de la recomman-dation nale Comme nous lavons montreacute dans leacutetat de lart il est deacutesormais neacutecessaire que lesrecommandations prennent en compte de multiples facteurs comme la diversiteacute la similariteacute oula nouveauteacute Il est tout aussi important pour les systegravemes de recommandation decirctre modulaireset geacuteneacuteriques an de sadapter aux situations toujours plus complexes et aux domaines applicatifstoujours plus varieacutes dans lesquels ils sont utiliseacutes Le choix de sinspirer dun modegravele multi-agentsest une reacuteponse agrave ces deacutes de la recommandation moderne Les systegravemes multi-agents ont unefaible complexiteacute algorithmique et sont particuliegraverement adaptables par nature Le modegravele quenous avons proposeacute est de plus susamment geacuteneacuterique pour sadapter aux domaines applicatifsougrave il est possible de faire de la recommandation de seacutequences

Dans la suite de ce manuscrit nous allons appliquer notre modegravele AntRS a un domaineapplicatif et reacutealiser des expeacuterimentations avec des donneacutees dutilisation concregravete an deacutetudierses performances dans des conditions dutilisation reacuteelles

72

Chapitre 4

Expeacuterimentations et reacutesultats

Sommaire

41 Introduction 74

42 Expeacuterimentations preacuteliminaires portant sur le modegravele ACS initial 74

421 Preacutesentation et inteacuterecircts de ces premiegraveres expeacuterimentations 74

422 Expeacuterimentations preacuteliminaires sur le modegraveles ACS 78

423 Conclusion 84

43 Expeacuterimentations sur le modegravele AntRS 84

431 Base de donneacutees utiliseacutee 84

432 AntRS mono-objectif expeacuterimentations sur chaque colonie isoleacutee 89

433 AntRS multi-objectifs expeacuterimentations sur lensemble des colonies si-

multaneacutement et sur les tactiques de fusion 93

434 Optimisation des meacutetavariables de AntRS 99

44 Conclusion 103

73

Chapitre 4 Expeacuterimentations et reacutesultats

41 Introduction

Dans la section preacuteceacutedente nous avons deacutetailleacute le modegravele AntRS que nous avons deacuteveloppeacutepour reacutepondre aux probleacutematiques de cette thegravese Comme nous lavons expliqueacute AntRS se basesur le travail de [Dorigo and Birattari 2011] qui a modeacuteliseacute le comportement de fourragementdes fourmis dans la nature Son modegravele et le notre par extension ont donc au cdivideur de leur fonc-tionnement le mecircme meacutecanisme permettant agrave des agents teacuteleacuteonomiques de suivre et de deacuteposerdes pheacuteromones sur un graphe An de mettre en exergue le cdivideur de ces modegraveles qui sera parla suite enrichi nous avons en premier lieu deacuteveloppeacute les modegravele Ant Colony System de MarcoDorigo [Dorigo and Birattari 2011] en Java avec une interface visuelle Cela nous a permis detester son fonctionnement dans diverses conditions expeacuterimentales controcircleacutees ainsi que de testerses limites Nous avons ensuite impleacutementeacute lensemble de notre modegravele AntRS en utilisant la basedeacutejagrave deacuteveloppeacutee preacuteceacutedemment puis nous avons reacutealiseacute les expeacuterimentations principales de cettethegravese agrave laide dune base de donneacutees deacutecrivant les habitudes de personnes eacutecoutant de la musique

Ce chapitre est constitueacute de deux sections principales Dans la premiegravere section nous allonsdabord nous inteacuteresser agrave limpleacutementation et au fonctionnement expeacuterimental du modegravele ACS deDorigo Cette section mettra en exergue les points importants permettant le bon fonctionnementdu modegravele classique Agrave laide dexpeacuterimentations simples nous reprendrons et expliquerons dunpoint du vue pratique les notions introduites de maniegravere theacuteorique dans leacutetat de lart lors de lapreacutesentation du modegravele ACS Ces premiegraveres expeacuterimentations permettront au lecteur de mieuxappreacutehender la suite du chapitre dans laquelle les notions abordeacutees seront reacute-utiliseacutees et eacutetenduesDans la deuxiegraveme section de ce chapitre nous nous inteacuteresserons aux expeacuterimentations principalesde cette thegravese portant sur notre modegravele AntRS Nous deacutecrirons dabord la base de donneacutees quenous avons utiliseacute pour tester notre modegravele puis lensemble des expeacuterimentations faites et ennles principaux reacutesultats obtenus

42 Expeacuterimentations preacuteliminaires portant sur le modegravele ACS

initial

421 Preacutesentation et inteacuterecircts de ces premiegraveres expeacuterimentations

La premiegravere eacutetape de ce travail expeacuterimental a consisteacute dans limpleacutementation du modegraveleinitial proposeacute par Dorigo sans modication Le but eacutetait agrave la fois de veacuterier si les reacutesultatsobtenus correspondaient agrave ce qui eacutetait attendu dans la litteacuterature et davoir par ailleurs unprogramme repreacutesentant une base fonctionnelle permettant de tester de nouveaux modegraveles pluscomplexes par la suite Nous avons donc commenceacute par impleacutementer le modegravele Ant ColonySystem deacutecrit par Dorigo dans son article [Dorigo and Birattari 2011] Comme nous avons deacutejagravedeacutecrit en deacutetail ce modegravele dans la Section 243 de leacutetat de lart nous ne reviendrons pas surles eacutequations reacutegissant le fonctionnement dACS Cependant nous allons plutocirct nous inteacuteresserici aux reacutesultats obtenus lors dexpeacuterimentations connues de la litteacuterature scientique Le choixdu langage de programmation dans lequel a eacuteteacute reacutealiseacute limpleacutementation et les expeacuterimentationsdurant toute cette thegravese a eacuteteacute Java Ce choix se justie par 3 principales raisons

1 La connaissance avanceacutee de ce langage

2 les bibliothegraveques 40 disponibles correspondant aux besoins de la thegravese

40 Ensemble de ressources (fonctions algorithmes speacuteciques documentation) permettant la creacuteation acceacuteleacutereacuteede programmes

74

42 Expeacuterimentations preacuteliminaires portant sur le modegravele ACS initial

3 Le fait que Java soit un langage de programmation orienteacute objet qui est un paradigmede programmation particuliegraverement adapteacute pour limpleacutementation dagents (chaque agentpeut ecirctre repreacutesenteacute par un objet Java)

Pour rappel lalgorithme geacuteneacuteral des Ant Colony Optimization servant de base pour toutesles dieacuterentes versions proposeacutees par Dorigo (Ant System Ant Colony System Ant-q ) estsyntheacutetiseacute dans lAlgorithme 3 ci-dessous

Algorithm 3 Meacutetaheuristique Ant Colony Optimization

Initialisation des paramegravetres et des pheacuteromoneswhile conditions darrecircts non atteintes doConstruction des solutionsRecherche locale (optionnelle)Mise agrave jour des pheacuteromones

end while

Agrave partir de lalgorithme geacuteneacuteral Ant Colony Optimization voici le fonctionnement de savariante Ant Colony System syntheacutetiseacute dans lAlgorithme 4 ci-dessous

Algorithm 4 Algorithme Ant Colony System

Initialisation des paramegravetres et des pheacuteromoneswhile conditions darrecircts non atteintes dowhile toutes les fourmis nont pas atteint le but dowhile tous les ndivideuds nont pas eacuteteacute pris en compte doAppliquer la regravegle de transition et choisir le prochain ndivideud agrave atteindreAppliquer la mise agrave jour locale des pheacuteromones sur larecircte traverseacutee

end whileend whileMise agrave jour globale des pheacuteromones

end while

Cet algorithme ACS peut aussi ecirctre deacutecrit sous la forme dun diagramme de ux commela proposeacute [Schlunz 2011] dans la Figure 41 Le format du diagramme de ux permet de bienvisualiser le fonctionnement de lalgorithme et notamment ses boucles iteacuteratives imbriqueacutees tantquun critegravere de n na pas eacuteteacute trouveacute tant quil reste des fourmis agrave deacuteplacer et tant quil restedes ndivideuds agrave explorer pour une fourmi

Apregraves avoir impleacutementeacute en Java lalgorithme ACS deacutecrit ci-dessus nous avons voulu testerson fonctionnement Agrave cette n nous avons repris les expeacuteriences des ponts binaires que nousavons preacutesenteacute dans la section 244 de leacutetat de lart Pour rappel ces types dexpeacuterimentationsconsistent agrave placer des fourmis dans un dispositif comportant un point de deacutepart (la fourmiliegrave-re) un point darriveacutee (la nourriture) et deux chemins y menant Ces chemins peuvent avoirla mecircme distance ou des distances dieacuterentes selon le type dexpeacuterimentation Le but est ensuitedobserver le comportement des fourmis sur quelques dizaines de minutes an de deacuteterminer si unchemin est plus emprunteacute quun autre La Figure 42 preacutesente deux exemples de congurationspossibles de cette expeacuterience utiliseacutee sur de vraies fourmis Le but eacutetant bien sucircr dobserver lecomportement de groupes de fourmis et leurs capaciteacutes agrave trouver le chemin le plus court vers

75

Chapitre 4 Expeacuterimentations et reacutesultats

Figure 41 Diagramme de ux repreacutesentant le deacuteroulement de lalgorithme ACS proposeacute par[Schlunz 2011]

une source de nourriture dans un environnement inconnu

Nous revenons sur ces expeacuterimentations dans ce chapitre de la thegravese apregraves les avoir deacutejagrave

76

42 Expeacuterimentations preacuteliminaires portant sur le modegravele ACS initial

Figure 42 Deux exemples de congurations expeacuterimentales dieacuterentes permettant chacune detester la capaciteacute des fourmis agrave trouver le plus court chemin dans un evironnement [Goss et al1989]

mentionneacutees dans leacutetat de lart car elles peuvent ecirctre utiliseacutees pour veacuterier le comportement dumodegravele ACS que nous avons impleacutementeacute En eet ces expeacuterimentations sont simples agrave mettreen divideuvre et les reacutesultats attendus sont connus De plus le modegravele ACS possegravede plusieurs meacuteta-variables permettant chacune de moduler le comportement de certaines parties du systegraveme Leparameacutetrage de ces meacutetavariables inue de maniegravere importante sur les reacutesultats potentiels dumodegravele il est donc important de bien comprendre le rocircle de chacune dentre elles et de les testerextensivement pour maximiser les capaciteacutes du modegravele Voici toutes les meacutetavariables du modegraveleACS

1 τ0 isin [0 1] valeur initiale des pheacuteromones disposeacutees sur chaque arecircte du graphe avant lepremier passage des agents

2 α isin [0 1] importance des pheacuteromones lorsque lagent fourmi choisit dune nouvelle arecircteagrave explorer Plus la valeur de ce paramegravetre est eacuteleveacutee plus lagent privileacutegiera les arecirctesavec un niveau eacuteleveacute de pheacuteromones

3 β isin [0 1] importance de lheuristique lorsque lagent fourmi deacutecide dune nouvelle arecircteagrave explorer Plus la valeur de ce paramegravetre est eacuteleveacutee plus lagent privileacutegiera les arecirctesposseacutedant une bonne heuristique

4 ρ isin [0 1] paramegravetre geacuterant leacutevaporation des pheacuteromones sur les arecirctes du graphe Plusla valeur de ce paramegravetre est eacuteleveacutee et plus les pheacuteromones seacutevaporent rapidement entrechaque passage dagent

5 Q0 isin [0 1] paramegravetre permettant deacutequilibrer la part dexploration et dexploitationbiaiseacutee du modegravele Plus la valeur de ce paramegravetre est eacuteleveacutee et plus les agents auront ten-dance agrave exploiter les arecirctes ougrave beaucoup dautres agents sont deacutejagrave passeacutes Inversementplus la valeur de ce paramegravetre est basse et plus les agents auront tendance agrave explorer denouveaux chemins encore peu visiteacutes

En plus de ces 5 meacutetavariables utiliseacutees dans le modegravele theacuteorique et les eacutequations dACSdautres meacutetavariables sont inheacuterentes au fonctionnement du modegravele en pratique On peut ainsideacutenombrer 2 autres meacutetavariables

77

Chapitre 4 Expeacuterimentations et reacutesultats

6 a nombre dagents fourmis se deacuteplaccedilant sur le graphe Plus le nombre dagents est eacuteleveacuteet plus lintelligence collective du systegraveme baseacutee sur les pheacuteromones se deacuteveloppera Ungrand nombre dagents allonge cependant la dureacutee de lexeacutecution du programme

7 n nombre diteacuterations du programme Lors dune iteacuteration chaque agent se deacuteplace surle graphe et produit un parcours complet Plus le nombre diteacuterations est grand et plusles agents ont de temps pour renforcer leacutemergence dune solution (un chemin particuliersur le graphe) mais plus lexeacutecution prendra du temps

Linteacuterecirct de mettre en place les expeacuterimentations des ponts binaires est donc double

1 Veacuterier le comportement du modegravele ACS impleacutementeacute en Java sur des expeacuterimentationsconnues

2 Observer limpact des 7 meacutetavariables listeacutees ci-dessus sur le comportement et les reacutesultatsdu modegravele dans le but de mieux appreacutehender les expeacuterimentations principales de cettethegravese qui seront preacutesenteacutees dans la suite de cette section

422 Expeacuterimentations preacuteliminaires sur le modegraveles ACS

Expeacuterimentation 11 ponts binaires de mecircme longueur

La premiegravere expeacuterimentation avait pour but de tester le graphe le plus simple possible agravelimage du dispositif de lexpeacuterimentation de Deneubourg dont nous avons deacutejagrave parleacute dans leacutetatde lart et qui est rappeleacute avec la Figure 43 un point de deacutepart un point darriveacutee et deuxchemins possibles strictement eacutequivalents en terme de distance agrave parcourir

Figure 43 Illustration de lexpeacuterience des ponts binaires par Jean-Louis Deneubourg (a)Apregraves un certain temps les fourmis choisissent majoritairement une des deux voies possibles (b)[Deneubourg et al 1990]

Avec le passage successif des fourmis un chemin va petit agrave petit ecirctre privileacutegieacute et renforceacute viales pheacuteromones deacuteposeacutees par ces derniegraveres Au bout dun certain temps un des deux chemins estemprunteacute par la majoriteacute des fourmis mecircme si quelques-unes dentre elles continuent toujoursdemprunter lautre chemin au cas ougrave celui-ci deviendrait plus avantageux Comme les cheminsrestent strictement identiques dans cette expeacuterience le choix nal du chemin nest pas important

An de pouvoir mieux appreacutecier le fonctionnement du modegravele en temps reacuteel nous avonsimpleacutementeacute une interface graphique permettant dacher le graphe ses ndivideuds ses arecirctes et

78

42 Expeacuterimentations preacuteliminaires portant sur le modegravele ACS initial

toutes leurs informations Cette interface a eacuteteacute deacuteveloppeacutee agrave laide dune bibliothegraveque Java gra-tuite nommeacutee GraphStream 41 orant tout un ensemble de fonctions permettant lachage degraphes Cette couche graphique se rajoute au-dessus de limpleacutementation complegravete du modegravelesans toutefois en modier son fonctionnement daucune maniegravere Linterface graphique reacutecupegraveresimplement les donneacutees agrave acher agrave linitialisation (la disposition du graphe avec ses arecirctes etses ndivideuds) ainsi quagrave chaque iteacuteration du modegravele pour mettre agrave jour les valeurs de pheacuteromonesagrave chaque arecircte Une fois lexeacutecution termineacutee le chemin nal trouveacute par les agents est coloreacutepermettant une rapide visualisation des reacutesultats du modegravele Pour cette sous-section les reacutesultatsdes expeacuterimentations seront preacutesenteacutes agrave laide de GraphStream

Figure 44 Repreacutesentation graphique de lExpeacuterimentation 11 meneacutee sur le modegravele ACSgracircce agrave la bibliothegraveque Java GraphStream Le ndivideud repreacutesenteacute par un carreacute rouge correspondau deacutepart le ndivideud repreacutesenteacute par un carreacute bleu repreacutesente larriveacutee les ndivideuds ronds noirsrepreacutesentent des points de passage possible les nombres noirs accoleacutes aux arecirctes repreacutesentent ladistance pour parcourir larecircte les nombres violets repreacutesentent le taux de pheacuteromones deacuteposeacuteessur larecircte

La Figure 44 est une capture deacutecran de la fenecirctre graphique construite avec les fonction-naliteacutes oertes par GraphStream montrant la conguration de lExpeacuterimentation 11 On y voitnotamment lensemble du graphe avec ses 4 ndivideuds distinguables par leur numeacutero didentication0 1 2 9 Le ndivideud 0 repreacutesente le point de deacutepart ougrave les agents sont initialement placeacutes tandisque le ndivideud 9 repreacutesente le ndivideud darriveacutee ougrave les agents atteignent leur but et cessent de sedeacuteplacer Au niveau des arecirctes du graphe on peut distinguer deux informations en violet laquantiteacute de pheacuteromones τ preacutesente sur larecircte en noir la distance d agrave parcourir pour traverserlarecircte Dans cette conguration lheuristique ηij associeacutee agrave chaque arecircte i j est calculeacutee demaniegravere classique uniquement avec la distance dij agrave savoir ηij = 1

dij Lheuristique est donc ici

41 httpgraphstream-projectorg

79

Chapitre 4 Expeacuterimentations et reacutesultats

eacutequivalente agrave la distance et nest pas acheacutee dans la fenecirctre graphique La conguration repreacute-senteacutee par la Figure 44 correspond agrave leacutetat dinitialisation du systegraveme avant que les agents neparcourent le graphe Toutes les arecirctes ont donc les mecircmes valeurs le taux de pheacuteromones τcorrespond au taux de pheacuteromones initial τ0 ici eacutegal agrave 0 1 et la distance est xeacute agrave 10 uniteacutesLes deux chemins possibles permettant aux agents de se deacuteplacer du ndivideud de deacutepart 0 au ndivideuddarriveacutee 9 sont eectivement strictement identiques

Figure 45 Reacutesultats obtenus apregraves 30 iteacuterations sur lExpeacuterimentation 11 Agrave gauche laconguration nale du graphe agrave droite le pourcentage dagents fourmis ayant emprunteacutes lesdeux chemins

LExpeacuterimentation 11 se deacuteroule donc ainsi 100 agents se deacuteplaceront agrave chaque fois etchercheront un chemin du ndivideud 0 au ndivideud 9 durant 30 iteacuterations La Figure 45 preacutesente lesreacutesultats de cette expeacuterimentation Agrave gauche la fenecirctre graphique montre leacutetat du graphe agrave lan des 30 iteacuterations on peut voir le chemin seacutelectionneacute par les agents passant par les ndivideudslt 0 1 9 gt Agrave droite le graphique preacutesentant leacutevolution du pourcentage dagents prenant soitle chemin 1 (lt 0 1 9 gt) ou le chemin 2 (lt 0 2 9 gt) Leacutevolution des pourcentages est similaireaux reacutesultats trouveacutes par Deneubourg avec de vraies fourmis (Figure 43) Une fois quun cheminest privileacutegieacute par rapport agrave un autre entre 80 et 95 des agents y passent Cet eacutecart saccentuede plus en plus au l des iteacuterations Il est toutefois important de noter quil subsiste un faiblepourcentage dagents deacutecidant quand mecircme de prendre le chemin 2 permettant au systegraveme desadapter agrave un potentiel changement denvironnement On voit ici linteacuterecirct de la meacutetavariableQ0 qui eacutequilibre lexploitation du chemin 1 en majoriteacute mais qui autorise aussi quelques agentsagrave explorer dautres chemins du graphe

Expeacuterimentation 12 ponts binaires de mecircme longueur et inuence des meacutetava-riables

LExpeacuterimentation 12 illustre limportance des meacutetavariables sur le comportement du sys-tegraveme La mecircme topologie du graphe est conserveacutee mais certaines meacutetavariables sont modieacutees Q0 et β La premiegravere gegravere leacutequilibre entre exploration et exploitation tandis que la deuxiegravemeconcerne limportance de lheuristique dans lexploration Contrairement agrave lExpeacuterimentation11 Q0 est ici biaiseacute pour privileacutegier lexploration et β est augmenteacute an de donner plus dimpor-tance agrave lheuristique par rapport au pheacuteromones lors de lexploration Les agents ont donc plus

80

42 Expeacuterimentations preacuteliminaires portant sur le modegravele ACS initial

de probabiliteacute dexplorer de nouvelles arecirctes plutocirct que demprunter des arecirctes ougrave beaucoup depheacuteromones sont deacutejagrave deacuteposeacutes Dans cette conguration lexploration se base principalement surlheuristique qui est ici strictement identique quelle que soit larecircte puisque baseacutee sur la distanceLes agents nont donc en theacuteorie pas vraiment de direction claire quant au chemin agrave prendre Onpeut voir le reacutesultat de lExpeacuterimentation 12 sur la Figure 46 les agents oscillent dun chemin agravelautre selon liteacuteration sans quaucun des deux ne soit vraiment privileacutegieacute Quand bien mecircme unchemin serait plus emprunteacute que lautre pendant une iteacuteration les pheacuteromones suppleacutementairesdeacuteposeacutees sur les arecirctes nont que peu dinuence sur la deacutecision lors des prochaines iteacuterations

Figure 46 Reacutesultats obtenus apregraves 30 iteacuterations sur lExpeacuterimentation 12 Comme les agentsse basent principalement sur lheuristique qui est partout eacutegale ils oscillent entre les deux cheminssans en privileacutegier un

Expeacuterimentation 13 ponts binaires de mecircme longueur et inuence des meacutetava-riables

LExpeacuterimentation 13 dont les reacutesultats sont preacutesenteacutes par la Figure 47 montre quil estaussi possible dobtenir linverse du comportement de lExpeacuterimentation 12 En donnant uneforte importance aux pheacuteromones et en favorisant grandement lexploitation par rapport agrave lex-ploration les agents choisissent tregraves rapidement un chemin et nen changent plus Au bout dequelques iteacuterations seulement 100 des agents prennent le mecircme chemin Lautre chemin aban-donneacute nit par voir toutes ses pheacuteromones seacutevaporer et les agents nont plus aucun moyen dyretourner

Expeacuterimentation 2 ponts binaires avec chemins de longueurs dieacuterentes

Apregraves avoir testeacute le comportement du modegravele ACS sur un graphe ougrave les chemins sont iden-tiques dans lExpeacuterimentation 1 nous allons maintenant creacuteer un graphe ayant la mecircme con-guration que dans la Figure 42 Le but est ici de tester la capaciteacute des agents agrave imiter lesfourmis dans la nature qui sont capables apregraves quelques dizaines de minutes de privileacutegier les 2

81

Chapitre 4 Expeacuterimentations et reacutesultats

Figure 47 Reacutesultats obtenus apregraves 30 iteacuterations sur lExpeacuterimentation 13 Les agents ex-ploitent ici les arecirctes ayant le plus de pheacuteromones Tregraves rapidement tous les agents utilisent lemecircme chemin

arecirctes courtes par rapport aux 2 arecirctes longues Nous allons de plus garder les mecircmes valeursde meacutetavariables que pour lExpeacuterimentation 11 sauf pour la quantiteacute initiale de pheacuteromoneτ0 qui sera augmenteacutee an de rester au-dessus de 0 La Figure 48 montre la conguration dugraphe directement apregraves 30 iteacuterations Toutes les arecirctes courtes avec une distance de 10 ont eacuteteacuteseacutelectionneacutees tandis que toutes les arecirctes longues avec une distance de 20 nont pas eacuteteacute utiliseacutees

Figure 48 Conguration nale du graphe pour lExpeacuterimentation 2 apregraves 30 iteacuterations Lesagents ont en majoriteacute bien seacutelectionneacute le chemin le plus court lt 0 1 3 4 9 gt

82

42 Expeacuterimentations preacuteliminaires portant sur le modegravele ACS initial

Expeacuterimentation 3 graphes aleacuteatoires plus complexes

Dans les preacuteceacutedentes expeacuterimentations le graphe eacutetait le plus simple possible pour pouvoirjouer avec le comportement du modegravele Avant de passer agrave la section suivante nous souhaitionstester les capaciteacutes du modegravele sur des topologies de graphes plus complexes Nous avons donccreacuteeacute aleacuteatoirement 10 graphes posseacutedant chacun 20 ndivideuds et des arecirctes aleacuteatoires selon un degreacutemoyen de 5 sur lesquels 100 agents se deacuteplaceront sur 50 iteacuterations La Figure 49 preacutesente lepremier de ces 10 graphes apregraves 30 iteacuterations On peut voir que le but est de trouver un chemindu ndivideud 0 au ndivideud 19 et les agents ont trouveacute le chemin lt 0 1 4 2 19 gt Ce chemin est eecti-vement le plus court avec une distance de 284 le deuxiegraveme meilleur chemin eacutetant lt 0 5 6 19 gtavec une distance de 315

Figure 49 Exemple de graphe de lExpeacuterimentation 3 agrave la n des 50 iteacuterations Ces graphessont geacuteneacutereacutes aleacuteatoirement

Parmi les 10 graphes aleacuteatoires le modegravele a trouveacute le chemin le plus court pour 9 dentre euxcar dans lun des graphes il neacutetait pas possible de rejoindre le ndivideud de n 19 Autrement dit

83

Chapitre 4 Expeacuterimentations et reacutesultats

les agents ont trouveacute le chemin le plus optimiseacute agrave chaque fois que cela eacutetait possible

423 Conclusion

Dans cette premiegravere section nous avons impleacutementeacute et testeacute le modegravele ACS proposeacute parDorigo Malgreacute la relative simpliciteacute des expeacuterimentations reacutealiseacutees nous avons pu comparer etveacuterier les reacutesultats que nous avons obtenus avec ceux de la litteacuterature scientique du domaineOutre ce point nous avons aussi pu deacuteduire quelques informations cruciales pour la suite de cettesection

Les meacutetavariables jouent un rocircle central dans le comportement les performances etles reacutesultats du modegravele

Les meacutetavariables peuvent donner de bons reacutesultats avec un type de graphemais pas forceacutement avec un autre Il sera donc important de pouvoir les adapter auxgraphes des expeacuterimentations principales

Leacutequilibre de ces meacutetavariables est relativement complexe agrave obtenirMecircme avecces congurations simples de graphes et laide de linterface graphique chaque expeacuterimen-tation a demandeacute un certain nombre dessais avant de trouver des valeurs concluantes Deplus comme ces meacutetavariables sont propres agrave chaque expeacuterimentation leacutetat de lart necontient que tregraves peu dindications sur les valeurs agrave leur donner Il sera donc importantdeacutetudier ce problegraveme pour les expeacuterimentations principales de cette thegravese

Il est important de noter que comme notre modegravele AntRS est une extension du modegravele ACSde Dorigo et reprend ses principes de fonctionnement toutes les conclusions ci-dessus pourrontecirctre appliqueacutees dans la section suivante ougrave nous reacutealiserons plusieurs expeacuterimentations avec lemodegravele AntRS

43 Expeacuterimentations sur le modegravele AntRS

Dans cette section nous allons maintenant deacutecrire les expeacuterimentations meneacutees sur le modegraveleAntRS que nous avons conccedilu dans le cadre de cette thegravese et deacutecrit dans le chapitre 3 preacuteceacutedentNous nallons pas re-deacutetailler la theacuteorie du modegravele AntRS ici comme cela a deacutejagrave eacuteteacute fait dansle chapitre preacuteceacutedent mais nous allons plutocirct nous concentrer sur son application et sur sescomportements dun point de vue expeacuterimental De la mecircme maniegravere que pour le modegravele ACSdans la section preacuteceacutedente il est important de proceacuteder agrave quelques tests pour jauger notremodegravele avant de lancer des expeacuterimentations pouvant ecirctre longues Toutefois et contrairementagrave la section preacuteceacutedente toutes les expeacuterimentations qui vont ecirctre preacutesenteacutees ici ont eacuteteacute reacutealiseacuteessur une base de donneacutees reacuteelles Avant de sinteacuteresser agrave ces expeacuterimentations nous allons doncpreacutesenter la base de donneacutees utiliseacutee

431 Base de donneacutees utiliseacutee

Tout dabord et avant de discuter du choix des donneacutees il est important de preacuteciser pour-quoi nous navons pas eu recours comme dans la section preacuteceacutedente pour le modegravele ACS agrave desdonneacutees simuleacutees Lexplication de cette deacutecision reacuteside dans lobjectif viseacute par ces expeacuterimen-tations Les expeacuterimentations reacutealiseacutees preacuteceacutedemment avaient seulement pour but de tester lebon fonctionnement du modegravele son comportement et linuence de ses meacutetavariables Lobjectifdes expeacuterimentations que nous allons preacutesenter maintenant est dieacuterent proposer des seacutequences

84

43 Expeacuterimentations sur le modegravele AntRS

de ressources correspondant aux preacutefeacuterences de lutilisateur Il serait theacuteoriquement possible desimuler un grand nombre de ressources aleacuteatoires posseacutedant des caracteacuteristiques elles aussi aleacutea-toires Cependant nous souhaitons principalement eacutevaluer la pertinence des seacutequences produitespar notre modegravele Pour ce faire il est neacutecessaire de disposer de donneacutees dusage pour veacuteriera posteriori si ces seacutequences sont susceptibles dinteacuteresser les utilisateurs Lexploitation dunebase de donneacutees reacuteelle posseacutedant ces donneacutees dusages eacutetait essentielle

Choix du domaine applicatif

Le choix du domaine applicatif a eacuteteacute un point crucial pour pouvoir tester notre modegravele dans debonnes conditions La recommandation de seacutequences restreint le choix du domaine en imposantcertaines contraintes

Les utilisateurs doivent consulter reacuteguliegraverement les ressources du domaine applicatif Lors dune peacuteriode dactiviteacute les utilisateurs doivent consulter un nombre susant (au

moins une dizaine) de ressources dans un court intervalle de temps Par conseacutequent les ressources doivent pouvoir ecirctre consulteacutees et consommeacutees rapide-

ment Ces ressources doivent aussi ecirctre disponibles en nombre susant

En se basant sur les eacutetudes de leacutetat de lart explorant les algorithmes de fourmis ou la recom-mandation de seacutequences deux domaines applicatifs sont majoritairement utiliseacutes les ressourceseacuteducatives ou les ressources multimeacutedias Le domaine eacuteducatif permet de geacuteneacuterer des seacutequencesdestineacutees aux apprenants comme le ferait un vrai professeur tandis que le domaine du divertisse-ment multimeacutedia est en plein essor depuis quelques anneacutees gracircce agrave la deacutemocratisation dInternethaut deacutebit et des smartphones permettant agrave tout un chacun de regarder des lms ou deacutecouter dela musique par exemple Un troisiegraveme domaine a aussi eacuteteacute consideacutereacute car il a eacuteteacute le sujet de monstage de n de Master en collaboration avec le projet europeacuteen CrossCult 42 le domaine museacutealautrement dit les seacutequences que creacuteent les visiteurs dun museacutee en se deacuteplaccedilant physiquementdans un museacutee [Osche et al 2016 Osche et al 2019b]

Toutefois mecircme si ces trois domaines sont adapteacutes agrave notre application la reacutecupeacuteration dunebase de donneacutees assez importante pour reacutealiser des expeacuterimentations ne pose pas les mecircmes pro-blegravemes selon le domaine consideacutereacute

Domaine eacuteducatif dans ce domaine les ressources sont des supports peacutedagogiques denatures dieacuterentes 43 et le but est de creacuteer des seacutequences permettant agrave des utilisateurs dat-teindre des connaissances speacutecieacutees Il existe des bases de donneacutees publiques provenantduniversiteacutes ouvertes comme par exemple lUniversiteacute Ouverte des Humaniteacutes 44 maisces derniegraveres nont pas de prols utilisateurs assez fournis pour pouvoir les utiliser icinotamment ducirce agrave une connexion avec une session unique et anonyme sans prol Commeil est preacutefeacuterable davoir plusieurs dizaines (voire centaines) dentreacutees preacute-existantes pourmodeacuteliser le graphe et les prols utilisateurs il est neacutecessaire dutiliser les donneacutees dunsite permettant la connexion de lutilisateur et lenregistrement de ses habitudes pendantune certaine dureacutee

42 httpwwwcrossculteu projet europeacuteen ayant pour but de modier la maniegravere dont les citoyens europeacuteensvoient et sapproprient lHistoire en creacuteant de nouvelles interconnexions entre lheacuteritage culturel des lieux deculture (museacutees villes etc) et le point de vue des citoyens eux-mecircmes43 Les supports peacutedagogiques peuvent inclure des cours eacutecrits oraux des videacuteos des exercices des tests etc44 httpwwwuohfr

85

Chapitre 4 Expeacuterimentations et reacutesultats

Domaine museacuteal ce domaine est unique car il est le seul des trois agrave neacutecessiter dereacutecolter des donneacutees de maniegravere physique et non sur ordinateur Comme nous lavons vudans leacutetat de lart des eacutetudes existent dans ce domaine et ont reacutecolteacute les positions desutilisateurs avec plus ou moins de preacutecision mais il nexiste agrave notre connaissance pas debase de donneacutees publique permettant de savoir ce que le visiteur regarde preacutecisemment 45Or cette information est essentielle agrave notre modegravele car la position seule ne permet pas dedeacuteterminer ce que fait preacuteciseacutement lutilisateur (par exemple il peut sassoir en face dunedivideuvre mais regarder derriegravere lui ou encore discuter avec quelquun sans precircter attentionagrave ldivideuvre devant lui etc) Autrement dit sans savoir ce que regarde lutilisateur il nestpas possible de savoir les ressources quil a consulteacute Eacutetant donneacute le sujet du stage eectueacuteavant cette thegravese cest sur ce problegraveme preacutecis que nous nous sommes dabord concentreacutesCependant devant le coucirct en temps de la mise en place dune telle expeacuterimentation nousavons chercheacute des alternatives plus reacutealisables Il est agrave noter quil existe aussi la possi-biliteacute dun museacutee virtuel ougrave les visiteurs utilisent un ordinateur et un casque de reacutealiteacutevirtuelle pour se deacuteplacer ddivideuvre en divideuvre dans un espace recreacuteeacute pour simuler un museacuteeLa creacuteation de lensemble des composants permettant cette expeacuterimentation ainsi que lerecrutement des visiteurs virtuels est cependant complexe et tregraves coucircteux en temps nechangeant pas le problegraveme principal de la reacutecolte de donneacutees dans notre cas

Domaine du divertissement multimeacutedia depuis le tout deacutebut des systegravemes de re-commandations le domaine multimeacutedia (musique lms etc) occupe une place majeuredans leacutetat de lart On peut citer par exemple la base de donneacutees publique MovieLensqui depuis 1998 a eacuteteacute utiliseacutee dans des milliers deacutetudes sur la recommandation de lms[Harper and Konstan 2015] La raison de cette omnipreacutesence est la grande quantiteacute desites web permettant souvent de maniegravere gratuite de regarder des videacuteos deacutecouter dela musique etc Les donneacutees dutilisation de ce genre de sites sont aussi relativementsimples agrave reacutecupeacuterer et agrave exploiter Leacutecoute de musique en ligne est speacuteciquement inteacute-ressante dans le cadre de cette thegravese car elle est propice agrave la consommation de multiplesressources agrave la suite dans une mecircme session orant ainsi la possibiliteacute de travailler avecdes seacutequences De plus il existe plusieurs sites de diusion de musique en ligne orantla possibiliteacute dacceacuteder agrave leur API et agrave certaines de leurs donneacutees comme Deezer 46 ouencore Spotify 47

Le choix sest nalement porteacute sur le domaine de leacutecoute de musique en ligne dune part pourla possibiliteacute dexploiter et de recommander des seacutequences de musiques et dautre part pour lapossibiliteacute dobtenir une base de donneacutees de la part de nos partenaires dans lindustrie musicaleNotre modegravele AntRS ayant la capaciteacute de sadapter agrave de nombreux domaines applicatifs nousavons pu nous diriger vers une base de donneacutees existante an de commencer les expeacuterimentationsAmaury LHuillier ancien doctorant de leacutequipe KIWI a reacutecupeacutereacute et exploiteacute durant sa thegraveseune base de donneacutees musicale provenant de Deezer [lHuillier 2018] Dans la section suivantenous allons deacutecrire les caracteacuteristiques de cette base de donneacutees

45 Bien que des solutions soient en cours deacutetudes[Mokatren et al 2018]46 httpswwwdeezercom47 httpswwwspotifycom

86

43 Expeacuterimentations sur le modegravele AntRS

Description de la base de donneacutees

La base de donneacutees que nous avons utiliseacute se base sur le comportement dutilisateurs deDeezer pendant un mois entre le 5 deacutecembre 2016 et le 5 janvier 2017 Durant ce mois nousavons pu identier

3561 utilisateurs uniques 1871919 eacutecoutes enregistreacutees 178910 musiques uniques eacutecouteacutees

En plus de ces donneacutees nous avons calculeacute le nombre de sessions uniques durant ce mois Unesession est deacutetermineacutee par un utilisateur se connectant sur le site eacutecoutant un certain nombre demusiques puis se deacuteconnectant Une session se poursuit tant que lutilisateur eacutecoute des musiquessans pause plus longues que 15 minutes Nous avons ainsi pu identier 91468 sessions uniquescomposeacutees en moyenne de 183 morceaux de musique Ces sessions seront la base de travail nouspermettant de construire le graphe de notre modegravele AntRS et de proposer des recommandationsLa Figure 410 preacutesente en scheacutema la deacutetection de sessions dans la base de donneacutees

Figure 410 Exemple de deacutetection de sessions dans la base de donneacutees Lheure agrave laquelleest lanceacutee chaque musique (ici en bas dans le scheacutema) ainsi que sa dureacutee sont enregistreacutees Silutilisateur ne relance pas de musique pendant 15 minutes apregraves la n de sa derniegravere eacutecoute alorsla session en cours est termineacutee et une nouvelle session est commenceacutee agrave la prochaine musiquelanceacutee

Deezer possegravede des meacutetadonneacutees sur chaque musique quil est possible de reacutecupeacuterer et decoupler agrave dautres API 48 (comme par exemple lAPI de Spotify 49) an de les compleacuteter si neacute-cessaire Sans preacutesenter la base de donneacutees dans lensemble de ses deacutetails voici ci-dessous les ca-racteacuteristiques potentiellement exploitables enregistreacutees pour chaque musique que nous pouvonsregrouper en trois cateacutegories Tout dabord nous disposons dinformations textuelles classiques

id identiant unique de la musique title titre de la musique album nom de lalbum auquel appartient la musique artist nom de lartiste (ou du groupe) qui a creacuteeacute la musique artistGenre genre musical de lartiste

Ensuite les API de descriptions de meacutetadonneacutees musicales disposent dun ensemble de va-leurs numeacuteriques correspondant aux caracteacuteristiques de chaque musique

48 API Application Programming Interface

49 httpsdeveloperspotifycomdocumentationweb-api

87

Chapitre 4 Expeacuterimentations et reacutesultats

duration dureacutee de la musique en secondes acousticness isin [0 1] indique agrave quel point la musique est acoustique cest-agrave-dire si

la musique est plutocirct de type eacutelectronique ou plutocirct classique (ie composeacutee avec desinstruments de musique agrave corde ou agrave vents par exemple)

danceability isin [0 1] indique agrave quel point la musique est adapteacutee agrave la danse energy isin [0 1] indique agrave quel point la musique est eacutenergique instrumentalness isin [0 1] indique agrave quel point la musique possegravede ou non des parties

vocales liveness isin [0 1] indique si la musique a eacuteteacute enregistreacutee avec ou sans la preacutesence dun

public loudness isin [0 1] mesure la preacutesence et la puissance des basses dans la musique speechiness isin [0 1] mesure limportance des paroles dans la musique sil y en a tempo rythme de la musique valence indique si leacutemotion geacuteneacuterale de la musique est plutocirct heureuse ou triste

Enn Deezer eacutetant un service de musique en ligne il dispose des donneacutees de freacutequentationsdes musiques les unes par rapport aux autres Il est donc possible de connaicirctre pour chaquemusique et artiste sa populariteacute

trackRankDeezer repreacutesente la populariteacute de la musique sur le site Deezer artistRankDeezer repreacutesente la populariteacute de lartiste sur le site Deezer

La base de donneacutees possegravede aussi une table concernant les utilisateurs Ces derniers sontbien sucircr anonymiseacutes avec un identiant geacuteneacutereacute automatiquement De plus pour chaque chansonDeezer peut connaicirctre quelles actions lutilisateur a eectueacute durant son eacutecoute (sil en a eectueacute)

idUser identiant unique de lutilisateur idTrack identiant unique de la musique eacutecouteacutee timestamp date preacutecise agrave laquelle lutilisateur a lanceacute la musique skip indique si lutilisateur est passeacute agrave la musique suivante durant son eacutecoute ban indique si lutilisateur a banni la musique eacutecouteacutee de ses futures recommandations love indique si lutilisateur a aimeacute la musique durant son eacutecoute

Ces trois derniegraveres informations sont importantes car elles repreacutesentent lavis de lutilisateursur la musique quil eacutecoute On peut par exemple deacuteduire dun utilisateur qui passe la musiqueen cours (skip) quil ne lappreacutecie pas ou alors quil laime mais que ce nest pas le bon momentpour leacutecouter Un utilisateur supprimant une musique de ses futures eacutecoutes (ban) indique quilne souhaite plus eacutecouter cette musique et ce quelles que soient les circonstances Le Tableau 41preacutesente la freacutequence agrave laquelle les utilisateurs se sont servis de ces fonctionnaliteacutes dans notrebase de donneacutees

Discussion sur la base de donneacutees

Dans cette section nous avons justieacute le choix dune base de donneacutees musicale et deacutecritson contenu Mecircme si initialement nous nous sommes plutocirct dirigeacutes vers lespace museacuteal etle-eacuteducation devant le temps et la complexiteacute de la reacutecupeacuteration de donneacutees dans ces deuxdomaines nous avons nalement proceacutedeacute au choix plus pragmatique du domaine musical dont

88

43 Expeacuterimentations sur le modegravele AntRS

Nombre doccurrences Pourcentage

skip 603773 3225ban 3417 018love 14174 076

Total 621364 3319

Table 41 Tableau repreacutesentant le nombre de fois ougrave un utilisateur a cliqueacute sur les boutonspour passer bannir ou aimer une musique durant son eacutecoute On remarque quau total dansnotre base de donneacutees pregraves dun tiers des utilisateurs ont passeacute la musique quils eacutecoutaient

une base de donneacutees eacutetait deacutejagrave disponible et precircte agrave lemploi Le travail preacuteliminaire sur les deuxdomaines applicatifs non seacutelectionneacutes na cependant pas eacuteteacute vain car des projets en parallegravelesur la creacuteation dune base de donneacutees de visiteurs se deacuteplaccedilant dans le museacutee des Beaux-arts deNancy sont en cours de reacutealisation [Osche et al 2019b][Castagnos et al 2019]

Un autre objectif derriegravere la prise en compte de plusieurs domaines sur lesquels appliquernotre modegravele est la geacuteneacutericiteacute de notre approche Ces trois domaines possegravedent de nombreusesdieacuterences les uns par rapports aux autres Le domaine des museacutees est un environnement physiqueougrave les distances entre les divideuvres dart et la foule sont des notions importantes agrave prendre en compteet unique agrave ce domaine Le domaine de le-eacuteducation quant agrave lui neacutecessite de prendre en comptelobjectif peacutedagogique de lapprenant son niveau ou encore sa vitesse dapprentissage plutocirctque les seules preacutefeacuterences quil est dusage dexploiter dans les systegravemes de recommandationNotre modegravele AntRS a eacuteteacute conccedilu dans le but de pouvoir sadapter agrave ces dieacuterentes speacuteciciteacutesAinsi le fonctionnement du cdivideur du modegravele reste le mecircme quel que soit le domaine et seulsles objectifs des colonies ainsi que le type des colonies neacutecessite decirctre adapteacute en fonctiondes objectifs importants du domaine et des caracteacuteristiques de ses ressources Pour illustrer cedernier point tregraves concregravetement les expeacuterimentations qui suivent nincluent pas la colonie deprogressiviteacute Nous avons reacutealiseacute de nombreux tests avec cette colonie avec le corpus de donneacuteesmais les reacutesultats obtenus nont jamais eacuteteacute concluants Cela sexplique par le fait que les seacutequencesdeacutecoutes utilisateurs que nous avons recueilli ne posseacutedaient elles-mecircmes aucun motif deacutetectablede progressiviteacute selon les critegraveres deacutenis dans notre modegravele Nous avons donc deacutecideacute dutiliser lamodulariteacute quore notre modegravele en enlevant cette colonie

432 AntRS mono-objectif expeacuterimentations sur chaque colonie isoleacutee

Apregraves avoir deacutetailleacute la base de donneacutees nous allons maintenant aborder la premiegravere expeacuteri-mentation que nous avons reacutealiseacute avec celle-ci Comme nous lavons fait au deacutebut de ce chapitreavec le modegravele ACS classique nous avons jugeacute important de reacutealiser quelques expeacuterimentationsde tests an dappreacutecier le fonctionnement en pratique de notre modegravele qui jusquagrave maintenantdans ce manuscrit na eacuteteacute preacutesenteacute que de maniegravere theacuteorique Pour rappel notre modegravele simuleen parallegravele plusieurs colonies de fourmis ayant chacune un objectif unique Ensuite un algo-rithme se charge de fusionner les dieacuterents reacutesultats de lensemble des colonies pour ne proposeragrave lutilisateur quune seule seacutequence de ressources Avant de tester lensemble de notre modegravelenous avons voulu tester les colonies seacutepareacutement an dobserver si les reacutesultats quelles produisentsont bien adapteacutes agrave leurs objectifs respectifs Voici les 4 colonies que nous avons preacutesenteacutes dansle chapitre 3 et que nous allons mesurer ici

1 Similariteacute

89

Chapitre 4 Expeacuterimentations et reacutesultats

2 Diversiteacute

3 Nouveauteacute

4 Preacutefeacuterences

An de mesurer les performances de ces 4 colonies nous allons les isoler et les lancer sur ungraphe identique en tous points La modulariteacute dAntRS nous permettant de changer le nombrede colonies utiliseacutees au vol agrave chaque exeacutecution est ici mis agrave prot pour lancer notre modegraveleavec uniquement une colonie au lieu des 4 habituelles La deuxiegraveme phase de notre modegravele lafusion des seacutequences provenant des dieacuterentes colonies nest ici pas utiliseacutee eacutetant donneacute que nousnaurons que les reacutesultats dune seule colonie autrement dit nous naurons agrave la n quune seuleseacutequence unique par utilisateur et par expeacuterimentation (soit 4 seacutequences par utilisateur pourlensemble des 4 expeacuterimentations) Nous allons donc proceacuteder agrave 4 tests dieacuterents pour chaquecolonie avec des conditions de deacutepart strictement identiques Le but est ici de voir si les reacutesultatsobtenus correspondent bien agrave lobjectif de la colonie testeacutee Autrement dit pour un utilisateurdonneacute les agents de la colonie de similariteacute devraient favoriser les musiques similaires au goucirct delutilisateur en question De son cocircteacute la colonie de nouveauteacute devrait dans les mecircmes conditionsproduire des seacutequences de musiques moins familiegraveres pour lutilisateur

Avant de preacutesenter les reacutesultats de ces premiegraveres expeacuterimentations nous allons deacutecrire dequelle maniegravere nous les avons reacutealiseacutees Nous avons deacutejagrave deacutetailleacute la base de donneacutees avec laquellenous travaillons dans la section preacuteceacutedente mais nous navons pas encore expliqueacute commentnous avons utiliseacute ces donneacutees Comme nous lavons preacuteciseacute nous avons agrave notre disposition plusde 3500 utilisateurs et plus de 91400 sessions Parmi lensemble total des utilisateurs nous enavons seacutelectionneacute 500 au hasard an de travailler uniquement sur eux Cette reacuteduction du nombredutilisateurs nous a permis de reacutealiser beaucoup plus rapidement des expeacuterimentations tout engardant une diversiteacute importante Pour chacun de ces 500 utilisateurs nous avons reacutecupeacutereacute leurssessions deacutecoute et gardeacute toutes celles contenant 5 musiques ou plus Ces 500 utilisateurs ontensuite eacuteteacute diviseacutes aleacuteatoirement en 2 groupes de 400 et de 100 les 400 premiers utilisateursont servi pour lentraicircnement du modegravele (dans notre cas la creacuteation du graphe) et cest sur les100 utilisateurs restants que nous avons meneacute les tests Dans le cadre de cette expeacuterimentationpreacutecise les utilisateurs de la base dentraicircnement ont eacutecouteacute 10621 sessions uniques de plus de5 musiques et les utilisateurs de la base de test ont quant agrave eux eacutecouteacute 2569 sessions Pourchacune des sessions deacutecoute des utilisateurs de la base de test notre modegravele a produit uneseacutequence de recommandations en partant de la premiegravere musique eacutecouteacutee Autrement dit pourchaque session les agents de notre modegravele ont eacuteteacute lanceacutes sur le graphe en prenant comme pointde deacutepart la premiegravere musique que lutilisateur avait eacutecouteacute Par exemple pour la session dunutilisateur consistant en leacutecoute de lalbum entier Dark Side of the Moon des Pink Floyd conte-nant 9 musiques les agents eacutetaient placeacutes sur le ndivideud du graphe correspondant agrave la premiegraveremusique de lalbum Speak to me Breathe puis notre modegravele sexeacutecute et les agents trouventun chemin dans le graphe Les agents possegravedent 3 conditions de parcours de graphe une condi-tion de taille minimale de la seacutequence recommandeacutee et deux conditions darrecircts La conditionde taille minimale de la seacutequence recommandeacutee est xeacutee agrave la moitieacute de la longueur de la sessioninitiale de lutilisateur Dans lexemple de lalbum de Pink Floyd un agent sera donc forceacute deparcourir au moins 5 ndivideuds du graphe avant de pouvoir sarrecircter Les deux conditions darrecirctseacutetaient quant agrave elles imposeacutees dans notre modegravele an de limiter la taille maximale de la seacutequencerecommandeacutee des agents Premiegraverement la derniegravere musique de la session initiale eacutecouteacutee parlutilisateur neacutetait pas donneacutee en amont mais si jamais les agents arrivaient agrave cette musique ils

90

43 Expeacuterimentations sur le modegravele AntRS

arrecirctaient ici leur chemin Deuxiegravemement dans le cas ougrave les agents natteignaient pas la derniegraveremusique de la session initiale de lutilisateur ces derniers sarrecirctaient lorsquils avaient parcourudeux fois la taille de la session initiale Dans notre exemple avec lalbum de Pink Floyd les agentspourraient donc parcourir au maximum 18 ndivideuds du graphe et produire ainsi une seacutequence derecommandations de 18 musiques En prenant en compte le nombre de ndivideuds des graphes surlesquels nous avons travailleacute (entre plusieurs dizaines de milliers jusquagrave plusieurs centaines demilliers) cest cette deuxiegraveme condition darrecirct qui eacutetait tregraves largement atteinte Ces trois condi-tions son neacutecessaires et ont eacuteteacute mises en place an dobtenir des seacutequences de recommandationfaisant sens dans le contexte du domaine applicatif musical Sans ces 3 conditions il est pos-sible dobtenir des seacutequences ne faisant que deux musiques ou posseacutedant des centaines voire desmilliers de musiques Comme le reste des paramegravetres de notre modegravele nous avons fait en sortequil soit aiseacute de les changer au vol en fonction du domaine applicatif voire mecircme en fonctionde chaque utilisateur au sein dun mecircme domaine

Nous allons maintenant nous inteacuteresser agrave la creacuteation du graphe Nous avons deacutecrit la maniegraveredont nous creacuteons le graphe sur lequel les agents se deacuteplacent dans la Section 33 du chapitrepreacuteceacutedent Nous avons utiliseacute un sous-ensemble de 500 utilisateurs choisis aleacuteatoirement parmilensemble des utilisateurs de notre base de donneacutees Deezer pour reacutealiser cette expeacuterimentationApregraves cette seacutelection aleacuteatoire nous avons seacutepareacute ces 500 utilisateurs en 5 blocs de 100 utilisateursan de reacutealiser une validation croiseacutee agrave 5 blocs 4 blocs ont constitueacute la base dapprentissage tandisque le dernier bloc restant a constitueacute la base de test Ce processus a eacuteteacute reacutepeacuteteacute 5 fois pour reacutealiserlexpeacuterimentation avec toutes les combinaisons possibles Le choix speacutecique dutiliser lensembledes connaissances disponibles de 80 des utilisateurs et dessayer de preacutevoir les preacutefeacuterences desderniers 20 est deacutelibeacutereacutement voulu Il nous permet de simuler au mieux le fonctionnement dunservice de recommandations en cours dutilisation En eet un nouvel utilisateur arrivant surle site sera inconnu du systegraveme de recommandation La tacircche de preacutediction est plus ardue etsaidera initialement des preacutefeacuterences des autres utilisateurs deacutejagrave connus du modegravele Au fur et agravemesure que le nouvel utilisateur eacutecoute des musiques et apporte ses retours sur ces derniegraveresle modegravele peut inteacutegrer ses preacutefeacuterences speacuteciques et de ce fait ameacuteliorer les recommandationsquil lui propose Pour simuler cette eacutevolution des connaissances du modegravele nous avons inteacutegreacutechaque session de lutilisateur au graphe apregraves avoir proposer une recommandation pour celle-ciAutrement dit une fois que le modegravele a proposeacute une recommandation de seacutequence en se basantsur une session deacutecoute de lutilisateur le graphe est reconstruit en inteacutegrant les informationsde cette nouvelle session deacutecoute Ainsi agrave chaque nouvelle session deacutecoute pour laquelle notremodegravele propose une recommandation le graphe gagne en information et est plus agrave mecircme depreacutedire correctement les preacutefeacuterences de lutilisateur Cependant linconveacutenient majeur de cettemeacutethode est de devoir reconstruire le graphe apregraves chaque recommandation an dinteacutegrer lesnouvelles informations Apregraves cette premiegravere expeacuterimentation nous proposerons une meacutethodeplus classique de reacutepartition des connaissances apporteacutees par les utilisateurs

Le Tableau 42 preacutesente les reacutesultats de cette expeacuterience pour les 4 colonies choisies Ce for-mat de tableau de reacutesultats et les meacutetriques deacutevaluations qui le compose seront utiliseacutes pour lesprochaines expeacuterimentations nous allons donc les expliquer ici avant de discuter des reacutesultatsobtenus An de mesurer les performances de notre modegravele nous avons utiliseacute diverses mesuresnous permettant de capturer dieacuterents aspects que nous consideacuterons ecirctre importants dans unerecommandation de seacutequence Nous allons deacutecrire ces dieacuterentes mesures ci-dessous

Preacutecision Rappel et F-mesure les mesures classiques dans le domaine de la recherche

91

Chapitre 4 Expeacuterimentations et reacutesultats

Preacutecision Rappel F-mesure Similariteacute SIL Diversiteacute DR Nouveauteacute Preacutefeacuterences

Colonie de Similariteacute 0317 0126 0165 0952 0923 0048 0049 072 0447 Colonie de Diversiteacute 0211 0104 0127 0862 077 0138 019 0806 0393 Colonie de Nouveauteacute 0132 0112 0114 0895 0837 0105 0144 0909 079 Colonie de Preacutefeacuterences 0296 0159 0191 0946 091 0054 008 0695 0804

Table 42 Expeacuterimentations avec le modegravele AntRS mono-objectif pour les 4 objectifs desimilariteacute diversiteacute nouveauteacute preacutefeacuterencesLe code couleur fait reacutefeacuterence agrave la signicativiteacute statistique de la p-valeur avec p isin [0 1] 0 0001 001 005 01 1

dinformation [Baeza-Yates et al 1999] Elles permettent de comparer directement lesseacutequences de recommandation produites par notre modegravele avec les sessions deacutecoute ini-tiales des utilisateurs Dans un contexte dutilisation reacuteel ougrave un utilisateur se connecte etle systegraveme propose une recommandation il ne serait pas possible dutiliser ces mesuresCependant dans le cadre dune eacutevaluation hors-ligne elles apportent des informations ma-jeures sur la qualiteacute des recommandations car nous consideacuterons que les sessions deacutecouteque nous posseacutedons sont de bons modegraveles pour nos recommandations

Similariteacute et SIL (Similariteacute Intra-Liste) bien quelles soient sur-utiliseacutees les me-sures de similariteacute et notamment la similariteacute intra-liste sont de bons indicateurs de lacoheacuterence de nos seacutequences de recommandations La mesure de similariteacute intra-liste pro-vient des travaux de Ziegler amp al[Ziegler et al 2005]

Diversiteacute et DR (Diversiteacute Relative) comme nous lavons expliqueacute plus tocirct dans cemanuscrit la diversiteacute est une caracteacuteristique cruciale des systegravemes de recommandationsen plus de la similariteacute Il eacutetait donc important de mesurer agrave quel point les musiques re-commandeacutees ainsi que les seacutequences en elles-mecircmes eacutetaient diverses [McGinty and Smyth2003 Vargas and Castells 2011]

Nouveauteacute et Preacutefeacuterences pour mesurer ces deux derniegraveres caracteacuteristiques nousavons utiliseacute les deux mesures proposeacutees dans larticle de[Vargas and Castells 2011] quenous avons aussi reproduites preacuteceacutedemment dans les Eacutequations 35 et 36

Apregraves avoir expliqueacute en deacutetail lexpeacuterimentation et le processus deacutevaluation nous pouvonsmaintenant nous inteacuteresser aux reacutesultats agrave proprement parler Le Tableau 42 preacutesente les reacutesul-tats de notre premiegravere expeacuterimentation mono-objectif avec 500 utilisateurs pour chacune des 4colonies isoleacutees

An de sassurer que les reacutesultats obtenus et preacutesenteacutes ci-dessus sont signicatifs nous avonsreacutealiseacute pour chacune des cases du tableau un test de signicativiteacute statistique An de savoirsi nos donneacutees suivaient la loi normale nous avons reacutealiseacute un test de Shapiro-Wilk et ce der-nier sest reacuteveacuteleacute neacutegatif Nous avons ainsi ducirc utiliser le test non parameacutetrique de Wilcoxon quinous a permis de comparer les moyennes des deux eacutechantillons connexes (mecircme utilisateurs maisdieacuterentes colonies) Les reacutesultats pour cette expeacuterimentation se sont tous reacuteveacuteleacutes ecirctre tregraves si-gnicatifs avec un p maximal infeacuterieur agrave p lt 0 001 Nous avons preacutesenteacutes la signicativiteacute dechaque case de reacutesultat avec un systegraveme de symboles coloreacutees ougrave les trois premiers symboles (0 0001 001 ) sont signicatifs Ces tests de signicativiteacute ont eacuteteacute systeacutematiquementeectueacutes agrave chaque expeacuterimentation et par conseacutequent tous les reacutesultats que nous preacutesenterons

92

43 Expeacuterimentations sur le modegravele AntRS

dans la suite de cette section seront accompagneacutes de leur signicativiteacute

Nous pouvons maintenant revenir sur les reacutesultats preacutesenteacutes dans le Tableau 42 Commeil eacutetait preacutevu on peut observer que chaque colonie a produit des recommandations orienteacuteesvers son objectif speacutecique Ainsi la colonie de similariteacute a produit des seacutequences de musiquesayant obtenu les plus hauts scores de preacutecision similariteacute et similariteacute intra-liste la colonie dediversiteacute a produit les seacutequences avec le plus haut score de diversiteacute et de diversiteacute relative tandis que les colonies de nouveauteacute et de preacutefeacuterences ont respectivement produit des seacutequencesavec le plus haut score de nouveauteacute et de preacutefeacuterences On peut cependant remarquer que pourcertaines mesures (la preacutecision la similariteacute ou encore la diversiteacute par exemple) les eacutecarts sontrelativement faibles entre les dieacuterentes colonies Nous pouvons reacutepondre agrave cette constatation endeux points Tout dabord et comme nous lavons preacuteciseacute plus haut toutes les cases ougrave 3 eacutetoilesvertes ont eacuteteacute apposeacutees repreacutesentent des reacutesultats tregraves signicatifs dun point de vue statistiqueEnsuite lobjectif principal de cette expeacuterimentation est de prouver que notre modegravele est biencapable de produire des recommandations diverses et complegravetes suivant plusieurs dimensionsLa deuxiegraveme partie de notre modegravele ougrave les reacutesultats de chaque colonie seront fusionneacutes devraproduire des seacutequences eacutequilibrant au mieux chacune des dimensions Les premiegraveres seacutequencesproduites par les colonies mono-objectifs prouvent que cela est possible mais quil est neacutecessairedavoir cette deuxiegraveme eacutetape an de mieux eacutequilibrer les seacutequences nales qui seront proposeacuteesagrave lutilisateur

433 AntRS multi-objectifs expeacuterimentations sur lensemble des colonies

simultaneacutement et sur les tactiques de fusion

Objectifs de lexpeacuterimentation

Apregraves avoir montreacute que toutes les colonies eacutetaient capables de produire des seacutequences demusiques speacutecialiseacutees dans une dimension speacutecique nous pouvons maintenant reacutealiser des ex-peacuterimentations sur notre modegravele AntRS dans son ensemble cest-agrave-dire avec les 4 colonies enparallegravele suivi de leacutetape de fusion pour ne produire quune seacutequence unique posseacutedant toutes lesqualiteacutes de chaque dimension agrave lutilisateur nal Autrement dit avec la premiegravere expeacuterimenta-tion nous avons obtenu 4 seacutequences excellant chacune dans une dimension speacutecique (similariteacutediversiteacute nouveauteacute et preacutefeacuterences) et doreacutenavant lobjectif est dobtenir une seule seacutequencereacuteunissant ces 4 dimensions

Nous nallons pas reacuteexpliquer en deacutetail ici la construction du graphe ni le fonctionnement descolonies eacutetant donneacute que nous lavons deacutejagrave fait preacuteceacutedemment mais les dieacuterences entre cetteexpeacuterimentation et les preacuteceacutedentes seront cependant souligneacutees Contrairement agrave lexpeacuterimenta-tion preacuteceacutedente les 4 colonies ont eacuteteacute exeacutecuteacutees en parallegravele en exploitant les threads de JavaLa deuxiegraveme et principale dieacuterence se trouve dans lexploitation des seacutequences geacuteneacutereacutees par lescolonies Au lieu de les preacutesenter directement comme nous lavons fait dans lexpeacuterimentationmono-objectif ces seacutequences ont eacuteteacute fusionneacutees avec la deuxiegraveme partie du modegravele preacutesenteacutee dansle chapitre preacuteceacutedent dans la Section 35 Le but est ici dobtenir une seule seacutequence combinantau mieux tous les points forts des 4 colonies Les meacutetavariables utiliseacutees sont les mecircmes que pourlexpeacuterience preacuteceacutedente

93

Chapitre 4 Expeacuterimentations et reacutesultats

Comparaison de performances intra-modegravele

Maintenant que nous avons deacutecrit lobjectif de cette expeacuterimentation nous allons deacutecrire lamaniegravere dont nous avons mesureacute et compareacute les reacutesultats obtenus Tout dabord nous avons testeacute3 versions de notre modegravele les voici deacutecrites ci-dessous

AntRS avec les 4 colonies en parallegravele et le fusion de seacutequences Comme nous lavonsexpliqueacute dans le chapitre preacuteceacutedent Section 35 nous avons proposeacute deux tactiques defusion pour les seacutequences trouveacutees par les dieacuterentes colonies lors de la premiegravere eacutetape dumodegravele La fusion de seacutequences est la premiegravere de ces deux tactiques Pour rappel cettetactique consiste agrave geacuteneacuterer une liste de toutes les ressources de chacune des 4 meilleuresseacutequences trouveacutees par les colonies lors de la premiegravere eacutetape du modegravele puis de les reacutear-ranger an de creacuteer la seacutequence nale

AntRS avec les 4 colonies en parallegravele et la colonie de fusion Le deuxiegraveme modegraveletesteacute est identique au premier sauf en ce qui concerne la tactique de fusion Nous avonsutiliseacute ici la deuxiegraveme tactique de fusion preacutesenteacutee dans la Section 35 Pour rappel cettetactique consiste agrave construire un nouveau graphe constitueacute uniquement des ressources quicomposent les seacutequences des colonies de la premiegravere eacutetape cette derniegravere agissant donccomme une sorte de seacutelection pour reacutecupeacuterer les ressources les plus inteacuteressantes

Colonie de fusion uniquement La troisiegraveme et derniegravere version de cette expeacuterimen-tation sur le modegravele AntRS est dieacuterente des deux premiegraveres Au lieu deectuer seacutequen-tiellement la premiegravere eacutetape (les 4 colonies) puis la deuxiegraveme eacutetape avec les reacutesultats dela premiegravere (la fusion) nous avons voulu tester si le fait dexeacutecuter la colonie de fusiondirectement avec lensemble des ressources de tous les utilisateurs pouvait produire desreacutesultats inteacuteressants En eet dans le modegravele AntRS classique cette colonie est exeacutecuteacuteeavec quelques dizaines de ressources tout au plus qui ont eacuteteacute seacutelectionneacutees par les autrescolonies de la premiegravere eacutetape mais rien nempecircche de lancer directement cette colonieavec le mecircme graphe quutilisent les premiegraveres colonies et qui contient quelques dizainesde milliers de sommets Notre hypothegravese est que la seacutequence nale obtenue par ce biaisobtiendra de moins bons reacutesultats que le processus complet de notre modegravele AntRS avecnotamment la preacute-seacutelection de ressources potentiellement inteacuteressantes par les premiegraverescolonies speacutecialiseacutees

Enn les mecircmes meacutetriques ont eacuteteacute utiliseacutees pour mesurer les performances de chaque ver-sion testeacutee du modegravele que pour lexpeacuterimentation mono-objectif preacuteceacutedente an de garder laconsistance des reacutesultats entre toutes les expeacuterimentations meneacutees

Comparaison de performances inter-modegraveles

En plus de mesurer les performances des dieacuterentes versions de notre modegravele nous avonsvoulu comparer nos reacutesultats obtenus avec dautres systegravemes de recommandation deacutejagrave existantsLe but est ici de conrmer que notre modegravele produit des recommandations compeacutetitives parrapport agrave dautres algorithmes souvent utiliseacutes dans leacutetat de lart Pour ce faire nous avonsutiliseacute deux types dalgorithmes (1) trois algorithmes classiques mono-objectif capables de pro-duire des listes de recommandations et (2) un algorithme speacuteciquement multi-objectifs an dedavoir un point de comparaison provenant dun modegravele de la mecircme classe que le nocirctre Nous

94

43 Expeacuterimentations sur le modegravele AntRS

avons choisi ces 2 familles dalgorithmes an de comparer au mieux notre modegravele Les algo-rithmes mono-objectif permettent deacutetablir une base de comparaison an de deacuteterminer si notremodegravele est compeacutetitif face agrave des systegravemes noptimisant quun seul de nos objectifs De plus cesalgorithmes sont classiques dans le domaine de la recommandation et sont tregraves souvent utiliseacutescomme base de comparaison Lalgorithme multi-objectifs de comparaison permet quant agrave lui demesurer nos performances sur lensemble des objectifs que nous optimisons Nous allons deacutecriresuccinctement le principe de ces algorithmes sans entrer dans les deacutetails eacutetant donneacute que nousavons deacutejagrave deacutecrit leur fonctionnement geacuteneacuteral preacuteceacutedemment dans leacutetat de lart

Algorithmes classiques mono-objectifs

1 UserKNN [Breese et al 2013] algorithme classique de ltrage collaboratif ougrave les k plusproches voisins de lutilisateur actif baseacutes sur la similariteacute des preacutefeacuterences sont seacutelectionneacutesan de participer au processus de recommandation

2 TrustMF [Yang et al 2017] dans cette meacutethode plus reacutecente de ltrage collaboratifles auteurs proposent des ameacuteliorations du modegravele classique de factorisation de matricesan dadresser les problegravemes de deacutemarrage agrave froid et de manque de donneacutees Mecircme silsutilisent la meacutethode classique de la factorisation de matrice ils se deacutemarquent en utilisantla conance quont les utilisateurs les uns envers les autres an de reeacuteter leur inuencereacuteciproque sur leurs opinions

3 SVD++ [Koren 2008] dans cet article les auteurs proposent des ameacuteliorations auxtechniques des facteurs latents et des plus proches voisins qui sont les deux approches dultrage collaboratif obtenant les meilleurs reacutesultats Les auteurs combinent ces deux ap-proches ensemble et utilisent agrave la fois les retours explicites et implicites an dobtenir unepreacutecision plus importante Ce modegravele a eacuteteacute creacutee dans le cadre du Netix Prize de 2008une compeacutetition organiseacutee par Netix ougrave le but eacutetait de creacuteer un algorithme de ltragecollaboratif an de preacutedire au mieux les preacutefeacuterences des utilisateurs [Bennett et al 2007]

Ces trois algorithmes ont eacuteteacute seacutelectionneacutes car ils repreacutesentent des techniques connues et bienutiliseacutees du domaine des systegravemes de recommandation Ils ont prouveacute leur ecaciteacute de par lesnombreuses eacutetudes de leacutetat de lart les utilisant comme nous lavons montreacute dans le chapitre 2de ce manuscrit De plus ces algorithmes sont mis agrave disposition dans la librairie Java Librec 50

[Guo et al 2015] Cette librairie propose plus de 70 algorithmes de systegravemes de recommandationen open source et a deux missions principales la preacutediction de preacutefeacuterences (via des notes) et leclassement de ressources Lutilisation de Librec nous a permis de travailler directement sur desalgorithmes agrave jour et sans erreur

Algorithme multi-objectifs

4 PEH [Ribeiro et al 2014] Nous avons souhaiteacute ajouter agrave cette liste un quatriegraveme algo-rithme qui contrairement aux trois premiers est multi-objectifs Cet algorithme nommeacutePEH pour Pareto-Ecient Hybridization a eacuteteacute preacutesenteacute dans la Section 252 de leacutetatde lart de ce manuscrit et nous allons ici discuter de son impleacutementation PEH est unmodegravele ougrave plusieurs algorithmes de recommandation sont exeacutecuteacutes en mecircme temps Lebut est dobtenir une valeur de pertinence pour chaque paire ressourcetimes utilisateur in-diquant agrave quel point il est pertinent de recommander la ressource agrave lutilisateur Chaquealgorithme produit un score et an de nobtenir quune seule valeur unique par paire

50 Librec la librarie Java pour les systegravemes de recommandation

95

Chapitre 4 Expeacuterimentations et reacutesultats

Table 43 Expeacuterimentations avec 3 versions du modegravele AntRS et 4 algorithmes de compa-raison 3 algorithmes mono-objectifs classiques (UserKNN TrustMF SVD++) et 1 algorithmemulti-objectifs (Pareto-Ecient Hybridization)

Preacutecision Rappel F-mesure Similariteacute SIL Diversiteacute DR Nouveauteacute Preacutefeacuterences Couverture

AntRS (4 colonies+ fusion de seacute-quences)

0344 0131 01838 0947 0908 0053 0069 0741 061 9692

AntRS (4 colonies+ colonie de fu-sion)

0288 0151 01836 0945 0905 0055 0082 0702 0612 9692

AntRS (colo-nie de fusionuniquement)

0197 0118 0141 0953 093 0047 0068 0324 0389 9692

UserKNN 0224 0138 0162 095 0905 005 0081 068 0541 6139TrustMF 0195 0117 014 095 0894 0058 009 0697 0458 6817SVD++ 0195 012 014 0941 0892 006 0093 070 0455 6817PEH 0193 0118 014 0941 0892 0059 0096 0697 0452 9752

Signicance codes (compared to AntRS with 4 colonies + lists merging) 0 0001 001 005 01 1

le modegravele PEH associe chacun de ces scores dans une combinaison lineacuteaire selon une hy-bridation speacutecique (ie des poids dieacuterents attribueacutes agrave chaque algorithme mitigeant ouaugmentant ainsi leur importance sur la valeur de pertinence nale) Le reacutesultat de cettecombinaison lineacuteaire est la valeur de pertinence de la recommandation de la ressource agravelutilisateur Plusieurs hybridations sont ainsi testeacutees et repreacutesenteacutees dans un espace en3 dimensions ougrave chaque point correspond aux niveaux de preacutecision de diversiteacute et denouveauteacute atteint par une hybridation Comme ces 3 dimensions sont aussi importantesles unes que les autres les auteurs utilisent le concept dOptimum de Pareto an de seacute-lectionner les meilleurs hybridations cest-agrave-dire les hybridations les plus proches ou surla frontiegravere de Pareto Dans leur article les auteurs utilisent dieacuterents algorithmes clas-sique de recommandation Ayant agrave notre disposition Librec ainsi que les 3 algorithmespreacutesenteacutes ci-dessus repreacutesentant plusieurs techniques de recommandation agrave la fois dieacute-rentes les unes des autres et tregraves utiliseacutees dans la litteacuterature nous les avons inclus dansle processus dhybridation Le reste du modegravele a eacuteteacute impleacutementeacute agrave partir de larticle desauteurs Ce modegravele est tregraves inteacuteressant pour notre comparaison de performance car il estmulti-objectifs comme le nocirctre mais utilise une technique tout agrave fait dieacuterente de An-tRS non baseacutee sur des modegraveles multi-agents et utilisant le concept dOptimum de Pareto

Pour cette expeacuterimentation nous avons donc un total de 4 algorithmes dieacuterents qui vontecirctre exeacutecuteacutes sur exactement la mecircme base de donneacutees et le mecircme nombre dutilisateurs quepour les trois versions de notre modegravele Les reacutesultats de cette expeacuterimentation sont preacutesenteacutesdans le Tableau 43

Reacutesultats

Comme pour lexpeacuterimentation mono-objectif nous avons mesureacute la signicativiteacute statistiqueavec le test des rangs signeacutes de Wilcoxon an de sassurer que les donneacutees obtenues pouvaientecirctre interpreacuteteacutee De plus les valeurs en gras pour chaque colonne montrent les meilleurs reacutesultatsobtenus

Les reacutesultats de cette expeacuterimentation nous reacutevegravelent plusieurs informations importantes Toutdabord nous allons nous inteacuteresser aux performances de notre modegravele AntRS Comme expliqueacute

96

43 Expeacuterimentations sur le modegravele AntRS

ci-dessus nous avons testeacute deux tactiques de fusion pour combiner les reacutesultats de nos quatreobjectifs Nous avons eacutegalement exeacutecuteacute directement la colonie de fusion sur le graphe completet sans la premiegravere eacutetape de notre modegravele

Les deux premiegraveres lignes du Tableau 43 preacutesentent les reacutesultats de notre modegravele AntRScomplet avec ses deux variations la fusion de seacutequences et la colonie de fusion Nous pouvonsvoir que dune maniegravere geacuteneacuterale notre modegravele obtient de tregraves bonnes performances par rapportaux 4 algorithmes de comparaison Les deux variations de notre modegravele obtiennent la meilleurepreacutecision (jusquagrave +7823) de rappel (jusquagrave +2905) et F-mesure (jusquagrave +3128) de tousles modegraveles testeacutes dans cette expeacuterimentation ce qui signie que notre modegravele est le meilleurpour modeacuteliser les preacutefeacuterences agrave partir des sessions initiales eacutecouteacutees par les utilisateurs AntRSa eacutegalement surpasseacute les autres modegraveles pour les preacutefeacuterences et les meacutetriques de nouveauteacute touten parvenant agrave maintenir un niveau correct de similitude et de diversiteacute Il est utile de rappelerici que nous avons deacutelibeacutereacutement choisi des objectifs non compatibles entre eux (Similariteacute vs Di-versiteacute Nouveauteacute vs Preacutefeacuterences) ce qui rend le processus de recommandations plus complexepour les algorithmes multi-objectifs (AntRS et PEH) par rapport aux algorithmes mono-objectifMalgreacute une diversiteacute un peu plus faible par rapport aux algorithmes de comparaison AntRS oreun meilleur compromis entre tous les objectifs que PEH et dans un temps dexeacutecution beaucoupplus court Enn nous pouvons remarquer que les deux modegraveles multi-objectifs AntRS et PEHont une bien meilleure couverture par rapport aux autres algorithmes

Les reacutesultats montrent que notre modegravele AntRS a obtenu de meilleurs reacutesultats que lesautres algorithmes de comparaison Cependant un autre objectif de cette expeacuterimentation eacutetaitde comparer les deux versions de la deuxiegraveme phase de notre modegravele la fusion de seacutequences et lacolonie de fusion Ces deux tactiques permettant dobtenir une seacutequence de recommandation -nale multi-objectifs agrave partir de plusieurs seacutequences mono-objectif repreacutesentent deux philosophiesdieacuterentes de construction de seacutequences et il est inteacuteressant de pouvoir observer leurs dieacuterencesde performance Dapregraves les reacutesultats obtenus ces deux meacutethodes sont relativement proches lunede lautre avec lexception majeure de la preacutecision qui est plus eacuteleveacutee pour la fusion de seacutequences(0 344) que pour la colonie de fusion (0 288) On peut noter aussi une leacutegegravere dieacuterence au ni-veau de la diversiteacute relative (respectivement 0 069 contre 0 082) et de la nouveauteacute (0 741 contre0 702) Limportance de la preacutecision dans la litteacuterature et la dieacuterence entre les deux tactiquesconcernant cette meacutetrique nous permettent de dire que la fusion de seacutequence est la meilleure desdeux tactiques pour cette expeacuterimentation

Nous allons maintenant nous inteacuteresser agrave la troisiegraveme ligne du tableau de reacutesultats repreacute-sentant lexeacutecution de la 2egraveme partie de notre modegravele seule Pour rappel lhypothegravese de cettetroisiegraveme version de notre modegravele est de veacuterier si la premiegravere eacutetape de notre modegravele permet biendameacuteliorer la qualiteacute des reacutesultats en preacute-seacutelectionnant les ressources correspondant le mieux auxquater objectifs agrave maximiser On peut observer en eet avec les reacutesultats que lexeacutecution directede la colonie de fusion sans la premiegravere eacutetape du modegravele deacutegrade bien la qualiteacute des solutionsnales trouveacutees Nous observons une nette diminution de la preacutecision du rappel de la F-mesureainsi que de la diversiteacute de la nouveauteacute et de preacutefeacuterences Ces reacutesultats nous permettent doncde conrmer que la premiegravere eacutetape de notre modegravele ougrave les 4 colonies travaillent simultaneacutementagrave obtenir des seacutequences speacutecialiseacutees dans leur objectif ameacuteliore bien la qualiteacute nale des recom-mandations dune maniegravere signicative Autrement dit les deux tactiques de fusion que nousavons deacuteveloppeacutees (fusion de seacutequences et colonie de fusion) permettent de trouver un compro-mis entre tous les objectifs de maniegravere plus ecace quand elles se basent sur les reacutesultats de la

97

Chapitre 4 Expeacuterimentations et reacutesultats

premiegravere eacutetape de notre modegravele

Expeacuterimentation alternative techniques de validation croiseacutee et de creacuteation degraphe alternative

Dans lexpeacuterimentation preacuteceacutedente nous avons deacutecideacute de seacuteparer les 500 utilisateurs en 5blocs de 100 ougrave agrave tour de rocircle 400 utilisateurs eacutetaient utiliseacutes pour la construction du grapheet 100 utilisateurs correspondaient agrave la base de test Ainsi le modegravele avait pour tacircche de pro-duire des seacutequences de recommandations baseacutees sur les sessions deacutecoute de ces 100 utilisateursUne fois que le modegravele avait produit sa seacutequence recommandeacutee la session deacutecoute initiale surlaquelle eacutetait baseacutee la recommandation eacutetait deacutevoileacutee au modegravele et le graphe eacutetait reconstruitpour en tenir compte Le but de ce fonctionnement eacutetait de simuler un fonctionnement reacuteel dunservice deacutecoute de musique Cependant un certain nombre deacutetudes du domaine de la recom-mandation de la litteacuterature scientique utilisent une meacutethode dieacuterente lors de la seacuteparationdes informations des utilisateurs pour reacutealiser une validation croiseacutee agrave 5 blocs Cette meacutethodeconsiste agrave peupler les 5 blocs non plus agrave partir dutilisateurs mais agrave partir de sessions deacutecoutedans chaque utilisateur Autrement dit au lieu davoir une base dapprentissage contenant 80des utilisateurs et une base de test contenant les derniers 20 dutilisateurs la base dapprentis-sage consiste en 80 des sessions deacutecoute de chaque utilisateur et la base de test correspond aux20 des sessions restantes Le but du modegravele est ici de recommander pour chaque utilisateurdes seacutequences correspondant agrave la base de test Par rapport agrave la premiegravere meacutethode le graphepossegravede donc en permanence 80 des sessions de tous les utilisateurs Cependant le graphe necontient pas les connaissances provenant de prols complets dutilisateurs Ces deux meacutethodessont toutes les deux valides mais proposent deux approches dieacuterentes concernant lexploitationdes donneacutees des utilisateurs et il est inteacuteressant de les comparer

Par ailleurs et comme nous lavons expliqueacute dans le chapitre 3 deacutecrivant notre modegravele AntRSla construction du graphe exploite les transitions trouveacutees dans les sessions deacutecoute des utilisa-teurs pour creacuteer un reacuteseau de ndivideuds et darecirctes repreacutesentant lensemble des donneacutees de la basedapprentissage Aucune emphase nest porteacutee speacuteciquement sur lutilisateur actif pour lequelle systegraveme est en train de construire des recommandations Cependant nous avons proposeacute dansle chapitre 3 une autre meacutethode de construction du graphe portant une emphase particuliegravere surlutilisateur actif Agrave chaque nouvel utilisateur traiteacute nous calculons ses k plus proches voisinsparmi les 499 utilisateurs restants Pour faire cela nous avons calculeacute la similariteacute cosine agrave partirdes preacutefeacuterences existantes de ces utilisateurs Autrement dit pour chaque utilisateur actif nousavons compareacute ses 80 des sessions deacutecoute de la base dapprentissage avec les 80 des sessionsdeacutecoute des 499 autres utilisateurs Les k utilisateurs les plus similaires sont ensuite utiliseacutespour construire le graphe avec la mecircme technique deacutecrite dans le chapitre 3 Lavantage est icide reacuteduire la taille du graphe dacceacuteleacuterer la dureacutee dexeacutecution et de potentiellement augmenterla qualiteacute des recommandations nales notamment en terme de similariteacute puisque cest le critegraverede seacutelection ici Cette variante de construction du graphe agrave partir des n plus proches voisins nestpossible quavec la technique de validation croiseacutee deacutecrite dans le paragraphe preacuteceacutedent puisquilest neacutecessaire davoir accegraves aux sessions deacutecoute des utilisateurs actifs ce qui nest pas le casavec la premiegravere expeacuterimentation de cette section

Dans la suite de la section nous allons reacutealiser la mecircme expeacuterimentation que preacuteceacutedem-ment avec ces deux modications (le changement du processus de validation croiseacutee et le grapheconstruit agrave partir de n plus proches utilisateurs en termes de similariteacute) puis nous allons preacute-

98

43 Expeacuterimentations sur le modegravele AntRS

Table 44 Expeacuterimentation AntRS multi-objectifs avec les modications de validation croiseacuteeet de creacuteation de graphe

Preacutecision Rappel F-mesure Similariteacute SIL Diversiteacute DR Nouveauteacute Preacutefeacuterences Couverture

AntRS grapheclassique (fusionde seacutequences)

0379 0147 0205 0942 0902 0058 0073 0748 0631 7168

AntRS grapheclassique (coloniede fusion)

0339 0176 0215 0943 09 0057 0085 072 0718 7168

AntRS graphe kvoisins (fusion deseacutequences)

0369 0149 0203 0941 0901 0059 0075 0737 0633 7168

AntRS graphe kvoisins (colonie defusion)

0329 0167 0206 0944 0905 0056 0081 0707 068 7168

senter les reacutesultats obtenus

Le Tableau 44 preacutesente les reacutesultats de cette deuxiegraveme expeacuterimentation Nous avons testeacute4 versions de notre modegravele Pour chacune de ces 4 versions la nouvelle technique de validationcroiseacutee a eacuteteacute utiliseacutee Comme pour lexpeacuterimentation suivante nous avons eacutegalement testeacute lesdeux tactiques de fusion de notre modegravele Quant aux modications portant sur la creacuteation dugraphe nous avons exeacutecuteacute notre modegravele selon 2 modaliteacutes avec la mecircme construction de grapheque lexpeacuterimentation preacuteceacutedente (graphe classique) et avec la prise en compte des k voisinsles plus similaires (graphe k voisins) On remarque deacutejagrave que les reacutesultats sont dune maniegraveregeacuteneacuterale relativement similaires agrave la premiegravere expeacuterimentation Les valeurs de preacutecision obte-nues sont plus eacuteleveacutees que pour lexpeacuterimentation preacuteceacutedente suggeacuterant que le modegravele produitdes recommandations plus proches des sessions deacutecoute des utilisateurs Cette augmentation depreacutecision est la conseacutequence logique du fait que 80 des sessions deacutecoute initiales sont connuesdu modegravele Ces reacutesultats sont cependant agrave nuancer avec la couverture qui est signicativementplus basse dans cette version de notre modegravele (7168 par rapport agrave 9692)

La tactique de fusion de seacutequence obtient une nouvelle fois la meilleure preacutecision par rapportagrave la tactique de colonie de fusion Cependant nous nobservons pas de nette dieacuterence entreles deux meacutethodes de construction du graphe Cette expeacuterimentation ne nous permet donc pasde valider lhypothegravese selon laquelle un graphe moins grand et construit agrave partir dutilisateurssimilaires agrave lutilisateur actif pourrait ameacuteliorer les recommandations nales Cependant lautreobjectif de cette expeacuterimentation qui eacutetait de deacutemontrer que notre modegravele obtient eacutegalementdes reacutesultats satisfaisants avec une meacutethode plus classique de validation croiseacutee est valideacutee Latechnique classique de creacuteation du graphe sans connaicirctre par avance 80 des seacutequences deacutecoutesdes utilisateurs reste cependant plus proche dun fonctionnement en conditions reacuteelles de notremodegravele

434 Optimisation des meacutetavariables de AntRS

Inuence du nombre dagents et diteacuterations sur la preacutecision des recommandations

Comme tous les systegravemes multi-agents AntRS est deacutependant du nombre dagents utiliseacutes etdes iteacuterations eectueacutees Un nombre trop faible dagents ou diteacuterations peut empecirccher leacutemer-gence dun comportement intelligent en raison dun manque dinteraction entre les agents Dansle mecircme temps il est eacutegalement crucial de ne pas augmenter aveugleacutement ces paramegravetres car ils

99

Chapitre 4 Expeacuterimentations et reacutesultats

aectent lineacuteairement le temps dexeacutecution de lalgorithme Nous avons ainsi reacutealiseacute des expeacuteri-mentations sur notre modegravele AntRS an de deacuteterminer un bon compromis entre performance ettemps dexeacutecution Dans la gure 411 la preacutecision moyenne des recommandations obtenues estpreacutesenteacutee en fonction du nombre dagents et diteacuterations par increacutementation de 50 allant de 50 agrave300 On observe comme attendu une leacutegegravere augmentation de la preacutecision suivant laccroissementdes agents et des iteacuterations sans toutefois que celle-ci ne soit majeure On remarque visuellementque la preacutecision obtenue atteint rapidement un plateau agrave partir de 100 agents et iteacuterations Cetteobservation a eacuteteacute conrmeacutee par un test de signicativiteacute statistique avec le test de WilcoxonDans un contexte de fonctionnement en ligne ougrave les utilisateurs sattendent agrave des recommanda-tions quasi immeacutediates laugmentation importante du temps dexeacutecution lieacutee agrave un nombre eacuteleveacutedagents et diteacuterations pour un gain minime de preacutecision nest pas recommandable Ce sontaussi ces valeurs de 100 agents et iteacuterations qui ont eacuteteacute utiliseacutees dans les expeacuterimentations de cechapitre

Figure 411 Inuence du nombre dagents et diteacuterations sur la preacutecision moyenne obtenuepar notre modegravele

Principe de fonctionnement et application dun algorithme geacuteneacutetique

Les meacutetavariables des algorithmes multi-agents ont une place importante dans la qualiteacute desreacutesultats obtenus Pour rappel et en plus du nombre diteacuterations et dagents dont nous avonsdeacutejagrave discuteacute dans la section preacuteceacutedente on peut lister

τ0 isin [0 1] quantiteacute de pheacuteromones deacuteposeacutee sur les arecirctes agrave linitialisation du modegravele q0 isin [0 1] gegravere la part dexploration et dexploitation des agents α isin [0 1] importance des pheacuteromones dans la prise de deacutecision des agents

100

43 Expeacuterimentations sur le modegravele AntRS

β isin [0 1] importance de lheuristique dans la prise de deacutecision des agents ρ isin [0 1] taux deacutevaporation des pheacuteromones

Les valeurs de ces 5 meacutetavariables ont eacuteteacute xeacutees agrave laide des expeacuterimentations preacuteliminairespreacutesenteacutees au deacutebut de ce chapitre dans la Section 422 Les valeurs de ces meacutetavariables ontpermis dobtenir des reacutesultats convaincants agrave la fois sur le modegravele ACS classique de Dorigo et surnotre modegravele ACS Cependant et an de maximiser le potentiel de notre modegravele AntRS nousavons voulu tester une optimisation automatique de ces meacutetavariables agrave laide dun algorithmegeacuteneacutetique Ces derniers font partie de la famille des algorithmes eacutevolutionnaires sinspirant de latheacuteorie de leacutevolution Le principe de ces algorithmes est de creacuteer des individus posseacutedant desgegravenes cest-agrave-dire des valeurs agrave des caracteacuteristiques preacute-deacutetermineacutees puis de tester ces individussur le problegraveme agrave optimiser Agrave la n dune iteacuteration les meilleurs individus transmettent unepartie de leurs gegravenes agrave leurs descendants Ainsi de geacuteneacuteration en geacuteneacuteration les gegravenes seacutelection-neacutes provenant des meilleurs individus permettent daugmenter la qualiteacute des reacutesultats Appliqueacuteagrave notre modegravele un gegravene correspond agrave des valeurs pour les 5 meacutetavariables agrave optimiser Cesvaleurs sont ensuite appliqueacutees agrave notre modegravele et testeacutees durant une exeacutecution complegravete dansles mecircmes conditions que les autres expeacuterimentations de ce chapitre Les reacutesultats sont ensuiteeacutevalueacutes selon les 4 meacutetriques correspondant agrave nos objectifs similariteacute diversiteacute nouveauteacute etpreacutefeacuterences Lutilisation dun algorithme geacuteneacutetique sur notre modegravele a cependant poseacute un pro-blegraveme majeur de temps dexeacutecution En eet chaque individu de chaque geacuteneacuteration a ducirc ecirctretesteacute sur une exeacutecution complegravete de notre modegravele Pour rappel une exeacutecution de notre modegravelecorrespond agrave 100 iteacuterations ougrave dans chacune dentre elles 100 agents se deacuteplacent pour trouverune seacutequence sur un graphe de plusieurs dizaines de milliers de ndivideuds et de plusieurs centainesde milliers darecirctes en moyenne Mecircme si la complexiteacute algorithmique est faible ducirce agrave la naturemecircme des modegraveles multi-agents la quantiteacute dopeacuterations agrave reacutesoudre est conseacutequente En plus delutilisation de serveurs de calculs deacutedieacutes une optimisation importante du code de AntRS a eacuteteacuteneacutecessaire pour pouvoir eectuer loptimisation des meacutetavariables avec un algorithme geacuteneacutetiquedans des temps raisonnables

Choix de lalgorithme geacuteneacutetique doptimisation

De nombreuses familles dalgorithmes geacuteneacutetiques ont eacuteteacute deacuteveloppeacutees depuis leur creacuteation agravelinstar des problegravemes algorithmiques complexes neacutecessitant des techniques doptimisation et dereacutesolution avanceacutees Il est donc neacutecessaire de correctement deacutenir le problegraveme agrave optimiser an dechoisir lalgorithme geacuteneacutetique le plus adapteacute agrave la tacircche AntRS est un modegravele multi-objectifs etles paramegravetres agrave optimiser sont les 4 objectifs de similariteacute diversiteacute nouveauteacute et preacutefeacuterencesIl est ainsi neacutecessaire dutiliser une technique parmi la famille des algorithmes eacutevolutionnairesmulti-objectifs (MOEA 51) Nous avons choisi lalgorithme NSGA-II 52 pour sa rapiditeacute et sonecaciteacute pour trouver de meilleurs solutions non-domineacutees agrave des problegravemes multi-objectifs clas-siques de la litteacuterature par rapport agrave dautres MOEA [Deb et al 2002]

Pour les mecircmes raisons que pour limpleacutementation des algorithmes de comparaison utiliseacutesdans cette section nous avons utiliseacute une librairie Java nommeacutee jMetal 53 [Durillo and Nebro2011] Cette librairie est speacutecialiseacutee dans limpleacutementation et la mise agrave disposition dune vingtaine

51 MOEA Multi-objective evolutionary algorithms

52 NSGA-II Non-dominated Sorting Genetic Algorithm 2

53 jMetal Metaheuristic Algorithms in Java

101

Chapitre 4 Expeacuterimentations et reacutesultats

Table 45 Expeacuterimentations preacutesentant AntRS avec les meacutetavariables empiriques et avec lesmeacutetavariables optimiseacutees via NSGA-II)

Preacutecision Rappel F-mesure Similariteacute SIL Diversiteacute DR Nouveauteacute Preacutefeacuterences Couverture

AntRS meacutetava-riables empiriques(fusion de seacute-quences)

0344 0131 01838 0947 0908 0053 0069 0741 061 9692

AntRS meacutetava-riables empiriques(colonie de fusion)

0288 0151 01836 0945 0905 0055 0082 0702 0612 9692

AntRS meacutetava-riables NSGA-II(fusion de seacute-quences)

0382 0153 0221 0953 091 0047 007 0762 0744 9692

AntRS meacutetava-riables NSGA-II(colonie de fusion)

0312 0174 0226 0946 0906 0054 0082 0703 0802 9692

Code de signicativiteacute statistique 0 0001 001 005 01 1

de MOEA permettant de les adapter agrave tous types de problegravemes multi-objectifs

Reacutesultats

La version du modegravele AntRS utiliseacutee est la mecircme que preacutesenteacutee dans le Chapitre 3 et danslexpeacuterimentation 433 Lalgorithme doptimisation NSGA-II a quant agrave lui eacuteteacute lanceacute sur unserveur de calculs deacutedieacute de leacutequipe KIWI et arrecircteacute agrave partir du moment ougrave 10 geacuteneacuterations de suitenameacutelioraient plus les reacutesultats obtenus Les valeurs obtenues pour les 5 meacutetavariables ont ensuiteeacuteteacute utiliseacutees dans une exeacutecution complegravete de AntRS an de mesurer limpact de loptimisationLalgorithme de comparaison PEH [Ribeiro et al 2014] inclut deacutejagrave dans son fonctionnement unMOEA nommeacute SPEA2 54 [Zitzler et al 2001] dont lobjectif est le mecircme que NSGA-II optimiserles recommandations en termes de similariteacute diversiteacute et nouveauteacute Nous ninclurons donc pasPEH dans les reacutesultats de cette derniegravere expeacuterimentation Outre les meacutetavariables lexeacutecution denotre modegravele sest deacuterouleacutee sous les mecircmes conditions que pour les expeacuterimentations preacuteceacutedentes

Le Tableau 45 preacutesente les reacutesultats obtenus Les deux premiegraveres lignes du tableau sont re-prises de lexpeacuterimentation principale AntRS multi-objectifs Section 433 pour plus de clarteacutePour rappel cette expeacuterimentation avait utiliseacute les meacutetavariables empiriques Les deux derniegravereslignes du tableau correspondent agrave AntRS avec les meacutetavariables optimiseacutees via le NSGA-II Lasignicativiteacute statistique de la dieacuterence des reacutesultats obtenus a eacuteteacute mesureacutee entre chaque paireayant la mecircme tactique de fusion (ie AntRS meacutetavariables empiriques (fusion de seacutequences)vs AntRS meacutetavariables NSGA-II (fusion de seacutequences) et AntRS meacutetavariables empiriques(colonie de fusion) vs AntRS meacutetavariables NSGA-II (colonie de fusion)) Les valeurs en grasindiquent les dieacuterences les plus notables entre les mecircmes versions de AntRS sans et avec opti-misation

Ces reacutesultats mettent principalement en exergue un net gain en preacutecision et rappel obtenuavec loptimisation des meacutetavariables Les valeurs obtenues pour ces meacutetriques sont similaires agravelexpeacuterimentation 44 ougrave le modegravele avait connaissance de 80 des seacutequences deacutecoutes des utili-sateurs On note eacutegalement des ameacuteliorations pour les meacutetriques de nouveauteacute et de preacutefeacuterencesmontrant que les seacutequences recommandeacutees eacutetaient agrave la fois plus proches des preacutefeacuterences de luti-

54 SPEA2 Strenght Pareto Evolutionary Algorithm 2

102

44 Conclusion

lisateur tout en introduisant parfois des musiques quil ne connaissait pas

Cependant il est important de nuancer ces reacutesultats Les gains obtenus mecircme sils sontstatistiquement signicatifs restent relativement peu eacuteleveacutes par rapport au temps neacutecessaire de-mandeacute par lalgorithme doptimisation De plus certaines meacutetriques comme la similariteacute ou ladiversiteacute nont que peu eacuteteacute aecteacutees par loptimisation En conclusion cette expeacuterimentation nousa montreacute quil eacutetait possible doptimiser les meacutetavariables de notre modegravele an dameacuteliorer cer-tains aspects des seacutequences recommandeacutees comme la preacutecision la nouveauteacute ou les preacutefeacuterencesToutefois le temps dexeacutecution dun tel processus doptimisation peut ecirctre prohibitif dans uncontexte dutilisation en ligne et en temps reacuteel

44 Conclusion

Dans ce Chapitre nous avons mis en pratique le modegravele multi-agents et multi-objectifs An-tRS Nous avons utiliseacute une base de donneacutees musicale provenant du site Deezer repreacutesentantun mois complet deacutecoutes en ligne Nous avons ensuite reacutealiseacute plusieurs expeacuterimentations por-tant chacune sur un aspect theacuteorique de AntRS La premiegravere expeacuterimentation preacutesenteacutee dans laSection 432 nous a permis de veacuterier que les colonies de notre modegravele permettent bien dobte-nir des recommandations de seacutequences speacutecialiseacutees dans les facteurs humains identieacutes dans leschapitres preacuteceacutedents Dans le cadre de ce travail nous avons testeacute de maniegravere isoleacutee 4 coloniescorrespondant agrave 4 facteurs humains speacuteciques la similariteacute la diversiteacute la nouveauteacute et lespreacutefeacuterences Les reacutesultats obtenus ont permis de prouver quil eacutetait possible de lier des facteurshumains agrave la recherche de chemins dans un graphe par des agents teacuteleacuteonomiques

La deuxiegraveme expeacuterimentation preacutesenteacutee dans la Section 433 sest appuyeacutee sur ces conclu-sions pour tester le modegravele AntRS dans son entiegravereteacute Le but de cette expeacuterimentation eacutetaittriple

1 Prouver que notre modegravele est capable de produire une seacutequence unique posseacutedant desaspects de chacun des 4 facteurs humains en utilisant les reacutesultats des colonies speacutecialiseacutees

2 Tester les performances des deux tactiques de notre modegravele (fusion de seacutequences et coloniede fusion) permettant de fusionner les seacutequences des colonies speacutecialiseacutees

3 Comparer les performances de AntRS avec dautres systegravemes de recommandations mono-objectif et multi-objectifs de la litteacuterature du domaine

Avec cette expeacuterimentation nous avons montreacute que AntRS eacutetait bien capable de syntheacutetiserdans une mecircme seacutequence les dieacuterents aspects humains consideacutereacutes De plus les seacutequences derecommandations produites par AntRS ont obtenu de meilleurs reacutesultats par rapport aux algo-rithmes de comparaison de leacutetat de lart La premiegravere tactique de fusion de seacutequences sest reacuteveacuteleacuteeecirctre plus ecace que la colonie de fusion pour obtenir un compromis entre les dieacuterents objectifs

Lexpeacuterimentation suivante preacutesenteacutee dans la Section 433 avait pour but de tester des va-riantes dans le fonctionnement de AntRS Au cours de cette thegravese nous avons reacutealiseacute et testeacutede multiples modications et variantes de notre modegravele de maniegravere empirique tant le fonction-nement du modegravele initial ACS de Dorigo est modulable Pour mettre en exergue un exemplede cette modulariteacute nous avons testeacute les performances de notre modegravele en modiant la basedapprentissage et la maniegravere dont le graphe eacutetait creacuteeacute Les reacutesultats obtenus ont mis en eacutevidence

103

Chapitre 4 Expeacuterimentations et reacutesultats

le potentiel deacutevolution et dadaptabiliteacute de AntRS agrave des travaux futurs

Enn nous nous sommes inteacuteresseacutes dans la Section 434 agrave loptimisation automatique desmeacutetavariables de notre modegravele Comme nous lavons illustreacute au deacutebut de ce chapitre avec les ex-peacuterimentations preacuteliminaires sur le modegravele ACS les meacutetavariables jouent un rocircle essentiel dans laqualiteacute des reacutesultats Ces derniegraveres gouvernent le comportement des agents comme par exempleleurs tendances agrave explorer lenvironnement ou au contraire agrave exploiter des chemins deacutejagrave connusAn de maximiser le potentiel de notre modegravele dans ce cadre applicatif nous avons utiliseacute lal-gorithme geacuteneacutetique doptimisation de problegravemes multi-objectifs NSGA-II sur 5 meacutetavariables deAntRS Le reacutesultat de cette optimisation a permis dameacuteliorer de maniegravere statistiquement signi-cative les performances de notre modegravele en termes de preacutecision rappel nouveauteacute et preacutefeacuterencesCependant la longueur du processus doptimisation limite pour le moment son application dansle contexte dune utilisation en temps reacuteel du modegravele

Le choix de la base de donneacutees musicale provenant de Deezer a permis de reacutealiser de nom-breuses expeacuterimentations et de tester dieacuterentes facettes de notre modegravele Cependant nousavons aussi rencontreacute beaucoup de problegravemes quant agrave la notion de progressiviteacute avec cette basede donneacutees et les reacutesultats obtenus nont pas eacuteteacute concluants concernant cette meacutetrique Nousdiscuterons de ce point et dautres perspectives dameacuteliorations dans la conclusion geacuteneacuterale decette thegravese

104

Chapitre 5

Conclusion et perspectives

51 Conclusion

Le domaine de la recommandation est en plein essor depuis maintenant une vingtaine dan-neacutees Durant cette peacuteriode la recommandation na cesseacute deacutevoluer an de sadapter agrave lexplosiondu nombre dutilisateurs et de la quantiteacute de donneacutees disponibles Nous pouvons distinguer troisaspects des recommandations modernes qui ont servi de l directeur dans cette thegravese Premiegrave-rement il y a encore 10 ans seulement la majoriteacute de la recherche avait pour but de maximiserla meacutetrique de preacutecision des reacutesultats des algorithmes il est aujourdhui admis quune bonnerecommandation neacutecessite aussi de satisfaire dautres meacutetriques comme la diversiteacute ou la nou-veauteacute Mecircme si la preacutecision reste centrale il est important de consideacuterer ces autres meacutetriquescar elles permettent de reacutepondre agrave une plus grande diversiteacute de situation chez les utilisateurs de-mandant des recommandations Deuxiegravemement la quantiteacute de donneacutees disponibles sur Interneta exploseacute tandis que lutilisation des systegravemes de recommandation sest tregraves largement deacutemocra-tiseacutee La diversiteacute des domaines applicatifs utilisant des systegravemes de recommandations est telleque lhyper-speacutecialisation dun systegraveme pour un seule domaine fait moins de sens quauparavantLes systegravemes de recommandations capables de sadapter rapidement agrave de multiples domainesapplicatifs sont donc aujourdhui particuliegraverement inteacuteressants Troisiegravemement la croissance etla complexication des donneacutees deacutecrivant les ressources et les utilisateurs permettent de propo-ser agrave ces derniers des recommandations plus complexes quauparavant Comme nous lavons ditdautres aspects que la preacutecision sont deacutejagrave exploiteacutes mais il est aussi possible de complexier lesrecommandations en les proposant par seacutequences et non plus par ressource unique En eet lanorme eacutetait avant de ne proposer agrave lutilisateur quune seule recommandation ou au mieux uneliste de recommandations au mecircme niveau les unes que les autres Or de nombreux domainescomme le-eacuteducation la musique ou encore le tourisme peuvent beacuteneacutecier de systegravemes capablesde recommander une seacutequence de ressources dans un ordre preacutecis Lutilisateur dun tel systegravemedispose donc dune seacutequence de ressources permettant datteindre potentiellement des objectifsqui ne seraient pas atteignables avec des recommandations simples ou en liste Ces trois pointseacutevoqueacutes ci-dessus constituent le cdivideur du travail de cette thegravese et nous allons maintenant rappelerles apports de notre travail sur ces trois points

1 Modegravele multi-objectifs En se basant sur larchitecture des colonies de fourmis notremodegravele AntRS permet dinteacutegrer autant de meacutetriques que voulues dans le processus degeacuteneacuteration de recommandations Dans ce travail nous en avons consideacutereacute 4 la similariteacutela diversiteacute la nouveauteacute et les preacutefeacuterences passeacutees Ces 4 meacutetriques sont inteacutegreacutees en

105

Chapitre 5 Conclusion et perspectives

tant que colonies dans notre modegravele et participent toutes agrave la construction de la seacutequencede recommandations Leur importance dans le processus de recommandation peut ecirctremoduleacutee an de mieux correspondre agrave chaque prol dutilisateur

2 Geacuteneacutericiteacute inter-domaine Dans le point preacuteceacutedent nous avons discuteacute de linteacutegrationde dieacuterentes meacutetriques dans les recommandations Comme nous lavons preacutesenteacute dansleacutetat de lart un certain nombre de modegraveles prennent deacutesormais en compte dieacuterentesmeacutetriques Cependant un des points forts de notre modegravele est la modulariteacute avec laquellenous pouvons lexeacutecuter Il est en eet possible denlever ou de rajouter des colonies agrave lademande Autrement dit nous sommes capable de changer agrave la voleacutee les facteurs humainsagrave consideacuterer pour construire les recommandations nales Outre ce point il est relati-vement simple de passer dun domaine applicatif agrave un autre Nous avons construit notremodegravele de sorte quil soit le plus geacuteneacuterique possible eacutetant donneacute que lors de sa conceptionnous navions pas encore deacutecideacute quelle base de donneacutees utiliser Ainsi la seule modica-tion neacutecessaire lors dun changement de domaine est dadapter le calcul de la distance dentre chaque ressource lors de la construction du graphe Apregraves cette modication le restede lalgorithme est le mecircme

3 Seacutequences de recommandation Eacutetant donneacute que notre modegravele AntRS se base sur lemodegravele des colonies de fourmis de Marco Dorigo les reacutesultats que nous obtenons se preacute-sentent sous le mecircme format que pour ce dernier Initialement dans les modegraveles proposeacutespar Dorigo les fourmis ont comme but de chercher un chemin parmi plusieurs possiblesdans un environnement repreacutesenteacute par un graphe et en empruntant des points de passagerepreacutesenteacutes par les ndivideuds du graphe Le reacutesultat obtenu est donc une suite de noeudavec un point de deacutepart un objectif de n et une seacuterie de points de passage dans unordre preacutecis entre les deux autrement dit une seacutequence Nous avons souhaiteacute garder ceprincipe de production naturelle de seacutequences et de ladapter agrave la recommandation Ainsien construisant avec attention le graphe an quil repreacutesente de la maniegravere la plus degravelepossible les liens preacutesents entre les ressources du domaine applicatif et en adaptant lecalcul de la distance d seacuteparant deux ndivideuds notre modegravele AntRS est capable de produiredes seacutequences avec des ressources varieacutees

Les deux premiers apports eacutenumeacutereacutes ci-dessus permettent de sadapter non seulement agrave denombreux prols utilisateurs gracircce aux dieacuterentes meacutetriques mais aussi agrave dieacuterents domainesapplicatifs gracircce agrave la simpliciteacute des changements agrave faire pour passer dun domaine agrave un autreLe troisiegraveme apport eacutenumeacutereacute permet quant agrave lui de proposer non plus des ressources uniques oudes listes de recommandations agrave lutilisateur nal mais bien des seacutequences posseacutedant un senscar baseacutees sur les habitudes de consommation des ressources des utilisateurs passeacutes

52 Perspectives

Dans ce travail nous avons reacutepondu aux probleacutematiques que nous avons deacutenies au deacutebutdu manuscrit mais nous pouvons cependant distinguer des pistes dameacuteliorations futures

Premiegraverement les seacutequences peuvent beacuteneacutecier dameacuteliorations notamment au niveau dela notion de progressiviteacute Pour le moment dans notre modegravele les seacutequences sont creacuteeacutees via

106

52 Perspectives

les agents fourmis parcourant le graphe agrave partir dun point de deacutepart jusquagrave un objectif Laprogressiviteacute des seacutequences est garantie par deux processus

1 La topologie du graphe qui prend en compte les seacutequences creacuteeacutees naturellement par lesutilisateurs lors de preacuteceacutedentes visites

2 La formule du calcul du meilleur chemin une fois les agents ayant termineacute de se deacuteplacersur le graphe

Nous avons exploreacute dautres pistes pour orir des seacutequences plus progressives aux utilisateursPar exemple en incluant une colonie deacutedieacutee uniquement agrave la progressiviteacute ou encore en modiantles calculs de distance totale de chemin Les tests que nous avons reacutealiseacutes nont cependant pasabouti agrave des reacutesultats concluants Nous attribuons ces reacutesultats au fait que le domaine de la mu-sique nest pas optimal pour utiliser ce genre de technique Quand bien mecircme il est courant pourles utilisateurs deacutecouter des musiques sous formes de playlists de reacutecentes eacutetudes ont montreacute quelordre dans lequel les musiques sont proposeacutees nest pas une caracteacuteristique prioritaire dans lasatisfaction de lutilisateur On peut par exemple citer les eacutetudes suivantes [Vall et al 2018 Vallet al 2019] ougrave les auteurs ont chercheacute agrave mesurer limportance de lordre dans lequel eacutetaient preacute-senteacutees les musiques dune playlist Les auteurs nobtiennent pas de dieacuterences de reacutesultats entreplusieurs expeacuterimentations ougrave lordre des musiques eacutetait maintenu ou lorsquil eacutetait rompu Lesauteurs concluent que lordre des musiques nest pas une variable cruciale pour la geacuteneacuteration au-tomatique de playlists Dautres domaines sont ainsi potentiellement plus agrave mecircme decirctre le sujetdeacutetudes plus approfondies sur la progressiviteacute comme par exemple les recommandations de par-cours dans des museacutees ou les recommandations de seacuteries de cours et dexercices dans le-eacuteducation

Une autre perspective dameacutelioration deacutecoulant du paragraphe preacuteceacutedent est lapplication denotre modegravele agrave un ou plusieurs autres domaines applicatifs Nous avons deacutejagrave mentionneacute dans cemanuscrit que nous avions consideacutereacute les domaines museacuteal et de le-eacuteducation en plus du domainemusical Ces deux autres domaines proposent chacun des deacutes uniques et pourraient proter deseacutequences de recommandations reacutepondant aux besoins speacuteciques de leurs utilisateurs Il a mal-heureusement eacutetait trop complexe de reacutecupeacuterer ou de creacuteer une base de donneacutees exploitable surces deux domaines durant cette thegravese Une expeacuterimentation est toutefois meneacutee actuellement enpartenariat avec le Museacutee des Beaux Arts de Nancy an de construire une base de donneacutees deschemins emprunteacutes par les visiteurs du museacutee ce qui permettra alors dappliquer notre modegravelean de proposer des parcours personnaliseacutes dans le museacutee

Une derniegravere perspective dameacutelioration reacuteside dans leacutevaluation des seacutequences geacuteneacutereacutees parnotre modegravele Notre but eacutetait de consideacuterer plusieurs facteurs humains pour geacuteneacuterer et eacutevaluernos recommandations tout en uniant leacutevaluation avec une seule meacutetrique de satisfaction Sinous avons reacuteussi agrave inteacutegrer plusieurs facteurs dans notre modegravele nous avons cependant rencon-treacute des problegravemes quant agrave lunication des eacutevaluations Lobjectif eacutetait de proposer une mesurede progressiviteacute permettant de mesurer la qualiteacute de la seacutequence recommandeacutee mais comme nouslavons expliqueacute nous navons pas obtenu de reacutesultats concluants au regard de la progressiviteacutedans notre base de donneacutees Ainsi la mesure de progressiviteacute optimale on proposeacutee et deacutetailleacuteedans la Section 345 na pas pu ecirctre testeacutee dans de bonnes conditions Mecircme si les expeacuterimenta-tions meneacutees dans ce travail nont pas pu exploiter cette mesure de progressiviteacute optimale nouspensons quelle pourrait agrave termes donner une indication geacuteneacuterale de la qualiteacute dune seacutequence deressources dans dautres domaines comme le-eacuteducation ou le tourisme

107

Chapitre 5 Conclusion et perspectives

Dun point de vue plus geacuteneacuteral sur le fonctionnement de notre modegravele AntRS certaines ameacute-liorations sont possibles si lon considegravere le fonctionnement du systegraveme dans des conditions reacuteelleset non plus pour une expeacuterimentation hors-ligne comme nous lavons fait dans ce travail Dans lecadre dune utilisation en conditions reacuteelles quelques modications du fonctionnement de notrealgorithme pourraient ameacuteliorer la satisfaction de lutilisateur Prenons lexemple dun utilisateurse connectant sur un site de diusion de musique et commenccedilant la lecture dune musique enparticulier Notre systegraveme sera capable agrave partir de ce point de deacutepart et des preacutefeacuterences passeacuteesde lutilisateur de creacuteer une seacutequence de musiques Cependant si lutilisateur ne clique pas surla recommandation de playlist ou eacutecoute une deuxiegraveme chanson complegravetement dieacuterente desrecommandations du systegraveme il serait inteacuteressant de pouvoir consideacuterer et inteacutegrer ces informa-tions dans le modegravele an que ce dernier puisse sadapter et satisfaire au mieux lutilisateur Deplus on voit bien linteacuterecirct de ces adaptations en temps reacuteel dans les domaines museacuteal (re-calculdun nouvel itineacuteraire de visite si lutilisateur ne suit pas la recommandation agrave linstar dunGPS par exemple) et de le-eacuteducation (adapter le contenu peacutedagogique en fonction du chemin delapprenant ou de ses reacutesultats) Une derniegravere remarque geacuteneacuterale concernant notre modegravele peutecirctre faite sur le temps dexeacutecution Malgreacute les optimisations reacutealiseacutees dans la derniegravere sectiondu chapitre preacuteceacutedent le temps dexeacutecution eacutetait relativement eacuteleveacute lors des expeacuterimentationsCependant les expeacuterimentations concernaient 100 utilisateurs agrave la fois et eacutetaient lanceacutees majo-ritairement sur un ordinateur portable Ainsi la recommandation en temps reacuteel dune seacutequencede ressources agrave un seul utilisateur peut ecirctre faite en temps reacuteel en utilisant un serveur deacutedieacute

Le domaine de la recommandation seacutelargit et se complexie chaque anneacutee agrave linstar du mondedans lequel nous vivons Devant la myriade de contenus accessibles sur Internet les utilisateurspeuvent plus que jamais beacuteneacutecier de recommandations intelligentes personnaliseacutees pertinenteset reacutepondant agrave leurs besoins Dans le futur les systegravemes dassistance aux utilisateurs devrontecirctre agrave la fois geacuteneacuteriques adaptables agrave tout types de contextes et toujours plus ecaces Cestdans cette direction que sinscrit le travail de cette thegravese et le modegravele AntRS

108

Bibliographie

[Adomavicius and Tuzhilin 2005] Adomavicius G and Tuzhilin A (2005) Toward the nextgeneration of recommender systems A survey of the state-of-the-art and possible extensionsIEEE Transactions on Knowledge amp Data Engineering (6) 734749

[Adomavicius and Tuzhilin 2011] Adomavicius G and Tuzhilin A (2011) Context-aware re-commender systems In Recommender systems handbook pages 217253 Springer

[Aggarwal et al 2016] Aggarwal C C et al (2016) Recommender systems Springer

[Agrawal et al 1995] Agrawal R Srikant R et al (1995) Mining sequential patterns Inicde volume 95 pages 314

[Alaya et al 2007] Alaya I Solnon C and Ghedira K (2007) Ant colony optimization formulti-objective optimization problems In Tools with Articial Intelligence 2007 ICTAI 200719th IEEE International Conference on volume 1 pages 450457 IEEE

[Angus 2007] Angus D (2007) Crowding population-based ant colony optimisation for themulti-objective travelling salesman problem In 2007 IEEE Symposium on ComputationalIntelligence in Multi-Criteria Decision-Making pages 333340 IEEE

[Angus and Woodward 2009] Angus D and Woodward C (2009) Multiple objective ant co-lony optimisation Swarm intelligence 3(1) 6985

[Antenucci et al 2018] Antenucci S Boglio S Chioso E Dervishaj E Kang S ScarlattiT and Dacrema M F (2018) Artist-driven layering and users behaviour impact on re-commendations in a playlist continuation scenario In Proceedings of the ACM RecommenderSystems Challenge 2018 page 4 ACM

[Aucouturier and Pachet 2002] Aucouturier J-J and Pachet F (2002) Scaling up music play-list generation In Proceedings IEEE International Conference on Multimedia and Expo vo-lume 1 pages 105108 IEEE

[Ausubel 1963] Ausubel D P (1963) The psychology of meaningful verbal learning

[Baeza-Yates et al 1999] Baeza-Yates R Ribeiro-Neto B et al (1999) Modern informationretrieval volume 463 ACM press New York

[Belkin and Croft 1992] Belkin N J and Croft W B (1992) Information ltering and infor-mation retrieval two sides of the same coin In Communications of the ACM Citeseer

[Bell and McMullen 2004] Bell J E and McMullen P R (2004) Ant colony optimizationtechniques for the vehicle routing problem Advanced engineering informatics 18(1) 4148

[Benbasat and Wang 2005] Benbasat I and Wang W (2005) Trust in and adoption of onlinerecommendation agents Journal of the association for information systems 6(3) 4

[Bennett et al 2007] Bennett J Lanning S et al (2007) The netix prize In Proceedingsof KDD cup and workshop volume 2007 page 35 New York

109

Bibliographie

[Bonabeau et al 1999] Bonabeau E Marco D d R D F Dorigo M Theacuteraulaz G The-raulaz G et al (1999) Swarm intelligence from natural to articial systems Number 1Oxford university press

[Borragraves et al 2014] Borragraves J Moreno A and Valls A (2014) Intelligent tourism recommen-der systems A survey Expert Systems with Applications 41(16) 73707389

[Boyer et al 2015] Boyer A Casanova G Roussanaly A and Ducreau F (2015) Periclesor how to assess and to improve quality in higher education

[Breese et al 2013] Breese J S Heckerman D and Kadie C (2013) Empirical analysis ofpredictive algorithms for collaborative ltering arXiv preprint arXiv 13017363

[Brooks 1991] Brooks R A (1991) Intelligence without reason

[Castagnos 2008] Castagnos S (2008) Modeacutelisation de comportements et apprentissage sto-chastique non superviseacute de strateacutegies dinteractions sociales au sein de systegravemes temps reacuteel derecherche et daccegraves agrave linformation PhD thesis Universiteacute Nancy II

[Castagnos and Boyer 2006] Castagnos S and Boyer A (2006) A clientserver user-basedcollaborative ltering algorithm Model and implementation In 17th European Conferenceon Articial Intelligence (ECAI 2006) pages 617621

[Castagnos et al 2013] Castagnos S Brun A and Boyer A (2013) Utiliteacute et perception dela diversiteacute dans les systegravemes de recommandation

[Castagnos et al 2010] Castagnos S Jones N and Pu P (2010) Eye-tracking product re-commenders usage In Proceedings of the fourth ACM conference on Recommender systemspages 2936 ACM

[Castagnos et al 2019] Castagnos S Marchal F Bertrand A Colle M and Mahmoudi D(2019) Inferring art preferences from gaze exploration in a museum In Adjunct Publicationof the 27th Conference on User Modeling Adaptation and Personalization pages 425430

[Castells et al 2015] Castells P Hurley N J and Vargas S (2015) Novelty and diversity inrecommender systems In Recommender Systems Handbook pages 881918 Springer

[Chen and Li 2019] Chen H and Li J (2019) Adversarial tensor factorization for context-aware recommendation In Proceedings of the 13th ACM Conference on Recommender Systemspages 363367

[Cheverst et al 2000] Cheverst K Davies N Mitchell K Friday A and Efstratiou C(2000) Developing a context-aware electronic tourist guide some issues and experiencesIn Proceedings of the SIGCHI conference on Human Factors in Computing Systems pages1724 ACM

[Chou et al 2005] Chou S-C Hsieh W-T Gandon F L and Sadeh N M (2005) Semanticweb technologies for context-aware museum tour guide applications In Advanced InformationNetworking and Applications 2005 AINA 2005 19th International Conference on volume 2pages 709714 IEEE

[Davis 1989] Davis F D (1989) Perceived usefulness perceived ease of use and user acceptanceof information technology MIS quarterly pages 319340

[Deb et al 2002] Deb K Pratap A Agarwal S and Meyarivan T (2002) A fast and elitistmultiobjective genetic algorithm Nsga-ii IEEE transactions on evolutionary computation6(2) 182197

[Deneubourg et al 1990] Deneubourg J-L Aron S Goss S and Pasteels J M (1990) Theself-organizing exploratory pattern of the argentine ant Journal of insect behavior 3(2) 159168

110

[Doerner et al 2004] Doerner K Gutjahr W J Hartl R F Strauss C and Stummer C(2004) Pareto ant colony optimization A metaheuristic approach to multiobjective portfolioselection Annals of operations research 131(1) 7999

[Dorigo 2001] Dorigo M (2001) Ant algorithms solve dicult optimization problems InEuropean Conference on Articial Life pages 1122 Springer

[Dorigo and Birattari 2010] Dorigo M and Birattari M (2010) Ant colony optimizationSpringer

[Dorigo and Birattari 2011] Dorigo M and Birattari M (2011) Ant colony optimization InEncyclopedia of machine learning pages 3639 Springer

[Dorigo et al 2006] Dorigo M Birattari M and Stutzle T (2006) Ant colony optimizationIEEE computational intelligence magazine 1(4) 2839

[Dorigo and Gambardella 1997] Dorigo M and Gambardella L M (1997) Ant colonies forthe travelling salesman problem biosystems 43(2) 7381

[Dorigo et al 1996] Dorigo M Maniezzo V Colorni A et al (1996) Ant system optimiza-tion by a colony of cooperating agents IEEE Transactions on Systems man and cyberneticsPart B Cybernetics 26(1) 2941

[Dorigo and Stuumltzle 2019] Dorigo M and Stuumltzle T (2019) Ant colony optimization overviewand recent advances In Handbook of metaheuristics pages 311351 Springer

[Drachsler et al 2015] Drachsler H Verbert K Santos O C and Manouselis N (2015)Panorama of recommender systems to support learning In Recommender systems handbookpages 421451 Springer

[Durillo and Nebro 2011] Durillo J J and Nebro A J (2011) jmetal A java framework formulti-objective optimization Advances in Engineering Software 42(10) 760771

[Ekstrand et al 2014] Ekstrand M D Harper F M Willemsen M C and Konstan J A(2014) User perception of dierences in recommender algorithms In Proceedings of the 8thACM Conference on Recommender systems pages 161168 ACM

[Ferber 1995] Ferber J (1995) Les systegravemes multi-agents Vers une intelligence collectiveintereditions 1995 Connaissances et compeacutetences requises Cette thegravese s adresse agrave des eacutetu-diants ayant un prol Intelligence ArticielleBase de Donneacutees et elle neacutecessite davoir descompeacutetences theacuteoriques dans les domaines 1

[Ferber and Weiss 1999] Ferber J and Weiss G (1999) Multi-agent systems an introductionto distributed articial intelligence volume 1 Addison-Wesley Reading

[Frolov and Oseledets 2017] Frolov E and Oseledets I (2017) Tensor methods and recom-mender systems Wiley Interdisciplinary Reviews Data Mining and Knowledge Discovery7(3) e1201

[Gambardella et al 1999] Gambardella L M Taillard Eacute and Agazzi G (1999) Macs-vrptw A multiple ant colony system for vehicle routing problems with time windows

[Gan et al 2020] Gan L Nurbakova D Laporte L and Calabretto S (2020) Enhancingrecommendation diversity using determinantal point processes on knowledge graphs In Pro-ceedings of the 43rd International ACM SIGIR Conference on Research and Development inInformation Retrieval pages 20012004

[Gavalas et al 2014] Gavalas D Konstantopoulos C Mastakas K and Pantziou G (2014)Mobile recommender systems in tourism Journal of network and computer applications39 319333

111

Bibliographie

[Goodenough et al 2017] Goodenough A E Little N Carpenter W S and Hart A G(2017) Birds of a feather ock together Insights into starling murmuration behaviour revealedusing citizen science PloS one 12(6) e0179277

[Goss et al 1989] Goss S Aron S Deneubourg J-L and Pasteels J M (1989) Self-organized shortcuts in the argentine ant Naturwissenschaften 76(12) 579581

[Gras et al 2016] Gras B Brun A and Boyer A (2016) Identifying grey sheep users incollaborative ltering a distribution-based technique In Proceedings of the 2016 Conferenceon User Modeling Adaptation and Personalization pages 1726 ACM

[Grasseacute 1959] Grasseacute P-P (1959) La reconstruction du nid et les coordinations interindi-viduelles chez bellicositermes natalensis etcubitermes sp la theacuteorie de la stigmergie Essaidinterpreacutetation du comportement des termites constructeurs Insectes sociaux 6(1) 4180

[Guo et al 2015] Guo G Zhang J Sun Z and Yorke-Smith N (2015) Librec A javalibrary for recommender systems In UMAP Workshops

[Han et al 2007] Han J Cheng H Xin D and Yan X (2007) Frequent pattern mining current status and future directions Data mining and knowledge discovery 15(1) 5586

[Harper and Konstan 2015] Harper F M and Konstan J A (2015) The movielens datasets History and context Acm transactions on interactive intelligent systems (tiis) 5(4) 119

[Herlocker et al 2004] Herlocker J L Konstan J A Terveen L G and Riedl J T (2004)Evaluating collaborative ltering recommender systems ACM Transactions on InformationSystems (TOIS) 22(1) 553

[Houmllldobler et al 1990] Houmllldobler B Wilson E O et al (1990) The ants Harvard UniversityPress

[Honey et al 1992] Honey P Mumford A et al (1992) The manual of learning styles

[Hu et al 2008] Hu Y Koren Y and Volinsky C (2008) Collaborative ltering for implicitfeedback datasets In 2008 Eighth IEEE International Conference on Data Mining pages263272 Ieee

[Iaquinta et al 2008] Iaquinta L De Gemmis M Lops P Semeraro G Filannino M andMolino P (2008) Introducing serendipity in a content-based recommender system In 2008Eighth International Conference on Hybrid Intelligent Systems pages 168173 IEEE

[Iredi et al 2001] Iredi S Merkle D and Middendorf M (2001) Bi-criterion optimizationwith multi colony ant algorithms In Evolutionary Multi-Criterion Optimization pages 359372 Springer

[Jameson et al 2015] Jameson A Willemsen M C Felfernig A de Gemmis M Lops PSemeraro G and Chen L (2015) Human decision making and recommender systems InRecommender Systems Handbook pages 611648 Springer

[Jannach et al 2016] Jannach D Kamehkhosh I and Bonnin G (2016) Biases in auto-mated music playlist generation A comparison of next-track recommending techniques InProceedings of the 2016 Conference on User Modeling Adaptation and Personalization pages281285 ACM

[Jawaheer et al 2010] Jawaheer G Szomszor M and Kostkova P (2010) Comparison ofimplicit and explicit feedback from an online music recommendation service In proceedingsof the 1st international workshop on information heterogeneity and fusion in recommendersystems pages 4751 ACM

112

[Jones 2010] Jones N (2010) User Perceived Qualities and Acceptance of Recommender Sys-tems The Role of Diversity PhD thesis EPFL

[Kaminskas and Bridge 2016] Kaminskas M and Bridge D (2016) Diversity serendipity no-velty and coverage A survey and empirical analysis of beyond-accuracy objectives in recom-mender systems ACM Trans Interact Intell Syst 7(1) 2 12 42

[Kardan et al 2014] Kardan A A Ebrahim M A and Imani M B (2014) A new perso-nalized learning path generation method Aco-map Indian Journal of Scientic Research5(1) 17

[King and Sumpter 2012] King A J and Sumpter D J (2012) Murmurations Current Bio-logy 22(4) R112R114

[Kolb and Fry 1974] Kolb D A and Fry R E (1974) Toward an applied theory of experientiallearning MIT Alfred P Sloan School of Management

[Konstan et al 1998] Konstan J A Riedl J Borchers A and Herlocker J L (1998) Re-commender systems A grouplens perspective In Recommender Systems Papers from the1998 Workshop (AAAI Technical Report WS-98-08) pages 6064 AAAI Press

[Koren 2008] Koren Y (2008) Factorization meets the neighborhood a multifaceted collabo-rative ltering model In Proceedings of the 14th ACM SIGKDD international conference onKnowledge discovery and data mining pages 426434 ACM

[Koren et al 2009] Koren Y Bell R and Volinsky C (2009) Matrix factorization techniquesfor recommender systems Computer (8) 3037

[Kuhlthau 1991] Kuhlthau C C (1991) Inside the search process Information seeking fromthe users perspective Journal of the American society for information science 42(5) 361371

[Kurilovas et al 2015] Kurilovas E Zilinskiene I and Dagiene V (2015) Recommending sui-table learning paths according to learners preferences Experimental research results Com-puters in Human Behavior 51 945951

[lHuillier 2018] lHuillier A (2018) Modeacuteliser la diversiteacute au cours du temps pour comprendrele contexte de lutilisateur dans les systegravemes de recommandation PhD thesis

[LHuillier et al 2014] LHuillier A Castagnos S and Boyer A (2014) Understanding usagesby modeling diversity over time In 22nd Conference on User Modeling Adaptation andPersonalization volume 1181

[Logan 2002] Logan B (2002) Content-based playlist generation Exploratory experimentsIn ISMIR

[Lops et al 2011] Lops P De Gemmis M and Semeraro G (2011) Content-based recom-mender systems State of the art and trends In Recommender systems handbook pages73105 Springer

[Mahmood and Ricci 2009] Mahmood T and Ricci F (2009) Improving recommender sys-tems with adaptive conversational strategies In Proceedings of the 20th ACM conference onHypertext and hypermedia pages 7382 ACM

[March 1991] March J G (1991) Exploration and exploitation in organizational learningOrganization science 2(1) 7187

[McGinty and Smyth 2003] McGinty L and Smyth B (2003) On the role of diversity inconversational recommender systems In Proceedings of the 5th International Conference onCase-based Reasoning Research and Development ICCBR03 pages 276290

113

Bibliographie

[McNee et al 2006] McNee S M Riedl J and Konstan J A (2006) Being accurate is notenough how accuracy metrics have hurt recommender systems In CHI06 extended abstractson Human factors in computing systems pages 10971101 ACM

[Merkle et al 2002] Merkle D Middendorf M and Schmeck H (2002) Ant colony optimi-zation for resource-constrained project scheduling IEEE transactions on evolutionary compu-tation 6(4) 333346

[Mokatren et al 2018] Mokatren M Kuik T and Shimshoni I (2018) Exploring the po-tential of a mobile eye tracker as an intuitive indoor pointing device A case study in culturalheritage Future Generation Computer Systems 81 528541

[Nurbakova et al 2018] Nurbakova D Laporte L Calabretto S and Gensel J (2018) Re-commandation de seacutequences dactiviteacutes lors deacutevegravenements distribueacutes

[Oard et al 1998] Oard D W Kim J et al (1998) Implicit feedback for recommendersystems In Proceedings of the AAAI workshop on recommender systems pages 8183

[Osche et al 2019a] Osche P-E Castagnos S and Boyer A (2019a) Antrs Recommendinglists through a multi-objective ant colony system In European Conference on InformationRetrieval pages 229243 Springer

[Osche et al 2019b] Osche P-E Castagnos S and Boyer A (2019b) From music to museum Applications of multi-objective ant colony systems to real world problems In Adaptive andLearning Agents Workshop at AAMAS (ALA 2019)

[Osche et al 2016] Osche P-E Castagnos S Napoli A and Naudet Y (2016) Walk theline toward an ecient user model for recommendations in museums In Semantic and SocialMedia Adaptation and Personalization (SMAP) 2016 11th International Workshop IEEE

[Oster 1981] Oster G (1981) E 0 wilson 1978 caste and ecology in the social insects Mo-nographs in Population Biology 12 1352

[Qiu et al 2015] Qiu J Lin Z and Li Y (2015) Predicting customer purchase behavior inthe e-commerce context Electronic commerce research 15(4) 427452

[Quadrana et al 2018] Quadrana M Cremonesi P and Jannach D (2018) Sequence-awarerecommender systems ACM Computing Surveys (CSUR) 51(4) 136

[Resnick et al 1994] Resnick P Iacovou N Suchak M Bergstrom P and Riedl J (1994)Grouplens an open architecture for collaborative ltering of netnews In Proceedings of the1994 ACM conference on Computer supported cooperative work pages 175186 ACM

[Reynolds 1987] Reynolds C W (1987) Flocks herds and schools A distributed behavioralmodel volume 21 ACM

[Ribeiro et al 2014] Ribeiro M T Ziviani N Moura E S D Hata I Lacerda A andVeloso A (2014) Multiobjective pareto-ecient approaches for recommender systems ACMTrans Intell Syst Technol 5(4) 53 153 20

[Ricci et al 2015] Ricci F Rokach L and Shapira B (2015) Recommender Systems Hand-book Springer US

[RISK 2002] RISK U (2002) Draft standard for learning object metadata IEEE standard1484(1)

[Rubtsov et al 2018] Rubtsov V Kamenshchikov M Valyaev I Leksin V and IgnatovD I (2018) A hybrid two-stage recommender system for automatic playlist continuation InProceedings of the ACM Recommender Systems Challenge 2018 page 16 ACM

114

[Russell and Norvig 2016] Russell S J and Norvig P (2016) Articial intelligence a modernapproach Malaysia Pearson Education Limited

[Salton 1989] Salton G (1989) Automatic text processing The transformation analysis andretrieval of Reading Addison-Wesley 169

[Salton and McGill 1986] Salton G and McGill M J (1986) Introduction to modern infor-mation retrieval

[Sammut and Webb 2010] Sammut C and Webb G I editors (2010) Mean Absolute Errorpages 652652 Springer US Boston MA

[Schlunz 2011] Schlunz E B (2011) Decision support for generator maintenance scheduling inthe energy sector PhD thesis Stellenbosch Stellenbosch University

[Schnabel et al 2018] Schnabel T Bennett P N Dumais S T and Joachims T (2018)Short-term satisfaction and long-term coverage Understanding how users tolerate algorithmicexploration In Proceedings of the Eleventh ACM International Conference on Web Search andData Mining pages 513521

[Semet et al 2003] Semet Y Lutton E and Collet P (2003) Ant colony optimisation fore-learning Observing the emergence of pedagogic suggestions In Swarm Intelligence Sympo-sium 2003 SIS03 Proceedings of the 2003 IEEE pages 4652 IEEE

[Shani and Gunawardana 2011] Shani G and Gunawardana A (2011) Evaluating recommen-dation systems In Recommender systems handbook pages 257297 Springer

[Shardanand and Maes 1995] Shardanand U and Maes P (1995) Social information ltering Algorithms for automating word of mouth In Chi volume 95 pages 210217 Citeseer

[Silva et al 2009] Silva A R D Lages W S and Chaimowicz L (2009) Boids that see Using self-occlusion for simulating large groups on gpus Computers in Entertainment (CIE)7(4) 51

[Simon 1997] Simon H A (1997) Models of bounded rationality Empirically grounded econo-mic reason volume 3 MIT press

[Smyth and McClave 2001] Smyth B and McClave P (2001) Similarity vs diversity InInternational Conference on Case-Based Reasoning pages 347361 Springer

[Stuumltzle and Hoos 2000] Stuumltzle T and Hoos H H (2000) Maxmin ant system Futuregeneration computer systems 16(8) 889914

[Su and Khoshgoftaar 2009] Su X and Khoshgoftaar T M (2009) A survey of collaborativeltering techniques Advances in articial intelligence 2009 4

[Tesoriero et al 2008] Tesoriero R Gallud J A Lozano M and Penichet V M R (2008) Alocation-aware system using rd and mobile devices for art museums In Fourth InternationalConference on Autonomic and Autonomous Systems (ICAS08) pages 7681 IEEE

[Tesoriero et al 2014] Tesoriero R Gallud J A Lozano M and Penichet V M R (2014)Enhancing visitors experience in art museums using mobile technologies Information SystemsFrontiers 16(2) 303327

[Tintarev et al 2017] Tintarev N Lo C and Liem C (2017) Sequences of diverse songrecommendations An exploratory study in a commercial system In Proceedings of the 25thConference on User Modeling Adaptation and Personalization pages 391392 ACM

[Twardowski 2016] Twardowski B (2016) Modelling contextual information in session-awarerecommender systems with neural networks In Proceedings of the 10th ACM Conference onRecommender Systems pages 273276 ACM

115

Bibliographie

[Vall et al 2018] Vall A Quadrana M Schedl M and Widmer G (2018) The impor-tance of song context and song order in automated music playlist generation arXiv preprintarXiv 180704690

[Vall et al 2019] Vall A Quadrana M Schedl M and Widmer G (2019) Order contextand popularity bias in next-song recommendations International Journal of Multimedia In-formation Retrieval 8(2) 101113

[Van den Berg et al 2005] Van den Berg B Van Es R Tattersall C Janssen J ManderveldJ Brouns F Kurvers H and Koper R (2005) Swarm-based sequencing recommendationsin e-learning In Intelligent Systems Design and Applications 2005 ISDA05 Proceedings 5thInternational Conference on pages 488493 IEEE

[Vargas and Castells 2011] Vargas S and Castells P (2011) Rank and relevance in noveltyand diversity metrics for recommender systems In Proceedings of the fth ACM conferenceon Recommender systems pages 109116 ACM

[Veacuteron and Levasseur 1989] Veacuteron E and Levasseur M (1989) Ethnographie de lexposition lespace le corps et le sens Centre Georges Pompidou Bibliothegraveque publique dinformation

[Volkovs et al 2018] Volkovs M Rai H Cheng Z Wu G Lu Y and Sanner S (2018)Two-stage model for automatic playlist continuation at scale In Proceedings of the ACMRecommender Systems Challenge 2018 page 9 ACM

[Wang et al 2012] Wang X Rosenblum D and Wang Y (2012) Context-aware mobile musicrecommendation for daily activities In Proceedings of the 20th ACM international conferenceon Multimedia pages 99108 ACM

[Weiss 2013] Weiss G (2013) Multiagent systems MIT press

[Yang et al 2017] Yang B Lei Y Liu J and Li W (2017) Social collaborative ltering bytrust IEEE transactions on pattern analysis and machine intelligence 39(8) 16331647

[Yang et al 2018] Yang H Jeong Y Choi M and Lee J (2018) Mmcf Multimodal colla-borative ltering for automatic playlist continuation In Proceedings of the ACM RecommenderSystems Challenge 2018 page 11 ACM

[Yang and Wu 2009] Yang Y J and Wu C (2009) An attribute-based ant colony system foradaptive learning object recommendation Expert Systems with Applications 36(2) 30343047

[Yoshimura et al 2014] Yoshimura Y Sobolevsky S Ratti C Girardin F Carrascal J PBlat J and Sinatra R (2014) An analysis of visitors behavior in the louvre museum a studyusing bluetooth data Environment and Planning B Planning and Design 41(6) 11131131

[Yu and Riedl 2012] Yu H and Riedl M O (2012) A sequential recommendation approachfor interactive personalized story generation In Proceedings of the 11th International Confe-rence on Autonomous Agents and Multiagent Systems-Volume 1 pages 7178 InternationalFoundation for Autonomous Agents and Multiagent Systems

[Zhang 2013] Zhang L (2013) The denition of novelty in recommendation system Journalof Engineering Science amp Technology Review 6(3)

[Zhao et al 2014] Zhao G Lee M L and Wynne H (2014) Utilizing purchase intervals inlatent clusters for product recommendation In Proceedings of the 8th Workshop on SocialNetwork Mining and Analysis page 4 ACM

[Ziegler et al 2005] Ziegler C-N McNee S M Konstan J A and Lausen G (2005) Im-proving recommendation lists through topic diversication In Proceedings of the 14th inter-national conference on World Wide Web pages 2232 ACM

116

[Zitzler et al 2001] Zitzler E Laumanns M and Thiele L (2001) Spea2 Improving thestrength pareto evolutionary algorithm TIK-report 103

117

Bibliographie

118

Reacutesumeacute

Les systegravemes de recommandations repreacutesentent un thegraveme de recherche fondamental agrave linter-section entre plusieurs grandes disciplines telles que lapprentissage automatique linteractionhomme-machine et les sciences cognitives Ils constituent en outre un cadre applicatif ambitieuxpour la communauteacute des chercheurs en Intelligence Articielle de par leur tregraves grande complexiteacuteet les nombreuses contraintes quils geacutenegraverent

Lobjectif de ces systegravemes est dameacuteliorer les interactions entre le grand public et les sys-tegravemes de recherche et daccegraves agrave linformation Il est en eet devenu dicile dans un contexte demasse de donneacutees heacuteteacuterogegravenes didentier les ressources les plus pertinentes Il sagit dassisterles utilisateurs dans leurs explorations (que cela soit dans un environnement virtuel ou physique)mais eacutegalement de proposer des ressources susceptibles de les inteacuteresser mais quils nauraientpas consulteacutees spontaneacutement

Les systegravemes actuels ont largement prouveacute leur valeur ajouteacutee et reposent sur des techniquesdapprentissage varieacutees (numeacuterique ou symbolique superviseacute ou non etc) [Castagnos 2008]Neacuteanmoins ils sourent encore de limitations lorsquil sagit de faire des recommandations deseacutequences (recommandations ditems dans un ordre preacutecis pouvant deacutependre des preacute-requis dela progressiviteacute requise du contexte des contraintes de temps etc) Certains modegraveles tels quele modegravele DANCE [Castagnos 2015] integravegrent cette dimension temporelle en suivant en tempsreacuteel leacutevolution en diversiteacute des ressources consulteacutees par les utilisateurs pour mieux comprendrele contexte dexploration Dans [Bonnin 2010] lauteur propose eacutegalement un modegravele temporelcapable de deacutetecter des motifs de consultations freacutequents dans un historique de consultationsan de fournir des recommandations de ressources a priori lieacutees agrave un mecircme contexte Neacuteanmoinssi la modeacutelisation temporelle et spatiale a eacuteteacute rendue possible [Zheng 2015] les modegraveles de leacutetatde lart sinteacuteressant agrave lordre dans lequel les recommandations doivent ecirctre faites ou agrave la qualiteacuteglobale dune seacutequence de recommandations sont encore trop rares

Dans le cadre de cette thegravese nous nous attacherons agrave deacutenir un nouveau formalisme etun cadre meacutethodologique permettant (1) la deacutenition de facteurs humains menant agrave la prisede deacutecision et agrave la satisfaction des utilisateurs (2) la construction dun modegravele geacuteneacuterique etmulti-critegraveres (contraintes physiques ou temporelles diversiteacute progressiviteacute etc) inteacutegrant cesfacteurs humains dans le but de recommander des ressources pertinentes sinscrivant dans uneseacutequence coheacuterente (3) une eacutevaluation holistique de la satisfaction utilisateur vis-agrave-vis de sonparcours de recommandations Leacutevaluation des recommandations tous domaines confondus sefait pour lheure recommandation par recommandation chaque meacutetrique deacutevaluation prise in-deacutependamment (preacutecision diversiteacute nouveauteacute couverture ) Il sagira de proposer un cadreplus complet mesurant leacutevolutiviteacute et la compleacutetude du parcours

Un tel modegravele de recommandations multi-critegraveres preacutesente de nombreux cadres applicatifs Agravetitre dexemple il peut ecirctre utiliseacute dans le cadre de leacutecoute de musique en ligne avec la recom-mandation de playlists adaptatives (recommandation de seacutequences de musique pour faire eacutevoluerlambiance dans un lieu tel quun bar pour susciter une certaine progressiviteacute de leacutemotion res-

119

sentie par le public ou pour sadapter aux attentes compleacutementairessimilairesdieacuterentes dungroupe) Il peut eacutegalement ecirctre utile pour adapter le parcours de recommandation aux progregraves delapprenant et au sceacutenario peacutedagogique de lenseignant dans un contexte de-eacuteducation Citonsaussi le domaine touristique ougrave ce modegravele pourrait inteacutegrer les contraintes spatiales et tempo-relles dun environnement physique (villes museacutees etc)

Mots-cleacutes Systegravemes de recommandation Systegravemes multi-agents Modeacutelisation utilisateur

120

Abstract

Recommender systems are a fundamental research topic at the intersection of several majordisciplines such as machine learning human-computer interaction and cognitive sciences Theyalso constitute an ambitious application framework for the community of researchers in ArticialIntelligence by their great complexity and the numerous constraints they generate

The purpose of these systems is to improve the interaction between the general audience andthe systems of search and access to information It has become dicult to identify the mostrelevant items in the context of big data The goal is thus to assist users in their explorations(whether in a virtual or physical environment) but also to propose items that may interest thembut that they would not consult spontaneously

Current systems have largely proven their added value and are based on various machinelearning techniques (numerical or symbolic supervised or not etc) [Castagnos 2008] Neverthe-less they still suer from limitations when making recommendations of sequences (recommendingitems in a specic order may depend on requirements progressiveness context time constraintsetc) Some models such as the DANCE model [Castagnos 2015] integrate this temporal di-mension by following in real time the evolution in diversity of resources consulted by users tobetter understand the exploration context In [Bonnin 2010] the author also proposes a temporalmodel capable of detecting frequent consultation patterns in a history of consultations in orderto provide a priori resource recommendations related to the same context Nevertheless whiletemporal and spatial modeling have been made possible [Zheng 2015] state-of-the-art modelsthat focus on sequence recommendations or on the overall quality of the sequence are still too rare

In the framework of this thesis we will focus on dening a new formalism and a method-ological framework allowing (1) the denition of human factors leading to decision making anduser satisfaction (2) the construction of a generic and multi-criteria model (physical or tem-poral constraints diversity progressiveness etc) integrating these human factors in order torecommend relevant resources in a coherent sequence (3) a holistic evaluation of user satisfac-tion with its recommendation path The evaluation of recommendations all domains includedis currently done recommendation by recommendation with each evaluation metric taken inde-pendently (accuracy diversity novelty coverage ) Thus we expect a more comprehensiveevaluation framework measuring the progressiveness and the completeness of the path

Such a multi-criteria recommendation model has many application frameworks As an exam-ple it can be used in the context of online music listening with the recommendation of adaptiveplaylists (recommendation of music sequences to change the atmosphere in a place such as a barto raise or lower the emotion felt by the audience progressively or to adapt to the complemen-tarysimilardierent expectations of a group) It can also be useful to adapt the recommendationpath to the learners progress and the teachers pedagogical scenario in an e-education contextLet us also mention the tourism eld where this model could integrate the spatial and temporalconstraints of a physical environment (cities museums etc)

Keywords Recommender systems Multi-agent systems User modeling

121

122

123

  • Introduction
    • Introduction
    • Preacuteambule
    • Contributions
      • SP1 les facteurs agrave prendre en compte pour satisfaire les utilisateurs
      • SP2 la conception de seacutequences de recommandations en accord avec les facteurs seacutelectionneacutes
      • SP3 et SP4 la creacuteation dun modegravele geacuteneacuterique prenant en compte plusieurs meacutetriques et produisant des seacutequences
        • Plan de la thegravese
          • Eacutetat de lart
            • Les systegravemes de recommandation
              • Le filtrage par contenu
              • Le filtrage collaboratif
              • Les actions des utilisateurs
              • Discussion et limites des systegravemes classiques
                • Les facteurs humains agrave prendre en compte dans la recommandation
                  • La similariteacute
                  • La diversiteacute
                  • La nouveauteacute
                  • Discussion
                    • La recommandation en seacutequence
                      • Deacutefinition et geacuteneacuteraliteacutes sur les seacutequences
                      • Domaines dapplication des modegraveles seacutequentiels
                      • Discussion
                        • Les systegravemes multi-agents
                          • Deacutefinition
                          • Preacutesentation de deux systegravemes multi-agents reacuteactifs
                          • Ant Colony System
                          • Discussion sur le modegravele ACS
                            • Utilisation et eacutevolution reacutecentes des algorithmes de colonies de fourmis
                              • Les algorithmes de colonies de fourmis dans les systegravemes de recommandation
                              • Les algorithmes de colonies de fourmis multi-objectifs
                              • Discussion sur lutilisation de loptimum de Pareto
                                • Discussion geacuteneacuterale
                                  • Notre modegravele de recommandation multi-objectifs AntRS
                                    • Introduction
                                    • Fonctionnement geacuteneacuteral du modegravele
                                    • Graphe
                                    • Objectifs
                                      • Similariteacute
                                      • Diversiteacute
                                      • Nouveauteacute
                                      • Preacutefeacuterences
                                      • Progressiviteacute
                                        • Tactiques de fusion
                                          • Colonie de fusion
                                          • Fusion de seacutequences
                                          • Conclusion
                                              • Expeacuterimentations et reacutesultats
                                                • Introduction
                                                • Expeacuterimentations preacuteliminaires portant sur le modegravele ACS initial
                                                  • Preacutesentation et inteacuterecircts de ces premiegraveres expeacuterimentations
                                                  • Expeacuterimentations preacuteliminaires sur le modegraveles ACS
                                                  • Conclusion
                                                    • Expeacuterimentations sur le modegravele AntRS
                                                      • Base de donneacutees utiliseacutee
                                                      • AntRS mono-objectif expeacuterimentations sur chaque colonie isoleacutee
                                                      • AntRS multi-objectifs expeacuterimentations sur lensemble des colonies simultaneacutement et sur les tactiques de fusion
                                                      • Optimisation des meacutetavariables de AntRS
                                                        • Conclusion
                                                          • Conclusion et perspectives
                                                            • Conclusion
                                                            • Perspectives
                                                              • Bibliographie
Page 3: Recommanding sequences in a multidimensional space

Ecole doctorale IAEM Lorraine

Recommandations en sequences dansun espace multidimensions

THESE

presentee et soutenue publiquement le 26 fevrier 2021

pour lrsquoobtention du

Doctorat de lrsquoUniversite de Lorraine

(mention informatique)

par

Pierre-Edouard Osche

Composition du jury

President Laurent Vigneron Professeur Universite de Lorraine

Rapporteurs Sylvie Calabretto Professeur INSA de LyonLaurent Vercouter Professeur INSA de Rouen

Directrice Anne Boyer Professeur Universite de Lorraine

Co-Directeur Sylvain Castagnos Maıtre de Conferences Universite de Lorraine

Laboratoire Lorrain de Recherche en Informatique et ses Applications mdash UMR 7503

Mis en page avec la classe thesul

Remerciements

Ce manuscrit de thegravese est le fruit dun long travail de recherche qui a eacuteteacute riche en enseigne-ments Durant ces anneacutees jai beaucoup appris tant du point de vue professionnel que personnelplus que je naurais imagineacute avant de commencer cette thegravese Pour tout cela je souhaite remer-cier les personnes qui mont entoureacute durant cette peacuteriode

Je tiens tout dabord agrave particuliegraverement remercier ma directrice Anne Boyer et mon co-directeur Sylvain Castagnos avec qui jai eu la chance de pouvoir travailler durant toute cettethegravese Anne ma apporteacute son expeacuterience et son recul dans le domaine de la recherche et Sylvainma guideacute et soutenu dans chacune des eacutetapes de ce travail Jai beaucoup appreacutecieacute travailleravec vous et je vous remercie encore une fois ici pour vos conseils aviseacutes votre patience votrebonne humeur et pour tout ce que jai pu apprendre agrave vos cocircteacutes

Je remercie Sylvie Calabretto et Laurent Vercouter qui ont rapporteacute ma thegravese et qui ontaccepteacute de faire partie du jury de thegravese Leurs remarques pertinentes mont donneacute un recul etune conance nouvelle en mon travail Je remercie Laurent Vigneron qui a apporteacute un regardexteacuterieur et bienveillant sur mon travail pendant ces anneacutees de thegravese et qui a eacutegalement accepteacutede faire partie du jury comme examinateur

Je remercie aussi leacutequipe KIWI dans son ensemble De nombreuses ideacutees de ce travail sont lefruit de discussions avec les membres de leacutequipe dont certains sont devenus pour moi des amisproches

Je remercie enn ma famille et mes amis leur soutien ma donneacute la motivation de terminerce travail dans cette peacuteriode dicile de pandeacutemie et disolation sociale Tout particuliegraverementje remercie Rose et Ragnar pour leur douce preacutesence quotidienne

i

ii

Sommaire

Chapitre 1

Introduction 1

11 Introduction 1

12 Preacuteambule 4

13 Contributions 8

131 SP1 les facteurs agrave prendre en compte pour satisfaire les utilisateurs 9

132 SP2 la conception de seacutequences de recommandations en accord avec les

facteurs seacutelectionneacutes 9

133 SP3 et SP4 la creacuteation dun modegravele geacuteneacuterique prenant en compte plusieurs

meacutetriques et produisant des seacutequences 9

14 Plan de la thegravese 10

Chapitre 2

Eacutetat de lart 11

21 Les systegravemes de recommandation 12

211 Le ltrage par contenu 12

212 Le ltrage collaboratif 13

213 Les actions des utilisateurs 13

214 Discussion et limites des systegravemes classiques 14

22 Les facteurs humains agrave prendre en compte dans la recommandation 15

221 La similariteacute 17

222 La diversiteacute 19

223 La nouveauteacute 20

224 Discussion 21

23 La recommandation en seacutequence 22

231 Deacutenition et geacuteneacuteraliteacutes sur les seacutequences 22

232 Domaines dapplication des modegraveles seacutequentiels 26

233 Discussion 30

iii

Sommaire

24 Les systegravemes multi-agents 31

241 Deacutenition 31

242 Preacutesentation de deux systegravemes multi-agents reacuteactifs 33

243 Ant Colony System 38

244 Discussion sur le modegravele ACS 40

25 Utilisation et eacutevolution reacutecentes des algorithmes de colonies de fourmis 43

251 Les algorithmes de colonies de fourmis dans les systegravemes de recommandation 43

252 Les algorithmes de colonies de fourmis multi-objectifs 47

253 Discussion sur lutilisation de loptimum de Pareto 50

26 Discussion geacuteneacuterale 50

Chapitre 3

Notre modegravele de recommandation multi-objectifs AntRS 53

31 Introduction 54

32 Fonctionnement geacuteneacuteral du modegravele 54

33 Graphe 55

34 Objectifs 60

341 Similariteacute 63

342 Diversiteacute 64

343 Nouveauteacute 64

344 Preacutefeacuterences 66

345 Progressiviteacute 67

35 Tactiques de fusion 70

351 Colonie de fusion 71

352 Fusion de seacutequences 72

353 Conclusion 72

Chapitre 4

Expeacuterimentations et reacutesultats 73

41 Introduction 74

42 Expeacuterimentations preacuteliminaires portant sur le modegravele ACS initial 74

421 Preacutesentation et inteacuterecircts de ces premiegraveres expeacuterimentations 74

422 Expeacuterimentations preacuteliminaires sur le modegraveles ACS 78

423 Conclusion 84

43 Expeacuterimentations sur le modegravele AntRS 84

431 Base de donneacutees utiliseacutee 84

432 AntRS mono-objectif expeacuterimentations sur chaque colonie isoleacutee 89

iv

433 AntRS multi-objectifs expeacuterimentations sur lensemble des colonies si-

multaneacutement et sur les tactiques de fusion 93

434 Optimisation des meacutetavariables de AntRS 99

44 Conclusion 103

Chapitre 5

Conclusion et perspectives 105

51 Conclusion 105

52 Perspectives 106

Bibliographie 109

v

Sommaire

vi

Table des gures

21 Preacutesentation scheacutematiseacutee du calcul de la preacutecision et du rappel en fonction desressources trouveacutees par rapport agrave lensemble des ressources disponibles (creacuteditimage Datamok UserWalber) 15

22 Vue densemble du fonctionnement dun systegraveme de recommandation sensible auxseacutequences (source [Quadrana et al 2018]) 25

23 Scheacutema repreacutesentant linteraction entre un agent et lenvironnement dans lequel ileacutevolue [Russell and Norvig 2016] 32

24 Simulation de boids ougrave lon peut voir les agents se deacuteplaccedilant dans la mecircme di-rection agrave une certaine distance les uns des autres dans un environnement simuleacute[Reynolds 1987] 35

25 Illustration dun chemin creacuteeacute par des fourmis appartenant agrave lespegravece des fourmisleacutegionnaires (creacutedit photo Mehmet Karatay) 36

26 Exemple de descente de gradient ougrave lon peut voir lexploration au deacutebut avec undeacuteplacement rapide puis lexploitation ensuite vers la solution trouveacutee ( creacuteditimage Joris Gillis 41

27 Illustration de lexpeacuterience des ponts binaires par Jean-Louis Deneubourg (a)Apregraves un certain temps les fourmis choisissent majoritairement une des deuxvoies possibles (b) [Deneubourg et al 1990] 41

28 Scheacutema du dispositif expeacuterimental utiliseacute pour veacuterier si les fourmis sont biencapables demprunter rapidement la voie la plus courte lorsque leur sont preacutesenteacutesdes choix qualitativement dieacuterents [Goss et al 1989] 42

29 Front de Pareto dun problegraveme de minimisation de deux variables f1 et f2 Toutesles solutions sur cette frontiegravere sont optimales (source Wikipedia) 48

31 Graphe repreacutesentant leacutevolution exponentielle du nombre darecirctes selon le nombrede sommets existants dans un graphe complet 57

32 Graphe repreacutesentant leacutevolution lineacuteaire du nombre darecirctes selon le nombre desommets voulus dans un graphe creacuteeacute avec dieacuterentes valeurs de d 60

41 Diagramme de ux repreacutesentant le deacuteroulement de lalgorithme ACS proposeacute par[Schlunz 2011] 76

42 Deux exemples de congurations expeacuterimentales dieacuterentes permettant chacune detester la capaciteacute des fourmis agrave trouver le plus court chemin dans un evironnement[Goss et al 1989] 77

43 Illustration de lexpeacuterience des ponts binaires par Jean-Louis Deneubourg (a)Apregraves un certain temps les fourmis choisissent majoritairement une des deuxvoies possibles (b) [Deneubourg et al 1990] 78

vii

Table des gures

44 Repreacutesentation graphique de lExpeacuterimentation 11 meneacutee sur le modegravele ACS gracircceagrave la bibliothegraveque Java GraphStream Le ndivideud repreacutesenteacute par un carreacute rouge cor-respond au deacutepart le ndivideud repreacutesenteacute par un carreacute bleu repreacutesente larriveacutee lesndivideuds ronds noirs repreacutesentent des points de passage possible les nombres noirsaccoleacutes aux arecirctes repreacutesentent la distance pour parcourir larecircte les nombresviolets repreacutesentent le taux de pheacuteromones deacuteposeacutees sur larecircte 79

45 Reacutesultats obtenus apregraves 30 iteacuterations sur lExpeacuterimentation 11 Agrave gauche laconguration nale du graphe agrave droite le pourcentage dagents fourmis ayantemprunteacutes les deux chemins 80

46 Reacutesultats obtenus apregraves 30 iteacuterations sur lExpeacuterimentation 12 Comme les agentsse basent principalement sur lheuristique qui est partout eacutegale ils oscillent entreles deux chemins sans en privileacutegier un 81

47 Reacutesultats obtenus apregraves 30 iteacuterations sur lExpeacuterimentation 13 Les agents ex-ploitent ici les arecirctes ayant le plus de pheacuteromones Tregraves rapidement tous les agentsutilisent le mecircme chemin 82

48 Conguration nale du graphe pour lExpeacuterimentation 2 apregraves 30 iteacuterations Lesagents ont en majoriteacute bien seacutelectionneacute le chemin le plus court lt 0 1 3 4 9 gt 82

49 Exemple de graphe de lExpeacuterimentation 3 agrave la n des 50 iteacuterations Ces graphessont geacuteneacutereacutes aleacuteatoirement 83

410 Exemple de deacutetection de sessions dans la base de donneacutees Lheure agrave laquelleest lanceacutee chaque musique (ici en bas dans le scheacutema) ainsi que sa dureacutee sontenregistreacutees Si lutilisateur ne relance pas de musique pendant 15 minutes apregravesla n de sa derniegravere eacutecoute alors la session en cours est termineacutee et une nouvellesession est commenceacutee agrave la prochaine musique lanceacutee 87

411 Inuence du nombre dagents et diteacuterations sur la preacutecision moyenne obtenue parnotre modegravele 100

viii

Chapitre 1

Introduction

11 Introduction

Les systegravemes de recommandation existent depuis maintenant plus de deux deacutecennies[Resnick et al 1994] et ont pris leur essor avec la deacutemocratisation dInternet et de laccegraves agravelinformation Le but dun systegraveme de recommandation est comme son nom lindique de recom-mander des ressources agrave lutilisateur pour laiguiller parmi la masse dinformations disponibles Leterme de ressource peut faire reacutefeacuterence agrave un produit une information un lm une musique etcCes ressources doivent correspondre agrave ce quattend lutilisateur pour reacutepondre agrave ses attentesLagrave ougrave dautres meacutethodes daide agrave lutilisateur comme les moteurs de recherche proposerontune liste de sites Internet relatifs agrave une question geacuteneacuterale (ex la requecircte lms super-heacuterosreacutesultera en une liste des lms de super-heacuteros les plus connus etou reacutecents) un systegraveme derecommandation proposera quant agrave lui une reacuteponse plus speacutecique agrave un besoin plus preacutecis (ex un systegraveme recommandera agrave un utilisateur de voir le dernier lm de super-heacuteros du studio Marvelcar ce dernier a appreacutecieacute tous les lms reacutealiseacutes par ce studio speacutecique ces derniegraveres anneacutees) Uneautre speacuteciciteacute majeure des systegravemes de recommandation reacuteside dans le fait que ces derniersreacutepondent agrave un besoin de lutilisateur qui naura pas forceacutement eacuteteacute exprimeacute en amont par cedernier Contrairement aux moteurs de recherche qui se contentent de reacutepondre agrave une requecircte delutilisateur les systegravemes de recommandation proposent quant agrave eux des informations de maniegraverepro-active au moment le plus opportun Un des deacutes majeurs des systegravemes de recommandationen plus de proposer des recommandations au bon moment est de reacuteussir agrave modeacuteliser ce quelutilisateur souhaite reacuteellement alors que les seules donneacutees disponibles proviennent des traceslaisseacutees par les utilisateurs lors des preacuteceacutedentes interactions avec le systegraveme (consultation depages achat de produits visionnage de lms etc) Les systegravemes de recommandation apportentune reacuteelle plus-value par rapport agrave dautres meacutethodes (comme les moteurs de recherche) carlaide proposeacutee se veut tregraves personnaliseacutee selon les preacutefeacuterences de chaque utilisateur Cet objectifde personnalisation entraicircne cependant une complexication du problegraveme car il est neacutecessaire dedeacutenir et de prendre en compte les facteurs humains sous-jacents agrave la satisfaction de lutilisateurlors de la recherche dinformation Nous allons maintenant nous inteacuteresser plus particuliegraverementaux dieacuterentes techniques employeacutees par les systegravemes de recommandation

Les systegravemes de recommandation existent depuis plus de deux deacutecennies et mecircme si les tech-niques ont eacutevolueacute le principe fondamental reste le mecircme identier les besoins et les preacutefeacuterencesdun utilisateur pour lui proposer des ressources adapteacutees Pour ce faire la premiegravere eacutetape estde reacutecolter des informations agrave propos de lutilisateur dans le but didentier ses preacutefeacuterences

1

Chapitre 1 Introduction

Les informations reacutecolteacutees sont deacutependantes du domaine dans lequel est deacuteployeacute le systegraveme derecommandation Sur un site de-commerce le systegraveme pourra par exemple utiliser les produitsconsulteacutes par lutilisateur ainsi que les eacuteventuelles notes sur les produits quil a acheteacute Un sitedeacutecoute de musique exploitera quant agrave lui les titres eacutecouteacutes par lutilisateur ainsi que son com-portement durant leacutecoute (est-ce quil a eacutecouteacute le titre jusquau bout etc)

Durant ces deux deacutecennies dexistence les systegravemes de recommandation ont changeacute pouraccompagner leacutevolution des usages dInternet Les premiegraveres geacuteneacuterations de systegravemes eacutetaientnaturellement adapteacutees aux ressources peu nombreuses et complexes typiques du deacutebut de legraveredInternet Cest agrave cette eacutepoque que les deux grandes cateacutegories de systegravemes de recommandationse sont dieacuterencieacutees agrave savoir le ltrage collaboratif [Resnick et al 1994] et le ltrage par contenu[Belkin and Croft 1992] Dans le ltrage collaboratif les preacutefeacuterences des utilisateurs du systegravemesont utiliseacutees (eg pour un site de recommandation de lms les notes donneacutees par les utilisa-teurs du site sur les lms quils ont vu) Ainsi le systegraveme proposera agrave lutilisateur souhaitant desrecommandations les ressources appreacutecieacutees des autres utilisateurs qui lui sont similaires suivantlhypothegravese selon laquelle les preacutefeacuterences dun ensemble dutilisateurs similaires sont coheacuterentesentre elles Dans le ltrage par contenu les caracteacuteristiques des ressources sont utiliseacutees (egpour un site de recommandation de lms genre acteurs anneacutee de sortie ) Ainsi le systegravemeproposera agrave lutilisateur les ressources similaires agrave celles quil a appreacutecieacutees preacuteceacutedemment Pen-dant longtemps ces deux techniques ont eacuteteacute eacutevalueacutees sur la mesure de preacutecision Pour calculercette mesure les preacutedictions du systegraveme de recommandation sont directement confronteacutees auxdonneacutees reacuteelles recueillies avec de vrais utilisateurs Par exemple un systegraveme calcule quun uti-lisateur pourrait donner agrave un lm une note de 4 sur 5 indiquant quil pourrait eectivementappreacutecier ce lm et quil serait inteacuteressant de lui recommander Cette note calculeacutee de 45 estensuite compareacutee avec la note reacuteelle que cet utilisateur a donneacute agrave ce lm speacutecique note quiavait auparavant eacuteteacute cacheacutee au systegraveme de recommandation pendant les calculs Plus la note preacute-dite et la note reacuteelle sont proches et plus le systegraveme va ecirctre jugeacute preacutecis [Konstan et al 1998]Cette preacutecision peut se mesurer via dieacuterentes meacutetriques comme par exemple lerreur moyenneabsolue qui calcule la deacuteviation entre ce qua preacutedit le systegraveme et les preacutefeacuterences reacuteelles de luti-lisateur [Sammut and Webb 2010] Cette meacutethode bien quintuitive a tendance agrave enfermer lesutilisateurs dans leurs preacutefeacuterences deacutejagrave eacutetablies puisque cest preacuteciseacutement de cette maniegravere queles performances du systegraveme sont jugeacutees Ainsi dans le cas du ltrage par contenu si lutilisateuravait appreacutecieacute par le passeacute un type de ressources particulier le systegraveme tendait agrave lui recomman-der plus de ressources de ce type

Un autre problegraveme provenant de leacutevolution des usages peut ecirctre souleveacute ici Agrave lorigineles systegravemes de recommandation se concentraient dans quelques domaines particuliers commepar exemple les lms ou les produits de sites commerciaux Les recommandations eacutetaient alorspreacutesenteacutees agrave lutilisateur sous forme de ressources uniques ou de liste de ressources similairesCette maniegravere de preacutesenter les recommandations est encore tregraves courante aujourdhui alors queles usages ont eacutevolueacute et que les systegravemes de recommandation sont preacutesents dans un nombre deplus en plus grand de domaines ougrave recevoir une liste de ressources nest pas forceacutement adapteacutePour conclure sur cette partie il est clair que les systegravemes de recommandation ont eacutevolueacute depuisleur creacuteation Cependant des problegravemes demeurent quant agrave leacutevaluation de leurs performances etla satisfaction de lutilisateur nal ainsi que pour la preacutesentation des reacutesultats agrave lutilisateur nal

Prenons maintenant deux exemples qui vont servir agrave illustrer ce propos dans le chapitre Lepremier exemple se concentre sur le problegraveme de leacutevaluation par la preacutecision dans le domaine de

2

11 Introduction

le-commerce Consideacuterons un utilisateur qui consulte depuis quelques temps des appareils photo-graphiques sur un site de vente en ligne Le systegraveme de recommandation deacutetecte ce comportementet calcule les produits les plus similaires disponibles sur le site agrave savoir dautres appareils pho-tographiques Apregraves secirctre deacutecideacute lutilisateur achegravete son appareil et satisfait le reccediloit chez luiquelques jours plus tard Lors de ses prochaines connexions au site de vente en ligne le sys-tegraveme de recommandation proposera encore agrave lutilisateur des appareils photographiques car cesont eectivement toujours ces produits qui correspondent le plus agrave ses preacutefeacuterences mecircme silutilisateur nen a maintenant plus besoin Ce premier exemple montre le problegraveme relatif agrave lasur-utilisation de la preacutecision comme mesure de la performance Si les premiegraveres recommanda-tions baseacutees sur la preacutecision pouvaient ecirctre utiles pour lutilisateur on voit bien quune fois lachateectueacute cette mesure nest plus adapteacutee Des recommandations sur des nouveaux produits pour-raient par exemple ici se reacuteveacuteler inteacuteressantes pour lutilisateur Une autre ameacutelioration possiblepourrait ecirctre la prise en compte de la temporaliteacute Des recommandations dappareils photogra-phiques pourraient ecirctre utiles agrave lutilisateur mais peut-ecirctre dans plusieurs mois ou anneacutees et nonpas directement apregraves son achatOn voit bien ici que le systegraveme de recommandation ne peut passe contenter de la seule mesure de preacutecision et pourrait beacuteneacutecier de lutilisation dautres mesures

Prenons maintenant un deuxiegraveme exemple dans le domaine de le-education pour illustrer lesproblegravemes que peut apporter la preacutesentation des recommandations sous forme de liste agrave lutili-sateur nal Un utilisateur sest inscrit reacutecemment sur un site proposant des cours en ligne caril souhaite apprendre la programmation en Java Il consulte ainsi un cours sur les bases de laprogrammation en Java et le termine avec succegraves Le systegraveme de recommandation du site calculeun certain nombre de ressources eacuteducatives similaires au cours quil vient de suivre et les pro-pose sous forme de liste Lutilisateur se voit donc proposer en tecircte de liste dautres cours pourdeacutebutants en Java ainsi que quelques cours pour deacutebutants dans dautres langages de program-mation dans le reste de la liste Lutilisateur aurait davantage proteacute dune recommandation deplusieurs ressources eacuteducatives sadaptant agrave son niveau et proposant une augmentation de ladiculteacute pour quil poursuive son apprentissage illustrant linteacuterecirct de ne pas uniquement pro-poser des recommandations sous forme de liste On remarque une nouvelle fois que la prise encompte dautres mesures auraient ameacutelioreacute la qualiteacute des recommandations temporaliteacute priseen compte du niveau de lutilisateur diversiteacute des cours proposeacutes etc

Ces deux exemples mettent en exergue la complexiteacute du domaine de la recommandation tantles besoins des utilisateurs peuvent ecirctre varieacutes et complexes agrave satisfaire La satisfaction de lutili-sateur nal est lobjectif central de tout systegraveme de recommandation tout en eacutetant un problegravemeouvert et complexe En eet la satisfaction dun utilisateur nest pas binaire mais continue (unutilisateur nest pas soit satisfait soit non satisfait mais sera plutocirct satisfait de la recommanda-tion agrave un certain degreacute) Nous proposons donc ici daborder ce problegraveme sous un autre angle comment ameacuteliorer la qualiteacute des recommandations fournies agrave lutilisateur dans le but dobtenirde lutilisateur nal une plus haute satisfaction Les deux exemples ci-dessus illustrent leetpotentiellement neacutefaste de proposer des recommandations innaproprieacutees cest-agrave-dire qui ne sa-tisfont pas les besoins de lutilisateur au moment ougrave celui-ci les reccediloit En eet un utilisateur agravequi lon propose de maniegravere reacutecurrente des recommandations innaproprieacutees sera de plus en plusmeacuteant quant agrave la capaciteacute du systegraveme de produire des recommandations adapteacutees agrave ses besoinsau moment t De la mecircme maniegravere un mauvais systegraveme de recommandation ne sera pas utileagrave lutilisateur pour satisfaire ses besoins Il a eacuteteacute prouveacute que ces deux notions de conance etdutiliteacute diminuent chez lutilisateur face agrave un systegraveme de recommandation ne les satisfaisant pas[Benbasat and Wang 2005] Agrave terme ce genre de recommandations peut amener lutilisateur agrave

3

Chapitre 1 Introduction

ne plus utiliser le systegraveme sil ne perccediloit pas la valeur ajouteacutee de celui-ci Les exemples preacuteceacute-dents donnent aussi quelques pistes sur la maniegravere dameacuteliorer la qualiteacute des recommandationsEn eet on peut remarquer que mecircme si les propositions eacutetaient satisfaisantes du point de vueinterne du systegraveme elles ne leacutetaient pas du point de vue externe de lutilisateur Cette contra-diction peut sexpliquer par le fait que le systegraveme ne prend simplement pas assez en compte lesfacteurs deacuteterminant les besoins de lutilisateur Un systegraveme reacuteussissant agrave mieux modeacuteliser unutilisateur et prenant en compte les facteurs les plus importants pour ce dernier dans le processusde recommandation permettrait de mieux satisfaire ses besoins La probleacutematique scientiqueprincipale de cette thegravese peut donc se formuler ainsi

SP0 Comment ameacuteliorer la qualiteacute des recommandations faites aux utili-sateurs

Sinteacuteresser agrave la qualiteacute des recommandations implique de sinteacuteresser agrave leacutevaluation de cesderniegraveres Dans la prochaine section nous deacutetaillerons les deacutes et enjeux de cette probleacutematiqueet son lien avec leacutevaluation puis nous deacutenirons plusieurs sous-probleacutematiques permettant dyapporter des reacuteponses

12 Preacuteambule

Lameacutelioration de la qualiteacute des recommandations des utilisateurs est un vaste sujet auquelil est possible de reacutepondre de multiples faccedilons Il est dabord neacutecessaire de se demander ce quesignie ameacuteliorer la qualiteacute dans cette question Nous avons vu jusquagrave maintenant quun sys-tegraveme de recommandation mesure classiquement la qualiteacute de ses reacutesultats selon une meacutetrique lapreacutecision Cependant la satisfaction de lutilisateur nest pas forceacutement en accord avec cette me-sure comme cela a eacuteteacute illustreacute dans lexemple des appareils photographiques ougrave malgreacute un scorede preacutecision potentiellement tregraves haut lutilisateur peut ne pas ecirctre satisfait des propositionsdu systegraveme La satisfaction de lutilisateur nal peut ecirctre eacutevalueacutee de deux maniegraveres dieacuterentesPremiegraverement elle peut ecirctre mesureacutee directement via un systegraveme deacutevaluation des recommanda-tions ougrave lon demande par exemple agrave lutilisateur de noter la recommandation qui vient de luiecirctre proposeacutee Deuxiegravemement elle peut ecirctre mesureacutee indirectement en observant le comporte-ment de lutilisateur apregraves lui avoir fourni la recommandation [Shani and Gunawardana 2011]Si ce dernier consulte ou consomme la ressource recommandeacutee plutocirct quune autre il est raison-nable de faire lhypothegravese quil est satisfait par cette recommandation cest ce quon appellele taux dacception des recommandations dun systegraveme par rapport agrave un utilisateur Ces deuxmeacutethodes deacutevaluation permettent davoir une ideacutee de la correacutelation entre les meacutetriques internesdu systegraveme et la satisfaction reacuteelle de lutilisateur Il est plus simple de se baser sur des me-sures internes pour eacutevaluer un systegraveme comme la preacutecision plutocirct que sur des mesures externescomme par exemple la satisfaction reacuteelle de lutilisateur eacutetant donneacute que celle-ci demande demettre le systegraveme en ligne et de leacutevaluer apregraves un certain temps dutilisation Leacutevaluation surles seules performances du systegraveme est appeleacutee eacutevaluation hors ligne tandis que leacutevaluation enconditions reacuteelles est appeleacutee eacutevaluation en ligne [Shani and Gunawardana 2011] Leacutevaluationhors ligne mecircme si potentiellement moins apte agrave juger de la satisfaction de lutilisateur oretout de mecircme de nombreux avantages Elle permet premiegraverement de reacutealiser des expeacuteriencesrapidement et agrave bas coucircts eacutetant donneacute quil ny a pas besoin dattendre que les utilisateurs seservent du systegraveme Elle permet ensuite dutiliser des bases de donneacutees deacutejagrave creacuteeacutees permettantaux chercheurs de se concentrer uniquement sur la conception du systegraveme de recommandation(comme par exemple la tregraves connue base de donneacutees MovieLens qui rassemble un grand nombre

4

12 Preacuteambule

deacutevaluations de lms par des utilisateurs sous la forme de notes [Resnick et al 1994]) Ennelle permet de comparer les performances de dieacuterentes techniques de maniegravere objective en lesappliquant agrave un mecircme jeu de donneacutees Autrement dit leacutevaluation en ligne permet dobtenirdes reacutesultats provenant directement dutilisateurs dans un contexte reacuteel mais est tregraves couteuseen temps et en ressource Leacutevaluation hors ligne est quant agrave elle peu couteuse en temps et enressources et permet de reacutealiser autant dexpeacuterimentations que neacutecessaire Dans le contexte decette thegravese ougrave la question de la qualiteacute des recommandations est centrale ces deux meacutethodesdeacutevaluations possegravedent chacune des avantages et des inconveacutenients et seront discuteacutees dans lechapitre deacutedieacutee aux expeacuterimentations du manuscrit

Lameacutelioration de la qualiteacute des recommandations est un point crucial de nos jours tant lessystegravemes de recommandation sont omnipreacutesents dans notre monde Presque tous les grands sitescommerciaux sont deacutesormais doteacutes dun systegraveme de ce genre dans le but de garder lutilisateurplus longtemps sur leur site (Youtube 1 Deezer 2 Netix 3) de le satisfaire pour quil revienne agraveson prochain achat voire mecircme de susciter chez lui de nouvelles envies gracircce agrave la caracteacuteristiquede ces systegravemes decirctre force de proposition (Amazon 4) Les entreprises commerciales ne sontpas les seules agrave exploiter le potentiel des systegravemes de recommandations Les eacutecoles et universiteacutescommencent elles aussi agrave se doter de systegravemes de recommandation permettant aux eacutetudiants desauto-former en utilisant les vastes ressources eacuteducatives mises agrave disposition par celles-ci [Drachs-ler et al 2015] [Boyer et al 2015] De la mecircme maniegravere le domaine de lheacuteritage culturel etdu tourisme seacutequipe petit agrave petit dapplications smartphone permettant aux touristes perdusdevant les possibiliteacutes oertes par certains lieux de culture une aide automatiseacutee et personnaliseacutee[Borragraves et al 2014]

Devant lexplosion de la populariteacute des systegravemes de recommandation devant la complexiteacutegrandissante des ressources agrave recommander et devant laugmentation du nombre dutilisateurs deces systegravemes un constat a eacuteteacute fait proposer constamment des ressources similaires par rapportaux preacutefeacuterences de lutilisateur nest plus susant [McNee et al 2006] De nouvelles eacutetudes etexpeacuterimentations ont montreacute que proposer des recommandations selon dautres modaliteacutes que lapreacutecision pouvait ecirctre beacuteneacuteque Citons ici la mesure de diversiteacute qui a eacuteteacute deacutenie par [Smythand McClave 2001] comme eacutetant linverse de la similariteacute entre deux ressources Ainsi plus deuxressources sont similaires entre elles et moins elles seront diverses et vice versa Proposer desrecommandations plus diversieacutees permet deacuteviter aux utilisateurs de recevoir toujours les mecircmesrecommandations similaires agrave leurs preacutefeacuterences ou encore daugmenter le nombre des ressourcespouvant ecirctre recommandeacutees agrave un utilisateur (cette proportion entre ressources existantes et res-sources pouvant ecirctre recommandeacutees est appeleacutee la couverture dun systegraveme) Citons aussi lamesure de nouveauteacute qui fait quant agrave elle reacutefeacuterence agrave une ressource qui na jamais eacuteteacute vue parlutilisateur [Castells et al 2015] La nouveauteacute permet de remplir un des buts principaux dunsystegraveme de recommandation agrave savoir faire deacutecouvrir agrave lutilisateur des ressources quil nauraitpeut-ecirctre pas trouveacutees sans le systegraveme Il est cependant important de preacuteciser que lapport deces mesures dans les systegravemes de recommandation est aussi discuteacute Par exemple [Ekstrandet al 2014] ont montreacute que si la diversiteacute eacutetait correacuteleacutee positivement avec la satisfaction desutilisateurs ce neacutetait pas le cas de la nouveauteacute Les auteurs expliquent que cette correacutelationneacutegative pourrait ecirctre due au fait quun systegraveme proposant beaucoup de ressources nouvelles sans

1 https wwwyoutubecom2 https wwwdeezercom3 https wwwnetixcom4 https wwwamazoncom

5

Chapitre 1 Introduction

lien avec les preacutefeacuterences de lutilisateur serait mal vu par ce dernier Les auteurs suggegraverent ainside ne pas inteacutegrer de ressources issues de la meacutetrique de nouveauteacute aux nouveaux utilisateurspour leur laisser le temps davoir conance dans le systegraveme avant eacuteventuellement dinteacutegrer dela nouveauteacute dans les recommandations agrave mesure que lutilisateur shabitue au systegraveme

Il apparaicirct donc important dinclure plusieurs critegraveres dans le calcul les recommandationstout en eacutequilibrant ces dieacuterentes recommandations selon lutilisateur Cependant cet eacutequilibreest loin decirctre eacutevident agrave trouver alors que les informations disponibles sur les ressources et les uti-lisateurs sont souvent limiteacutees et que certaines de ces meacutetriques semblent opposeacutees les unes auxautres comme par exemple la similariteacute et la diversiteacute De plus cet eacutequilibre est non seulementameneacute agrave changer selon chaque utilisateur mais il peut aussi varier selon les attentes dun mecircmeutilisateur Ce dernier souhaitera par exemple deacutecouvrir les ressources les plus populaires dansun premier temps apregraves secirctre inscrit sur un site Apregraves avoir consulteacute ces ressources ce mecircmeutilisateur souhaitera peut-ecirctre deacutecouvrir des ressources moins populaires ou plus reacutecentes Il estdonc important de pouvoir modier limportance de chacun de ces facteurs agrave tout moment lorsde la recommandation

Reprenons maintenant le premier exemple de lintroduction sur les appareils photographiquesen proposant cette fois-ci une solution gracircce aux dieacuterentes meacutetriques expliciteacutees ci-dessus Unutilisateur arrive sur un site de vente en ligne et commence agrave consulter du mateacuteriel photogra-phique Le systegraveme neacutetant pas encore certain du but de lutilisateur ses recommandations sontrelativement diverses Apregraves un certain temps lutilisateur qui a aneacute ses recherches sur desappareils photographiques se voit proposer dautres types dappareils similaires agrave celui quil esten train de consulter dans le but de lui faire deacutecouvrir des alternatives possibles Le systegravemedeacutetecte nalement que lutilisateur est sur le point de se deacutecider Il propose alors une liste derecommandations plus diverses permettant agrave lutilisateur deectuer un dernier tour dhorizongeacuteneacuteral avant lachat et de conrmer son choix [Castagnos et al 2010] Apregraves secirctre deacutecideacute aveclaide du systegraveme lutilisateur achegravete son appareil Lors de ses prochaines connexions sur le sitede vente en ligne le systegraveme de recommandation ne proposera peu ou plus dappareils photo-graphiques Agrave la place lutilisateur se verra recommander du mateacuteriel photographique dont ilpourrait maintenant avoir lutiliteacute comme un eacutetui de protection ou encore dieacuterents objectifsLe systegraveme lui recommandera aussi de nouveaux produits quil na encore jamais consulteacute dansle but de lui faire deacutecouvrir la grande varieacuteteacute des produits vendus par le site comme par exempledu mateacuteriel informatique On peut voir ici linteacuterecirct dinteacutegrer de nouveaux facteurs comme ladiversiteacute dans la recommandation La variation du niveau de diversiteacute au cours du temps et enfonction du contexte permet dans cet exemple dameacuteliorer la qualiteacute de la recommandationnale en sadaptant plus nement aux besoins de lutilisateur et en laidant agrave des moments cleacutescomme juste avant ou apregraves son achat Lajout dun facteur comme la diversiteacute permet de plusdeacuteviter la scleacuterose des recommandations passeacute un certain temps cest-agrave-dire la recommandationdes mecircmes ressources en boucle agrave un utilisateur Ce pheacutenomegravene se produit ineacutevitablement dansun systegraveme baseacute uniquement sur la preacutecision ougrave les ressources recommandeacutees nissent toutes parecirctre deacutejagrave connues de lutilisateur ou trop similaires agrave ses goucircts Ce problegraveme peut en fait ecirctreconsideacutereacute comme du sur-apprentissage dans le sens ougrave le systegraveme est tellement speacutecialiseacute sur lespreacutefeacuterences de lutilisateur que quelques ressources obtiennent un tregraves haut score de preacutecisionet sont recommandeacutees en permanence Lintroduction de nouveaux facteurs permettant dautresmaniegraveres de calculer des recommandations ainsi que des variations dimportance entre ces fac-teurs au cours du temps peuvent reacuteduire ce problegraveme

6

12 Preacuteambule

De cet exemple la premiegravere probleacutematique scientique permettant de reacutepondre agrave la questiongeacuteneacuterale poseacutee agrave la n de lintroduction peut ecirctre deacutenie comme suit

SP1 Quels sont les facteurs agrave prendre en compte pour satisfaire les uti-lisateurs et comment adapter leur importance au cas par cas pour chaqueutilisateur

Comme nous lavons eacutevoqueacute preacuteceacutedemment les systegravemes de recommandation se sont gran-dement deacutemocratiseacutes et existent deacutesormais dans la plupart des domaines ougrave se trouvent denombreuses ressources mises agrave disposition de nombreux utilisateurs et ce quelque soit le typede ces ressources Classiquement un systegraveme de recommandation va calculer par divers moyensles ressources que lutilisateur pourraient le plus appreacutecier Le reacutesultat de cette opeacuteration est biensouvent une valeur reacuteelle dutiliteacute ou dinteacuterecirct comprise dans lintervalle [0 1] associeacutee agrave chaqueressource ougrave 1 correspond agrave la preacutediction selon laquelle lutilisateur devrait tregraves fortement appreacute-cier la ressource en question et inversement Ainsi les n ressources ayant les plus hautes valeurssont recommandeacutees agrave lutilisateur Certains domaines comme le-commerce se satisfont tregraves biende recommandations proposeacutees de cette maniegravere sous forme de listes Cependant dautres do-maines comme le-eacuteducation ou le tourisme beacuteneacutecieraient de recommandations proposeacutees auxutilisateurs sous la forme dune seacutequence Nous deacutenissons ici une seacutequence comme une suiteordonneacutee de ressources posseacutedant un deacutebut une n un but et eacuteventuellement une ou plusieurscontrainte(s) agrave respecter lors de sa creacuteation Cette deacutenition implique entre autres de deacutenir ceque signie la notion dordre dans la seacutequence Un ordre correspond agrave un agencement particulierde ressources permettant datteindre le but rechercheacute de maniegravere optimiseacutee Reprenons main-tenant le deuxiegraveme exemple de lintroduction sur le site de-eacuteducation en ajoutant cette fois-cila notion de seacutequence an dillustrer son inteacuterecirct Un utilisateur sest inscrit reacutecemment sur unsite proposant des cours en ligne car il souhaite apprendre la programmation en Java Cepen-dant et avant de commencer le site lui propose de fournir quelques informations sur son objectifeacuteducatif Ainsi lutilisateur explicite lobjectif quil souhaite atteindre (apprendre les bases deJava) ainsi que le temps dont il dispose (exprimeacute par exemple ici sous la forme dun nombre nde ressources eacuteducatives voulues pour atteindre lobjectif) Avec ces informations le systegraveme derecommandation du site va calculer parmi toutes les ressources eacuteducatives disponibles lesquellescorrespondent aux besoins de lutilisateur Le niveau de diculteacute de ces ressources seacutelectionneacuteesest ensuite calculeacute par le systegraveme gracircce agrave leurs caracteacuteristiques Enn le systegraveme construit uneseacutequence de taille n ougrave la place de chaque ressource eacuteducative deacutepend de son niveau de diculteacutede maniegravere agrave ce que lutilisateur deacutebute avec la ressource la moins complexe puis progresse avecdes ressources abordant des notions de plus en plus avanceacutees La seacutequence creacuteeacutee va donc luipermettre datteindre son objectif gracircce agrave des cours agrave la diculteacute croissante tout en respectantla contrainte de temps imposeacutee

Avec cet exemple nous pouvons maintenant expliciter les deuxiegraveme et troisiegraveme probleacutema-tiques scientiques

SP2 Connaissant les facteurs humains agrave prendre en compte (SP1) com-ment passer dune recommandation unitaire agrave une seacutequence de recomman-dations

7

Chapitre 1 Introduction

SP3 Connaissant les facteurs humains agrave prendre en compte (SP1) com-ment les combiner dans un mecircme modegravele permettant de faire varier leurimportance les uns par rapport aux autres agrave tout moment

Le domaine de la recommandation est en plein essor et mecircme si des problegravemes subsistentencore actuellement des solutions existent pour y reacutepondre comme lont illustreacute les exemples ci-dessus La compreacutehension des besoins des utilisateurs la prise en consideacuteration de la dimensiontemporelle et dobjectifs multiples et parfois antagonistes dans le processus de recommandationsont deacutesormais les objectifs principaux du domaine de la recommandation et cest au sein dece mouvement que cette thegravese sinscrit De plus les nouveaux domaines applicatifs souvrantagrave la recommandation (eg le-eacuteducation le tourisme ) sont agrave la fois une chance et un deacute une chance car il devient possible dassister lutilisateur dans un panel de plus en plus grand desituations un deacute dans le sens ougrave les modegraveles doivent ecirctre assez geacuteneacuteriques pour sadapter agravecette grande varieacuteteacute de situations possibles Une derniegravere probleacutematique scientique est toutefoisneacutecessaire dans le cadre de cette thegravese pour compleacuteter ce tour dhorizon Il est en eet neacutecessairede pouvoir quantier agrave quel point SP1 et SP2 ameacuteliorent la qualiteacute des recommandations Nousavons vu dans les exemples preacuteceacutedents que cette qualiteacute neacutetait pas une notion simple agrave mesurermais il est pourtant neacutecessaire de satteler agrave ce problegraveme pour quantier les performances dunmodegravele La 3egraveme et derniegravere probleacutematique de cette thegravese peut donc ecirctre exprimeacutee ainsi

SP4 Comment eacutevaluer les seacutequences produites en SP2 et SP3

Leacutevaluation des recommandations est au cdivideur des nouveaux deacutes eacutevoqueacutes preacuteceacutedemment Ledomaine de la recommandation est intimement lieacute agrave lecirctre humain et il est important de ne plusuniquement se concentrer sur une seule mesure comme la preacutecision Lecirctre humain est complexedans ses besoins et leacutevaluation des recommandations doit reeacuteter cette complexiteacute

13 Contributions

Dans cette thegravese une reacuteponse agrave eacuteteacute apporteacutee agrave chacune des probleacutematiques scientiques eacutenon-ceacutees ci-dessus Ces contributions scientique ont fait lobjet de trois publications

Workshop international SMAP 5 Walk the line Toward an ecient user model

for recommendations in museums [Osche et al 2016] Confeacuterence internationale ECIR 6 AntRS Recommending lists through a multi-

objective ant colony system [Osche et al 2019a] Workshop international ALA 7 organiseacute avec la confeacuterence internationale AAMAS 8

From Music to Museum Applications of Multi-Objective Ant Colony Sys-

tems to Real World Problems [Osche et al 2019b]

Dans la suite de cette section un aperccedilu plus en deacutetail des reacuteponses apporteacutees aux probleacute-matique scientique est donneacute

5 SMAP International Workshop on Semantic Media Adaptation and Personalization

6 ECIR European Conference on Information Retrieval http ecir2019org7 ALA Adaptive and Learning Agents

8 AAMAS International Conference on Autonomous Agents and Multiagent Systems

8

13 Contributions

131 SP1 les facteurs agrave prendre en compte pour satisfaire les utilisateurs

Pour reacutepondre agrave la premiegravere probleacutematique scientique SP1 nous avons seacutelectionneacute un en-semble de quatre critegraveres deacutevaluation repreacutesentant au mieux les besoins de lutilisateur Cescritegraveres ont eacuteteacute choisis car ils apparaissent dans la litteacuterature scientique comme eacutetant lieacutes agravela satisfaction nale de lutilisateur Ils repreacutesentent un panel inteacuteressant de facteurs humainsimportants pour les utilisateurs mais il est important de noter que ce choix nest pas exhaustifComme nous lavons mentionneacute le nombre de facteurs humains rentrant en compte dans la prisede deacutecision est potentiellement inni et varie en fonction de lutilisateur Nous avons donc choisices quatre critegraveres car ils sont les plus eacutetudieacutes dans la litteacuterature mais le but de cette thegravese estde pouvoir inteacutegrer de nouveaux critegraveres de faire varier leur importance si neacutecessaire et de lestraiter comme un problegraveme doptimisation multi-critegraveres Ces quatre critegraveres nous permettentde nous situer par rapport aux travaux existants de la litteacuterature tout en eacutetablissant un modegravelegeacuteneacuterique capable de sadapter agrave de multiples besoins Voici ces quatre critegraveres

1 La similariteacute garantissant agrave lutilisateur des recommandations similaires aux ressourcesquil appreacutecie deacutejagrave

2 La diversiteacute permettant dorir de la varieacuteteacute dans les recommandations

3 La nouveauteacute proposant agrave lutilisateur des ressources quil ne connaicirct et quil nauraitpeut-ecirctre jamais trouveacute lui-mecircme

4 Les preacutefeacuterences orant agrave lutilisateur la possibiliteacute de revoir les ressources quil a deacutejagraveaimeacute par le passeacute

132 SP2 la conception de seacutequences de recommandations en accord avec

les facteurs seacutelectionneacutes

La notion de seacutequence est centrale pour comprendre son inteacuterecirct dans le paysage actuel dessystegravemes de recommandation ainsi que pour ecirctre capable den geacuteneacuterer Dans ce travail nousavons proposeacute une meacutethode permettant de garantir des transitions optimales entre ressourcesau sein dune seacutequence Nous avons ensuite mis en pratique ces contributions dans un jeu dedonneacutees existant provenant de Deezer un site deacutecoute de musique en ligne Ce jeu de donneacuteescorrespond agrave un mois deacutecoutes de titres par plusieurs milliers dutilisateurs et possegravede desinformations sur les titres ainsi que sur les utilisateurs Gracircce agrave ce jeu de donneacutees nous avonspu extraire des seacutequences deacutecoutes et nous avons utiliseacute ces seacutequences reacuteelles comme eacutevaluationpour notre systegraveme Nous avons enn creacuteeacute un modegravele permettant de geacuteneacuterer des seacutequences de lataille voulue posseacutedant un point de deacutepart et darriveacutee deacutenis

133 SP3 et SP4 la creacuteation dun modegravele geacuteneacuterique prenant en compte

plusieurs meacutetriques et produisant des seacutequences

Apregraves avoir deacuteni les meacutetriques agrave utiliser la maniegravere de les calculer et apregraves avoir deacuteni lanotion de seacutequence et la maniegravere de les construire nous avons deacuteveloppeacute un modegravele reacuteunissantlensemble de ces caracteacuteristiques Pour cela nous nous sommes inspireacutes de solutions deacuteveloppeacuteespendant des millions danneacutees par la seacutelection naturelle pour reacutesoudre des problegravemes dexplora-tion et doptimisation de chemins dans la nature Il existe en eet tout un domaine de recherchedeacutedieacute agrave la modeacutelisation informatique de systegravemes vivants complexes et agrave lapplication de cesmodegraveles agrave des problegravemes complexes humains les Systegravemes Multi-Agents [Ferber and Weiss1999] Nous avons utiliseacute lun de ces systegravemes inspireacute des colonies de fourmis pour reacutepondre agrave

9

Chapitre 1 Introduction

notre probleacutematique [Dorigo et al 1996] [Dorigo et al 2006] Dans la nature il a eacuteteacute observeacute queles fourmis empruntaient la plupart du temps le plus court chemin possible entre leur fourmiliegravereet une source de nourriture Une fourmi prise seacutepareacutement na pas des capaciteacutes cognitives tregravesdeacuteveloppeacutees avec ses quelques centaines de milliers de neurones seulement Cependant linter-action entre toutes les fourmis de la fourmiliegravere produit ce quon appelle un eet deacutemergenceLinteraction danimaux simples (ou dagents si lon parle dun systegraveme informatique) provoqueleacutemergence dune intelligence collective capable de reacutesoudre des problegravemes dont la complexiteacute deacute-passe la somme des capaciteacutes des individus [Bonabeau et al 1999] Cest bien ce pheacutenomegravene quiest agrave ldivideuvre lors de loptimisation de la distance dun chemin par toutes les fourmis dune four-miliegravere Nous reviendrons plus en deacutetail sur lensemble des meacutecanismes permettant leacutemergencede cette intelligence collective dans ce manuscrit An de reacutepondre agrave notre probleacutematique nousavons deacuteveloppeacute un modegravele ougrave une multitude dagents tregraves simples (correspondant aux fourmis)sont deacuteployeacutes dans un graphe ougrave les sommets repreacutesentent les ressources dun domaine applicatifet ougrave les arecirctes repreacutesentent les liens entre ces ressources (correspondant agrave lenvironnement agraveparcourir pour les fourmis) An dinteacutegrer les quatre meacutetriques discuteacutees ci-dessus nous avonscreacuteeacute dieacuterentes colonies posseacutedant chacune leurs agents speacutecialiseacutes dans loptimisation dune desmeacutetriques De par le pheacutenomegravene dintelligence collective les agents produisent des seacutequencesoptimiseacutees dans le graphe pouvant ecirctre recommandeacutees agrave lutilisateur Cette approche apporteainsi des solutions aux problegravemes souleveacutes par les probleacutematiques scientiques sus-mentionneacutes

Nous sommes capables de prendre en compte les dieacuterentes meacutetriques expliciteacutees dans unseul et mecircme modegravele De plus nous produisons des solutions repreacutesentant un compromisentre des objectifs parfois divergents entre eux (similariteacute et diversiteacute)

Dans la nature les fourmis creacuteent un chemin entre leur fourmiliegravere et la source de nourri-ture Nous utilisons cette aptitude inheacuterente an de creacuteer des seacutequences entre une ressourcede deacutepart (la fourmiliegravere) et une ressource darriveacutee (la nourriture)

Ladaptation aux changements de lenvironnement est rapide (nouvel utilisateur nouvelleressource suppression dune ressource etc) De la mecircme maniegravere que dans la nature lesfourmis sont capables de retrouver un autre chemin optimiseacute si le premier venait agrave ecirctrebloqueacute par une branche venant de tomber par exemple

Notre modegravele est souple car il permet de modier le poids de chaque meacutetrique dans laseacutequence nale permettant de sadapter agrave chaque utilisateur

Il est possible dajouter ou denlever des colonies agrave la voleacutee dans le systegraveme permettantde sadapter rapidement agrave dieacuterents domaines applicatifs et agrave dieacuterents objectifs

14 Plan de la thegravese

La suite de ce manuscrit se preacutesente ainsi dans le chapitre 2 nous preacutesenterons les travaux dela litteacuterature portant sur les dieacuterents facteurs humains utiliseacutes dans les systegravemes de recomman-dation les approches existantes de recommandations en seacutequences et les systegravemes multi-agentsDans le chapitre 3 nous preacutesenterons notre modegravele et son fonctionnement en deacutetail Ensuitenous preacutesenterons les reacutesultats obtenus par ce modegravele dans le domaine applicatif de leacutecoute demusique en ligne dans le chapitre 4 Enn nous conclurons et discuterons des perspectives de cetravail dans le chapitre 5

10

Chapitre 2

Eacutetat de lart

Sommaire

21 Les systegravemes de recommandation 12

211 Le ltrage par contenu 12

212 Le ltrage collaboratif 13

213 Les actions des utilisateurs 13

214 Discussion et limites des systegravemes classiques 14

22 Les facteurs humains agrave prendre en compte dans la recommandation 15

221 La similariteacute 17

222 La diversiteacute 19

223 La nouveauteacute 20

224 Discussion 21

23 La recommandation en seacutequence 22

231 Deacutenition et geacuteneacuteraliteacutes sur les seacutequences 22

232 Domaines dapplication des modegraveles seacutequentiels 26

233 Discussion 30

24 Les systegravemes multi-agents 31

241 Deacutenition 31

242 Preacutesentation de deux systegravemes multi-agents reacuteactifs 33

243 Ant Colony System 38

244 Discussion sur le modegravele ACS 40

25 Utilisation et eacutevolution reacutecentes des algorithmes de colonies de four-

mis 43

251 Les algorithmes de colonies de fourmis dans les systegravemes de recomman-

dation 43

252 Les algorithmes de colonies de fourmis multi-objectifs 47

253 Discussion sur lutilisation de loptimum de Pareto 50

26 Discussion geacuteneacuterale 50

11

Chapitre 2 Eacutetat de lart

Dans cet eacutetat de lart nous allons tout dabord nous pencher sur le fonctionnement dessystegravemes de recommandation classiques ainsi que sur leurs limites Nous allons ensuite eacutetudierquelques reacuteponses agrave ces limites proposeacutees par la litteacuterature et discuter des ameacuteliorations possibles

21 Les systegravemes de recommandation

Les systegravemes de recommandation ont pour but principal de proposer aux utilisateurs desressources adapteacutees agrave leurs attentes Une ressource peut ecirctre un document une page web unemusique un lm un livre un objet un cours etc Pour eectuer une recommandation une hy-pothegravese simple a eacuteteacute exploiteacutee par les premiers systegravemes les preacutefeacuterences passeacutees dun utilisateurpeuvent ecirctre utiliseacutees pour preacutedire les preacutefeacuterences futures de ce mecircme utilisateur Cette hypothegravesesest deacuteclineacutee dans les deux approches principales des systegravemes de recommandation que sont leltrage par contenu [Belkin and Croft 1992 Lops et al 2011] et le ltrage collaboratif [Resnicket al 1994] La principale dieacuterence entre ces deux approches repose sur lexploitation de dieacute-rents types des donneacutees le ltrage par contenu utilise les informations descriptives caracteacuterisantles utilisateurs et les ressources du systegraveme tandis que le ltrage collaboratif exploite uniquementles interactions entre utilisateurs et ressources comme les consultations ou les votes [Aggarwalet al 2016] Ces deux familles ont par la suite donneacute naissance a de nombreuses techniquesque nous naborderons pas ici Toutes peuvent cependant ecirctre rapporteacutees agrave lune ou lautre deces familles ou agrave une combinaison des deux Dans la suite de cette section nous reviendronsrapidement sur ces deux familles qui ont marqueacute les deacutebuts des systegravemes de recommandationet qui regroupent agrave elles seules un grand nombre darticles de la litteacuterature du domaine Cetteintroduction aux systegravemes de recommandation servira aussi agrave preacutesenter quelques concepts-cleacuteslieacutes agrave ces systegravemes

211 Le ltrage par contenu

Le ltrage par contenu est une des deux approches majeures dans les systegravemes de recomman-dation [Belkin and Croft 1992 Lops et al 2011] Le but dun systegraveme de ltrage par contenu estde proposer des recommandations agrave lutilisateur uniquement en fonction des caracteacuteristiques desressources appreacutecieacutees Ce genre de systegraveme va donc enregistrer les actions de lutilisateur sur lesressources quil a consulteacutees dans le but de trouver dautres ressources quil pourrait appreacutecierCette meacutethode de fonctionnement implique deux principes

1 Le systegraveme doit pouvoir enregistrer les actions de lutilisateur dans le systegraveme 9 Le sys-tegraveme doit ensuite pouvoir interpreacuteter ces dieacuterentes actions an decirctre capable deacutevalueragrave quel point un utilisateur appreacutecie la ressource sur laquelle il a eectueacute des actions Nousdiscuterons de ces actions et des maniegraveres de les interpreacuteter plus en deacutetail dans la suitede cette section

2 Le systegraveme doit pouvoir comparer des ressources entre elles an de deacuteterminer lesquellespourraient ecirctre appreacutecieacutees par lutilisateur en fonction de son historique de consultationsPour reacutealiser cela il est neacutecessaire que les ressources soient deacutecrites par ce que lon appelledes meacuteta-donneacutees cest-agrave-dire des donneacutees deacutecrivant dautres donneacutees ou comme ici desdonneacutees deacutecrivant des ressources Il est dusage de deacutenir ou dutiliser des standards pour

9 Des exemples dactions possibles consulter une ressource donner une note agrave une ressource acheter uneressource bannir une ressource pour ne plus la voir placer une ressource dans ses favoris etc

12

21 Les systegravemes de recommandation

les meacuteta-donneacutees an de deacutecrire toutes les ressources de la mecircme maniegravere et eacuteventuelle-ment de pouvoir partager ou utiliser des bases de donneacutees utilisant les mecircmes standardsOn peut par exemple citer le Learning Object Metadata qui est un standard utiliseacute ene-eacuteducation pour deacutecrire des ressources eacuteducatives [RISK 2002] Des domaines commele web seacutemantique ou les systegravemes agrave base dontologie ont comme but de structurer cesdonneacutees descriptives lorsquelles ne le sont initialement pas

Le ltrage par contenu a lavantage de pouvoir fournir des recommandations agrave un utilisateurmecircme sil est le seul agrave utiliser le systegraveme tant que ce dernier possegravede des informations sur lesressources consulteacutees Cependant la qualiteacute des recommandations deacutependra directement de laqualiteacute de ces informations Si les actions de lutilisateur ou les descriptions de ressources sontinsusantes un systegraveme de ltrage par contenu ne sera pas capable de proposer de recommanda-tions de grande qualiteacute Une autre limite majeure de ce genre de systegraveme reacuteside dans le manquede nouveauteacute En eet apregraves un certain temps les recommandations proposeacutees par le systegravemeont un risque de scleacuterose provoqueacute par un manque de nouvelles informations dans le systegraveme

212 Le ltrage collaboratif

La deuxiegraveme approche majeure des systegravemes de recommandation est donc le ltrage colla-boratif [Resnick et al 1994] Cette technique utilise les preacutefeacuterences des autres utilisateurs dusystegraveme sur les ressources pour estimer les preacutefeacuterences de lutilisateur Lhypothegravese sous-jacentea cette meacutethode est quil est possible de preacutedire les preacutefeacuterences dun utilisateur en eacutetudiant ce quedautres utilisateurs similaires en termes de preacutefeacuterences ont aimeacute Si beaucoup de ces utilisateurssimilaires ont appreacutecieacute une ressource alors il est probable que lutilisateur appreacutecie aussi cetteressource Cette meacutethode repose ici aussi sur deux principes

1 Comme pour le ltrage par contenu il faut dabord pouvoir collecter les actions de nom-breux utilisateurs sur les ressources du systegraveme an den deacuteterminer leurs preacutefeacuterences

2 Le systegraveme doit ensuite deacuteterminer les utilisateurs les plus similaires agrave lutilisateur enterme de preacutefeacuterences avec pour but nal de lui recommander des ressources quil na pasencore consulteacute et qui sont appreacutecieacutees par ces utilisateurs similaires

Le ltrage collaboratif permet par rapport au ltrage par contenu de proposer des recom-mandations agrave lutilisateur sans forceacutement connaicirctre le contenu des ressources recommandeacutees Eneet le systegraveme ne manipule que des preacutefeacuterences geacuteneacuterales souvent repreacutesenteacutees numeacuteriquementpar une note associeacutee agrave une ressource et agrave un utilisateur En dautres termes le ltrage col-laboratif sinteacuteresse agrave lusage qui est fait des ressources et non aux ressources en elles-mecircmesUne fois ces preacutefeacuterences eacutetablies ce genre de systegraveme peut donc sadapter agrave des domaines ougraveles ressources sont dieacuterentes Cependant il est aussi neacutecessaire davoir agrave disposition un grandnombre dutilisateurs ainsi que leurs preacutefeacuterences an de pouvoir utiliser ce genre de systegravemecorrectement

213 Les actions des utilisateurs

Comme nous lavons deacutecrit plus haut peu importe le type de systegraveme de recommandationutiliseacute il est neacutecessaire de reacutecolter les actions des utilisateurs an dobtenir une eacutevaluation desressources quils ont consulteacutees Cette eacutevaluation prend la plupart du temps la forme dune noter entiegravere variant de 1 agrave 5 ou dune valeur continue r isin [0 1] ougrave dans les deux cas une preacutefeacuterence

13

Chapitre 2 Eacutetat de lart

marqueacutee correspond agrave une valeur haute et inversement Dune maniegravere geacuteneacuterale on nommeretours les informations reacutecupeacutereacutees par un systegraveme sur un utilisateur permettant daboutir agravecette note Dans les systegravemes de recommandation on peut distinguer deux types de retours le retour explicite et le retour implicite Le retour explicite est le plus simple des deux puisquilcorrespond agrave la situation ougrave lutilisateur fournit naturellement de lui-mecircme la note associeacutee agrave uneressource quil a consulteacutee Cette maniegravere de proceacuteder est courante dans le-commerce ou dansle divertissement ougrave les utilisateurs peuvent geacuteneacuteralement noter de 1 agrave 5 le produit quils ontacheteacute ou encore le lm quils ont vu Cette meacutethode permet dacceacuteder agrave leacutevaluation reacuteelle delutilisateur et agrave ses preacutefeacuterences orant de maniegravere directe des donneacutees de haute qualiteacute [Korenet al 2009] Agrave linverse le retour implicite repreacutesente les traces laisseacutees par lutilisateur lors desa preacutesence dans le systegraveme Ces traces ne sont pas directement des eacutevaluations ou des notes maisrepreacutesentent bien les dieacuterentes possibiliteacutes dactions quore un systegraveme agrave ses utilisateurs Cesactions diegraverent donc selon le domaine dapplication du systegraveme Pour un site web de-commerceles actions pourront ecirctre la consultation dune page la consultation dune che produit la misedun produit dans le panier ou encore lachat dun produit Pour un site web deacutecoute de musiqueles actions pourront ecirctre leacutecoute dune musique en entier larrecirct de leacutecoute dune musique avantla n la consultation de la page dun artiste etc On voit bien ici que les actions possiblessont deacutependantes du domaine mais aussi que toutes les actions nont pas la mecircme importanceni la mecircme signication On peut en eet supposer quun utilisateur appreacuteciera davantage unproduit sil lachegravete que sil consulte seulement sa page On retrouve cette distinction dans [Oardet al 1998] ougrave les auteurs deacutenissent trois cateacutegories permettant de grouper les actions de mecircmeimportance ensemble (1 consultation de la ressource 2 conservation de la ressource 3 partagede la ressource) On peut aussi citer [Castagnos 2008] qui dune maniegravere plus geacuteneacuterale proposeune meacutethode permettant de calculer linteacuterecirct preacutesumeacute dun utilisateur pour une ressource selonles types dactions eectueacutees par lutilisateur et leurs importances respectives An de conclurecette section il est important de preacuteciser que mecircme si le retour explicite semble plus deacutesirablepour les systegravemes de recommandation il a eacuteteacute montreacute que ces deux types de retours apportentdes informations dieacuterentes et quil peut justement ecirctre inteacuteressant de les prendre tous les deuxen compte [Jawaheer et al 2010]

214 Discussion et limites des systegravemes classiques

Dans les deux approches de recommandation preacutesenteacutees ci-dessus le problegraveme et la solutionsont fondamentalement les mecircmes Le problegraveme peut se formuler ainsi comment estimer linteacuterecirctr qua un utilisateur u sur une ressource i encore non consulteacutee en se basant sur les connaissancesincomplegravetes repreacutesenteacutees par le prol de lutilisateur u Le prol de lutilisateur est incompletcar les informations sur ses preacutefeacuterences proviennent uniquement des interactions que ce dernier aeu avec le systegraveme Autrement dit il nest pas possible de connaicirctre les facteurs ayant abouti auxactions de lutilisateur puisque ces derniegraveres sont le fruit des meacutecanismes de raisonnement internede lutilisateur Il nest par exemple pas possible de savoir reacuteellement pourquoi un utilisateur adonneacute la note de 5 sur 5 agrave un lm Est-ce parce quil considegravere que cest le meilleur lm quil a vude sa vie et quil aimerait deacutecouvrir plus de lms de ce genre Ou bien est-ce parce que cest unlm quil a vu dans un contexte particulier et que mecircme sil la beaucoup aimeacute il ne souhaiteraitpas revoir des lms similaires aujourdhui Il existe ainsi probablement une multitude de facteursjouant dans les actions que nous eectuons et il nest pas possible de tous les appreacutehender Devantce constat la solution adopteacutee par les deux approches est la mecircme se baser sur les preacutefeacuterencesconnues de lutilisateur pour extrapoler ses preacutefeacuterences futures potentielles Cependant et commenous lavons vu dans lexemple de lintroduction sur les appareils photo il est aiseacute de concevoir

14

22 Les facteurs humains agrave prendre en compte dans la recommandation

des situations ougrave les preacutefeacuterences et actions passeacutees dun utilisateur ne sont pas forceacutement lesmeilleurs indicateurs de ses besoins actuels ou futurs

22 Les facteurs humains agrave prendre en compte dans la recom-

mandation

Comme nous lavons vu dans la section preacuteceacutedente la performance des premiers systegravemes derecommandation a eacuteteacute mesureacutee avec les outils du domaine de la recherche dinformation Parmiceux-ci on peut citer la preacutecision et le rappel qui sont deux mesures permettant de jauger la per-tinence des ressources seacutelectionneacutees en les comparant avec lensemble des ressources disponiblesLa Figure 21 preacutesente bien la maniegravere dont ces deux mesures sont calculeacutees 10

Figure 21 Preacutesentation scheacutematiseacutee du calcul de la preacutecision et du rappel en fonction desressources trouveacutees par rapport agrave lensemble des ressources disponibles (creacutedit image Datamok UserWalber)

Plusieurs raisons peuvent expliquer pourquoi les systegravemes de recommandations ont initiale-ment emprunteacute des techniques venant de la recherche dinformation et en voici trois parmi lesplus eacutevidentes Premiegraverement les systegravemes de recommandation sont agrave la croiseacutee de plusieurs

10 httpsfrwikipediaorgwikiPreacutecision_et_rappel

15

Chapitre 2 Eacutetat de lart

disciplines parmi lesquelles entre autres la recherche dinformation [Adomavicius and Tuzhilin2005] Ce domaine a beaucoup utiliseacute et utilise toujours les mesures de preacutecision et de rappel[Salton 1989] il est donc naturel que les premiers systegravemes de recommandation aient utiliseacuteces mesures de performance Deuxiegravemement tregraves tocirct dans le domaine des systegravemes de recom-mandation des corpus de donneacutees ont eacuteteacute mis agrave disposition de tous tel que MovieLens 11 gracircceagrave GroupLens [Resnick et al 1994] Ces corpus de donneacutees ont beaucoup aideacute le domaine enpermettant agrave tous les chercheurs de mesurer la performance de leurs algorithmes en les com-parant avec les reacutesultats obtenus par dautres eacutetudes de la litteacuterature sur les mecircmes donneacuteesLa populariteacute toujours haute du corpus MovieLens depuis maintenant 25 ans illustre linteacuterecirctscientique de partager des donneacutees initiales Cependant lutilisation principale des meacutetriquesde preacutecision pour eacutevaluer la performance des premiers systegravemes de recommandation a meacutecani-quement pousseacute les autres auteurs voulant comparer leurs algorithmes agrave utiliser eux aussi cesmecircmes meacutetriques rareacuteant potentiellement le travail sur dautres meacutetriques Troisiegravemement lemesure de la performance des algorithmes en fonction de la preacutecision megravene forceacutement agrave la creacutea-tion dalgorithmes de plus en plus performants dans ce domaine Les chercheurs sont en eet plusenclins agrave deacutevelopper des algorithmes optimisant la mesure de preacutecision si la performance de lamajoriteacute des algorithmes existants est mesureacutee via cette meacutetrique Ce point mecircme sil est lieacute aupreacuteceacutedent nest pas agrave neacutegliger et explique en partie la concentration des premiers systegravemes surla meacutetrique de preacutecision La recherche dans le domaine de linformatique est compeacutetitive et lesrevues scientiques accepteront plus facilement de publier un article montrant quun algorithmeobtient de meilleures performances sur une meacutetrique bien connue plutocirct quune eacutetude reposantsur dautres meacutetriques moins communes

Apregraves ces explications donnant quelques raisons systeacutemiques de lutilisation de la preacutecisioncomme mesure deacutevaluation il est neacutecessaire de nuancer ce constat La preacutecision a beaucoup eacuteteacuteutiliseacutee car avant toute chose elle est au cdivideur des systegravemes de recommandation et doit doncecirctre consideacutereacutee par tous ces systegravemes Le but de lutilisation de la preacutecision est dobtenir desrecommandations proches de ce que lutilisateur a deacutejagrave consulteacute et donc appreacutecie deacutejagrave Il est im-portant de preacuteciser aussi ici que malgreacute les critiques faites dans le paragraphe preacuteceacutedent sur cettemesure il est indispensable de la conserver et de lutiliser lors du processus de recommandationUn utilisateur souhaite avant tout se voir proposer des ressources pertinentes et il convient pourun systegraveme dutiliser la preacutecision pour arriver agrave cet objectif Il est cependant neacutecessaire de ne pasuniquement consideacuterer la preacutecision pour produire de bonnes recommandations et nous allons levoir dans la suite de cette section

Nous venons de voir quelques-unes des raisons de lomnipreacutesence de leacutevaluation par la preacuteci-sion au deacutebut des systegravemes de recommandation Nous allons maintenant eacutetudier les conseacutequencesque la sur-utilisation de la preacutecision a pu avoir sur les utilisateurs en se basant agrave la fois sur lalitteacuterature et sur des constatations empiriques Pour comprendre les limites de cette meacutetrique ilest tout dabord neacutecessaire de sinteacuteresser agrave ce que repreacutesente une recommandation preacutecise pourlutilisateur nal Nous lavons vu preacuteceacutedemment plus un modegravele sapproche des preacutefeacuterences deacutejagraveconnues dun utilisateur et plus il obtiendra de bonnes performances dans les meacutetriques mesurantla preacutecision Dans la pratique cela se traduit par le systegraveme proposant agrave lutilisateur nal desressources souvent deacutejagrave connues de celui-ci ou a minima des ressources tregraves proches de ce quilaime deacutejagrave [McNee et al 2006] Un utilisateur dun site de recommandation de lms indiquantquil a aimeacute le premier lm Star Wars se verra probablement recommander une liste de tous les

11 httpsgrouplensorgdatasetsmovielens

16

22 Les facteurs humains agrave prendre en compte dans la recommandation

lms Star Wars suivants Intuitivement on voit bien que ces recommandations ne seront proba-blement pas satisfaisantes pour lutilisateur bien queacutetant les plus preacutecises possibles par rapportagrave ses preacutefeacuterences Ces lms sont anciens connus et il ny a donc que tregraves peu de chances pour quelutilisateur nen ait pas deacutejagrave connaissance On peut imaginer que lutilisateur aurait souhaiteacuteque le systegraveme lui propose des lms de science-ction ou de guerre spatiale reacutecents ou du moinsquil ne connaissait pas encore Plus que de ne pas ecirctre utiles ce genre de recommandations peutmecircme deacutegrader linteacuterecirct et la conance que lutilisateur porte au systegraveme En eet un utilisa-teur recevant beaucoup de recommandations inutiles ou deacutejagrave connues de la part dun systegravemenira par ne plus lui accorder de limportance Cet argument peut ecirctre rapprocheacute du TechnologyAcceptance Model de Fred Davis sur la maniegravere dont les utilisateurs appreacutehendent une technolo-gie [Davis 1989] et notamment sur la notion dutiliteacute perccedilue qui fait reacutefeacuterence agrave la tendancequont les personnes agrave utiliser une technologie si cela leur permet de reacutealiser plus ecacementleur tacircche en cours (comme par exemple trouver un bon lm ou deacutecouvrir une nouvelle musique)Pour conclure il semble eacutevident que de nouvelles maniegraveres de concevoir et deacutevaluer les systegravemesde recommandation sont neacutecessaires Dans la suite de cette section nous allons voir commentlinteacutegration de facteurs humains suppleacutementaires dans le processus de recommandation et lamise en place de nouvelles maniegraveres deacutevaluer la qualiteacute des recommandations nales doiventpermettre de palier les problegravemes eacutevoqueacutes preacuteceacutedemment

221 La similariteacute

Comme nous lavons vu dans la section preacuteceacutedente limportance de la similariteacute dans lessystegravemes de recommandation est eacutevidente tant ces derniers ont longtemps eu comme but principalde proposer des ressources proches autrement dit similaires de ce quappreacuteciait deacutejagrave lutilisateurNous avons vu que la preacutecision a beaucoup eacuteteacute utiliseacutee pour eacutevaluer ces systegravemes mais il eacutetaitaussi neacutecessaire de deacuteterminer agrave quel point des ressources etou des utilisateurs eacutetaient prochesles uns des autres En eet les approches les plus utiliseacutees comme le ltrage collaboratif ou leltrage par contenu neacutecessitent souvent de deacuteterminer un ensemble dutilisateurs ou un ensemblede ressources proches des goucircts de lutilisateur Pour ce faire ces systegravemes vont utiliser desmeacutetriques permettant de juger la similariteacute de deux variables entre elles On retrouve parmi cesmeacutetriques le coecient de correacutelation de Pearson qui calcule la correacutelation lineacuteaire r entre deuxvariables agrave laide de leur covariance Cette correacutelation peut ecirctre appliqueacutee agrave des prols utilisateurs[Shardanand and Maes 1995] posseacutedant des eacutevaluations communes sur des ressources LEacutequation21 deacutecrit son calcul pour deux prols utilisateurs ux et uy

ruxuy =

sumn1 (uxi minus ux)times (uyi minus uy)radicsumn

1 (uxi minus ux)2 timessumn

1 (uyi minus uy)2(21)

ougrave n est le nombre de co-consultations des deux prols utilisateurs ux et uy uxi est une noteindividuelle du prol de lutilisateur ux et ux est la moyenne des notes dans le prol ux Classi-quement les eacutevaluations des ressources co-consulteacutees sont consideacutereacutees pour calculer la correacutelationde Pearson dont la valeur r isin [minus1 1] ougrave une valeur proche de 1 signie une correacutelation posi-tive entre les utilisateurs (autrement dit une forte similariteacute entre les deux) minus1 une correacutelationneacutegative (autrement dit une forte dissimilariteacute entre les deux utilisateurs) et 0 une absence decorreacutelation lineacuteaire entre les deux prols 12

12 Une valeur de correacutelation de Pearson r = 0 signie uniquement une absence de correacutelation lineacuteaire entre lesdeux variables eacutetudieacutees Il est cependant possible quune correacutelation non lineacuteaire existe entre ces deux variables

17

Chapitre 2 Eacutetat de lart

On peut aussi citer la tregraves utiliseacutee similariteacute cosinus permettant de calculer langle formeacute pardeux vecteurs Cette ideacutee a dabord eacuteteacute proposeacutee dans le domaine de la recherche dinformationan de comparer deux documents repreacutesenteacutes sous forme de vecteurs doccurrences de mots[Salton and McGill 1986] Cette mesure a ensuite eacuteteacute adapteacutee pour le ltrage collaboratif enremplacant les documents par les utilisateurs les mots par les ressources et les occurrences parles votes [Breese et al 2013] 13 Le calcul de la similariteacute cosinus est preacutesenteacute dans lEacutequation22

Cosine_Similarity(u1 u2) =

sumu1u2radicsumu21radicsum

u22(22)

ougrave comme pour le coecient de correacutelation de Pearson on considegravere uniquement les eacuteva-luations des ressources co-consulteacutees par les deux utilisateurs dans le calcul Beaucoup dautresmesures de similariteacute existent dans le cadre de la comparaison de deux variables entre elles etchacune possegravede des avantages et des inconveacutenients Lensemble de ces mesures ont cependantpour point commun de mesurer la similariteacute entre deux ressources uniquement et on peut tou-tefois apporter quelques critiques agrave ce genre de mesures En eet [McNee et al 2006] critiquejustement le fait que les mesures classiques calculent geacuteneacuteralement la preacutecision de chaque res-source recommandeacutee une par une Cependant limmense majoriteacute des recommandations sontproposeacutees via des listes agrave lutilisateur et non via une seule ressource On peut le voir chez tousles grands sites utilisant un systegraveme de recommandation tels que Netix 14 Youtube 15 Ama-zon 16 Deezer etc Cette maniegravere de calculer la preacutecision ressource par ressource peut provoquerleacutemergence de listes de recommandations posseacutedant des ressources toutes similaires entre ellesLe site de recommandation de lms proposant agrave un utilisateur la liste de tous les lms Star Warssoure de ce problegraveme Toutes ces recommandations sont preacutecises et similaires par rapport auxpreacutefeacuterences de lutilisateur mais les meacutetriques classiques ne donnent aucune indication sur ledegreacute de similariteacute de ces recommandations entre elles dans la liste proposeacutee agrave lutilisateur Unemaniegravere de mitiger ce problegraveme est de calculer la similariteacute non plus ressource par ressourcemais pour la liste entiegravere La similariteacute intra-liste permet justement de calculer agrave quel point lesressources dune liste sont similaires entre elles [Ziegler et al 2005] La similariteacute de chaque pairede ressources est calculeacutee et la moyenne est ensuite calculeacutee pour obtenir agrave une valeur uniquemesurant agrave quel point la liste dans son ensemble possegravede des ressources similaires entre elles

ILS(u) =

sumijisinL

sumikisinLij 6=ik sim(ij ik)

2(23)

ougrave ILSu est la similariteacute intra-liste dun utilisateur u ij et ik sont deux ressources de laliste recommandeacutee L et sim(ij ik) est la similariteacute des deux items ij et ik similariteacute pouvantecirctre calculeacutee dieacuteremment selon la meacutethode utiliseacutee (similariteacute cosinus similariteacute de Jaccardetc) Cette maniegravere de proceacuteder est inteacuteressante car premiegraverement elle deacutenote avec les mesuresclassiques et permet de proposer une liste plus homogegravene plaisante pour lutilisateur et nonplus uniquement sur les performances pures des systegravemes Deuxiegravemement le fait de consideacutererla liste de recommandations comme un tout et non plus uniquement comme des ressourcesaligneacutees les unes agrave la suite des autres permet de se rapprocher de la notion de seacutequence dontnous allons parler dans la suite de cette section Enn larticle de [McNee et al 2006] dont

13 Il est agrave noter quune variante de la mesure de similariteacute cosine sappliquant aux ressources et non auxutilisateurs a aussi eacuteteacute deacuteveloppeacutee14 httpswwwnetixcom15 httpswwwyoutubecom16 httpswwwamazoncom

18

22 Les facteurs humains agrave prendre en compte dans la recommandation

est tireacutee cette reacuteexion marque un tournant dans le domaine des systegravemes de recommandationavec la critique de la sur-utilisation de la similariteacute et linteacutegration dautres facteurs humainsToutefois dans le contexte de cette thegravese ce constat doit ecirctre nuanceacute En eet la similariteacute a eacuteteacutela meacutetrique reine pendant plusieurs anneacutees dans le domaine de la recommandation pour mesurerla performance des modegraveles Cette omnipreacutesence a provoqueacute lessor dun nouveau pan de larecherche portant sur dautres facteurs humains et dautres meacutetriques deacutevaluation Neacuteanmoinsla similariteacute reste une meacutetrique centrale dans la mesure des performances dun algorithme etdans la qualiteacute perccedilue des recommandations des utilisateurs comme lont montreacute les multitudesdeacutetudes utilisant principalement cette meacutetrique Il est donc naturel que cette meacutetrique soitinteacutegreacute dans notre modegravele comme un objectif Notre approche se veut cependant multi-objectifset nous allons preacutesenter dans la suite de cette section les autres objectifs agrave consideacuterer

222 La diversiteacute

La diversiteacute est une des meacutetriques ayant attireacute le plus lattention de la communauteacute scien-tique des recommandations ces derniegraveres anneacutees La diversiteacute est au cdivideur du changement deparadigme du domaine et larticle de McNee amp al justement intituleacute Being accurate is not en-ough how accuracy metrics have hurt recommender systems 17 repreacutesente bien ce changement[McNee et al 2006] Dans cet article les auteurs expliquent que jusqualors la majoriteacute desrecherches seacutetaient eacutetroitement concentreacutees sur lameacutelioration de la preacutecision des systegravemes Ilssoutiennent cependant que cet eacutetat de fait a nui au domaine en nencourageant pas les recherchesallant dans dautres directions et a aussi nui aux utilisateurs car les recommandations les pluspreacutecises ne sont pas forceacutement les meilleures pour ces derniers Mecircme si ce constat a eacuteteacute fait il y aplus dune deacutecennie la preacutecision est toujours tregraves utiliseacutee dans le domaine des recommandationsPar conseacutequent il nest pas rare de trouver des eacutetudes tregraves reacutecentes se deacutemarquant encore enprocircnant lutilisation dautres mesures [Gan et al 2020]

La diversiteacute et la similariteacute sont deux mesures extrecircmement lieacutees et ont souvent eacuteteacute deacutecritesensemble La similariteacute intra-liste preacutesenteacutee dans la section preacuteceacutedente est un exemple de ce lienpuisque cette mesure permet de faire varier le taux de similariteacute ou inversement de diversiteacutedune liste de ressources Dans [Smyth and McClave 2001] les auteurs soutiennent lideacutee quelorsque plusieurs ressources sont proposeacutees il est important de mesurer agrave la fois la similariteacutede chacune de ces ressources par rapport agrave la cible (pouvant ecirctre par exemple un modegraveleutilisateur) mais aussi la diversiteacute de chacune de ces ressources entre elles Le deacute revient alorsagrave ameacuteliorer la diversiteacute des ressources entre elles sans compromettre leur similariteacute par rapport agravela cible Les auteurs deacutenissent ainsi la diversiteacute dun ensemble de ressources (i1 in) commela dissimilariteacute moyenne entre toutes les paires de ressources illustreacute dans lEacutequation 24 ougrave ladissimilariteacute est deacutenie comme eacutetant linverse de la similariteacute

Diversity(i1 in) =

sumi=1n

sumj=1n(1minus Similarity(ii ij))

n2 lowast (nminus 1)

(24)

Il existe plusieurs interpreacutetations et deacutenitions de la diversiteacute dans les systegravemes de recom-mandation mais nous nutiliserons ici que la plus reacutepandue vue ci-dessus la diversiteacute sappliqueagrave un ensemble de ressources et correspond agrave la mesure moyenne de la dissimilariteacute par rapportagrave chacune dentre elles Pour compleacutementer cette deacutenition qui permet dintroduire une valeurgeacuteneacuterale de diversiteacute pour une liste de ressources nous pouvons preacutesenter ici la notion de diversiteacute

17 Ecirctre preacutecis nest pas susant comment les mesures de preacutecision ont nui aux systegravemes de recommandation

19

Chapitre 2 Eacutetat de lart

relative RD 18 qui consiste agrave calculer lapport en diversiteacute de chaque ressource i agrave un ensemblede ressources C 19 [Smyth and McClave 2001] La RD permet dobserver les changements dansla diversiteacute de la liste au moment mecircme de sa construction agrave chaque fois que le systegraveme ajouteune nouvelle ressource agrave la liste deacutejagrave existante La maniegravere de la calculer est expliqueacutee danslEacutequation 25

RD(i C) =

0 si C = sum

i=1m(1minus Similarity(i cj))

m sinon

(25)

La diversiteacute est aujourdhui reconnue comme une mesure importante agrave prendre en comptedans les systegravemes de recommandation car permettant dameacuteliorer la satisfaction de lutilisateur[Jones 2010] Cependant il est important de savoir utiliser la diversiteacute agrave bon escient et au bonmoment Comme lexemple donneacute dans lintroduction agrave propos des appareils photos le montraitlinteacuterecirct de la diversiteacute dans la recommandation deacutepend de nombreux facteurs comme lutilisa-teur son ancienneteacute dans le systegraveme le contexte de sa visite le moment de la recommandationetc Certains travaux se sont ainsi concentreacutes sur la dimension temporelle de la diversiteacute et surlimpact que cette derniegravere avait selon le contexte de la recommandation On peut citer [Mc-Ginty and Smyth 2003] dont leurs travaux portent sur le rocircle de la diversiteacute dans les systegravemesde recommandation conversationnels 20 et sur linteacuterecirct dapporter de la diversiteacute dans ce genrede systegravemes Les auteurs ont ainsi montreacute que lajout de diversiteacute durant le processus de re-commandation eacutetait beacuteneacuteque pour lutilisateur Cependant ils ont aussi montreacute que mecircme silinteacuterecirct de la diversiteacute est indeacuteniable il nest pas forceacutement justieacute dintroduire de la diversiteacuteagrave chaque recommandation sous peine de nuire agrave lecaciteacute du systegraveme [Castagnos et al 2013]De la mecircme maniegravere on peut rappeler les travaux de [Castagnos et al 2010] prouvant quilest beacuteneacuteque pour lutilisateur de se voir proposer des recommandations diverses juste avant unachat sur un site de-commerce

223 La nouveauteacute

La nouveauteacute est un facteur humain qui sous la mecircme impulsion que la diversiteacute est ap-parue comme une reacuteponse possible au problegraveme de la sur-utilisation de la preacutecision Mecircme siles deux mesures de diversiteacute et de nouveauteacute sont lieacutees il convient de ne pas les confondreLa nouveauteacute dune ressource se deacutenit geacuteneacuteralement par rapport aux autres ressources deacutejagraveconsulteacutees par lutilisateur La notion de diversiteacute sapplique quant agrave elle agrave un ensemble deressources en deacuteterminant si elles sont diverses les unes par rapport aux autres [Castells et al2015] La nouveauteacute reacutepond de plus agrave un besoin bien speacutecique de lutilisateur En eet etcomme lexpliquent [Vargas and Castells 2011] dans la majoriteacute des sceacutenarios le but dune re-commandation est de faire deacutecouvrir agrave lutilisateur des ressources quil naurait pas deacutecouvertesautrement Les auteurs preacutecisent aussi que la nouveauteacute est une caracteacuteristique importante dansun systegraveme de recommandation car elle contribue agrave diminuer la preacutevisibiliteacute des recommanda-tions et donc agrave maintenir linteacuterecirct des utilisateurs pour le systegraveme En partant de ce principeles recommandations eacutevidentes ne sont pas forceacutement de grande utiliteacute mecircme si elles possegravedentun haut niveau de preacutecision avec les preacutefeacuterences de lutilisateur On peut illustrer ce point en

18 RD pour Relative Diversity19 C pour Class soit classeensemble de ressources20 Un systegraveme de recommandation conversationnel consiste en un systegraveme interactif qui va dialoguer avec

lutilisateur sous la forme deacutechange de propositions et de critiques de ces propositions par ce dernier [Mahmoodand Ricci 2009]

20

22 Les facteurs humains agrave prendre en compte dans la recommandation

citant le classique exemple du fan de musique rock qui apregraves avoir eacutecouteacute quelques musiquesde lalbum Dark Side of the Moon de Pink Floyd se voit recommander le reste des musiquesde lalbum En terme de preacutecision la recommandation est quasi parfaite mais lutiliteacute dunetelle recommandation peut laisser agrave deacutesirer On retrouve le mecircme constat chez [Zhang 2013] ougravelomnipreacutesence de la preacutecision et de ses mesures y est critiqueacutee Les auteurs proposent ainsi unedeacutenition de la nouveauteacute en deacutenissant les trois caracteacuteristiques quune ressource doit posseacutederpour ecirctre consideacutereacutee comme nouvelle pour un utilisateur

1 Inconnue la ressource doit ecirctre inconnue de lutilisateur

2 Satisfaisante la ressource doit ecirctre satisfaisante par rapport aux besoins de lutilisateur

3 Dissimilaire la ressource doit ecirctre dissimilaire aux autres ressources que lutilisateur ap-preacutecie

En utilisant les 3 caracteacuteristiques eacutenonceacutees ci-dessus les auteurs ont ensuite proposeacute deacutevaluerla nouveauteacute dune ressource i pour un utilisateur u comme preacutesenteacute dans lEacutequation 34

Novelty(i u) = p(i|unknown u) middot dis(i prefu) middot p(i|like u) (26)

ougrave p(i|unknown u) est la probabiliteacute que lutilisateur u ne connaisse pas la ressource idis(i prefu) est la dissimilariteacute entre i et lensemble des ressources consulteacutees par lutilisateur etp(i|like u) est la probabiliteacute que u appreacutecie i On retrouve ainsi dans cette maniegravere de mesurerla nouveauteacute les 3 caracteacuteristiques mises en avant par [Zhang 2013] pour que le score de nou-veauteacute dune ressource soit haut elle doit ecirctre pour lutilisateur agrave la fois inconnue satisfaisanteet dissimilaire avec ce quil a lhabitude de voir

De reacutecentes eacutetudes ont exploreacute plus avant le lien entre nouveauteacute et satisfaction de lutilisateurNous pouvons citer ici [Schnabel et al 2018] ougrave les auteurs ont testeacute limpact de nouvellesrecommandations par rapport agrave lexploitation des preacutefeacuterences deacutejagrave connues des utilisateurs Ilsen concluent quune petite dose de nouveauteacute permet dameacuteliorer la satisfaction de lutilisateurmais que trop de ressources nouvelles nuisent fortement agrave sa satisfaction

224 Discussion

Au travers de ces quelques exemples un changement de vision dans le domaine de la re-commandation a eacuteteacute illustreacute Dun domaine ougrave la majeure partie des eacutetudes eacutetait initialementconcentreacutee sur la maximisation dune seule meacutetrique la preacutecision [Ricci et al 2015] nous avonsvu que de plus en plus de travaux sinteacuteressaient agrave dautres maniegraveres de proposer des recomman-dations Ainsi on peut deacutesormais trouver pleacutethore deacutetudes tentant de trouver des compromisentre plusieurs des facteurs discuteacutes ci-dessus comme la preacutecision et la diversiteacute [Ziegler et al2005 LHuillier et al 2014] ou encore entre la preacutecision la seacuterendipiteacute 21 et la nouveauteacute [Ka-minskas and Bridge 2016] Ces nouvelles maniegraveres de proceacuteder ont pour but didentier lesfacteurs explicatifs de la satisfaction des utilisateurs an de les prendre en compte dans des mo-degraveles plus complexes et plus geacuteneacuteraux

Il est cependant important de noter que outre ceux citeacutes dans les sections preacuteceacutedentes denombreux autres facteurs humains ont eacuteteacute eacutetudieacutes dans la litteacuterature pour reacutepondre au problegraveme

21 La notion de seacuterendipiteacute fait reacutefeacuterence agrave lheureuse deacutecouverte soit le fait de deacutecouvrir par hasard quelquechose dinteacuteressant qui naurait potentiellement pas eacuteteacute deacutecouvert sans aide [Iaquinta et al 2008]

21

Chapitre 2 Eacutetat de lart

de la satisfaction utilisateur et de la sur-utilisation de la preacutecision On peut citer la seacuterendipiteacutela couverture le contexte la personnaliteacute de lutilisateur Nous avons fait le choix de nous ba-ser sur 4 facteurs couramment dans la litteacuterature an de tester la probleacutematique de cette thegravesesur la recommandation multi-objectifs La multitude de facteurs humains eacutetudieacutes ces derniegraveresanneacutees pour enrichir les recommandations soulignent agrave quel point il est important de nos joursde penser des modegraveles geacuteneacuteriques capables dinteacutegrer de nouveaux facteurs humains agrave la demande

Cette premiegravere grande section de leacutetat de lart a montreacute que le domaine de la recommanda-tion est passeacute dun problegraveme doptimisation mono-objectif agrave un problegraveme doptimisation multi-objectifs Un systegraveme de recommandation agrave lheure actuelle se doit de prendre en compte lesfacteurs humains tels que ceux preacutesenteacutes dans les sections preacuteceacutedentes an decirctre performant etcapable de satisfaire le plus grand nombre de type dutilisateurs dans le maximum de situationspossibles Cest dans ce contexte multi-objectif que cette thegravese se positionne Dans la deuxiegraveme etderniegravere grande section de cet eacutetat de lart nous allons preacutesenter et comparer dieacuterentes maniegraveresde proposer des recommandations agrave lutilisateur la recommandation unitaire la recommanda-tion en liste et la recommandation en seacutequences Nous allons notamment nous attarder sur leslistes et les seacutequences car elles sont les plus agrave mecircmes de fournir des recommandations complexesinteacutegrant de multiples objectifs

23 La recommandation en seacutequence

231 Deacutenition et geacuteneacuteraliteacutes sur les seacutequences

Pour comprendre linteacuterecirct des seacutequences il est neacutecessaire de sattarder sur les listes En eetdegraves les premiers systegravemes de recommandation les utilisateurs se sont la plupart du temps vuproposer soit des ressources uniques soit des listes de ressources On peut deacutenir une liste ainsi

Dans le domaine de la recommandation une liste est un ensemble de res-sources ordonneacutees selon un ou plusieurs critegraveres orant agrave lutilisateur lechoix de consulter ces ressources indeacutependamment les unes des autres

Preacutesenter une liste de recommandations a ainsi pour but de proposer les ressources ayantobtenu le score le plus haut selon un ou plusieurs critegraveres choisis par le systegraveme pour produiredes recommandations Comme nous lavons vu dans la section preacuteceacutedente un des critegraveres les plusutiliseacutes eacutetait originellement la preacutecision Lautre speacuteciciteacute dune liste est dorir agrave un utilisateurplusieurs ressources adapteacutees agrave ses preacutefeacuterences agrave un temps t Ainsi le but nest pas moins desatisfaire lobjectif agrave moyenlong terme de lutilisateur que de simplement lui proposer une listede ressources alternatives adapteacutees agrave son prochain choix Autrement dit le but dune liste derecommandations est de satisfaire les besoins dun utilisateur au temps t+ 1 (soit agrave sa prochaineaction) Le format des listes a donc souvent eacuteteacute utiliseacute car il permet agrave la fois de maximiser leschances de satisfaire lutilisateur tout en tirant parti des meacutecanismes internes de production derecommandations geacuteneacuterant la plupart du temps des listes de ressources de la plus preacutecise agrave lamoins preacutecise pour chaque utilisateur Ce mode de repreacutesentation de par sa capaciteacute agrave pro-poser des alternatives se rapproche deacutejagrave un peu plus du cadre de notre travail doptimisationmulti-critegraveres contrairement aux recommandations unitaires Il nest donc pas question ici deremettre en cause linteacuterecirct dutiliser des listes de ressources comme format de recommandationsces derniegraveres eacutetant adapteacutees agrave de nombreux domaines dapplication De tregraves populaires sites

22

23 La recommandation en seacutequence

de-commerce ou de divertissement utilisent dailleurs principalement des recommandations parlistes comme Netix Youtube ou encore Amazon Un client sur un site de-commerce pourrapar exemple ecirctre satisfait de se voir proposer par le systegraveme une liste darticles similaires agrave sesrecherches an de laider dans son choix Cependant certains domaines peuvent ne pas beacuteneacuteciervoire ecirctre desservis par ce format de recommandation On peut ici agrave nouveau rappeler lexempledirecteur de lintroduction agrave ce sujet ougrave un apprenant se voyait proposer une liste de ressourceseacuteducatives toutes similaires au cours quil avait deacutejagrave suivi sans tenir compte de sa progression nide ses objectifs De la mecircme maniegravere un visiteur dun museacutee ne sera pas forceacutement satisfait de sevoir proposer une liste de 10 divideuvres dart similaires agrave ce quil vient de voir mais potentiellementeacuteparpilleacutees dans tous le museacutee Dans ces deux exemples on devine bien que dautres maniegraveresde proposer les recommandations seraient beacuteneacuteques Cest ici que lon peut deacutenir la notion deseacutequence qui pourrait permettre de reacutepondre agrave des situations ougrave une liste de ressources nest passusante pour satisfaire lutilisateur et ougrave la composante temporelle entre en ligne de compte

Dans le domaine de la recommandation une seacutequence est une suite de res-sources permettant datteindre un ou plusieurs objectifs speacutecieacutes ou nonpar lutilisateur (eg une compeacutetence speacutecique la sortie dun museacutee unapprentissage des recommandations diverses pour un parcours eacuteclectiqueetc) Une seacutequence possegravede donc un deacutebut une n et une progression deacute-nie sous forme dun ordonnancement temporel Une seacutequence est reacutegiepar les objectifs agrave atteindre ces derniers eacutetant speacutecique au domaine et agravelutilisateur

Une seacutequence peut donc ecirctre vue comme une liste ameacutelioreacutee de ressources prenant uncompte un nombre plus grand de variables et une dimension temporelle dans le but de mieuxsatisfaire lutilisateur Nous allons ici deacutetailler la notion de progression qui est importante dansune seacutequence Le principe dune seacutequence reacuteside dans lexistence dau moins un objectif agrave at-teindre et cest ce qui la dieacuterencie dune liste Comme nous lavons vu une liste de ressourcesna pas fondamentalement dobjectif agrave atteindre si ce nest satisfaire lutilisateur agrave t + 1 en luiproposant des ressources adapteacutees De part la notion dobjectif agrave atteindre une seacutequence a pourbut de satisfaire les besoins de lutilisateur non plus agrave t + 1 mais agrave t + n Il nest donc plusquestion daider lutilisateur pour sa prochaine action mais bien daider lutilisateur agrave atteindreun objectif plus complexe qui neacutecessitera n actions ou paliers intermeacutediaires Avec ces deux deacute-nitions on se rend bien compte que les notions de liste et de seacutequence ne sont pas opposeacutees maiscompleacutementaires Certains domaines ne neacutecessitent pas forceacutement lutilisation de seacutequences carlutilisateur naura pas dobjectif agrave moyenlong terme agrave satisfaire (ex la recherche dun lmsur une plateforme de videacuteos agrave la demande) tandis que dans dautres domaines une liste serainsusante pour satisfaire lutilisateur (ex e-eacuteducation heacuteritage culturel playlist musicale)De la mecircme maniegravere il nest pas neacutecessaire de recommander des seacutequences agrave un utilisateur si cedernier na pas dobjectif agrave atteindre et souhaite simplement une aide pour sa prochaine actionet ce mecircme si le domaine dapplication est propice agrave lutilisation de seacutequences

Linteacuterecirct des seacutequences na pas eacutechappeacute aux chercheurs du domaine des systegravemes de recom-mandation qui les ont consideacutereacute comme eacutetant un moyen suppleacutementaire permettant de mieuxsatisfaire lutilisateur Cette prise de conscience sest dailleurs deacutemocratiseacutee au mecircme momentque la prise en compte des facteurs humains autre que la preacutecision dans larticle deacutejagrave citeacute preacute-ceacutedemment [McNee et al 2006] Ainsi on peut lire en 2004 dans le tregraves complet article sur

23

Chapitre 2 Eacutetat de lart

leacutevaluation des systegravemes de recommandation de [Herlocker et al 2004] une liste des tacircchesusuelles que doivent reacutealiser ces systegravemes Dans cette liste se trouve entre autres une reacuteexiondes auteurs sur la recommandation de seacutequences dans le cadre de lutilisation dun site deacutecoutede musiques en ligne

[] Cependant le deacute que repreacutesente le fait de passer dune recommandation dune seulemusique agrave une recommandation dune seacutequence de musiques satisfaisante dans son ensemblenous a intrigueacute Cette mecircme tacircche peut sappliquer agrave la recommandation darticles de recherchean dappreacutehender un domaine (lire cette introduction puis lire cette eacutetude ) Alors que ledomaine de la recherche dinformation a exploreacute le timing et les seacutequences dachat de produitsnous navons connaissance daucun systegraveme de recommandation ou de recherche sattelant direc-tement agrave la reacutesolution de cette tacircche (ie la recommandation en seacutequences)

Les auteurs expliquent donc clairement ici que la recommandation de seacutequences mecircme sielle navait pas encore eacuteteacute traiteacutee agrave leacutepoque eacutetait un point inteacuteressant agrave deacutevelopper et pouvaitsatisfaire des besoins speacuteciques comme la recommandation de musiques en ligne ou encore lac-quisition de nouvelles connaissances en ligne La premiegravere partie de leur reacuteexion qui na pas eacuteteacutetraduite ici sur les speacuteciciteacutes des recommandations musicales sera eacutetudieacutee plus en deacutetail dans lechapitre suivant Mecircme si les recommandations de ressources uniques ou de listes de ressourcessont resteacutees tregraves largement majoritaires dans le domaine quelques travaux se sont tout de mecircmeatteleacutes au problegraveme des seacutequences Il est tout dabord neacutecessaire de distinguer deux utilisationsde la notion de seacutequence dans la litteacuterature lutilisation de seacutequences deacutejagrave existantes en entreacuteedun systegraveme et la production de seacutequences en sortie dun systegraveme Dans la suite de cette sec-tion nous allons eacutetudier ces deux maniegraveres de proceacuteder ainsi que leurs avantages et inconveacutenients

Comme nous lavons vu dans la majoriteacute des cas les systegravemes de recommandation se basentsur la matrice deacutevaluations utilisateurs times ressources pour preacutedire les ressources encore nonconsulteacutees pouvant inteacuteresser lutilisateur Cependant mecircme si elle permet lapplication de nom-breuses et puissantes meacutethodes de preacutediction que nous ne deacutetaillerons pas ici 22 lutilisationdune matrice ne permet pas en leacutetat de tenir compte de lordre dans lequel les ressources onteacuteteacute consulteacutees ni de distinguer les variances agrave court ou moyen-terme des prols utilisateurs [Qua-drana et al 2018] De la mecircme maniegravere une cellule de cette matrice rui repreacutesente uniquementune eacutevaluation r dun utilisateur u sur une ressource i pouvant cacher une reacutealiteacute plus complexeougrave un utilisateur a consulteacute plusieurs fois cette ressource au cours du temps potentiellement dansdieacuterents contextes et avec une eacutevaluation dieacuterente agrave chaque fois Pour remeacutedier agrave ce problegravemedes approches agrave base de tenseurs ont eacuteteacute proposeacutees permettant dutiliser plusieurs matrices re-preacutesentant dieacuterents moments ou critegraveres dans le prol de lutilisateur [Frolov and Oseledets2017] Il est donc clair que les seacutequences de consultation contiennent des informations richespouvant ecirctre exploiteacutees dans un systegraveme de recommandation Lexploitation de lordre des res-sources dans des seacutequences nest cependant pas nouvelle et provient principalement du domainede la recherche dinformation [Agrawal et al 1995] Aujourdhui on retrouve lexploitation delordre des seacutequences dans de nombreux autres domaines comme la fouille de motifs seacutequentielsou encore la reconnaissance de la parole [Han et al 2007] Lexplosion des services proposeacutes parla deacutemocratisation dInternet et du numeacuterique en geacuteneacuteral ces derniegraveres anneacutees a ameneacute la recom-mandation agrave sadapter agrave de nombreux domaines ougrave lordre dans lequel les utilisateurs reacutealisent

22 On peut par exemple citer les techniques de factorisation de matrice qui dominent le domaine [Koren et al2009]

24

23 La recommandation en seacutequence

des actions a de limportance Ces systegravemes de recommandation portant une attention particu-liegravere aux seacutequences sont regroupeacutes sous le terme de systegravemes de recommandation sensiblesaux seacutequences (sequence-aware recommender system) [Quadrana et al 2018] Dans leur tourdhorizon du domaine les auteurs proposent une vue densemble de la maniegravere dont un systegravemede recommandation sensible aux seacutequences fonctionne agrave laide dun scheacutema en 3 parties preacutesenteacutepar la Figure 22

Figure 22 Vue densemble du fonctionnement dun systegraveme de recommandation sensible auxseacutequences (source [Quadrana et al 2018])

Dans la Figure 22 on peut donc bien distinguer 3 parties distinctes dans le fonctionnementinterne dun systegraveme de recommandation sensible aux seacutequences

1 Les entreacutees les entreacutees se caracteacuterisent par des donneacutees relatives aux actions eectueacuteespar les utilisateurs du systegraveme Ces actions doivent ecirctre classeacutees selon lordre dans lequelelles ont eacuteteacute eectueacutees par chaque utilisateur an de pouvoir exploiter toutes les infor-mations disponibles (si les actions ne sont pas reccedilues de maniegravere ordonneacutee ces derniegraveresdoivent au minimum ecirctre associeacutees agrave un timestamp agrave une date preacutecise pour pouvoir ecirctrereacute-ordonneacutees et traiteacutees dans le bon ordre par le systegraveme de recommandation)

2 Le processus de recommandation le processus de recommandation est geacuteneacuteralementdieacuterent des systegravemes de recommandation classiques utilisant des matrices 23 mais leprincipe geacuteneacuteral reste le mecircme utiliser lensemble des informations fournies par les entreacuteespour produire des recommandations adapteacutees agrave lutilisateur nal On retrouve dans cettepartie les tacircches purement lieacutees agrave la recommandation la prise en compte des facteurshumains du contexte eacuteventuellement des contraintes sil y en a etc Dans la Figure 22les auteurs distinguent 4 types de tacircches lieacutees aux systegravemes de recommandation sensiblesaux seacutequences Nous discuterons de ces 4 tacircches dans la suite de ce manuscrit lors de lapreacutesentation du modegravele et des expeacuterimentations meneacutees pour le tester

23 Mecircme si quelques modegraveles utilisant agrave la fois des seacutequences et des meacutethodes de factorisation de matrices onteacuteteacute proposeacutes ces derniegraveres anneacutees [Yu and Riedl 2012 Zhao et al 2014 Twardowski 2016 Chen and Li 2019]

25

Chapitre 2 Eacutetat de lart

3 Les sorties les auteurs distinguent ici deux types de sorties possibles Le premier typede sortie concerne dabord les listes ordonneacutees de ressources que nous avons deacutejagrave expli-citeacutees auparavant dans ce manuscrit Une liste aura pour but de proposer agrave lutilisateurun ensemble de ressources ordonneacutees de la meilleure agrave la moins bonne selon une ou plu-sieurs meacutetriques speacuteciques Une liste propose dans les faits un ensemble dalternatives dechoix possibles que le systegraveme met agrave disposition de lutilisateur an que ce dernier puissechoisir une (ou eacuteventuellement plusieurs) ressource(s) parmi toutes celles proposeacutees Cepremier type de sortie est donc identique aux systegravemes de recommandation classiques Ledeuxiegraveme type de sortie concerne les seacutequences de ressources Contrairement aux listesconsistant en un ensemble dalternatives les ressources dune seacutequence ont pour but decirctretoutes consulteacutees dans lordre donneacute par le systegraveme Lagrave ougrave pour les listes une recomman-dation consiste en une ressource pour les seacutequences une recommandation consiste en unesuite de ressources agrave consulter dans lordre proposeacute Ainsi une seacutequence peut ecirctre consi-deacutereacutee comme une unique recommandation de la mecircme maniegravere que dans une liste chaqueressource est une recommandation unique

232 Domaines dapplication des modegraveles seacutequentiels

Comme nous lavons expliqueacute auparavant il est eacutevident que certains domaines dapplicationssont adapteacutes aux systegravemes de recommandation sensibles aux seacutequences comme par exemple lamusique ou le tourisme [Nurbakova et al 2018] Inversement certains domaines semblent moinsbeacuteneacutecier de tels systegravemes Le domaine de le-commerce est un cas particulier dans le sens ougraveil a vu un grand nombre de ces systegravemes y ecirctre testeacutes quand bien mecircme il semble agrave premiegraverevue ecirctre moins adapteacutes aux seacutequences Deux raisons peuvent expliquer cet eacutetat de fait Premiegrave-rement il a statistiquement eacuteteacute prouveacute que la tregraves grande majoriteacute des clients consultant un sitede-commerce ne le font en reacutealiteacute que dans le but de trouver un seul produit speacutecique avantde quitter le site [Qiu et al 2015] Deuxiegravemement le domaine de le-commerce est geacuteneacuteralementtregraves repreacutesenteacute dans les systegravemes de recommandation [Quadrana et al 2018] potentiellement ducircaux forts inteacuterecircts nanciers et agrave lancienneteacute de lutilisation de ce domaine dapplication Dansla suite de cette section nous allons nous inteacuteresser agrave quelques exemples de systegravemes sensiblesaux seacutequences dans les domaines de la musique et du tourisme an dillustrer leacutetat du domaineainsi que les directions potentielles pour de futurs travaux

Dans le domaine musical

Le domaine de la musique est un deacuteboucheacute naturel des systegravemes de recommandation sinteacute-ressant aux seacutequences autant quand il sagit dexploiter les seacutequences creacuteeacutees par les utilisateursque lorsquil sagit den produire en sortie dun systegraveme Cet eacutetat de fait sexplique par la speacuteci-citeacute du domaine musical ougrave les utilisateurs eacutecoutent tregraves souvent plusieurs musiques les unes agravela suite des autres Ces utilisateurs produisent des seacutequences signicatives de par leurs eacutecoutes etpeuvent ecirctre demandeurs de seacutequences de musiques ou playlists adapteacutees agrave leurs preacutefeacuterences Ilnest donc pas eacutetonnant de trouver degraves le deacutebut des anneacutees 2000 dans la litteacuterature des travauxportant sur ce sujet Les travaux de leacutepoque souraient cependant dun certain nombre de pro-blegravemes comme un manque de personnalisation et dexpressiviteacute ou encore des diculteacutes pourgeacuterer le grand nombre de musiques des catalogues en ligne problegravemes qui ont par la suite eacuteteacutereacutesolus avec la production de nouveaux systegravemes et laugmentation de la puissance de calcul desmachines [Aucouturier and Pachet 2002] On peut cependant aussi trouver des eacutetudes dont le

26

23 La recommandation en seacutequence

but eacutetait dexploiter les caracteacuteristiques speacuteciques du domaine musical pour proposer des adap-tations des techniques classiques de recommandation utiliseacutees dans le-commerce [Logan 2002]Plus reacutecemment le domaine des recommandations musicales a beaucoup gagneacute en populariteacutecomme lillustre le ceacutelegravebre ACM RecSys Challenge dont leacutedition 2018 en partenariat avec Spo-tify 24 sest porteacutee sur la musique avec comme challenge de creacuteer un systegraveme capable de prolongerdes playlists deacutejagrave existantes 25 Au total plus de 100 eacutequipes ont participeacute agrave ce deacute et plus de15 articles ont eacuteteacute publieacutes Voici un court reacutesumeacute des 4 approches ayant eacuteteacute les plus performantes

[Volkovs et al 2018] ont proposeacute un modegravele en deux eacutetapes baseacute sur des meacutethodes deltrage collaboratif utilisant la factorisation de matrice (Weighted Regularized Matrix Fac-torization[Hu et al 2008]) et de renforcement de gradient (gradient boosting) La premiegravereeacutetape est optimiseacutee pour reacutecupeacuterer rapidement une liste de musiques candidates tandisque le deuxiegraveme stage reacuteordonne ces musiques en maximisant la preacutecision au deacutebut de laliste ainsi creacuteeacutee [Rubtsov et al 2018] ont proposeacute une approche relativement similaireavec un modegravele posseacutedant aussi deux eacutetapes la premiegravere utilisant des techniques de l-trage collaboratif pour seacutelectionner des candidats potentiels et la deuxiegraveme utilisant uneplaylist avec ces candidats agrave laide de techniques de renforcement de gradient

[Yang et al 2018] ont proposeacute un modegravele multimodal de ltrage collaboratif en deuxparties utilisant chacune des reacuteseaux de neurones (autoencoder pour la premiegravere partie etreacuteseau neuronal convolutif pour la deuxiegraveme partie) Le but des auteurs eacutetait de prendreen compte 3 des problegravemes les plus communs aux systegravemes de recommandation musicauxagrave savoir (1) le problegraveme du deacutemarrage agrave froid (2) les biais de populariteacute ougrave des musiquesse retrouvent soit dans la plupart des playlists soit dans tregraves peu dentre elles (3) et ennle contexte de la playlist originale (autrement dit le fait dutiliser les preacutefeacuterences agrave courtterme de lutilisateur dans la session deacutecoute en cours pour continuer du mieux possiblela playlist)

[Antenucci et al 2018] ont proposeacute une approche mecirclant agrave la fois des techniques de l-trage collaboratif et de ltrage par contenu Les preacutedictions de ces dieacuterentes techniquessont ensuite agreacutegeacutees ensemble dans le but de maximiser la qualiteacute de la recommandation

On peut remarquer que ces 4 approches ayant obtenu les 4 premiegraveres places de la compeacute-tition possegravedent des points communs et orent des perspectives inteacuteressantes sur la maniegraverede concevoir des systegravemes de recommandation performants dans ce domaine Premiegraverementon remarque que toutes ces approches sont relativement complexes et utilisent des meacutethodesvarieacutees pour la recommandation (ltrage collaboratif ltrage par contenu factorisation de ma-trice reacuteseaux neuronaux gradient boosting etc) prouvant que les systegravemes de recommandationperformants utilisent plus que jamais des techniques hybrides Deuxiegravemement chacune de ces 4approches propose un modegravele en deux parties La premiegravere partie est geacuteneacuteralement utiliseacutee pourseacutelectionner un certain nombre de candidats parmi les 22 millions de musiques disponibles quiavaient eacuteteacute mises agrave disposition et ce an de limiter lespace de recherche et donc le temps decalcul La deuxiegraveme partie consiste en la creacuteation de la playlist nale baseacutee sur les candidats deacutejagraveseacutelectionneacutes Cette partie peut potentiellement ecirctre plus complexe dun point de vue algorith-mique car lespace de recherche est beaucoup plus restreint quinitialement

Par ailleurs chacune de ces 4 approches a aussi tenteacute de prendre en compte un maximum

24 https wwwspotifycom25 http wwwrecsyschallengecom2018

27

Chapitre 2 Eacutetat de lart

dinformations an de satisfaire au mieux lutilisateur (caracteacuteristiques des musiques preacutecisiondiversiteacute contexte de la playlist initiale utilisation de la session deacutecoute en cours) validantainsi lapproche deacuteveloppeacutee depuis le deacutebut de ce manuscrit qui consiste agrave prendre en compte unmaximum dobjectifs associeacutes agrave des facteurs humains dans la recommandation Cette constata-tion se retrouve aussi chez [Jannach et al 2016] ougrave les auteurs expliquent que le but des systegravemesde recommandation dans le domaine de la musique est dacqueacuterir et dexploiter des informationssuppleacutementaires agrave propos des musiques an de comprendre le thegraveme sous-jacent des playlistscreacuteeacutees par les utilisateurs [] Le but ultime serait ainsi de concevoir de nouvelles approchesalgorithmiques qui seraient explicitement conccedilues pour creacuteer des playlists correspondant agrave une ouplusieurs caracteacuteristiques signicatives pour lutilisateur En dehors des facteurs humains deacutejagravedeacuteveloppeacutes au deacutebut de cette section (similariteacute diversiteacute nouveauteacute) les auteurs explicitentces caracteacuteristiques signicatives comme pouvant aussi ecirctre lhomogeacuteneacuteiteacute de la playlist dansson ensemble ou encore les transitions entre chacune des musiques dune playlist Le but seraitdonc ici de reacuteussir agrave creacuteer des playlists semblables agrave ce quun ecirctre humain pourrait faire tout entenant compte au maximum des besoins en similariteacute diversiteacute et nouveauteacute [Quadrana et al2018] deacuteveloppent aussi cette ideacutee en expliquant quun systegraveme de recommandation musical peutsoit proposer des musiques correspondant dune maniegravere geacuteneacuterale au thegraveme de la playlist soitproposer une playlist avec un ordre speacutecique permettant de garantir des transitions douces entrechaque musique comme par exemple une augmentation graduelle du tempo Les notions de pro-gression et de transitions douces dans une playlist correspondent agrave la deacutenition dune seacutequencedonneacutee plus haut dans le manuscrit et sont donc particuliegraverement inteacuteressantes dans le cadre decette thegravese Il est cependant agrave noter que dans le domaine des recommandations musicales undeacutebat est reacutecemment apparu sur limportance de lordre des musiques dans les recommandationsde playlist En eet une eacutetude exploratoire reacutecente a montreacute que si les utilisateurs jugent posi-tivement un systegraveme recommandant des musiques diverses et nouvelles ces derniers ne portaientque peu dinteacuterecirct agrave lordre dans lequel les musiques eacutetaient proposeacutees (voire dans certains casne percevaient mecircme pas dordre speacutecique dans les recommandations) [Tintarev et al 2017]Mecircme si cette eacutetude na porteacute que sur 20 participants les reacutesultats obtenus sont inteacuteressantset soulignent agrave quel point chaque domaine agrave des particulariteacutes propres dont il est neacutecessairede tenir compte pour la conception dun systegraveme de recommandation sensible aux seacutequencesPour renforcer encore cette derniegravere constatation nous allons nous inteacuteresser dans la prochainesous-section aux systegravemes de recommandation touristiques

Dans le domaine touristique

Le domaine du tourisme a lui aussi vu sa populariteacute croicirctre dans la litteacuterature gracircce agrave lexplo-sion des teacuteleacutephones portables et tablettes orant un nouveau support pour les recommandationsDe la mecircme maniegravere que pour le domaine de la musique le tourisme a vu ses premiegraveres appli-cations de recommandation apparaicirctre au deacutebut des anneacutees 2000 Dans [Cheverst et al 2000]par exemple les auteurs ont deacuteveloppeacute un guide mobile permettant daider les visiteurs de laville de Lancaster en leur fournissant des informations contextuelles (localisation date heure dela journeacutee ouvertures et fermetures dattractions heures de visites etc) ainsi quen proposantau visiteur plusieurs services comme avoir plus dinformations sur un monument ou geacuteneacuterer unparcours prenant en compte ces informations contextuelles Cette eacutetude a permis de proposer unstandard dans la recommandation touristique comme la prise en compte du contexte et eacutetaittregraves complegravete pour son eacutepoque mecircme si lon peut critiquer labsence dun modegravele utilisateurne permettant pas de prendre en compte les besoins speacuteciques de chaque visiteur Toujours audeacutebut des anneacutees 2000 nous pouvons aussi citer [Chou et al 2005] dont les auteurs ont modeacuteliseacute

28

23 La recommandation en seacutequence

agrave laide dun systegraveme de repreacutesentation de connaissances (OWL pour Web Ontology Language)les inteacuterecircts dun visiteur ainsi que les divideuvres dun museacutee dans un systegraveme de recommandationproposant des parcours Il est agrave noter que dans cette eacutetude les auteurs ont pu prouver que letemps passeacute par un visiteur devant un objet eacutetait positivement correacuteleacute avec son appreacuteciationpositive sur cet objet Le terme objet est utiliseacute ici car les auteurs ont reacutealiseacute cette expeacuteriencesur un site proposant des vecirctements et non dans le museacutee comme le reste de leur application

Plus reacutecemment les systegravemes de recommandation touristiques de ces derniegraveres anneacutees ontproteacute des nombreuses avanceacutees technologiques leur donnant plus de possibiliteacutes quant agrave la lo-calisation de lutilisateur et agrave laide personnaliseacutee dans des lieux autrefois complexes agrave atteindreEn eet la deacutemocratisation des smartphones recevant tous un signal GPS de bonne qualiteacute per-met deacutesormais agrave des applications de connaicirctre relativement preacuteciseacutement la position dun visiteurtant quil est dehors Dune maniegravere geacuteneacuterale les systegravemes utilisant des donneacutees geacuteographiquesdans le processus de recommandation sont regroupeacutes sous le terme systegravemes de recommandationsensibles agrave la position (Location-Aware Recommender Systems (LARS)) Pour les systegravemes derecommandation destineacutes agrave ecirctre utiliseacutes agrave linteacuterieur dun bacirctiment ougrave le signal GPS ne peutpas passer (comme un museacutee par exemple) il existe maintenant plusieurs solutions eacutetudieacutees etdeacuteveloppeacutees dans le domaine de recherche des systegravemes de localisation en interne comme parexemple le Wi-Fi [Tesoriero et al 2014] les puces RFID 26 [Tesoriero et al 2008] les senseursde proximiteacute Bluetooth [Yoshimura et al 2014] et mecircme le geacuteomagneacutetisme 27 Les moyens tech-niques permettant de localiser preacuteciseacutement un visiteur ou de lui fournir des recommandations agravedistance via une application ne seront pas deacutetailleacutes ici Cependant il est important de prendreen compte ces problegravemes lorsque lon passe dun domaine agrave un autre Mecircme si lobjectif est lemecircme agrave savoir recommander les meilleures seacutequences agrave un utilisateur dun systegraveme les moyenstechniques agrave mettre en divideuvre ainsi que les caracteacuteristiques agrave prendre en compte pour produire debonnes recommandations peuvent drastiquement changer Ainsi alors que certains systegravemes derecommandations musicaux commencent depuis quelques anneacutees agrave prendre en compte le contextede lutilisateur quand cela est possible [Wang et al 2012] les systegravemes deacuteployeacutes dans le domainedu tourisme doivent neacutecessairement tenir compte du contexte de lutilisateur au minimum pourpouvoir le guider activement [Adomavicius and Tuzhilin 2011 Gavalas et al 2014] De la mecircmemaniegravere les modegraveles utilisateurs requis dans les recommandations touristiques diegraverent de ceuxdes autres domaines Il est par exemple important de prendre en compte la maniegravere dont lesvisiteurs se deacuteplacent physiquement agrave la fois pour proposer des recommandations satisfaisantesdun point de vue individuel mais aussi pour avoir une vision globale de la foule et de ses ef-fets sur les individus Ainsi [Veacuteron and Levasseur 1989] ont reacutealiseacute une eacutetude ethnographiqueau centre Pompidou montrant que les visiteurs pouvaient ecirctre classeacutes en 4 cateacutegories selon leurmaniegravere de se deacuteplacer tandis que [Yoshimura et al 2014] ont observeacute pendant 3 semaines lecomportement de plus de 27000 visiteurs au museacutee du Louvre permettant de discerner 2 typesde visiteurs selon la dureacutee de leur visite ainsi que linuence de la foule sur les comportements

Ces deux eacutetudes toujours tregraves utiliseacutees aujourdhui reacutevegravelent que le domaine des recomman-dations touristiques possegravede des speacuteciciteacutes quil est important de prendre en compte an decorrectement modeacuteliser le comportement de lutilisateur et de lui fournir des recommandationspertinentes Dune maniegravere geacuteneacuterale et peut-ecirctre encore plus que dans dautres domaines la

26 Acronyme de Radio-Frequency IDentication deacutesignant lutilisation de radio-eacutetiquettes adheacutesives permet-tant de recevoir et de reacutepondre agrave des signaux agrave courte distance27 IndoorAtlas

29

Chapitre 2 Eacutetat de lart

recommandation de points dinteacuterecircts physiques neacutecessite une attention toute particuliegravere agrave uncertain nombre de caracteacuteristiques quant agrave la modeacutelisation de lutilisateur parmi lesquelles onpeut citer [Osche et al 2016]

Le style de visite repreacutesente le style de visite de lutilisateur en rapport avec les deuxeacutetudes citeacutees ci-dessus [Veacuteron and Levasseur 1989 Yoshimura et al 2014]

Le niveau de fatigue repreacutesente agrave quel point lutilisateur est mentalement etouphysiquement fatigueacute

Les preacutefeacuterences implicites repreacutesente les preacutefeacuterences sur les ressources deacuteduites ducomportement de lutilisateur

La toleacuterance agrave la distance repreacutesente agrave quel point lutilisateur souhaite se deacuteplacer La toleacuterance agrave la foule repreacutesente agrave quel point lutilisateur est deacuterangeacute par les autres

visiteurs autour de lui La toleacuterance agrave la preacutecision repreacutesente le souhait de lutilisateur concernant la balance

entre recommandations preacutecises et recommandations diverses La toleacuterance agrave lintrusion technologique repreacutesente agrave quelle freacutequence lutilisateur

souhaite recevoir des recommandations du systegraveme Le niveau de controcircle repreacutesente le niveau de choix que lutilisateur attend cest-agrave-

dire le nombre dalternatives proposeacutees

Outre ces points relatifs agrave la modeacutelisation de lutilisateur il est aussi important de prendreen compte lenvironnement dans lequel il se trouve comme par exemple la geacuteographie du lieu etses contraintes les distances physiques entre les points dinteacuterecircts les donneacutees meacuteteacuteorologiquesles horaires douvertures et de fermetures sil y en a etc

Mecircme si agrave premiegravere vue le domaine touristique semble dieacuterent du domaine musical denombreux points communs peuvent ecirctre trouveacutes comme par exemple la gestion de la distance(distance physique entre deux points dinteacuterecircts ou distance matheacutematiques entre deux ressourcesles preacutefeacuterences implicites les divers niveaux de toleacuterances etc) Dans la prochaine section nousallons discuter des points communs entre ces dieacuterents domaines et des caracteacuteristiques quunmodegravele se voulant geacuteneacuterique et multi-domaines se doit de posseacuteder

233 Discussion

Cette section a eu pour but de preacutesenter un certain nombre de travaux lieacutes de pregraves ou de loinagrave la notion de seacutequence Nous avons vu que dans le domaine des recommandations musicales lacreacuteation ou la continuation de playlists sont des objectifs de plus en plus consideacutereacutes par les cher-cheurs Ce domaine sy precircte en eet tregraves bien car la majoriteacute des utilisateurs eacutecoutent plusieursmusiques les unes agrave la suite des autres permettant dexploiter linformation contenue dans cesseacutequences deacutejagrave existantes et de tenter den creacuteer de nouvelles De la mecircme maniegravere le rapidetour dhorizon du domaine des recommandations touristiques a permis de mettre en exerguemecircme sil existe des dieacuterences notables avec le domaine musical dont il faut tenir compte unobjectif principal commun consideacuterer le maximum de donneacutees pertinentes disponibles (compor-tements preacuteceacutedents des utilisateurs informations sur les ressources caracteacuteristiques personnellesde chaque utilisateur etc) dans le but de produire des seacutequences adapteacutees agrave chaque utilisateurLes eacutetudes de ces domaines ont permis de faire ressortir 5 directions majeures dans la conceptiondun tel systegraveme de recommandation

1 Les approches les plus performantes actuellement semblent geacuteneacuteralement composeacutees de

30

24 Les systegravemes multi-agents

deux parties distinctes La premiegravere partie consiste en une preacute-seacutelection avec pour but dediminuer lespace de recherche en seacutelectionnant une liste de candidats potentiels tandisque dans la deuxiegraveme partie une seacutequence est produite en utilisant les meilleurs candidatspreacute-seacutelectionneacutes dans leacutetape 1

2 Ces approches ne se limitent plus uniquement agrave lutilisation de techniques provenantdes systegravemes de recommandation classiques mais mecirclent deacutesormais dieacuterentes techniquesprovenant de divers domaines de la recherche en informatique

3 Les seacutequences deacutejagrave creacuteeacutees en amont par les utilisateurs peuvent ecirctre utiliseacutees an dexploi-ter les informations quelles contiennent et produire en aval des seacutequences plus conformesagrave ce quun ecirctre humain ferait

4 Le mouvement geacuteneacuteral des eacutetudes produites ces derniegraveres anneacutees va dans le sens dune priseen compte conjointe et toujours plus importante de facteurs et caracteacuteristiques humains

5 Un systegraveme geacuteneacuterique permettant de produire des seacutequences personnaliseacutees quelque soit ledomaine reste possible mais ce dernier devra ecirctre susamment modulable pour sadapteraux dieacuterences bien reacuteelles entre tous les domaines concerneacutes

Dans la suite de cette section nous allons nous concentrer sur un domaine de linformatiquedont les meacutethodes saccordent avec lensemble des points eacutevoqueacutes ci-dessus les systegravemes multi-agents et plus particuliegraverement les algorithmes de colonies de fourmis Cest dans le cadre de ceparadigme que nous reacutepondrons aux probleacutematiques de cette thegravese

24 Les systegravemes multi-agents

241 Deacutenition

Les systegravemes multi-agents deacutesignent lensemble des systegravemes ougrave de nombreux agents co-opegraverent dans le but de reacutesoudre un problegraveme trop complexe pour un agent seul [Ferber andWeiss 1999 Weiss 2013] Un agent dans sa deacutenition la plus large repreacutesente toute entiteacute pou-vant percevoir son environnement agrave travers ses senseurs et pouvant agir dans cet environnementavec ses actuateurs [Russell and Norvig 2016] comme le preacutesente la Figure 23

Selon cette deacutenition limmense majoriteacute des ecirctres vivants robots machines et programmesinformatiques peuvent ecirctre consideacutereacutes comme des agents Nous allons aner petit agrave petit cettedeacutenition an de rentrer dans le cadre speacutecique des systegravemes multi-agents Un premier eacuteleacutementpouvant ecirctre ajouteacute est la notion de rationaliteacute Un agent rationnel est un agent dont le com-portement est le bon eacutetant donneacute un environnement speacutecique dans lequel il eacutevolue Avoir lebon comportement autrement dit eectuer une bonne seacutequence dactions implique de deacutenirun but preacutecis ainsi quune maniegravere deacutevaluer les seacutequences dactions que lagent eectue commepar exemple la maximisation dune fonction dutiliteacute An de reacutealiser des actions dans son en-vironnement un agent a besoin de pouvoir prendre des deacutecisions de lui-mecircme Il existe dans lalitteacuterature deux types dagents repreacutesentant deux conceptions dieacuterentes pour la reacutesolution dunproblegraveme [Ferber 1995]

Le premier type dagent est appeleacute agent cognitif et fait reacutefeacuterence agrave des agents pos-seacutedant une repreacutesentation symbolique du monde avec laquelle ils peuvent appliquer desraisonnements Ces agents possegravedent donc une repreacutesentation interne de leur environ-nement et sont capables dinteragir entre eux de maniegravere sophistiqueacutee Ce type dagent

31

Chapitre 2 Eacutetat de lart

Figure 23 Scheacutema repreacutesentant linteraction entre un agent et lenvironnement dans lequel ileacutevolue [Russell and Norvig 2016]

correspond plus geacuteneacuteralement agrave une approche cognitive qui a pour but de faire commu-niquer et coopeacuterer des systegravemes experts classiques [ougrave] chaque agent dispose dune base deconnaissance comprenant lensemble des informations et des savoir-faire neacutecessaires agrave lareacutealisation de sa tacircche et agrave la gestion des interactions avec les autres agents et avec sonenvironnement [Ferber and Weiss 1999]

Le deuxiegraveme type dagent nommeacute agent reacuteactif ne possegravede pas de repreacutesentation sym-bolique du monde et est donc limiteacute par ses propres perceptions Ces agents et leursinteractions sont geacuteneacuteralement moins complexes que les agents cognitifs Ce type dagentcorrespond plus geacuteneacuteralement agrave une approche reacuteactive qui quant agrave elle preacutetend quil nestpas neacutecessaire que les agents soient intelligents individuellement pour que le systegraveme aitun comportement global intelligent Des meacutecanismes de reacuteaction aux eacuteveacutenements ne pre-nant en compte ni une explicitation des buts ni des meacutecanismes de planication peuventalors reacutesoudre des problegravemes qualieacutes de complexes [Ferber and Weiss 1999]

En plus de ces deux types dagents dieacuterencieacutes par leur repreacutesentation du monde Ferberpropose un autre type de distinction sur les comportements ces derniers peuvent ecirctre teacuteleacuteono-miques cest-agrave-dire dirigeacutes vers des buts explicites ou bien reacuteexes cest-agrave-dire reacutegis par lesperceptions Ces 4 dieacuterents types dagents peuvent se combiner comme illustreacute dans le Tableau21

Nous allons plus particuliegraverement nous inteacuteresser ici aux agents reacuteactifs et agrave leurs dieacuterencesavec les agents cognitifs Malgreacute leur relative simpliciteacute les interactions entre agents reacuteactifsexistent bien Mais contrairement aux agents cognitifs elles seectuent au travers de lenvi-ronnement geacuteneacuteralement par des traces laisseacutees dans ce dernier comme des donneacutees visuellesolfactives auditives etc Lagrave ougrave les agents cognitifs raisonnent avant de prendre une deacutecisionles agents reacuteactifs ne font que reacuteagir agrave des stimuli externes Ils possegravedent bien des senseurs ande deacutetecter leur environnement et des actuateurs pour agir mais leur fonctionnement reste tregraves

32

24 Les systegravemes multi-agents

Agents cognitifs Agents reacuteactifsTeacuteleacuteonomiques Agents intentionnels Agents pulsionnels

Reacuteexes Agents modules Agents tropiques

Table 21 Description des dieacuterents types dagents selon leur relation au monde et selon leursconduites [Ferber 1995]

simple par rapport aux agents cognitifs La relative simpliciteacute de ces agents est inteacuteressante carelle sinscrit dans un changement de paradigme par rapport agrave la vision classique des lintelligencearticielle dans le domaine de linformatique En eet le domaine de lintelligence articielleexiste depuis pregraves de 60 ans maintenant et agrave lorigine les systegravemes intelligents creacuteeacutes dans cedomaine pour reacutesoudre des problegravemes lont eacuteteacute selon une approche dite top-down cest-agrave-direde haut en bas avec les notions de penseacutee et de raison au centre de ces systegravemes Ainsi cessystegravemes manipulaient les connaissances agrave laide de symboles et de regravegles et navaient aucune in-teraction ni avec leur environnement ni avec dautres systegravemes intelligents Cest ce quon appellecommuneacutement la Good Old Fashioned Articial Intelligence Depuis les anneacutees 1990 une autreapproche est apparue pour eacutetudier lintelligence et creacuteer des systegravemes intelligents lapprochebottom-up soit de bas en haut dont certains systegravemes tregraves populaires sinspirent de systegravemesbiologiques incarneacutes dans un environnement et pouvant communiquer entre eux Cest dans cemouvement que sinscrivent les systegravemes multi-agents et comme le dit Rodney A Brooks dansson article justement intituleacute Intelligence without Reason [Brooks 1991]

Les comportements intelligents peuvent ecirctre geacuteneacutereacutes sans laide de systegravemes de raisonne-ment explicites

Lintelligence est une proprieacuteteacute eacutemergente de certains systegravemes complexes apparaissantparfois sans quelle nait de raison speacutecique dapparaicirctre

Une premiegravere implication de la simpliciteacute des agents reacuteactifs est quil est neacutecessaire de faireinteragir un certain nombre de ces agents pour pouvoir solutionner des problegravemes Lagrave ougrave unagent cognitif peut potentiellement ecirctre tregraves complexe et capable de solutionner des problegravemesprincipalement par lui-mecircme (en deacuteleacuteguant ou coopeacuterant parfois avec dautres agents) un agentreacuteactif seul nen sera pas capable de par sa simpliciteacute Cependant cette simpliciteacute ore aussides avantages dans le sens ougrave il est aiseacute de comprendre de programmer ou de modier cesagents Apregraves cette partie theacuteorique nous allons voir dans la sous-section suivante deux modegravelesmulti-agents an dillustrer la maniegravere dont ils fonctionnent reacuteellement Ces deux systegravemes nouspermettrons par la suite de tirer quelques conclusions sur leur utiliteacute dans le cadre de cette thegravese

242 Preacutesentation de deux systegravemes multi-agents reacuteactifs

Nous avons pour le moment seulement deacutecrit le principe des modegraveles multi-agents et lesagents pouvant les composer Cependant ces systegravemes ne puisent pas leur origine uniquementdans linformatique Beaucoup de systegravemes multi-agents sinspirent agrave lorigine de comportementsdanimaux ou dinsectes observeacutes en milieu naturel par des eacutethologues En eet certaines espegravecesanimales semblent agir en groupe de maniegravere tregraves intelligente sans quil ny ait de meneur ou sansquun individu pris seacutepareacutement ne soit speacutecialement intelligent On parle alors dauto-organisationet deacutemergence de lintelligence quand une masse dindividus peu intelligents se coordonne ainsidans la nature Ce pheacutenomegravene a eacuteteacute eacutetudieacute par le biologiste franccedilais Pierre-Paul Grasseacute en 1959

33

Chapitre 2 Eacutetat de lart

et a eacuteteacute nommeacute stigmergie [Grasseacute 1959] La stigmergie est le meacutecanisme par lequel des agentsvont se synchroniser et travailler ensemble dans un but commun sans quaucun nait lideacutee agravelavance de laction agrave faire ou nait le plan nal de la construction agrave reacutealiser (une fourmiliegravereou un nid de termites par exemple) Pour deacutecrire le pheacutenomegravene de stigmergie agrave ldivideuvre chezcertains animaux Pierre-Paul Grasseacute explique ainsi Louvrier ne dirige pas son travail maisil est guideacute par lui Cette phrase signie quun agent na pas dintention et dideacutee de ce quildoit faire mais quil sait cependant exactement quoi faire au moment ougrave il est preacutesent devant letravail Cette capaciteacute sexplique par le fait que les individus sont geacuteneacutetiquement preacuteprogrammeacutespour eectuer certaines tacircches [Oster 1981] Cest de cette maniegravere que des espegraveces ne posseacutedantquune tregraves faible intelligence individuelle comme les fourmis ou les termites sont capables deproduire des constructions extrecircmement grandes et sophistiqueacutees On peut par exemple citer uneespegravece nommeacutee la fourmi coupe-feuille du Texas aussi appeleacutee fourmi champignonniste dontles individus vivent dans de grandes colonies de plusieurs millions dindividus et cultivent deschampignons dans des piegraveces souterraines doteacutees dune structure particuliegravere et dune aeacuterationspeacutecique destineacutee agrave favoriser la pousse du champignon [Houmllldobler et al 1990] La cleacute de lacapaciteacute de ces animaux agrave agir de la bonne maniegravere face agrave tel ou tel stimulus reacuteside dans lADNmecircme de lespegravece faccedilonneacute par des millions danneacutees deacutevolution Cest ainsi quune ouvriegraverevaquera agrave ses tacircches jusquagrave ce quun pan de mur de son nid seondre et que devant ce nouveaustimulus elle deacuteploie une nouvelle panoplie de comportements approprieacutes agrave la situation agrave laquelleelle fait soudainement face Ces exemples deacutemontrent que lintelligence est bien preacutesente dans cessystegravemes biologiques vivants et dans la suite de cette section nous allons donner deux exemplesde modeacutelisation de ces systegravemes biologiques en systegravemes multi-agents dans linformatique

Murmuration deacutetourneaux le modegravele des boids

Les eacutetourneaux repreacutesentent une famille dune quinzaine despegraveces doiseaux et vivent surles 5 continents Ces oiseaux se regroupent parfois dans la nature sous forme de nueacutees pouvantcontenir des dizaines de milliers dindividus La raison de ces murmurations nest pas encoreconnue avec certitude mais des theacuteories existent expliquant par exemple que ces regroupementspermettraient une plus grande chance de survie face aux preacutedateurs [King and Sumpter 2012]ou bien que le regroupement et la haute densiteacute dindividus leur permettraient de se reacutechauerdurant les peacuteriodes les plus froides de lanneacutee [Goodenough et al 2017] Ce pheacutenomegravene est beau-coup eacutetudieacute car tous les oiseaux semblent se deacuteplacer dans la mecircme direction et modient leurtrajectoire en mecircme temps sans quaucun oiseau ne se touche en vol ce qui est remarquable eacutetantdonneacute le nombre dindividus et la vitesse agrave laquelle ils volent Malgreacute cette complexiteacute il ny apas doiseau meneur deacutecidant de la direction agrave prendre et un individu seul na pas la capaciteacuteintellectuelle susante pour planier ce genre de deacuteplacements complexes dans un environne-ment en 3 dimensions On retrouve bien lagrave les caracteacuteristiques dun systegraveme multi-agents ougrave desagents simples provoquent de par leurs interactions un comportement intelligent et complexedeacutepassant de loin les capaciteacutes dun individu seul Le domaine des systegravemes multi-agents sestdonc inteacuteresseacute agrave creacuteer un modegravele permettant agrave laide de simulations informatiques de recreacuteer lesmumurations deacutetourneaux Ce modegravele ougrave les agents sont appeleacutes des boids 28 permet dobtenirinformatiquement des murmurations dagents dans un environnement simuleacute gracircce agrave trois regraveglesimplanteacutees dans chaque agent donneacutees ici par ordre de prioriteacute [Reynolds 1987]

28 Le terme boid provient de la contraction de lexpression bird-oid object et signiant objet ressemblant agrave unoiseau

34

24 Les systegravemes multi-agents

1 Eacutevitement des collisions eacuteviter les collisions avec les agents se trouvant agrave proximiteacuteSi un agent est trop proche seacuteloigner dans une autre direction

2 Coordination de la vitesse aller agrave la mecircme vitesse que les agents se trouvant agraveproximiteacute

3 Centrage rester le plus proche possible des autres agents se trouvant agrave proximiteacute sansdeacuteclencher la regravegle deacutevitement de collision

Ces trois regravegles sont donc exeacutecuteacutees par les agents en permanence de la plus prioritaire agravela moins prioritaire et permettent dobtenir virtuellement un comportement de murmurationougrave tous les agents restent proches les uns des autres et changent de direction ensemble commemontreacute dans la Figure 24 Ce modegravele a par exemple eacuteteacute utiliseacute dans lindustrie du divertissementpour simuler des foules coheacuterentes dans des jeux videacuteos ou des lms [Silva et al 2009]

Figure 24 Simulation de boids ougrave lon peut voir les agents se deacuteplaccedilant dans la mecircme directionagrave une certaine distance les uns des autres dans un environnement simuleacute [Reynolds 1987]

Le fourragement des fourmis algorithme de colonies de fourmis

Un autre exemple de systegraveme biologique complexe ougrave lon peut observer leacutemergence duneintelligence collective est le comportement des fourmis dans la nature Dans la section preacuteceacutedentenous avons deacutejagrave vu que par un meacutecanisme de stigmergie certains insectes sociaux comme lesfourmis ou les termites eacutetaient capables de construire des structures tregraves complexes Un autrepheacutenomegravene dauto-organisation a eacuteteacute observeacute lors du fourragement 29 des fourmis de lespegravece de lafourmi dArgentine En eet les ouvriegraveres de cette espegravece se deacuteplacent de maniegravere aleacuteatoire auxalentours de la fourmiliegravere jusquagrave trouver une source de nourriture Une fois que des fourmis onttrouveacute de la nourriture elles retournent agrave la fourmiliegravere Apregraves un certain temps de plus en plusdouvriegraveres se dirigent vers cette source de nourriture jusquagrave ce quun chemin de fourmis allantde la fourmiliegravere jusquagrave la nourriture se forme Ce chemin a cependant la particulariteacute decirctreoptimiseacute en termes de distance agrave parcourir et dobstacles agrave eacuteviter de sorte que les ouvriegraveres em-pruntent eectivement le plus court chemin possible entre leur nid et la nourriture [Deneubourg

29 Le fourragement deacutesigne le comportement des fourmis recherchant de la nourriture et revenant avec celle-ciagrave la fourmiliegravere

35

Chapitre 2 Eacutetat de lart

et al 1990] La Figure 25 donne un exemple de ce agrave quoi peut ressembler un de ces chemins unefois emprunteacute par beaucoup dindividus Ce comportement est remarquable quand on le replacedans le contexte des individus qui en sont agrave lorigine Les ouvriegraveres ne font pas plus de 1 ou 2centimegravetre(s) de long et peuvent couvrir des distances jusquagrave 100 megravetres an de trouver de lanourriture Lenvironnement dans lequel elles se deacuteplacent est complexe joncheacute dobstacles eteacutevolue en permanence alors quelles nont quun sens de lorientation limiteacute et une faible capaciteacutede traitement ducirce agrave leur tregraves petit nombre de neurones (environ 250000)

Figure 25 Illustration dun chemin creacuteeacute par des fourmis appartenant agrave lespegravece des fourmisleacutegionnaires (creacutedit photo Mehmet Karatay)

An de comprendre les meacutecanismes permettant leacutemergence de ce comportement intelligentdes expeacuterimentations ont eacuteteacute meneacutees en laboratoire avec de petites colonies de fourmis dansun environnement controcircleacute [Goss et al 1989] Voici donc le principe de fonctionnement de lacreacuteation de chemins optimiseacutes chez les fourmis

1 Des fourmis se deacuteplacent aleacuteatoirement autour de la colonie agrave la recherche de nourriture

2 Quand une fourmi trouve de la nourriture elle retourne du mieux possible agrave la fourmiliegravereen deacuteposant des pheacuteromones

3 Dautres fourmis attireacutees par ces pheacuteromones vont avoir tendance agrave suivre ce cheminLes nouvelles fourmis atteignant la nourriture vont elles aussi revenir agrave la fourmiliegravere endeacuteposant des pheacuteromones

4 Les fourmis reacuteussissant agrave revenir plus rapidement avec des chemins plus courts agrave la four-miliegravere vont redeacuteposer plus rapidement de nouvelles pheacuteromones eacutetant donneacute quellesmettront moins de temps pour faire des allers-retours entre la nourriture et la fourmi-liegravere

5 Agrave linverse les fourmis ayant emprunteacute des chemins plus longs vont deacuteposer de nouvellespheacuteromones moins rapidement puisquelles mettront plus de temps agrave faire leurs allers-retours

6 Petit agrave petit le chemin le plus court va ecirctre emprunteacute par de plus en plus de fourmisdeacuteposant chacune des pheacuteromones renforccedilant de plus en plus ce mecircme chemin

36

24 Les systegravemes multi-agents

7 Les chemins les plus longs sont peu agrave peu abandonneacutes dautant plus que les pheacuteromonesseacutevaporent avec le temps renforccedilant encore plus les chemins fortement emprunteacutes

8 Au bout dun certain temps seul le chemin le plus court est emprunteacute par la majoriteacute desfourmis

9 Quelques fourmis ne prennent cependant pas ce chemin permettant la recherche de nou-velles sources de nourriture ou de nouveaux chemins En eet si jamais le chemin em-prunteacute par la majoriteacute des individus se voit perturbeacute par un nouvel obstacle (un arbrevenant de tomber par exemple) alors ces quelques fourmis pourront eacuteventuellement trou-ver le nouveau meilleur chemin le plus court et le cycle de renforcement recommencera

Comme pour les murmurations deacutetourneaux on retrouve bien les caracteacuteristiques de lauto-organisation dans un systegraveme multi-agents aucun meneur nest preacutesent les agents suivent seule-ment quelques regravegles simples permettant leacutemergence dun comportement deacutepassant les capaciteacutescognitives de lespegravece Ces regravegles ont eacuteteacute deacutecrites de maniegravere formelle par Marco Dorigo durant sathegravese dans un modegravele appeleacute Ant System (AS) permettant de recreacuteer le comportement des four-mis au sein dune simulation informatique [Dorigo et al 1996] Dans ce modegravele lenvironnementest repreacutesenteacute par un graphe dont les sommets sont les points dinteacuterecircts ougrave lagent peut se rendreet dont les arecirctes sont les chemins disponibles permettant de se deacuteplacer de point en point Agravechaque arecircte (i j) est associeacutee deux valeurs numeacuteriques la premiegravere repreacutesentant la distanceagrave parcourir pour se deacuteplacer du sommet i au sommet j la deuxiegraveme repreacutesentant la quantiteacutede pheacuteromones preacutesente sur cette arecircte Un agent se trouvant agrave un sommet i a connaissancede lensemble des sommets Vi accessibles directement agrave partir de i Pour deacutecider quelle arecircteemprunter lagent prend en compte la distance et la quantiteacute de pheacuteromones associeacutees agrave chaquearecircte Une fois que lagent a atteint un sommet speacutecique deacutesigneacute agrave lavance comme objectif ildeacutepose des pheacuteromones sur chacune des arecirctes emprunteacutees La quantiteacute de pheacuteromones deacuteposeacuteeest deacutependante de la longueur du chemin emprunteacute de sorte quun agent ayant trouveacute un chemincourt deacuteposera plus de pheacuteromones quun agent ayant trouveacute un chemin plus long Ce cycle peutensuite recommencer avec une multitude dagents jusquagrave ce quune solution eacutemerge de la mecircmemaniegravere que pour les fourmis dans la nature Marco Dorigo a dans la suite de ses travaux deacuteve-loppeacute dautres modegraveles ayant tous comme base le modegravele AS mais posseacutedant quelques variationsou ajouts orant une plus grande varieacuteteacute doutils pour reacutesoudre les nombreux problegravemes de larecherche en informatique Dans les faits le modegravele original AS a aujourdhui pratiquement dis-paru au prot de ses descendants et cest pour cette raison que nous nallons pas ici deacutetailler plusavant le modegravele AS [Dorigo and Birattari 2010] Tous ces dieacuterents modegraveles sont maintenantregroupeacutes sous le nom de Ant Colony Optimization (ACO) [Dorigo and Birattari 2011] Cesderniers ont eacuteteacute exploiteacutes dans de nombreux domaines de la recherche scientique pour reacutesoudredes problegravemes varieacutes On peut par exemple citer trois de ces problegravemes tregraves connus et eacutetudieacutesen informatique de par leur complexiteacute qui ont chacun vu des solutions leur ecirctre trouveacutees gracircceagrave ACO

Le problegraveme du voyageur de commerce [Dorigo and Gambardella 1997] Le problegraveme des tourneacutees de veacutehicules [Bell and McMullen 2004] Le problegraveme de gestion de projet agrave contraintes de ressources [Merkle et al 2002]

Dans la prochaine section nous allons nous inteacuteresser plus particuliegraverement agrave lun des modegravelesde la famille ACO nommeacute Ant Colony System (ACS) Nous allons voir son fonctionnement deacutetailleacuteet expliquer les speacuteciciteacutes qui le rendent particuliegraverement inteacuteressant dans le cadre de cette thegravese

37

Chapitre 2 Eacutetat de lart

243 Ant Colony System

Le modegravele ACS possegravede plusieurs modications majeures par rapport au modegravele initial ASnotamment par rapport aux meacutecanismes lieacutes aux pheacuteromones et agrave la prise de deacutecision des agents[Dorigo and Birattari 2010] Premiegraverement seul lagent ayant trouveacute le meilleur chemin est au-toriseacute agrave deacuteposer des pheacuteromones sur les arecirctes quil a emprunteacute alors que dans AS tous les agentsdeacuteposaient des pheacuteromones Deuxiegravemement et pour contrer la relatif manque de pheacuteromones en-gendreacute par cette premiegravere modication les agents possegravedent un nouveau comportement appeleacutemise agrave jour locale de pheacuteromones (locale pheromone update) consistant en la mise agrave jour despheacuteromones par chaque agent sur la derniegravere arecircte emprunteacutee durant la construction dun che-min Cette mise agrave jour sarticule autour dun seuil de pheacuteromones speacutecieacute comme meacutetavariableavant lexeacutecution du programme Si une arecircte traverseacutee par un agent possegravede une quantiteacute depheacuteromones infeacuterieure agrave ce seuil alors lagent deacutepose des pheacuteromones Agrave linverse si la quantiteacutede pheacuteromone sur cette arecircte est supeacuterieure au seuil alors lagent retire une certaine quantiteacute depheacuteromones En dautres termes dans ACS degraves quun agent emprunte une arecircte il met agrave jourla quantiteacute de pheacuteromones sur cette arecircte et ce quelle que soit la qualiteacute du chemin quil est entrain de construire Marco Dorigo explique lui-mecircme les avantages que possegravede ACS par rapportagrave dautres versions existantes [Dorigo and Birattari 2011]

ACS permet de diversier lexploration eectueacutee par les agents pendant une iteacuterationde lalgorithme en diminuant la quantiteacute des pheacuteromones sur les arecirctes les plusutiliseacutees les agents suivants sont encourager agrave se deacuteplacer sur dautres arecirctes moinsexploreacutees permettant de diversier les solutions trouveacutees agrave la n dune iteacuterationCette meacutecanique rend moins probable le fait que plusieurs agents puissent produiredes solutions identiques durant une iteacuteration

Une autre modication du modegravele ACS par rapport au modegravele AS concerne le deacuteplacementdes agents Il est maintenant possible gracircce agrave une nouvelle meacutetavariable de donner limportancesouhaiteacutee entre les pheacuteromones et la distance lors du processus de choix de la prochaine arecircte agraveemprunter par un agent Dans le reste de cette sous-section nous allons expliquer les principalesformules reacutegissant le comportement des agents et la mise agrave jour des pheacuteromones dans ACS

Regravegle de transition deacutetat - la regravegle de transition (state transition rule) deacutetat utilise laregravegle proportionnelle pseudo-aleacuteatoire (pseudo-random proportional rule) ougrave une variable aleacutea-toire q isin [0 1] est compareacutee agrave une meacutetavariable q0 an de deacutecider si lagent courant va explorerle graphe ou sil va exploiter la connaissance produite par les autres agents avant lui En dautrestermes il est possible deacutequilibrer avec cette variable limportance des pheacuteromones et de la dis-tance lors du choix des arecirctes q0 = 0 entraicircne lexploration du graphe en tenant uniquementcompte de la distance associeacutee aux arecirctes tandis que q0 = 1 correspond agrave un comportement derenforcement pur via les pheacuteromones sans aucune exploration LEacutequation 27 permet de choisirentre lexploitation de la connaissance ou lexploration du graphe donnant plus de latitude aumodegravele ACS par rapport agrave AS

Exploitation (Equation 28) si q le q0Exploration biaiseacutee (Equation 29) si q ge q0

(27)

LEacutequation 28 repreacutesente lexploitation directe du graphe ougrave la meilleure arecircte est toujourschoisie

arg maxlisinVi ταil middot η

βil (28)

38

24 Les systegravemes multi-agents

ougrave Vi est lensemble des sommets accessibles depuis le sommet i τil isin [0 1] est la quantiteacute depheacuteromones deacuteposeacutee sur larecircte (i l) par les agents preacuteceacutedents ηil est linformation heuristique delarecircte (i l) α et β sont deux meacutetavariables repreacutesentant respectivement le poids des pheacuteromoneset celui de lheuristique dans le calcul Lheuristique ηil repreacutesente classiquement linformationrelative agrave la distance seacuteparant les sommets i et l et sera deacutecrite apregraves

Il est agrave noter quon ne parle pas ici de pure exploration mais dexploration biaiseacutee dans lesens ougrave les meilleures arecirctes ont une probabiliteacute plus eacuteleveacutee decirctre seacutelectionneacutees Lexpressionmeilleure arecircte est ici deacutenie comme le produit de lheuristique avec la quantiteacute de pheacuteromonesassocieacutees agrave cette arecircte LEacutequation 29 correspond agrave lexploration biaiseacutee du graphe

pij =

ταij middot η

βijsum

lisinViταil middot η

βil

si j isin Vi

0 sinon

(29)

Mise agrave jour globale des pheacuteromones - Apregraves chaque iteacuteration cest-agrave-dire apregraves que tousles agents aient termineacute leur chemin seul lagent qui a trouveacute le meilleur chemin est autoriseacute agravemettre agrave jour le niveau de pheacuteromones τij sur chaque arecircte (i j) quil a emprunteacute

τij =

(1minus ρ) middot τij + ρ middot∆τij si (i j) appartient au meilleur chemin

τij sinon(210)

ougrave ρ est le taux deacutevaporation des pheacuteromones et ∆τij = 1Lbest ougrave Lbest est la longueur dumeilleur chemin

Mise agrave jour locale des pheacuteromones - Un autre ajout du modegravele ACS par rapport aumodegravele AS est la mise jour locale des pheacuteromones Eacutetant donneacute que seul lagent ayant trouveacute lemeilleur chemin deacutepose des pheacuteromones dans ACS (contrairement agrave tous les agents proportion-nellement agrave la qualiteacute de leur solution dans AS) tregraves peu de pheacuteromones sont deacuteposeacutes avec laregravegle de mise agrave jour globale des pheacuteromones Pour contrer ce problegraveme tous les agents mettentagrave jour la quantiteacute de pheacuteromones agrave chaque arecircte emprunteacutee lors de la construction du chemincomme deacutecrit dans lEacutequation 211

τij = (1minus ρ) middot τij + ρ middot τ0 (211)

ougrave τ0 est le niveau de pheacuteromones placeacute sur chaque arecircte du graphe agrave linitialisation du modegravele

Information heuristique - linformation heuristique ηij repreacutesente linformation que lafourmi possegravede a priori sur une arecircte (i j) Dans lalgorithme ACS linformation heuristiqueest calculeacutee en se basant sur la distance entre les deux sommets i et j de larecircte (i j) plus lesdeux sommets sont eacuteloigneacutes lun de lautre et plus la valeur de ηij sera basse indiquant agrave unagent situeacute sur le sommet i quil nest a priori pas inteacuteressant pour lui demprunter larecircte (i j)LEacutequation 212 deacutecrit comment obtenir la valeur de linformation heuristique ηij de larecircte (i j)

ηij =1

dij (212)

ougrave dij est la distance entre les sommets i et j

39

Chapitre 2 Eacutetat de lart

244 Discussion sur le modegravele ACS

Dans cette sous-section nous allons revenir sur un des principes de lalgorithme ACS laregravegle proportionnelle pseudo-aleacuteatoire et son importance danc le fonctionnement du modegraveleCette regravegle comme deacutetailleacutee ci-dessus permet de geacuterer leacutequilibre dans lexploration et lex-ploitation de maniegravere semi-aleacuteatoire (ie avec une variable aleacuteatoire servant agrave xer le seuil debasculement dun comportement vers lautre) Cette dualiteacute explorationexploitation est bienconnue des systegravemes de recherche et de creacuteation de connaissances [March 1991] en voici leurdeacutenition

Lexploration est deacutenie comme eacutetant lexpeacuterimentation avec de nouvelles alternatives sanstenir compte de la connaissance du domaine Les reacutesultats obtenus via cette tactique sont incer-tains mais peuvent aussi aboutir agrave de nouveaux et potentiellement meilleurs reacutesultats que ceuxdeacutejagrave deacutecouverts

Lexploitation quant agrave elle est deacutenie comme le perfectionnement et lextension de reacute-sultats deacutejagrave connus Les reacutesultats obtenus via cette tactique sont plutocirct certains et preacutevisiblesCependant un processus trop axeacute sur lexploitation aura des diculteacutes agrave trouver de tregraves bonnessolutions agrave un problegraveme et aura tendance agrave deacutevelopper la premiegravere solution trouveacutee mecircme sidautres solutions de meilleures qualiteacutes pourraient ecirctre deacutecouvertes en explorant plus avant les-pace de recherche

Il est donc important de trouver un eacutequilibre entre lexploration de lespace de recherchepour trouver de nouvelles solutions et lexploitation permettant daner ces solutions Dautresmeacutethodes dexploration et de deacutecouverte de solutions dans un espace de recherche proposent destechniques speacuteciques pour solutionner ce problegraveme On peut par exemple citer la meacutethode dela descente du gradient consistant agrave minimiser une fonction reacuteelle dans un espace de rechercheCette meacutethode procegravede par iteacuterations successives et se deacuteplace dabord de maniegravere importantedans lespace de recherche an dexplorer un maximum de solutions Puis une fois quune bonnesolution est trouveacutee la meacutethode va diminuer son deacuteplacement dans lespace de recherche andaner la solution trouveacutee La descente de gradient utilise donc une approche ougrave lexplorationest dabord privileacutegieacutee puis petit agrave petit se dirige vers de lexploitation comme illustreacute dans laFigure 26

On pourrait penser agrave premiegravere vue que lexploitation autrement dit le fait que lagent prennela meilleure arecircte disponible agrave chaque choix sorant agrave lui permettrait dobtenir les meilleursreacutesultats En eet le but est ici de trouver le meilleur chemin soit le plus court chemin dans lecadre dune distance euclidienne dun sommet a agrave un sommet b Le fait de permettre agrave lagentde ne pas forceacutement prendre la meilleure arecircte lors de la construction du chemin est donc relati-vement contre-intuitif On peut cependant lever cette intuition avec une seacuterie dexpeacuterimentationsprovenant de la litteacuterature et des observations meneacutees sur les fourmis dans la nature Jean-LouisDeneubourg dont nous avons deacutejagrave parleacute au deacutebut de cette section a beaucoup eacutetudieacute le compor-tement des fourmis en milieu reacuteel et la modeacutelisation de leur processus deacutecisionnel collectif Il aainsi proposeacute en 1990 une expeacuterience appeleacutee le pont binaire [Deneubourg et al 1990] pouvantecirctre reacutesumeacutee ainsi le nid dune colonie de fourmis est seacutepareacutee dune source de nourriture par deuxchemins de longueurs identiques Pour ramener la nourriture au nid les fourmis peuvent doncemprunter lune de ces deux voies sans conseacutequence sur la longueur du chemin total Au deacutepartles fourmis empruntent les deux voies sans distinctions puis une fois un certain temps passeacute

40

24 Les systegravemes multi-agents

Figure 26 Exemple de descente de gradient ougrave lon peut voir lexploration au deacutebut avecun deacuteplacement rapide puis lexploitation ensuite vers la solution trouveacutee ( creacutedit image JorisGillis

une des voies est privileacutegieacutee par rapport agrave lautre et la majoriteacute des fourmis lempruntent Cecomportement est la conseacutequence des pheacuteromones deacuteposeacutees par les fourmis au bout de quelquestemps une des deux voies est emprunteacutee par plus de fourmis que lautre et comme les four-mis deacuteposent des pheacuteromones et sont attireacutees par celles-ci cette dieacuterence saccentue jusquagrave cequune voie soit majoritairement emprunteacutee Il est agrave noter que ce comportement de renforcementnest pas forceacutement vrai pour toutes les espegravece de fourmis dans la nature Cependant cest surce principe que Deneubourg a modeacuteliseacute les eacutequations deacuteterminant le choix eectueacutee par chaquefourmi Ces eacutequations sont agrave la base mecircme des modegraveles ACO deacuteveloppeacutes par Dorigo quelquesanneacutees plus tard Le dispositif de lexpeacuterience des ponts binaires est preacutesenteacute par la Figure 27

Figure 27 Illustration de lexpeacuterience des ponts binaires par Jean-Louis Deneubourg (a)Apregraves un certain temps les fourmis choisissent majoritairement une des deux voies possibles (b)[Deneubourg et al 1990]

Une autre expeacuterimentation du mecircme genre a eacuteteacute reacutealiseacutee par la mecircme eacutequipe de chercheurs ougraveles fourmis doivent se deacuteplacer dun point A agrave un point B en choisissant parmi dieacuterentes voiespossibles [Goss et al 1989] Le dispositif expeacuterimental contient cependant une dieacuterence notable

41

Chapitre 2 Eacutetat de lart

avec lexpeacuterience initiale dans le sens ougrave les dieacuterentes voies ne font pas la mecircme longueurComme le montre la Figure 28 pour aller du nid jusquagrave la nourriture les fourmis disposentdun chemin ougrave deux embranchements similaires sont proposeacutes Chacun de ces embranchementspossegravede une voie courte et une voie longue La fourmi a donc 4 choix agrave eectuer lors dun aller-retour pour partir de son nid et ramener de la nourriture Au deacutebut de lexpeacuterimentation lesfourmis ont besoin de 5 agrave 10 minutes pour explorer leur environnement et trouver la nourritureTous les chemins sont dabord choisis de maniegravere aleacuteatoire puis quelques minutes plus tard etde maniegravere abrupte le meacutecanisme de renforcement rentre en jeu et les voies les plus courtes sontprivileacutegieacutees Une trentaine de minutes apregraves le deacutebut de lexpeacuterimentation les fourmis empruntentmajoritairement le chemin le plus court

Figure 28 Scheacutema du dispositif expeacuterimental utiliseacute pour veacuterier si les fourmis sont biencapables demprunter rapidement la voie la plus courte lorsque leur sont preacutesenteacutes des choixqualitativement dieacuterents [Goss et al 1989]

Alors que la premiegravere expeacuterience a montreacute que les fourmis possegravedent bien un meacutecanismedexploration aleacuteatoire menant au choix puis au renforcement dune des deux voies possibles ladeuxiegraveme expeacuterience montre que les fourmis sont bien capables de choisir le chemin le plus courtlorsquelles sont confronteacutees agrave deux voies possibles ayant des distances dieacuterentes Une critiquepeut ecirctre formuleacutee dans le sens ougrave ces deux expeacuterimentations se sont deacuterouleacutees en laboratoireavec un dispositif expeacuterimental relativement petit (quelques dizaines de centimegravetres pour allerdu nid agrave la nourriture) De par la taille reacuteduite des dispositifs les expeacuterimentations ne duraientgeacuteneacuteralement pas plus dune trentaine de minutes Durant ce laps de temps relativement courtle meacutecanisme deacutevaporation des pheacuteromones ne pouvait pas entrer en jeu car les pheacuteromonesnavaient pas le temps de seacutevaporer

Ces deux expeacuteriences sont inteacuteressantes et illustrent chacune des capaciteacutes fondamentalesdes fourmis dans la nature quant agrave leur deacuteplacement et agrave leur survie Jean-Louis Deneubourg[Deneubourg et al 1990] et Marco Dorigo [Dorigo 2001] ont montreacute comment il eacutetait possible dereproduire ces comportements via des simulations informatiques Dans la tradition des systegravemesmulti-agents les principes permettant de modeacuteliser ces comportements sont relativement simpleset comme montreacute dans la section preacuteceacutedente seules quelques eacutequations susent agrave obtenir unemodeacutelisation de la reacutealiteacute et leacutemergence de comportements intelligents Dans la suite de cettesection nous allons voir quelques exemples dutilisation dalgorithmes provenant des modegraveles

42

25 Utilisation et eacutevolution reacutecentes des algorithmes de colonies de fourmis

ACO dans les systegravemes de recommandation

25 Utilisation et eacutevolution reacutecentes des algorithmes de colonies

de fourmis

Nous avons vu dans les sections preacuteceacutedentes que les algorithmes de colonies de fourmis onteacuteteacute utiliseacutees dans des problegravemes connus comme le voyageur de commerce les tourneacutees de veacutehi-cules ou la gestion de projet agrave contraintes Chacun de ces exemples a la particulariteacute decirctre unproblegraveme doptimisation ougrave le but est de minimiser une distance agrave parcourir ou un temps dexeacute-cution avec certaines contraintes ce qui correspond bien au but premier des ACO La versatiliteacutedes systegravemes multi-agents leur a permis de sadapter dans des domaines comme les systegravemesde recommandation et ils ont particuliegraverement eacuteteacute exploiteacute pour le-eacuteducation Dans la suite decette section nous allons eacutetudier quelques applications des algorithmes de la famille des ACOdans ce domaine particulier

251 Les algorithmes de colonies de fourmis dans les systegravemes de recomman-

dation

Lune des premiegraveres applications des ACO dans le domaine des systegravemes de recommandationa eacuteteacute proposeacutee par [Semet et al 2003] dans le-education Le but de leacutetude eacutetait de recomman-der des cours et des exercices agrave des lyceacuteens avec lobjectif peacutedagogique dameacuteliorer leur reacuteussitescolaire Cette eacutetude est inteacuteressante car en plus de proposer une modication des modegraveles ACOpour la recommandation elle a eacuteteacute reacutealiseacutee en partenariat avec Paraschool 30 une entreprise deacute-dieacutee agrave lapprentissage en ligne pour les lyceacuteens franccedilais permettant aux auteurs de tester leurmodegravele Dans ce dernier le domaine peacutedagogique est repreacutesenteacute par un graphe valueacute ougrave les som-mets sont des items peacutedagogiques et les arcs sont les liens hypertextes ougrave des probabiliteacutes depassage sont associeacutees Les eacutetudiants sont repreacutesenteacutes par des agents se deacuteplaccedilant dans le grapheen laissant des pheacuteromones sur les arcs quils suivent Chaque page de cours ou dexercice (re-preacutesenteacute par un sommet unique dans le graphe) est doteacute dun bouton NEXT amenant leacutetudiantvers un nouveau cours selon une arecircte choisie par lalgorithme selon les facteurs suivants

Poids peacutedagogique W cest la valeur principale de chaque arecircte Il est impleacutementeacutecomme une variable globale accessible agrave tous les agents W est manuellement deacuteni enamont par les professeurs et reegravete limportance des arecirctes venant dun sommet particulier(ie cet exercice est important apregraves la leccedilon x donc W = 0 8 la leccedilon y nest pas tregravesimportante apregraves la leccedilon x donc W = 0 3)

Pheacuteromones S and F S repreacutesente la pheacuteromone de succegraves tandis que F repreacutesente lapheacuteromone deacutechec S est increacutementeacutee quand les eacutetudiants ont reacuteussi agrave compleacuteter lexercicecorrespondant et inversement pour F Ces pheacuteromones sont associeacutees agrave larecircte qui ameneacute lagent au sommet courant mais aussi aux preacuteceacutedents sommets emprunteacutes avec unequantiteacute de plus en plus reacuteduite limiteacutee agrave 4 sommets en arriegravere Le but est de repreacutesenterle fait que le reacutesultat dun exercice deacutepend de lensemble du parcours emprunteacute et nondu dernier sommet uniquement 31 Les pheacuteromones seacutevaporent aussi au fur et agrave mesure

30 http wwwparaschoolcom31 Cette meacutethode est similaire dans son fonctionnement agrave la technique de reacutetropropagation du gradient dans

lapprentissage des reacuteseaux de neurones

43

Chapitre 2 Eacutetat de lart

chaque jour Historique personnel H cest une variable propre agrave chaque sommet visiteacute pour chaque

agent Quand un eacutetudiant valide le module peacutedagogique associeacute au sommet alors la valeurh associeacutee agrave ce sommet particulier est eacutegale agrave 0 5 quand un eacutetudiant eacutechoue le modulepeacutedagogique alors h = 0 75 Cette valeur est ensuite utiliseacutee comme facteur multiplicatifpour reacuteduire la probabiliteacute de visiter le sommet agrave nouveau Si le sommet est revisiteacute Hest agrave nouveau multiplieacute par ces mecircmes valeurs H seacutevapore avec le temps pour tendrevers 1 symbolisant le fait que plus le temps passe et plus un eacutetudiant aura tendance agraveoublier le module peacutedagogique visiteacute

Pour chaque arc a une tness value est calculeacutee selon lEacutequation f(a) = H(ω1W + ω2S minusω3F ) ougrave ω1 ω2 et ω3 sont les poids permettant de moduler limportance des 3 facteurs pris encompte Plus la valeur de f(a) est haute et plus larc sera consideacutereacute attractif Un arc sera doncattractif quand

son ndivideud darriveacutee na jamais eacuteteacute visiteacute ou na pas eacuteteacute visiteacute depuis longtemps (H rarr 1) il est pleacutebisciteacute par les professeurs (W important) il y a une atmosphegravere de succegraves autour de cet arc (S important) peu deacutechecs ont eu lieu pregraves de cet arc (F faible)

An de choisir le prochain arc pour leacutetudiant le systegraveme seacutelectionne aleacuteatoirement un cer-tain nombre darcs possibles et garde celui posseacutedant la plus haute valeur f(a) La seacutelection dunsous-ensemble darcs permet de varier un minimum les recommandations et deacuteviter de proposertout le temps les arcs les plus attractifs

Les auteurs proposent donc ici une adaptation complegravete des ACO pour un systegraveme de recom-mandation dans le-eacuteducation tout en inteacutegrant des principes peacutedagogiques importants Luti-lisation de plusieurs types de pheacuteromones et de dieacuterentes valuations sur les arecirctes du graphepermettent dentrevoir le potentiel et ladaptabiliteacute des algorithmes ACO Quelques critiquespeuvent cependant ecirctre proposeacutees

Une premiegravere critique possible est quil nexiste pas de modegravele utilisateur prenant en compteles caracteacuteristiques personnelles de chaque eacutetudiant (notes niveau style dapprentissage) Pos-seacuteder et utiliser un modegravele par eacutetudiant pourrait permettre agrave lalgorithme de mieux sadapteraux cas particuliers nombreux dans le domaine des systegravemes de recommandation [Gras et al2016] Dans cet article les auteurs montrent que les techniques classiques de ltrage collaboratifnarrivent pas agrave bien deacutetecter les utilisateurs atypiques 32 alors quil est possible de deacutetecter etde satisfaire ces derniers avec des techniques speacuteciques

Une autre critique possible concerne le fait que les professeurs doivent au preacutealable eacutevaluerles chemins possibles agrave partir de chaque sommet sous la forme du poids peacutedagogique W Ce faitreacutevegravele que lexpeacuterimentation na pas utiliseacute un grand nombre de ressources peacutedagogiques (ce quiest le cas car le graphe utiliseacute par les auteurs ne posseacutedait que 20 ndivideuds et 47 arecirctes soit 20ressources peacutedagogiques) Dans la pratique cette meacutethode nest pas adapteacutee pour trois raisonsmajeures Premiegraverement il est dicilement concevable deacutevaluer manuellement la probabiliteacute de

32 Les utilisateurs atypiques (Grey Sheep Users) sont des utilisateurs posseacutedant des preacutefeacuterences dieacuterentes dela majoriteacute des autres utilisateurs du systegraveme

44

25 Utilisation et eacutevolution reacutecentes des algorithmes de colonies de fourmis

passage de chaque arecircte dans des domaines deacutepassant les quelques dizaines de ressources Deuxiegrave-mement lutilisation dexperts du domaine comme les professeurs dans le-eacuteducation nest pasforceacutement possible selon le domaine consideacutereacute Qui peut par exemple juger de la qualiteacute destransitions agrave partir dune musique speacutecique Troisiegravemement un tel modegravele nest que dicile-ment transfeacuterable en leacutetat dun domaine applicatif agrave un autre pour les raisons eacutevoqueacutees ci-dessus

Inteacuteressons-nous maintenant agrave une autre eacutetude dans le-eacuteducation qui propose une solutionpour permettre une plus grande personnalisation des recommandations Dans leur article [Kurilo-vas et al 2015] utilisent eux aussi les ACO avec comme but de fournir des seacutequences composeacutees demodules dapprentissage aux eacutetudiants en fonction de leur style dapprentissage Des recherchesont montreacute quil existait de grands styles dapprentissage et que les apprenants posseacutedaient despreacutefeacuterences pour certains styles plus que dautres Les auteurs utilisent ici la cateacutegorisation en 4grands styles proposeacutee par [Honey et al 1992] 33 Ainsi les agents ne sont deacutesormais plus tousidentiques mais possegravedent un ou plusieurs style(s) dapprentissage preacutefeacutereacute(s) et la mise agrave jourdes pheacuteromones est elle aussi modieacutee an de prendre en compte ces preacutefeacuterences Ainsi un agentpreacutefeacuterera un chemin composeacute de modules dapprentissage correspondant agrave son ou ses propre(s)style(s) dapprentissage et deacuteposera plus de pheacuteromones le cas eacutecheacuteant Ces changements reegravetentune volonteacute de personnalisation des recommandations sinscrivant dans le reacutecent changement deparadigme du domaine des systegravemes de recommandation ougrave les preacutefeacuterences des utilisateurs sontde plus en plus prises en compte Il est neacuteanmoins agrave noter pour cette eacutetude quil est neacutecessairede faire passer un long questionnaire pour deacutenir les styles dapprentissage des apprenants avantde pouvoir utiliser le systegraveme De plus ces styles dapprentissage sont xes et ne peuvent plusecirctre modieacutes apregraves le deacutemarrage du systegraveme empecircchant potentiellement un apprenant deacutevoluerdans sa maniegravere dapprendre

Lideacutee de modier le modegravele ACO pour prendre en compte plusieurs types dutilisateurs aaussi eacuteteacute exploiteacutee dans une autre eacutetude en e-eacuteducation par [Kardan et al 2014] Cette eacutetude a lemecircme but que la preacuteceacutedente agrave savoir recommander des seacutequences personnaliseacutees eacuteducatives avecACO mais les auteurs proposent une autre solution tout aussi inteacuteressante Ils se basent ainsi surla theacuteorie de David Ausubel selon laquelle lapprentissage est faciliteacute lorsque lapprenant peutmettre en relation les nouveaux concepts quil est en train de deacutecouvrir avec ce quil connaicirct deacutejagrave[Ausubel 1963] Les auteurs proposent un algorithme en deux parties

1 Les apprenants sont dabord eacutevalueacutes avec des items de tests correspondant chacun agrave unou plusieurs concepts devant ecirctre appris An de deacuteterminer le degreacute de familiariteacute agraveun concept par un apprenant le score quil a obtenu agrave chaque item de test est utiliseacuteen combinaison avec le degreacute de lien entre les concepts et chaque item pour creacuteer unematrice learners times concepts Lalgorithme des k-means est ensuite utiliseacute an de diviserles apprenants en groupes ayant les mecircmes familiariteacutes avec les concepts

2 lalgorithme ACO est appliqueacute avec autant de groupes dagents speacuteciques quil y a degroupes dapprenants deacutecouverts preacuteceacutedemment avec les k-means Ainsi un chemin opti-mal est trouveacute pour chaque groupe permettant de naviguer parmi tous les concepts dansun ordre preacutecis et speacutecique au degreacutes de familiariteacute de chaque groupe Autrement dit lesystegraveme recommande pour chaque groupe dapprenants une seacutequence eacuteducative person-naliseacutee en fonction de ses connaissances initiales

33 Activist Theorist Pragmatist Reector

45

Chapitre 2 Eacutetat de lart

On retrouve donc ici lideacutee de creacuteer dieacuterents types dagents pour reacutesoudre dieacuterents pro-blegravemes Cette constatation nest pas eacutetonnante dans le sens ougrave lorsquil sagit doptimisationun seul groupe dagents peut sure agrave optimiser une variable unique comme par exemple la dis-tance En revanche dans le domaine des systegravemes de recommandation il nest pas envisageablede proposer la mecircme recommandation agrave tous les utilisateurs Au contraire lapproche agrave privi-leacutegier est de pouvoir sadapter au cas par cas agrave chaque utilisateur et de prendre en compte sespreacutefeacuterences pour lui proposer une solution adapteacutee On peut dailleurs eacutemettre deux critiques decette eacutetude agrave la lumiegravere de cette analyse Premiegraverement mecircme si le modegravele propose un certaindegreacute de personnalisation sa granulariteacute nest encore pas assez ne puisquil traite des groupesdindividus et non un individu unique Ensuite il ny a encore une fois pas de moyen pour unapprenant de changer dynamiquement de groupe eacutetant donneacute que ces derniers doivent ecirctre creacuteeacutesen amont du processus de recommandation

Toujours dans la famille des algorithmes ACO nous pouvons eacutegalement citer le modegraveleAttribute-based Ant Colony System qui est similaire aux derniers modegraveles deacutecrits ci-dessus touten proposant un degreacutes de personnalisation plus n [Yang and Wu 2009] Les auteurs utilisentle modegravele dapprentissage de Kolb [Kolb and Fry 1974] an dassigner agrave chaque ressource eacuteduca-tive et agrave chaque apprenant deux attributs les deacutecrivant (type dapprentissage de la ressourcedelapprenant et niveau de compeacutetence de la ressourcede lapprenant) Les agents possegravedent aussices attributs puisquils correspondent aux apprenants Les auteurs calculent ensuite un niveaude correspondance entre lapprenant et la ressource eacuteducative permettant de juger de la qualiteacutedu chemin trouveacute Finalement la seacutequence dont les ressources eacuteducatives la composant corres-pondent le plus aux caracteacuteristiques de lagent est recommandeacutee agrave lapprenant Ce travail estinteacuteressant car il pousse encore un peu plus la personnalisation des recommandations Cependanton commence agrave remarquer ici que la neacutecessiteacute de personnaliser toujours plus les recommandationscommence agrave complexier de maniegravere importante les systegravemes proposeacutes Nous discuterons plusen deacutetail de ce point dans la conclusion de cette section

Prenons enn une derniegravere eacutetude dans le domaine de le-eacuteducation qui sest particuliegravere-ment inteacuteresseacutee agrave la notion de seacutequence et dobjectif agrave atteindre pour lapprenant [Van den Berget al 2005] En eet les auteurs expliquent que les plateformes deacuteducation en ligne proposentde plus en plus datteindre des objectifs peacutedagogiques de haut niveau (eg acqueacuterir une com-peacutetence speacutecique posseacuteder un certain niveau de connaissance dans un domaine ) tout enlaissant les apprenants libres de suivre les modules quils souhaitent Cependant cette exibiliteacutede fonctionnement complexie les programmes de ces plateformes et peut amener agrave labandondes apprenants Pour remeacutedier agrave ce problegraveme les auteurs proposent un systegraveme de guidage desapprenants utilisant ACO baseacute sur la speacutecication au preacutealable de plusieurs concepts pour chaqueapprenant

Le but de lapprenant cest la description du niveau de compeacutetence que lapprenant veutatteindre)

Le parcours le plan pour atteindre le but de lapprenant deacutecrit comme une seacuterie deseacutequences de ressources eacuteducatives Les plateformes dapprentissage en ligne proposentsouvent elles-mecircmes des parcours via lesquels les apprenants peuvent atteindre leur but

La position de lapprenant repreacutesente lensemble des ressources eacuteducatives ayant eacuteteacutecompleacuteteacutees par lapprenant

Autrement dit an de pouvoir satisfaire un apprenant il est neacutecessaire de savoir quel est

46

25 Utilisation et eacutevolution reacutecentes des algorithmes de colonies de fourmis

le but quil souhaite atteindre la maniegravere dont il veut latteindre et sa position actuelle Cestrois informations sont primordiales pour comprendre la trajectoire dun utilisateur et pour ecirctrecapable de lui recommander une seacutequence adapteacutee agrave ses besoins

Nous avons vu dans cette section le potentiel des algorithmes de colonies de fourmis pour larecommandation Neacuteanmoins la premiegravere partie de leacutetat de lart a montreacute agrave quel point il eacutetaitimportant pour les systegravemes actuels de pouvoir prendre en compte plusieurs facteurs humainsan de satisfaire au mieux les utilisateurs Dans la section suivante nous allons nous inteacuteresseragrave la maniegravere dont les algorithmes de colonies de fourmis sont capables de minimiser non plus unseul objectif (la distance) mais bien plusieurs objectifs pouvant ecirctre opposeacutes les uns aux autres

252 Les algorithmes de colonies de fourmis multi-objectifs

En parallegravele du deacuteveloppement des algorithmes de colonies de fourmis mono-objectif dans lalitteacuterature une partie de la communauteacute scientique sest inteacuteresseacutee aux algorithmes de coloniesde fourmis multi-objectifs dans le but de reacutesoudre de nouvelles classes de problegravemes En eetles algorithmes ACO ont agrave lorigine eacuteteacute conccedilus pour minimiser une valeur souvent repreacutesenteacuteepar la notion de distance Cependant de nombreux problegravemes neacutecessitent la minimisation demultiples valeurs en parallegravele an dobtenir une solution On peut par exemple citer les variantesmulti-objectifs de problegravemes vus dans la section preacuteceacutedente

Le problegraveme du voyageur de commerce multi-objectifs (multi-objective travelling salesmanproblem) ougrave la distance agrave minimiser ainsi que le temps de voyage sont les deux objectifsagrave minimiser (avec lintroduction de contraintes de circulation rendant certains cheminsplus ou moins longs agrave emprunter)

Le problegraveme de la tourneacutee de veacutehicules avec fenecirctre de temps (vehicle routing problem withtime windows) ougrave en plus de minimiser le nombre de veacutehicules utiliseacutes et le trajet totalparcouru par ceux-ci les clients doivent ecirctre livreacutes dans une certaine fenecirctre de temps

Dans le cas de ces deux problegravemes ainsi que pour beaucoup de problegravemes multi-objectifstraiteacutes dans la litteacuterature scientique les objectifs agrave minimiser sont souvent incompatibles entreeux dans le sens ougrave minimiser un objectif speacutecique tend agrave peacutenaliser un ou plusieurs des autresobjectifs Prenons comme exemple le problegraveme du voyageur de commerce multi-objectifs Le butest de trouver le plus court chemin dun point A agrave un point B non seulement dun point devue de la distance parcourue mais aussi du temps neacutecessaire pour faire le chemin Cependantminimiser la distance parcourue impliquera potentiellement demprunter des chemins encombreacutesrallongeant le temps de voyage En dautres termes minimiser lobjectif de distance parcouruepeut deacutegrader lobjectif de temps Inversement optimiser lobjectif de temps demanderait po-tentiellement dutiliser des chemins moins emprunteacutes mais plus longs deacutegradant ainsi lobjectifde minimisation de la distance totale parcourue Ces problegravemes ougrave loptimisation dun objectifaecte les performances des autres objectifs ne possegravedent souvent pas de solution optimale Eneet dans un problegraveme mono-objectif plus un algorithme reacuteussira agrave minimiser cet objectif etmeilleure sera la solution Un problegraveme mono-objectif possegravede donc une solution optimale ougravelobjectif agrave optimiser possegravede une valeur minimale et corollairement il est possible de classerles solutions trouveacutees en fonction de cette valeur Autrement dit pour deux solutions dieacuterentess1 s2 devant minimiser la valeur v pour le mecircme problegraveme si vs1 lt vs2 alors s1 est strictementune meilleure solution que s2 Pour les problegravemes multi-objectifs il nest pas directement possiblede deacuteterminer si une solution est meilleure quune autre Lexemple du voyageur de commerce

47

Chapitre 2 Eacutetat de lart

multi-objectifs avec la distance d et le temps t illustre bien ce fait comment deacuteterminer si une

solution s1 =

d = 13 kmt = 23 mn

est meilleure quune autre solution s2 =

d = 11 kmt = 26 mn

Devant

la multitude de solutions possibles sans moyen direct de les classer il est utile de consideacutererle concept doptimum de Pareto Le principe de Pareto a dabord eacuteteacute inventeacute dans le domainesocio-eacuteconomique pour deacutecrire la distribution de pouvoir et de richesses au sein dune populationIl a ensuite eacuteteacute eacutetendu avec la notion doptimum de Pareto deacutecrivant lensemble des solutionsagrave un problegraveme multi-objectifs ougrave il nest pas possible dameacuteliorer un des objectifs sans deacutegraderles autres 34 Toutes les solutions Pareto-optimales agrave un problegraveme sont donc eacutequivalentes entreelles (mecircme si elles sont bien toutes dieacuterentes les unes des autres) et sont strictement meilleuresque toutes les autres solutions non optimales agrave ce mecircme problegraveme (aussi appeleacutees solutions do-mineacutees) La Figure 29 illustre lespace des solutions sur un problegraveme de minimisation de deuxvariables On remarque la preacutesence dune frontiegravere aussi appeleacute front de Pareto ougrave toutes lessolutions sont optimales

Figure 29 Front de Pareto dun problegraveme de minimisation de deux variables f1 et f2 Toutesles solutions sur cette frontiegravere sont optimales (source Wikipedia)

On peut trouver dans la litteacuterature des exemples de reacutesolution de problegravemes multi-objectifsavec ACO utilisant le concept de Pareto [Alaya et al 2007] proposent un algorithme geacuteneacuteriquebaseacute sur le MAX-MIN Ant System 35 ougrave les nombres de colonies et de structures de pheacuteromonesvarient en fonction du nombre dobjectifsm agrave optimiser Les auteurs proposent ainsi plusieurs va-riantes de leur algorithme ayant des paramegravetres dieacuterents (nombres de colonies de pheacuteromonesde fourmis de cycles et valeur des meta-paramegravetres) Ces dieacuterentes versions sont ensuite testeacuteesavec le problegraveme du sac-agrave-dos multi-objectifs 36 et montrent que la version posseacutedant 1 seulecolonie et m pheacuteromones obtient les meilleurs reacutesultats Outre les reacutesultats obtenus ce travailest inteacuteressant car il propose plusieurs strateacutegies dieacuterentes pour pouvoir adapter les algorithmes

34 On peut deacutecliner ce concept en socio-eacuteconomie ougrave le but est deacutetudier les richesses dune socieacuteteacute an quellessoient reacuteparties selon une solution optimale de Pareto entre toutes les personnes Ce concept a cependant deslimites que nous verrons par la suite35 Le MAX-MIN Ant System [Stuumltzle and Hoos 2000] est une version dieacuterente de lalgorithme initial de

Marco Dorigo posseacutedant deux dieacuterences majeures avec ce dernier seule la fourmi ayant reacutealiseacutee le meilleurparcours peut mettre agrave jour les pheacuteromones du chemin emprunteacute et la quantiteacute de pheacuteromones est limiteacute dans unintervalle speacutecique sur chaque arc36 Le plus souvent reacutefeacuterenceacute dans la litteacuterature en anglais via lacronyme MOKP Multi-Objective Knapsack

Problem

48

25 Utilisation et eacutevolution reacutecentes des algorithmes de colonies de fourmis

ACO aux problegravemes multi-objectifs agrave savoir

Traces de pheacuteromones 2 strateacutegies existent lorsquun problegraveme possegravede plusieurs objec-tifs La premiegravere est de nutiliser quun seul type de pheacuteromones Dans ce cas la quantiteacutede pheacuteromones deacuteposeacutee par les fourmis est deacutenie par une agreacutegation des dieacuterents objec-tifs La deuxiegraveme strateacutegie consiste agrave utiliser plusieurs pheacuteromones Dans ce cas chaqueobjectif est geacuteneacuteralement associeacute agrave une colonie de fourmis unique chacune posseacutedant sonpropre type de pheacuteromones

Deacutenition des heuristiques encore une fois 2 strateacutegies existent pour la partie heuristiqueUne premiegravere solution consiste agrave agreacuteger tous les objectifs en une seule heuristique Unedeuxiegraveme solution consiste agrave consideacuterer chaque objectif seacutepareacutement Dans ce cas il y ageacuteneacuteralement une colonie par objectif

Mise-agrave-jour des pheacuteromones lors de la mise agrave jour des pheacuteromones il est neacutecessaire dedeacutecider sur quelle solution des pheacuteromones doivent ecirctre deacuteposeacutees Une premiegravere possibi-liteacute est de reacutecompenser les meilleures solutions agrave chaque objectif Une seconde possibiliteacuteest de reacutecompenser toutes les solutions appartenant agrave lensemble des solutions Pareto-optimales

Le concept doptimisation multi-objectifs est aussi utiliseacute pour reacutesoudre des problegravemes sansutiliser des algorithmes de type ACO Ces travaux sont inteacuteressants dans le cadre de cette thegravesecar ils peuvent orir un point de comparaison aux modegraveles deacuteveloppeacutes dans le chapitre suivantougrave le but est le mecircme mais la technique utiliseacutee pour y parvenir est dieacuterente Nous allons main-tenant voir plus en deacutetails le travail de [Ribeiro et al 2014] ougrave les auteurs ont proposeacute deuxmeacutethodes de recommandation multi-objectifs sans utiliser dalgorithmes de type ACO

Pareto-ecient ranking dans cette premiegravere meacutethode le principe est ici de re-preacutesenter chaque ressource recommandable agrave un point dans un espace agrave n dimensionsappeleacute le user-interest space Un point dans cet espace est repreacutesenteacute par n coordon-neacutees [c1 c2 cn] ougrave chacune repreacutesente un score de pertinence de la ressource pourlutilisateur estimeacute par dieacuterents algorithmes Les points situeacutes agrave la frontiegravere de Paretocorrespondent aux cas ougrave aucune Pareto-ameacutelioration nest possible dans les dieacuterentesdimensions

Pareto-Ecient Hybridization (PEH) dans cette deuxiegraveme meacutethode le principe estdassocier chaque ressource avec une valeur de pertinence unique pour lutilisateur Cettevaleur est elle-mecircme estimeacutee par une combinaison lineacuteaire des scores de pertinence obtenuspar n dieacuterents algorithmes de recommandation existants (ie αtimesc1+βtimesc2+ +θtimescn)Dans cette tactique lespace appeleacute objective space comporte 3 dimensions ougrave chaquepoint correspond aux niveaux de preacutecision de diversiteacute et de nouveauteacute atteint par unetechnique dhybridation possible Le but est de chercher les poids (ie α β θ) pourlesquels lhybridation des dieacuterents algorithmes permet dobtenir le meilleur reacutesultat pourlutilisateur Il est ensuite possible de moduler cette hybridation an de correspondre aumieux aux prioriteacutes de lutilisateur au moment de la recommandation (eg pour un utilisa-teur reacutecent le systegraveme pourrait proposer des ressources pertinentes et classiques pour luiprouver linteacuterecirct du systegraveme de recommandation tandis que pour un utilisateur ancienil pourrait ecirctre inteacuteressant de privileacutegier la diversiteacute et la nouveauteacute an de lui apporterde nouvelles ressources quil ne connaicirct pas encore)

Selon les auteurs la premiegravere meacutethode permet de trouver un ordonnancement partiel entre

49

Chapitre 2 Eacutetat de lart

les ressources tout en eacutevitant les ressources positionneacutees aux positions extrecircmes de la frontiegravere dePareto La deuxiegraveme meacutethode quant agrave elle utilise la frontiegravere de Pareto pour trouver des hybri-dations capable de sadapter aux demandes et dorir des recommandations eacutetant simultaneacutementpertinentes en termes de preacutecision de diversiteacute et de nouveauteacute Dans le cadre de cette thegravese ladeuxiegraveme technique pareto-ecient hybridization (PEH) est particuliegraverement inteacuteressante carelle correspond aux probleacutematiques poseacutees au chapitre preacuteceacutedent De plus cet article est agrave lafois reacutecent est beaucoup reacutefeacuterenceacute dans la litteacuterature scientique de par la qualiteacute des solutionsproposeacutees Ainsi nous preacuteciserons le fonctionnement de lalgorithme PEH proposeacute par [Ribeiroet al 2014] et nous utiliserons ses reacutesultats comme comparaison pour eacutevaluer les performancesde notre modegravele dans la chapitre preacutesentant les expeacuterimentations meneacutees et les reacutesultats obtenus

253 Discussion sur lutilisation de loptimum de Pareto

Dans ces derniegraveres pages nous nous sommes attardeacutes sur lutilisation du concept doptimumde Pareto dans la litteacuterature Cependant mecircme si lutilisation de cette technique est courantepour reacutesoudre des problegravemes multi-objectifs elle nest pas forceacutement la plus adapteacutee selon lessituations rencontreacutees et les solutions attendues On peut deacutenombrer au moins quatre problegravemesengendreacutes par lutilisation du concept de Pareto

1 Comme le souligne [Iredi et al 2001] lutilisation du front de Pareto est utile lorsquilnest pas possible dordonner limportance des dieacuterents objectifs du problegraveme Lorsquecela est possible des poids sont attribueacutes agrave chacun des objectifs et il devient possible declasser les dieacuterentes solutions obtenues selon ces poids

2 Il est neacutecessaire decirctre capable de geacuteneacuterer beaucoup de solutions pour un problegraveme donneacutean de pouvoir deacuteterminer les solutions Pareto-optimales et les solutions domineacutees

3 Une solution Pareto-optimale nest pas forceacutement une solution inteacuteressante pour le pro-blegraveme Un exemple connu illustre ce fait une socieacuteteacute ougrave un seul homme possegravede lensembledes richesses est optimale car partager ces richesses entraicircnerait la reacuteduction du bien-ecirctredau moins un individu

4 Si le problegraveme exige le choix dune solution le front de solutions Pareto-optimales nepermet pas a priori de faire un choix eacutetant donneacute que toutes les solutions du front sonteacutequivalentes les unes aux autres Le problegraveme dispose alors dun ensemble de solutions lereacutesolvant et non dune seule solution

Le dernier point ci-dessus est eacutegalement eacutevoqueacute dans [Dorigo and Birattari 2010] ougrave lesauteurs expliquent que deux maniegraveres de reacutesoudre les problegravemes multi-objectifs existent dans lalitteacuterature soit il est possible de classer les objectifs par ordre dimportance ou eacuteventuellementde combiner tous les objectifs en un seul gracircce agrave une somme pondeacutereacutee soit les preacutefeacuterences ou lespoids a priori ne sont pas connus et dans ce cas il est inteacuteressant de deacuteterminer un ensemblede solutions Pareto optimales Dans le cadre dun systegraveme de recommandation et comme nouslavons illustreacute dans la Section 22 il est possible destimer les besoins des utilisateurs danschacune des dimensions eacutevalueacutees (diversiteacute nouveauteacute preacutecision ) et donc de moduler leurimportance en amont de la recommandation (eg en leur attribuant des poids par exemple)

26 Discussion geacuteneacuterale

Dans cet eacutetat de lart nous avons fait un tour dhorizon du domaine de la recommandationet de son eacutevolution au cours de ces derniegravere anneacutees Avec la deacutemocratisation dInternet de plus

50

26 Discussion geacuteneacuterale

en plus dutilisateurs ont eacuteteacute ameneacutes agrave utiliser ces systegravemes et aujourdhui ils accompagnentlimmense majoriteacute des grands sites web et prennent une place de plus en plus importante Cettedeacutemocratisation a permis la mise en relief des besoins toujours plus varieacutes des utilisateurs et amontreacute que les systegravemes mono-objectif baseacutes uniquement sur la preacutecision des recommandationsneacutetaient plus susants Agrave la lumiegravere de ce constat nous nous sommes particuliegraverement inteacute-resseacutes aux techniques permettant de prendre en compte le plus de dimensions possibles dans lesbesoins des utilisateurs que nous avons appeleacutes facteurs humains Les travaux de la litteacuteraturedu domaine preacutesenteacutes dans cette section ont permis de mettre en exergue un certain nombre depoints inteacuteressants qui seront utiliseacutes pour reacutepondre aux probleacutematiques de cette thegravese ils sontreacutesumeacutes dans la liste suivante

[Dorigo and Birattari 2011] les auteurs ont preacutesenteacute dieacuterents modegraveles dalgorithmes defourmis permettant de reacutesoudre un grand nombre de problegravemes Ces modegraveles sont inteacuteres-sants notamment de par leur capaciteacute de reacutesoudre des problegravemes multi-objectifs complexesgracircce aux notions dintelligence collective et deacutemergence Ils sont utiliseacutes dans dieacuterentsdomaines dapplication (optimisation recommandation) ils sont tregraves modulables etorent de nombreuses possibiliteacutes pour les probleacutematiques de cette thegravese

[Semet et al 2003] cette eacutetude est lune des premiegraveres agrave proposer lutilisation de plusieurspheacuteromones dieacuterentes dans les ACO dans le cadre dun systegraveme de recommandation dansle-education Ces dieacuterents pheacuteromones eacutetaient chacun destineacutes agrave reacutesoudre une facettedu problegraveme Ce travail a neacuteanmoins aussi montreacute les limites de la creacuteation manuelle dungraphe sur lequel appliquer les ACO deacutemontrant linteacuterecirct davoir une meacutethode automa-tique de creacuteation et de valuation dun graphe repreacutesentant le domaine dapplication et sesressources

[Kurilovas et al 2015] les auteurs ont deacutemontreacute dans cette eacutetude linteacuterecirct de pouvoircateacutegoriser les utilisateurs dun systegraveme an de personnaliser davantage les recommanda-tions mais elle a aussi montreacute le besoin de pouvoir modier en cours de fonctionnementces cateacutegories pour ne pas enfermer les utilisateurs dans les mecircmes recommandations

[Kardan et al 2014] les auteurs ont ici montreacute lutilisation de plusieurs types dagentsdieacuterents qui chacun cherchaient dieacuterentes solutions Cette technique est proche de luti-lisation des dieacuterents types de pheacuteromones de [Semet et al 2003] et permet de chercherdes solutions plus varieacutees agrave des problegravemes complexes

[Yang and Wu 2009] cette eacutetude utilise les modegraveles ACO dans le-education en eacutetoantencore le niveau de personnalisation pour chaque utilisateur Elle illustre cependant leproblegraveme courant ougrave lameacutelioration de la personnalisation des recommandations reacutesultesouvent dans laugmentation de la complexiteacute du modegravele

[Van den Berg et al 2005] cet article propose de recommander des seacutequences de res-sources eacuteducatives agrave des apprenants Il illustre linteacuterecirct de deacutenir une seacutequence de recom-mandation avec des buts peacutedagogiques agrave atteindre un objectif nal et un point de deacutepartougrave lutilisateur se trouve actuellement

[Ribeiro et al 2014] ce dernier article nutilise pas les ACO mais une hybridation de plu-sieurs algorithmes permettant de proposer des recommandations de ressources pertinentespour chaque utilisateur sur 3 dimensions (preacutecision diversiteacute nouveauteacute) Il propose doncde reacutesoudre un problegraveme similaire agrave celui poseacute dans cette thegravese mais avec une techniquedieacuterente des travaux preacutesenteacutes preacuteceacutedemment il sera par conseacutequent une solide base decomparaison pour mesurer les performances dun algorithme de type ACO

Dune maniegravere geacuteneacuterale cette revue des travaux sur les algorithmes de colonies de fourmis

51

Chapitre 2 Eacutetat de lart

ont montreacute leur puissance de reacutesolution de problegravemes varieacutes et leur modulariteacute Cependant nousavons aussi constateacute ici une tendance geacuteneacuterale ces derniegraveres anneacutees agrave complexier toujours plusle modegravele initial et les agents le composant illustrant un certain eacuteloignement avec la philosophiedes modegraveles multi-agents Celle-ci repose sur la reacutesolution de problegravemes complexes gracircce agrave laproprieacuteteacute de leacutemergence et de lauto-organisation dagents simples reacutegis par des regravegles simplesCette complexication deacutecoule cependant de la direction prise par le domaine des systegravemes de re-commandation ces derniegraveres anneacutees avec la deacutemocratisation de nombreuses mesures deacutevaluationtelles que la diversiteacute la nouveauteacute etc Dans la suite de cette thegravese nous eacutetudierons la maniegraveredont il est possible de combiner la neacutecessaire complexication des recommandations an decirctrele plus pertinent possible pour lutilisateur et la simpliciteacute inheacuterente aux modegraveles multi-agents

En conclusion nale de cet eacutetat de lart nous pouvons deacutenir deux enjeux qui guiderontla suite de ce travail la recommandation multi-objectifs et la recommandation enseacutequences Le but de cette thegravese est donc de sinscrire agrave lintersection de ces deux enjeux gracircceagrave un modegravele de colonies de fourmis multi-objectifs qui sera deacutecrit dans le chapitre suivant

52

Chapitre 3

Notre modegravele de recommandationmulti-objectifs AntRS

Sommaire

31 Introduction 54

32 Fonctionnement geacuteneacuteral du modegravele 54

33 Graphe 55

34 Objectifs 60

341 Similariteacute 63

342 Diversiteacute 64

343 Nouveauteacute 64

344 Preacutefeacuterences 66

345 Progressiviteacute 67

35 Tactiques de fusion 70

351 Colonie de fusion 71

352 Fusion de seacutequences 72

353 Conclusion 72

53

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

31 Introduction

Apregraves cet eacutetat des lieux de la recherche sur les systegravemes de recommandation il peut ecirctre utilede rappeler ici les principaux objectifs que nous nous sommes xeacutes pour ecirctre satisfaits par notremodegravele multi-objectifs de recommandation de seacutequences

Ecirctre susamment geacuteneacuterique pour quil puisse ecirctre utiliseacute dans plusieurs domaines touten sadaptant aux diverses contraintes et eacutevolutions de lenvironnement de ces domaines

Permettre de prendre des facteurs humains Pouvoir geacuterer dimportantes quantiteacute de donneacutees cest-agrave-dire ecirctre capable de produire des

recommandations satisfaisantes dans un grand espace de recherche Produire des recommandations sous forme de seacutequences

Tous ces objectifs sont neacutecessaires pour produire un modegravele reacutepondant aux probleacutematiqueseacutenonceacutees dans lintroduction de ce manuscrit Le modegravele que nous avons conccedilu prend inspirationdes modegraveles de colonies de fourmis preacutesenteacutes dans leacutetat de lart et plus particuliegraverement dela variante ACS (Ant Colony System) car cette version possegravede des qualiteacutes intrinsegraveques im-portantes notamment sa capaciteacute supeacuterieure dexploration de lenvironnement pour reacutepondreaux probleacutematiques poseacutees Pour rappel les avantages du modegravele ACS ont eacuteteacute deacutetailleacutes dans laSection 243 En se basant sur Dans la suite de ce chapitre nous deacutetaillerons le fonctionnementgeacuteneacuteral du modegravele dans la Section 32 Ensuite nous preacutesenterons la creacuteation du graphe dansla Section 33 et les facteurs humains consideacutereacutes et leur inteacutegration dans la Section 34 Nousdeacutetaillerons par la suite les deux tactiques de fusion des reacutesultats pour la recommandation naledans la Section 35 et enn nous discuterons du modegravele dans son ensemble

32 Fonctionnement geacuteneacuteral du modegravele

Dans le chapitre preacuteceacutedent sur leacutetat de lart nous avons preacutesenteacute dans la Section 243 lemodegravele ACS de Dorigo et son fonctionnement [Dorigo and Birattari 2010] Notre modegravele sinspiredACS dans le sens ougrave nous reprenons les grandes eacutetapes de ce dernier tout en ladaptant aucontexte et aux contraintes des systegravemes de recommandation Pour rappel voici lalgorithme 1de haut niveau sur lequel se base le fonctionnement de lensemble des algorithmes des ACO

Algorithm 1 Meacutetaheuristique Ant Colony Optimization

Initialisation des paramegravetres et des pheacuteromoneswhile conditions darrecircts non atteintes doConstruction des solutionsRecherche Locale (optionnelle)Mise agrave jour des pheacuteromones

end while

Chaque version existante des ACO a introduit des variations dans une ou plusieurs deseacutetapes centrales de lalgorithme La variante ACS a par exemple introduit la mise agrave jour localedes pheacuteromones dans la derniegravere eacutetape UpdatePheromones Notre modegravele suit cette philosophieen prolongeant les travaux de Dorigo agrave travers une variante multi-colonies et multi-objectifs quenous avons nommeacute AntRS Avant de deacutenir plus en deacutetail ces modications dans le reste duchapitre voici lalgorithme 2 modieacute correspondant au fonctionnement de notre modegravele

54

33 Graphe

Algorithm 2 AntRS

Initialisation des paramegravetres et des pheacuteromonesCreacuteation du grapheInitialisation des dieacuterentes colonieswhile conditions darrecircts non atteintes doConstruction des solutions pour chaque colonieMise agrave jour locale et globale des pheacuteromones modieacutee

end whileFusion des dieacuterentes solutionsRecommandation

Dans notre modegravele inspireacute dACS nous pouvons distinguer un certain nombre dapports quiseront approfondis dans la suite de ce chapitre La creacuteation du graphe prend ainsi une placepreacutepondeacuterante en amont de lexeacutecution de lalgorithme an de pouvoir repreacutesenter correctementle domaine dapplication et ses ressources De plus alors que dans les modegraveles initiaux de Dorigoune seule colonie de fourmis avait pour but de trouver des solutions notre modegravele possegravedeplusieurs colonies travaillant chacune agrave optimiser un objectif (ie un aspect correspondant agraveun facteur humain) de la recommandation nale Ces dieacuterentes colonies constituent le cdivideurde notre approche et seront expliqueacutees en deacutetail Enn apregraves la convergence dune solutiondans chacune des colonies (ie un chemin dans le graphe correspondant agrave une seacutequence deressources dans un ordre preacutecis) un dernier processus de fusion de ces solutions a lieu an dene proposer agrave lutilisateur nal quune seule seacutequence orant le meilleur compromis entre lesdieacuterents objectifs de chaque colonie Apregraves cette derniegravere eacutetape la recommandation peut ecirctreproposeacutee agrave lutilisateur Dans la suite de ce chapitre ces dieacuterentes eacutetapes seront deacutetailleacutees ande mettre en exergue le fonctionnement de notre modegravele

33 Graphe

La premiegravere eacutetape de fonctionnement du modegravele est la creacuteation du graphe Celui-ci repreacute-sente lenvironnement dans lequel les agents eacutevoluent Dans ce contexte les ndivideuds repreacutesententles ressources du domaine (musiques oeuvres dart contenu peacutedagogique etc) tandis que lesarecirctes sont les chemins permettant dacceacuteder agrave ces ressources Les agents se deacuteplacent ainsi dendivideuds en ndivideuds en empruntant des arecirctes Le processus de creacuteation du graphe nest souvent quepeu deacutetailleacute dans la litteacuterature pour plusieurs raisons Premiegraverement un certain nombre deacutetudesse focalisent sur un jeu de test composeacute de peu de ressources limitant linteacuterecirct de deacutevelopperdes tactiques eacutelaboreacutees de creacuteation dun graphe Cela peut ecirctre ducirc agrave la simpliciteacute dutiliser unpetit jeu de donneacutees aux limites poseacutees par le domaine dapplication ou encore agrave la diculteacute dereacutecolter des donneacutees Par exemple si le but est de deacutevelopper un systegraveme de recommandationdans un museacutee contenant 100 divideuvres dart le graphe repreacutesentant le domaine sera relativementpeu complexes (ie 100 ndivideuds et quelques centaines ou milliers darecirctes) De la mecircme maniegraverelorsque le jeu de donneacutees est limiteacute en taille il est possible pour des experts du domaine decreacuteer et de valuer manuellement les arecirctes entre les dieacuterentes ressources comme cela a eacuteteacute faitdans [Semet et al 2003] Cependant la conception dun algorithme permettant de construire latopologie du graphe de maniegravere automatique possegravede agrave la fois des avantages et des inconveacutenients

55

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

Avantages Inconveacutenientsbull La conception algorithmique du graphepermet de sadapter rapidement agrave dieacute-rents domaines applicatifs ayant dieacuterentstypes et nombres de ressources

bull La qualiteacute dun graphe produit automa-tiquement deacutepend fortement de la qualiteacutede son algorithme et peut potentiellementecirctre moins pertinent quun graphe creacutee parun expert du domaine

bull Il devient possible dinteacutegrer untregraves grand nombre de ressources du do-maine applicatif si cela est neacutecessaire (parexemple toutes les musiques dun sitedeacutecoute de musiques en ligne)

bull La prise en compte dun grand nombrede ressources a pour conseacutequence daug-menter signicativement le temps de calculde lalgorithme travaillant sur ce graphe enaval

bull Lintervention dexperts humains ne de-vient plus neacutecessaire pour creacuteer la topolo-gie du graphe et valuer ses arecirctes

bull Lalgorithme de creacuteation automatiquedu graphe doit capturer les informationsdun domaine et les reeacuteter dans la topolo-gie du graphe (ie pourquoi une ressourceest lieacutee par une arecircte agrave une autre etc)

Le but de cette section sera donc de deacutetailler lalgorithme de creacuteation du graphe ainsi que lesreacuteponses proposeacutees aux inconveacutenients eacutenonceacutes ci-dessus

Avant de preacutesenter la meacutethode de creacuteation du graphe il est important de discuter de ceque repreacutesente ce graphe dans le modegravele ACO et de son pendant pour les fourmis Une desdieacuterences principales entre le comportement reacuteel des fourmis dans la nature et les simulationsinformatiques des algorithmes ACO reacuteside dans la deacutenition de lespace de recherche Les four-mis reacuteelles eacutevoluent dans un espace de recherche continu sans aucun point de repegravere ni cheminpreacute-eacutetabli Les fourmis sont en outre libres dexplorer lenvironnement ougrave bon leur semble Lesagents simuleacutes avec ACO sont quant agrave eux limiteacutes agrave un espace de recherche discret (le graphe)et ne peuvent se mouvoir quagrave certains points dinteacuterecircts (les sommets) en empruntant certainschemins deacutejagrave eacutetablis (arecirctes) Cette simplication de lespace de recherche est neacutecessaire agrave la foispour reacuteduire la complexiteacute de lalgorithme et pour permettre de repreacutesenter des domaines dap-plication posseacutedant des ressources connues contrairement agrave un environnement naturel inconnuet potentiellement inni du point de vue dune fourmi Cependant les algorithmes ACO ontavant tout un but de simulation du comportement de ces fourmis An de combiner agrave la fois lescontraintes dune simulation informatique avec le comportement reacuteel observeacute des fourmis dansla creacuteation du graphe plusieurs solutions sont possibles

Lun des moyens les plus simples pour approcher le comportement reacuteel des fourmis dansla nature consiste agrave creacuteer des arecirctes entre chaque sommet du graphe dans le but de creacuteer unenvironnement ougrave lagent simuleacute pourra se deacuteplacer ougrave il veut en empruntant le chemin quildeacutesire Le graphe creacuteeacute serait ainsi complet Neacuteanmoins cette approche nest pas reacutealiste pour deuxraisons principales Premiegraverement lenvironnement peut contenir des obstacles infranchissablespour des fourmis et elles ne peuvent donc pas se deacuteplacer partout Dans un graphe cela setraduirait par une absence darecircte entre deux sommets Deuxiegravemement cette solution est aussipeu pratique degraves que le nombre de sommets deacutepasse plusieurs centaines car le nombre darecirctesn creacuteeacutees se calcule avec |E| = n(nminus1)

2 Le nombre darecirctes dun graphe de 100 sommets est doncde 4950 tandis que pour un graphe de 1000 sommets ce nombre atteint deacutejagrave 499500 comme lemontre la Figure 31 Cette augmentation exponentielle nest eacutevidemment pas envisageable degraveslors que lon traite de domaines pouvant posseacuteder plusieurs dizaines de milliers de ressources agrave

56

33 Graphe

repreacutesenter dans le graphe

Figure 31 Graphe repreacutesentant leacutevolution exponentielle du nombre darecirctes selon le nombrede sommets existants dans un graphe complet

Un des objectifs de cette thegravese eacutetant dappliquer notre modegravele agrave un domaine applicatif reacuteelposseacutedant de tregraves nombreuses ressources la creacuteation dun graphe complet neacutetait pas une op-tion Nous avons donc opteacute pour une approche plus reacutealiste dans la creacuteation du graphe ande diminuer sa taille et les temps de calculs potentiels Pour reacutealiser cette tacircche nous navonsque deux solutions possibles supprimer des sommets etou supprimer des arecirctes La premiegraverepossibiliteacute a rapidement eacuteteacute eacutecarteacutee car supprimer des sommets aecte directement la qualiteacutedes solutions trouveacutees en faisant meacutecaniquement baisser la mesure de couverture du systegraveme derecommandation cest-agrave-dire la capaciteacute qua un systegraveme agrave recommander toutes les ressourcesdun domaine De plus il nest pas eacutevident de justier la suppression de certains sommets parrapport agrave dautres Chaque sommet du graphe repreacutesentant une ressource unique du domainedapplication la suppression de certains sommets ne pourrait se faire que par la creacuteation de regraveglesgeacuteneacuterales Une solution possible pourrait ecirctre par exemple de ne pas inteacutegrer dans le graphe lesressources nayant jamais eacuteteacute consulteacutees ou nayant pas eacuteteacute consulteacutees lors des 6 derniers moisCependant on voit bien que ces regravegles ne sont pas forceacutement adapteacutees agrave chaque utilisateur etont un grand risque de supprimer des ressources que ces derniers auraient pu appreacutecier Nousavons donc preacutefeacutereacute la deuxiegraveme solution supprimer des arecirctes Cette meacutethode a lavantage degarder lensemble des ressources du domaine recommandables par le systegraveme tout en reacuteduisantgrandement la complexiteacute du graphe 37 La question sest donc poseacutee didentier les arecirctes agraveseacutelectionner le but eacutetant de permettre au systegraveme de proposer des recommandations agrave la foisqualitatives adapteacutees mais aussi potentiellement nouvelles agrave lutilisateur tout en reacuteduisant lataille du graphe Pour ce faire nous avons formuleacute deux hypothegraveses aidant agrave la seacutelection desarecirctes

37 Tant quil y a un chemin dans le graphe permettant de se deacuteplacer dun sommet quelconque vers tous lesautres sommets alors toutes les ressources peuvent theacuteoriquement ecirctre recommandeacutees par le systegraveme

57

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

1 Les seacutequences de ressources deacutejagrave consulteacutees par le passeacute contiennentdes informations sur le comportement des utilisateurs qui peuventecirctre exploiteacutees pour la topologie du graphe

2 Les seacutequences de ressources deacutejagrave consulteacutees par les utilisateurs au-paravant ne sont pas toujours les meilleures possibles et auraient puecirctre ameacutelioreacutees avec des recommandations pertinentes

La premiegravere hypothegravese H1 se justie par le fait que lutilisateur est le premier agrave connaicirctreses envies ses besoins et les ressources qui le satisferaient le plus agrave un moment t [Jones 2010]Il est donc neacutecessaire de consideacuterer ces seacutequences de consultations passeacutees an de comprendrelutilisation que font les utilisateurs des ressources du domaine La deuxiegraveme hypothegravese se justiequant agrave elle par le fait quun utilisateur ne peut pas dans la majoriteacute des cas avoir une vue den-semble de toutes les ressources dun domaine Il est en eet courant pour un site de e-commerceou deacutecoute de musiques de posseacuteder plusieurs dizaines de milliers de ressources La deuxiegravemehypothegravese H2 se base donc sur le problegraveme fondamental que les systegravemes de recommandationessaient de reacutesoudre agrave savoir aider les utilisateurs agrave faire les meilleurs choix possibles dans desenvironnements toujours plus complexes et vastes Cette discussion sur les deacutes ameneacutes par cesdeux hypothegraveses nous amegravene agrave consideacuterer le travail dHerbert Simon qui a eacuteteacute deacutecoreacute dun prixnobel deacuteconomie et dun prix Turing Ce dernier a theacuteoriseacute et nommeacute le problegraveme de rationaliteacutelimiteacutee devant des contraintes alteacuterant et limitant les capaciteacutes dun individu (domaine tropvaste manque dinformation etc) il est preacutefeacuterable de se diriger vers des solutions satisfaisantesplutocirct quoptimales [Simon 1997] En reacuteponse agrave ce problegraveme les utilisateurs procegravedent donc paressais-erreurs pour reacutepondre agrave leurs besoins de maniegravere empirique [Jameson et al 2015] Les seacute-quences dinteractions creacuteeacutees par les utilisateurs durant ces processus contiennent donc beaucoupdinformations exploitables par un systegraveme de recommandation mais aussi beaucoup de bruitset dapproximations [Kuhlthau 1991 Castagnos et al 2010] La philosophie de notre modegraveleest les reacuteponses que nous apportons aux problegravemes ci-dessus sont inspireacutees par cette theacuteorie

An de prendre en compte ces deux hypothegraveses nous proposons dans la suite de cette sectionune meacutethode permettant de creacuteer un graphe orienteacute en se basant agrave la fois sur les seacutequencespasseacutees des utilisateurs ainsi que sur la creacuteation de nouvelles arecirctes Lobjectif est dexploiterles informations contenues dans les seacutequences passeacutees des utilisateurs mais aussi de garantirune certaine seacuterendipiteacute du systegraveme de recommandation via la creacuteation de nouvelles arecirctes Lapremiegravere eacutetape de ce processus est de creacuteer un sommet par ressource du domaine Ensuite pourconstruire les arecirctes reliant ou non ces sommets nous calculons les poids associeacutes aux nombrede co-consultations preacutesentes dans lensemble des seacutequences de consultations passeacutees Autrementdit quand un utilisateur consulte une ressource A puis une ressource B directement apregraves nousconsideacuterons que la transition A rarr B est une co-consultation Pour deacuteterminer si une arecircte estconstruire entre deux sommets nous calculons ensuite le poids de la co-consultation cest-agrave-direle nombre de fois quelle apparaicirct dans les seacutequences des utilisateurs En fonction de ce poidsdeux opeacuterations sont reacutealiseacutees

1 Toutes les co-consultations posseacutedant un poids supeacuterieur agrave seuil speacutecique sont ajouteacuteescomme arecirctes orienteacutees dans le graphe reliant les deux sommets concerneacutes Le seuil estdeacutetermineacute de maniegravere empirique car il est deacutependant de chaque domaine et de la base dedonneacutees utiliseacutees

2 En dessous du seuil seules certaines co-consultations sont seacutelectionneacutees pour devenir des

58

33 Graphe

arecirctes selon un processus inteacutegrant une part daleacuteatoire que nous deacutetaillerons dans la suitede cette section

Ces deux opeacuterations permettent de peupler le graphe darecirctes correspondant agrave la fois agrave toutesles transitions les plus eectueacutees par les utilisateurs ainsi quagrave certaines des transitions moinsusiteacutees par ces derniers Apregraves ces deux opeacuterations le graphe possegravede donc un certain nombredarecirctes reliant ses sommets mais rien ne garantit que chaque sommet est bien relieacute au reste dugraphe (si par exemple un sommet repreacutesente une ressource tregraves peu consulteacutee du domaine) Deplus et malgreacute la deuxiegraveme opeacuteration mitigeant cet eet les transitions tregraves usiteacutees (entre desressources populaires par exemple) seront sur-repreacutesenteacutees avec cette meacutethode de constructionCette sur-repreacutesentation produira forceacutement en aval des solutions que lon pourrait qualier declassique dans le sens ougrave elles reprendraient en majoriteacute ces transitions tregraves utiliseacutees et connuesdes utilisateurs An de limiter cet eet et de sassurer que tous les sommets sont bien connecteacutesau graphe une troisiegraveme et derniegravere opeacuteration est eectueacutee

3 Pour chaque sommet si un certain niveau de connectiviteacute nest pas atteint autrement ditsi le sommet possegravede moins darecirctes quun seuil xeacute agrave lavance alors des arecirctes aleacuteatoiressont ajouteacutees an datteindre ce seuil

Cette troisiegraveme opeacuteration permet de sassurer quaucun sommet repreacutesentant une ressourcepeu consulteacutee ne soit laisseacute sans connexion avec le reste du graphe Ainsi chaque sommet pos-seacutedera un certain niveau de connectiviteacute aussi appeleacute degreacute avec le reste du graphe Le grapheainsi obtenu apregraves ces 3 opeacuterations possegravede dans sa topologie agrave la fois les liens les plus usiteacutes parles utilisateurs ainsi que des liens aleacuteatoires permettant la creacuteation de recommandations poten-tiellement nouvelles Lensemble du processus de creacuteation du graphe est repris dans lEacutequation31 ci-dessous

(1) si tij ge m alors creacuteer eij(2) si tij lt m et q lt tij ougrave q isin [min til log(max til)] alors creacuteer eij(3) si deg(i) lt d alors choisir un sommet k aleacuteatoire

et creacuteer eik jusquagrave deg(i) = d

(31)

(1) et (2) sappliquent pour chaque co-consultation tandis que (3) sapplique pour chaque som-met du graphe eij repreacutesente larecircte entre les sommets i et j tij est le poids de la co-consultationde la ressource i vers la ressource j par les utilisateurs dans les seacutequences de consultations passeacuteesm est le seuil au-dessus duquel les co-consultations sont automatiquement ajouteacutees au graphecomme arecirctes q isin [min til log(max til)] est une variable aleacuteatoire uniformeacutement distribueacutee danslintervalle deacutecrit min til est le nombre minimal de co-consultations entre la ressource i et toutesles autres ressources l isin Vi ougrave au moins une co-consultation a eacuteteacute trouveacutee deg(i) est le degreacutedu ndivideud i dans le graphe et d est un paramegravetre speacuteciant le degreacute minimal de connectiviteacute quedoit posseacuteder chaque sommet dans le graphe nal Il est agrave noter quagrave ce stade du processus decreacuteation du graphe les arecirctes ne sont pas valueacutees car les valeurs attribueacutees aux arecirctes varientpour chaque utilisateur Ce processus sera deacutetailleacute dans la suite de la section

Avec cette technique de construction la taille du graphe deacutepend deacutesormais principalementde la variable d deacutenissant le degreacute minimal de connectiviteacute agrave atteindre (en plus du nombrede sommets comme preacuteceacutedemment) La Figure 32 ci-dessous repreacutesente leacutevolution du nombredarecirctes uniquement en fonction de la variable d Dans la pratique le nombre darecirctes sera

59

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

supeacuterieur aux nombres preacutesenteacutes dans la gure eacutetant donneacute que les deux premiegraveres eacutetapes de lacreacuteation du graphe ajoutent des arecirctes en fonction des transitions trouveacutees dans les consultationspasseacutees des utilisateurs

Figure 32 Graphe repreacutesentant leacutevolution lineacuteaire du nombre darecirctes selon le nombre desommets voulus dans un graphe creacuteeacute avec dieacuterentes valeurs de d

Ce processus de construction de graphe a pour double objectif dexploiter les informationsdes seacutequences des utilisateurs et de creacuteer de nouvelles seacutequences possibles Il existe potentiel-lement une inniteacute de creacuteer un graphe agrave partir des ressources dont nous disposons et il esteacutevident que la topologie du graphe a une inuence importante sur les reacutesultats possibles carle graphe repreacutesente lentiegravereteacute de lenvironnement dans lequel les agents vont eacutevoluer Le pro-cessus de construction que nous avons deacutecrit nest quune maniegravere parmi dautres daboutir agraveun graphe Cependant nous faisons lhypothegravese que la combinaison darecirctes repreacutesentant desco-consultations aux poids importants darecirctes repreacutesentant certaines co-consultations moinspreacutesentes et darecirctes creacuteant de nouvelles transitions permet de capturer linformation preacutesentedans le domaine tout en garantissant une certaine seacuterendipiteacute avec leacutemergence possible nouvellesseacutequences

34 Objectifs

Une fois le graphe creacuteeacute le modegravele peut ecirctre appliqueacute sur ce dernier an de produire des recom-mandations Dans cette section nous allons deacutenir comment fonctionne le modegravele pour produiredes recommandations agrave partir du graphe ainsi que les facteurs humains ie les objectifs quilcherche agrave satisfaire

Comme nous lavons vu dans le chapitre preacuteceacutedent sur leacutetat de lart il est deacutesormais lar-gement admis que la mesure de preacutecision seule nest pas susante pour produire de bonnesrecommandations aux utilisateurs Dautres facteurs humains doivent ecirctre consideacutereacutes pour satis-faire la plus grande varieacuteteacute dutilisateurs et de contextes possible Nous proposons donc de deacutenirun ensemble de 4 facteurs humains parmi les plus eacutetudieacutes dans la litteacuterature et de les prendre encompte dans notre modegravele de recommandation Ces facteurs humains seront par la suite appe-

60

34 Objectifs

leacutes objectifs car pour notre modegravele ces facteurs humains sont en eet consideacutereacutes comme desobjectifs agrave atteindre et agrave maximiser Les voici accompagneacutee dune courte description

1 Similariteacute recommander des ressources similaires agrave ce que lutilisateur a aimeacute par lepasseacute

2 Diversiteacute recommander des ressources diverses par rapport agrave ce que lutilisateur a aimeacutepar le passeacute

3 Nouveauteacute recommander des ressources nouvelles que lutilisateur ne connaicirct pas en-core

4 Preacutefeacuterences recommander des ressources que lutilisateur a deacutejagrave appreacutecieacute dans le passeacute

La similariteacute et les preacutefeacuterences sont proches des notions de preacutecision et de rappel mais diegraverenttoutefois dans le sens ougrave lon ne cherche pas agrave reproduire exactement les mecircmes seacutequences quelutilisateur a consulteacute mais agrave lui recommander des seacutequences pouvant le satisfaire Ces objectifsrepreacutesentent des facteurs humains important dans la creacuteation dune bonne recommandationIls seront deacutetailleacutes dans la suite de cette section Agrave ces 4 objectifs concernant les ressourcesrecommandeacutees nous ajoutons un cinquiegraveme objectif sinteacuteressant quant agrave lui agrave la maniegravere dontsont proposeacutees les recommandations agrave un utilisateur

5 Progressiviteacute recommander une seacutequence de ressources de sorte que la transition entrechacune de ces ressources soit uide et adapteacutee aux preacutefeacuterences de lutilisateur

Ces 5 objectifs consideacutereacutes sont tous transposables dans dieacuterents domaines applicatifs ga-rantissant la geacuteneacutericiteacute de cette approche Cependant il est eacutevident que dun domaine applicatifagrave lautre certaines dieacuterences peuvent justier la mise en avant dun objectif plutocirct quun autreDe la mecircme maniegravere les besoins et preacutefeacuterences pour ces objectifs peuvent varier dun utilisateuragrave un autre au sein du mecircme domaine Pour reacutepondre agrave ces deux problegravemes nous expliqueronsaussi dans cette section comment adapter limportance de chaque objectif Il est aussi importantde consideacuterer le fait que nous nous appuyons sur ces objectifs car ils sont les plus freacutequemmentciteacutes dans la litteacuterature Lobjectif est de deacutemontrer que notre modegravele est capable de produiredes seacutequences satisfaisant les objectifs consideacutereacutes Ce faisant nous montrons par la mecircme occa-sion que les objectifs peuvent ecirctre adapteacutes enleveacutes ou ajouteacutes En eet on pourrait tregraves bienconsideacuterer dautres objectifs (personnaliteacute point de congestion si lon est dans un museacutee etc)En dautres termes le but est de deacutemontrer la geacuteneacutericiteacute de notre modegravele

Avant de deacutetailler comment calculer ces objectifs nous allons expliquer ici comment les in-teacutegrer dans le modegravele Le but de notre modegravele est de proposer des recommandations orant unbon compromis entre les dieacuterents objectifs ougrave limportance de ces derniers peut ecirctre ajusteacutees agravevolonteacute Pour ce faire notre modegravele doit ecirctre capable de transformer ces objectifs listeacutes plus hauten valeurs pouvant ecirctre chireacutees et optimiseacutees Autrement dit notre modegravele a pour but de reacute-soudre un problegraveme de recommandation multi-objectifs Le choix des algorithmes ACO est ici dusens eacutetant donneacutes ces besoins speacuteciques En eet nous avons montreacute dans leacutetat de lart que lemodegravele ACS faisant partie des ACO eacutetait capable de reacutesoudre des problegravemes posseacutedant plusieursobjectifs comme par exemple avec le vehicle routing problem with time windows [Gambardellaet al 1999] ou encore avec le multi-objective travelling salesman problem [Angus 2007] Devantla complexiteacute et les dimensions toujours croissantes des problegravemes agrave reacutesoudre en informatique lesapproches multi-dimensionnelles des algorithmes ACO se sont multiplieacutees ces derniegraveres anneacutees

61

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

[Doerner et al 2004 Alaya et al 2007 Angus and Woodward 2009 Dorigo and Stuumltzle 2019]Mecircme si chacune de ces approches a pour but de reacutesoudre un problegraveme multi-objectif la maniegraveredy arriver est dieacuterente tant les algorithmes ACO sont modulaires Pour rappel notre problegravemeconsiste en la recommandation de seacutequences agrave partir dun graphe et prenant en compte plusieursobjectifs pouvant potentiellement ecirctre incompatible entre eux Il est important dinsister sur cedernier point an de comprendre la solution mise en place dans notre modegravele Les objectifs quenous avons deacutecrits ci-dessus peuvent en eet ecirctre incompatibles les uns avec les autres quandbien mecircme le but est de geacuteneacuterer une recommandation posseacutedant un certain eacutequilibre parmi cha-cun dentre eux Lobjectif de preacutefeacuterences dont le but est de proposer des ressources deacutejagrave connueset appreacutecieacutees ainsi que lobjectif de nouveauteacute dont le but est de proposer des ressources en-core non connues sont par exemple en contradiction claire Chaque objectif traiteacute seacutepareacutementproduira potentiellement des recommandations mutuellement exclusives et pourtant il peut ecirctreinteacuteressant de proposer agrave lutilisateur une seacutequence de recommandations posseacutedant ces deux as-pects speacuteciques Partant de ce constat nous avons deacutecideacute dinteacutegrer chaque objectif comme unecolonie dieacuterente dans le modegravele ACS Ainsi nos 4 premiers objectifs (similariteacute diversiteacute nou-veauteacute preacutefeacuterences) seront repreacutesenteacutes par 4 colonies dans notre modegravele tandis que le cinquiegravemeobjectif la progressiviteacute sera quant agrave lui traiteacute agrave part eacutetant donneacute quil concerne la structure dela recommandation et non les ressources recommandeacutees en elles-mecircmes

Inteacutegrer ces objectifs par le biais de plusieurs colonies a neacutecessiteacute quelques changements danslalgorithme ACS Dans le modegravele initial les agents dune seule colonie se deacuteplacent sur le graphedont chacune des arecirctes est valueacutee en fonction de la distance seacuteparant les 2 sommets la consti-tuant Le but des agents est ensuite de se deacuteplacer sur ce graphe an de trouver le plus courtchemin dun sommet A agrave un sommet B agrave laide des pheacuteromones quils y deacuteposent Une fois quunesolution eacutemerge comme eacutetant la meilleure gracircce au meacutecanisme de stigmergie lalgorithme peutsarrecircter et la meilleure solution est retenue

La philosophie derriegravere cette solution deacutecoule des principes mecircme des systegravemes multi-agentsLeacutetat de lart du chapitre preacuteceacutedent la montreacute lapproche multi-agent pour la reacutesolution deproblegravemes est agrave la fois simple eacuteleacutegante et ecace Dautres solutions auraient eacuteteacute possiblescomme par exemple complexier les agents en leur ajoutant de nouveaux comportementS maisnous avons voulu garder lessence des systegravemes multi-agents reacuteactifs leacutemergence de comporte-ments intelligents de par les interactions entre agents tregraves simples An de rester aussi procheque possible des principes de base de lalgorithme nous avons voulu converser le fonctionnementgeacuteneacuteral des colonies et de la deacutecouverte de solutions sur le graphe tout en les adaptant agrave notrecontexte Pour ce faire nous avons jouer sur la maniegravere dont se deacutenit et se calcule la notionde distance dans le graphe Dans les algorithmes ACO la distance d associeacutee agrave chaque arecirctedu graphe repreacutesente comme son nom lindique la distance physique neacutecessaire pour aller dunsommet agrave lautre de larecircte Cette distance ne demande a priori pas de calcul et est simple-ment deacuteduite ou mesureacutee de lenvironnement repreacutesenteacute par le graphe Elle est ensuite utiliseacuteepour calculer lheuristique ηij comme montreacute dans lEacutequation 212 (pour rappel lheuristiquese calcule ainsi ηij = 1

dij) Nous navons pas modieacute le calcul de ηij mais nous avons modieacute

le sens de la distance d qui le compose Au lieu de repreacutesenter la distance physique entre deuxsommets d repreacutesente dans notre modegravele une distance calculeacutee entre deux ressources sa valeureacutetant directement deacutependante de lobjectif de la colonie Prenons un exemple pour illustrer lamaniegravere dont cette distance peut varier entre deux sommets pour dieacuterentes colonies

62

34 Objectifs

Supposons un systegraveme de recommandation dans le domaine museacuteal dont le but est de proposerdes parcours composeacutes de dieacuterentes peintures Le museacutee possegravede entre autres deux tableauxde Vincent van Gogh appartenant agrave la seacuterie des Tournesols Ces tableaux sont tous les deux desnatures mortes repreacutesentant un vase et 15 tournesols ils ont tous les deux eacuteteacute peints en 1889 les palettes de couleurs et le style sont quasi similaires Dans le graphe les sommets A et Brepreacutesentent ces deux tableaux et (AB) repreacutesente larecircte les reliant Pour toutes les raisonseacutevoqueacutees ci-dessus on peut raisonnablement penser que ces deux ressources sont tregraves similairesentre elles La distance dsimilarit de la colonie axeacutee sur la similariteacute sera donc faible indiquant auxagents que les deux sommets sont eectivement proches lun de lautre et favorisant le passagepar cette arecircte pour minimiser la distance totale de la solution Agrave linverse la colonie relativeagrave la diversiteacute aura agrave traverser une plus longue distance ddiversit entre les deux sommets commeces derniers sont tregraves similaires entre eux Agrave travers ces exemples sont illustreacutees les dieacuterencespossibles dans le calcul de la distance d en fonction de lobjectif consideacutereacute La conseacutequence agrave celaest que mecircme si la topologie du graphe peut rester la mecircme pour tous les objectifs le calculdes distances et la valuation des arecirctes seront quant agrave eux dieacuterents selon lobjectif Le reste decette section propose une maniegravere de calculer ces distances pour chaque objectif

341 Similariteacute

Cest lun des facteurs humains les plus importants des systegravemes de recommandation et il estpris en compte par limmense majoriteacute de ces systegravemes En eet un des objectifs majeurs dunsystegraveme de recommandation est de proposer des ressources similaires agrave celles que lutilisateura aimeacute auparavant ou proche des ressources quil consultait reacutecemment La similariteacute est unecaracteacuteristique bien connue et largement utiliseacutee dans la litteacuterature Nous adheacuterons au principeselon lequel un systegraveme de recommandation ne peut pas la neacutegliger et doit linclure pour produiredes recommandations satisfaisantes Cependant la similariteacute ne devrait pas non plus ecirctre lapierre angulaire de chaque systegraveme de recommandation comme elle la eacuteteacute par le passeacute Le butde cette colonie est donc de trouver une liste avec des eacuteleacutements aussi proches que possible dece que lutilisateur appreacutecie ou est en train de consulter Il existe de nombreuses meacutethodespour calculer la similariteacute entre deux ressources Dune maniegravere geacuteneacuterale les ressources dundomaine sont deacutecrites par des meacutetadonneacutees numeacuteriques textuelles binaires etc Le format deces meacutetadonneacutees est entiegraverement deacutependant de chaque domaine applicatif Nous avons deacutecideacutede geacuteneacuteraliser ce problegraveme et de le consideacuterer comme une comparaison entre deux vecteursNous avons ensuite deacutecideacute dutiliser la mesure de la similariteacute cosinus entre ces deux vecteurs depar sa populariteacute dans la litteacuterature scientique et sa pertinence quand aux donneacutees dont nousdisposons [Su and Khoshgoftaar 2009] La maniegravere dimpleacutementer cette similariteacute dun point devue applicatif deacutepend des meacutetadonneacutees disponibles Dans le cas de donneacutees non numeacuteriques il estpossible dobtenir des valeurs numeacuteriques de similariteacute agrave partir de listes ou de valeurs qualitatives[lHuillier 2018] De mecircme dautres maniegravere de calculer la similariteacute peuvent ecirctre utiliseacutees enfonction de leur pertinence par rapport au domaine applicatif Dans notre contexte geacuteneacuteralisteet an de deacuteterminer la valeur de la distance d associeacutee agrave chaque arecircte du graphe nous avonstout dabord calculeacute la similariteacute cosinus entre les deux ressources repreacutesenteacutees par les sommetsPlus formellement pour une arecircte (i j) la similariteacute de ses deux ressources sij est calculeacutee avecla similariteacute cosinus entre les deux vecteurs des caracteacuteristiques descriptives C des ressources iet j comme montreacute dans lEacutequation 32

sij =1

sim(Ci Cj)(32)

63

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

ougrave Ci repreacutesentent les caracteacuteristiques de la ressource i Le terme de caracteacuteristiques estgeacuteneacuterique et peut inclure toutes les meacutetadonneacutees exploitables de domaine applicatif sur une res-source Comme expliqueacute plus haut ces caracteacuteristiques sont donc deacutependantes de chaque basede donneacutees et de chaque domaine dapplication Nous avons ici geacuteneacuteraliseacute ces donneacutees avec laformalisation suivante chaque ressource (ou item) i du domaine dapplication est deacutecrite par ncaracteacuteristiques c comme suit Ci = c1 c2 cn

Dans lexemple donneacute plus haut avec les deux tableaux de van Gogh nous avons expliqueacute quela distance seacuteparant deux sommets sur le graphe repreacutesentait intuitivement leur eacuteloignementselon lobjectif consideacutereacute Ainsi pour la similariteacute deux sommets repreacutesentant des ressourcessimilaires verront larecircte les reliant posseacuteder une faible distance et inversement Le but est icidecirctre le plus proche possible du fonctionnement du modegravele initial ougrave une petite distance entredeux sommets repreacutesentent eectivement une petite distance physique entre ces deux points(par exemple deux points geacuteographiques proches lun de lautre) La similariteacute cosinus produitcependant une valeur comprise entre [0 1] ne correspondant pas agrave la valuation des arecirctes dansle modegravele initial An de convertir cette similariteacute s isin [0 1] en distance d isin [1 +infin] nous avonssimplement utiliseacute linverse multiplicatif d = 1

s Ainsi et agrave linstar du modegravele initial de Dorigoune distance proche de 1 associeacutee agrave une arecircte (i j) signie que les deux ressources i et j sontsimilaires

342 Diversiteacute

Ce facteur est souvent preacutesenteacute en mecircme temps que la similariteacute eacutetant donneacute quils sont tousdeux lieacutes agrave la distance ou agrave la correacutelation entre les ressources consulteacutees par lutilisateur etses recommandations Mais contrairement agrave la similariteacute la diversiteacute illustre agrave quel point deuxeacuteleacutements sont dissemblables lun par rapport agrave lautre La similariteacute et la diversiteacute se complegravetentdans la mesure ougrave elles sont toutes deux neacutecessaires pour adapter le systegraveme de recommandationaux besoins des dieacuterents utilisateurs [Jones 2010] Nous avons choisi dutiliser linterpreacutetationclassique consistant agrave consideacuterer la diversiteacute comme linverse de la similariteacute La diversiteacute divijentre deux ressources i et j est donc obtenue en calculant linverse de la similariteacute entre i etj comme indiqueacute dans Eacutequation 33 De la mecircme maniegravere que pour la similariteacute nous avonsensuite utiliseacute linverse multiplicatif de la diversiteacute pour obtenir une distance d isin [1 +infin]

divij =1

1minus sim(Ci Cj)(33)

Toutefois cette seule mesure ne capture pas lensemble de la diversiteacute dune seacutequence Destravaux de la litteacuterature ont eacuteteacute meneacutes sur les seacutequences et les dieacuterentes maniegraveres de les ca-racteacuteriser On peut citer la diversiteacute relative (RD Relative Diversity) qui permet de mesurerlapport de chaque ressource ajouteacutee agrave une seacutequence existante en cours de construction ou encorela similariteacute intra-liste (ILS Intra-List Similarity) qui est la moyenne des similariteacutes cosinusde toutes les ressources composant une seacutequence [Ziegler et al 2005] Nous navons pas utiliseacuteces deux mesures agrave ce stade de notre modegravele mais nous les exploiteront an de mesurer lesperformances de notre modegravele

343 Nouveauteacute

Ce facteur humain repreacutesente les ressources encore non connues de lutilisateur Il peut sagirde nouvelles ressources reacutecemment ajouteacutees au systegraveme ou de ressources plus anciennes mais

64

34 Objectifs

moins populaires que lutilisateur na pas consulteacutees Selon le domaine dapplication etou selonlancienneteacute de lutilisateur les ressources non consulteacutees peuvent ne constituer quune faible par-tie des ressources totales (eg dans un petit museacutee ne posseacutedant que quelques dizaines ddivideuvres)comme elles peuvent aussi repreacutesenter limmense majoriteacute des ressources totales (eg sur des sitesdeacutecoute de musiques en ligne qui ont souvent des catalogues de plusieurs centaines de milliers demusiques disponibles) La nouveauteacute ne doit cependant pas ecirctre confondue avec la diversiteacute carles ressources consideacutereacutees comme nouvelles peuvent ecirctre soit similaires soit dieacuterentes de cellesque lutilisateur aime habituellement La nouveauteacute est une caracteacuteristique importante dans unsystegraveme de recommandation car elle permet deacuteviter un deacutesinteacuterecirct potentiel des utilisateurs an-ciens En eet apregraves un certain temps passeacute agrave produire des recommandations un systegraveme peutavoir tendance agrave enfermer lutilisateur dans les mecircmes recommandations agrave linstar dun algo-rithme dapprentissage automatique trop bien entraicircneacute 38 Ce problegraveme dans les systegravemes derecommandation reacutesulte en une trop grande preacutevisibiliteacute des ressources recommandeacutees [Vargasand Castells 2011] Lintroduction de la nouveauteacute permet entre autres de mitiger ce problegravemeet de produire des recommandations inattendues agrave lutilisateur

An de deacuteterminer si une ressource est nouvelle ou pas pour un utilisateur en particuliernous avons utiliseacute le travail de Zhang [Zhang 2013] qui a deacuteni la nouveauteacute comme une mesurecomposeacutee de trois caracteacuteristiques

1 Unknown (notion dinconnue) repreacutesente si la ressource est connue ou non de lutilisa-teur

2 Satisfactory (satisfaction) repreacutesente si la ressource est aimeacutee ou non par lutilisateur

3 Dissimilarity (dissimilariteacute) repreacutesente si la ressource est dissimilaire aux autres res-sources connues par lutilisateur

Lauteur a ensuite proposeacute deacutevaluer formellement la nouveauteacute dune ressource i pour luti-lisateur u en proposant lEacutequation 34

Novelty(i u) = p(i|unknown u) middot dis(i prefu) middot p(i|like u) (34)

ougrave p(i|unknown u) est la probabiliteacute que lutilisateur u ne connaisse pas la ressource idis(i prefu) est la dissimilariteacute entre i et les ressources consulteacutees par lutilisateur et p(i|like u)est la probabiliteacute que lutilisateur u appreacutecie la ressource i Cette eacutequation est inteacuteressante maisdans le contexte de ce travail les notions de satisfaction et de dissimilariteacute de lutilisateur enversla ressource i sont proches des autres objectifs de notre modegravele agrave savoir respectivement pour lasatisfaction par lobjectif de diversiteacute et pour la dissimilariteacute par les deux objectifs de similariteacuteet de preacutefeacuterences Nous avons donc deacutecideacute de reacuteduire lEacutequation 34 agrave lEacutequation 35 an deacuteviterune redondance entre les objectifs

p(i|unknown u) = minuslog(1minus popi) (35)

ougrave popi est la populariteacute de la ressource i La notion de populariteacute est ici volontairement lais-seacutee geacuteneacuterale car largement deacutependante du domaine dapplication et des ressources consideacutereacuteesEn eet la populariteacute peut prendre la forme dun nombre de vues dun nombre deacutecoutes dunevaleur calculeacutee de maniegravere interne par des sites dune comparaison entre les consultations des

38 Cest le problegraveme statistique classique de lovertting ou du surentrainement souvent rencontreacute dans ledomaine de lapprentissage automatique

65

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

ressources etc On peut toutefois consideacuterer que cette valeur sera geacuteneacuteralement numeacuterique

Il est important ici de preacuteciser un point de dieacuterence important avec les deux autres objectifsqui ont eacuteteacute vu jusquagrave preacutesent Dans les eacutequations ci-dessus on peut en eet remarquer que lecalcul de la distance se fait non plus en consideacuterant deux ressources mais uniquement avec uneressource et le prol de lutilisateur Ainsi une arecircte du graphe ne repreacutesente plus la distanceentre les deux sommets la composant mais la distance neacutecessaire pour atteindre le sommet selonchaque utilisateur Autrement dit lagrave ougrave jusquagrave maintenant la distance associeacutee agrave larecircte (AB)repreacutesentait la distance entre le sommet A et le sommet B (la similariteacute ou la diversiteacute entreA et B) cette distance repreacutesente maintenant la distance de lutilisateur avec ce sommet BLe sommet dorigine ne rentre plus en compte dans le calcul de la distance dune arecircte maisuniquement son sommet de destination Par conseacutequent toutes les arecirctes arrivant agrave un sommetunique posseacutederont la mecircme valuation Les calculs de valuation des arecirctes du graphe sont doncmoins nombreux mais en contrepartie il est neacutecessaire de recalculer ces valuations pour chaqueutilisateur eacutetant donneacute quelles deacutependent maintenant du prol de ce dernier

344 Preacutefeacuterences

Le facteur que nous avons appeleacute preacutefeacuterences correspond aux ressources que lutilisateur aparticuliegraverement appreacutecieacutees dans le passeacute Cet objectif bien quassez proche de la similariteacute aupremier abord exprime un autre aspect dune recommandation satisfaisante que nous pensonsimportant En eet le but nest pas ici de recommander des ressources proches et potentiellementnouvelles de ce que lutilisateur connaicirct deacutejagrave comme la similariteacute mais bien de lui reproposer desressources quil a deacutejagrave consulteacutees et aimeacutees par le passeacute Autrement dit cet objectif cherche agraverecommander agrave lutilisateur les ressources les plus en accord avec ses preacutefeacuterences (ses ressourcespreacutefeacutereacutees) sans essayer de faire des preacutedictions Par conseacutequent le but de lobjectif de simila-riteacute est de proposer agrave lutilisateur des ressources proches de ce que lutilisateur a consulteacute ouconsulte mais il nest pas possible de savoir si ce dernier va reacuteellement appreacutecier ces recomman-dations Il est par exemple commun dappreacutecier une musique particuliegravere dun artiste et de nepas aimer les autres musiques appartenant pourtant au mecircme album Toutes les musiques de cetalbum sont tregraves similaires les unes aux autres (mecircme artiste mecircme date de sortie mecircme albumprobablement mecircme genre) elles auraient donc de tregraves hautes valeurs de similariteacute entre ellesmais lutilisateur qui se verrait proposer le reste de lalbum jugerait ces recommandations nonsatisfaisantes Lobjectif de preacutefeacuterences favorisera quant agrave lui les ressources connues et aimeacuteespar lutilisateur et pourrait donc recommander dans cette situation uniquement la musique quelutilisateur appreacutecie

Le but des agents de la colonie preacutefeacuterences est donc de trouver un chemin ougrave les ressourcessont connues et aimeacutees de lutilisateur On peut dores et deacutejagrave lister deux conseacutequences agrave cefait Tout dabord nous nous retrouvons dans le mecircme cas de gure que pour lobjectif denouveauteacute ougrave une arecircte du graphe ne repreacutesente plus la distance entre ses deux sommets maisla distance neacutecessaire pour atteindre le sommet darriveacutee Ensuite il est neacutecessaire de deacutenir desmoyens de calculer les preacutefeacuterences des utilisateurs envers les ressources mises agrave leur dispositionComme nous lavons vu dans leacutetat de lart il y a deux grandes maniegraveres de calculer linteacuterecirctdun utilisateur envers une ressource avec des retours explicites (eg notes sur les ressourcesbouton jaime et je naime pas) avec des retours implicites (eg temps passeacute agrave consulterles ressources nombre de consultations) 39 La nature des retours va donc eacutenormeacutement varier

39 Ces deux types de retours ne sont pas redondants mais plutocirct compleacutementaires Lorsque cela est possible

66

34 Objectifs

selon le domaine dapplication mais nous pouvons tout de mecircme formaliser la maniegravere dont ilssont consideacutereacutes Chaque information collecteacutee par le systegraveme concernant le comportement dunutilisateur doit ecirctre prise en compte Plus preacuteciseacutement chaque interaction directe ou indirectequun utilisateur peut avoir avec une ressource doit ecirctre inteacutegreacutee dans lestimation de son inteacuterecirctsur cette ressource Soit Cu lensemble de tous les types dinteractions possibles quun utilisateuru peut avoir avec les ressources du systegraveme cui repreacutesente alors la somme des interactions dunmecircme type c dun utilisateur u sur une ressource i Voici un rapide exemple toujours dans ledomaine musical an dillustrer ces derniers points

Cu eacutecouter une musique noter une musique passer une musique avant la n mettre unemusique dans sa playlist

cui pourrait par exemple renseigner sur le fait que lutilisateur u agrave eacutecouter la musiquei 15 fois

An dagreacuteger tous les types dinteractions possibles dans une unique valeur dinteacuterecirct dunutilisateur envers une ressource nous avons utiliseacute la formule proposeacutee par Castagnos [Castagnosand Boyer 2006] et deacutecrite dans lEacutequation 36

presumed interestui = vmin +

sumcisinC

(w(c) middot c(ui))sumcisinC

w(c)middot (vmax minus vmin)

cmax(36)

ougrave c(u i) correspond aux valeurs normaliseacutees donneacutees agrave la ressource i par lutilisateur u agravechaque type dinteraction c w(c) est le poids ou limportance de chaque type dinteraction cvmin et vmax sont les valeurs minimales et maximales attendues pour linteacuterecirct preacutesumeacute et cmaxest la valeur maximale que c(u i) peut prendre peu importe le critegravere c consideacutereacute

Linteacuterecirct de cette colonie peut ecirctre discuteacute selon les domaines dapplications auquel le mo-degravele est appliqueacute Lexemple preacuteceacutedant portant sur la musique illustre bien linteacuterecirct dinteacutegrerun tel facteur humain dans un systegraveme de recommandations En eet il est rare de neacutecou-ter quune seule fois une musique que lon appreacutecie Comme lont montreacute divers travaux il estbeaucoup plus courant deacutecouter plusieurs fois ses musiques preacutefeacutereacutees parfois de suite parfois agravedieacuterents moments de la journeacutee parfois sur plusieurs semaines mois ou anneacutees etc [lHuillier2018][Jones 2010] Lideacutee davoir une colonie deacutedieacutee agrave la revisite de ressources deacutejagrave consulteacuteespeut ecirctre eacutetendue agrave dautres domaines a priori moins eacutevidents que la musique Cet objectif depreacutefeacuterences peut par exemple ecirctre inteacuteressant dans le domaine de le-eacuteducation ougrave une ressourceeacuteducative peut avoir eacuteteacute consulteacutee par un utilisateur sans pour avoir eacuteteacute comprise (apregraves avoirpasseacute une eacutevaluation sur les thegravemes de cette ressource par exemple) Dans ce cas il peut ecirctreinteacuteressant de recommander une nouvelle fois agrave lutilisateur cette ressource an quil puisse mieuxla comprendre En conclusion lobjectif de preacutefeacuterences est certes plus speacutecique agrave certains do-maines que les autres objectifs plus geacuteneacuteralistes preacutesenteacutes jusquagrave maintenant mais nous pensonsneacuteanmoins quil a sa place dans le modegravele notamment pour les possibiliteacutes quil apporte dansces domaines dapplication speacuteciques

345 Progressiviteacute

Le concept de la progressiviteacute fait partie inteacutegrante du but de notre modegravele qui est de trouveret de recommander une bonne seacutequence de ressources Contrairement agrave la majoriteacute des systegravemes

il est beacuteneacuteque de les prendre tous les deux en comptes pour estimer linteacuterecirct de lutilisateur

67

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

de recommandation actuels nous ne souhaitons pas proposer quune simple liste agrave lutilisateurnal mais bien une seacutequence construite dans un but posseacutedant un deacutebut une n et une progres-sion entre ses divers eacuteleacutements An de bien faire la dieacuterence entre une liste et une seacutequence derecommandation voici 3 exemples dans 3 domaines dapplications dieacuterents

Listes

1 Musique Les musiques les plus similaires aux derniegraveres eacutecoutes voire agrave la toutederniegravere eacutecoute de lutilisateur sans ordre particulier

2 Museacutee Des divideuvres dart correspondant agrave ce que lutilisateur vient de voir Si lecritegravere principal de la creacuteation de liste est la similariteacute les ressources de celles-ci neseront pas forceacutement adapteacutees agrave la topologie du museacutee ou agrave sa sceacutenographie

3 E-eacuteducation Des ressources eacuteducatives sans ordre particulier (cours videacuteos expli-catives exercices) tous proches de ce que lutilisateur eacutetait en train de consulter

Seacutequences

1 Musique Une playlist de musiques proposant par exemple les titres dun mecircmeartiste selon leur date de sortie ou bien posseacutedant un tempo de plus en plus rythmeacuteou encore proposant une transition douce dun style de musical agrave un autre

2 Museacutee Un chemin composeacute de plusieurs divideuvres dart prenant compte de la distancephysique entre chaque divideuvre an davoir un parcours adapteacute au museacutee et en inteacutegrantune progression dans les divideuvres proposeacutees (par date styles auteurs etc)

3 E-eacuteducation Une seacutequence composeacutee de ressources eacuteducatives adapteacutees au niveauactuel de lutilisateur et agrave son objectif inteacutegrant des cours et des exercices proposantune progression mesureacutee (ni trop rapide ni trop lente) entre chaque ressources eacuteduca-tives de la seacutequences

Comme le montrent ces exemples lideacutee geacuteneacuterale derriegravere la recommandation de seacutequencesest de proposer une suite de ressources eacutetant toutes en lien les unes avec les autres et posseacutedantune progression sur un ou plusieurs critegraveres Cette progression se manifeste alors par de leacutegegraverestransitions entre chaque ressource an de faire avancer petit agrave petit la seacutequence vers un but Lebut est donc ici de parvenir agrave construire une seacutequence dont la progression nest ni trop lenteni trop rapide mais adapteacutee agrave lutilisateur et agrave son but Nous donnons agrave cet objectif le nom deprogressiviteacute optimale o Cette meacutetrique est utiliseacutee an de sassurer que les agents de la colo-nie de progressiviteacute trouvent un chemin dans le graphe ougrave chaque sommet seacutelectionneacute ore unebonne progressiviteacute par rapport agrave son preacutedeacutecesseur et agrave son successeur Pour ce faire nous avonscalculeacute la valeur de o en prenant en compte une ressource de deacutepart et une ressource darriveacuteerepreacutesenteacutee dans le graphe par deux sommets speacuteciques

Colonie de progressiviteacute

Le concept de progressiviteacute est lieacute agrave notre objectif de construire une bonne seacutequence deressources Contrairement agrave la majoriteacute des systegravemes de recommandation nous ne souhaitonspas seulement recommander une liste de ressources mais une seacutequence ayant un deacutebut unen et un ordre speacutecique Comme indiqueacute preacuteceacutedemment dans un museacutee une bonne seacutequencerecommandeacutee pourrait consister en des divideuvres dart lieacutees dune maniegravere ou dune autre (ie du

68

34 Objectifs

mecircme artiste ou de la mecircme peacuteriode) et situeacutees agrave proximiteacute les unes des autres Une telle seacutequencepourrait ensuite progresser lentement vers un autre artiste ou une section dieacuterente du museacuteeNotre objectif est donc de recommander une seacutequence qui ne progresse ni trop lentement ni troprapidement cest ce que nous appelons la progressiviteacute optimale o Cette meacutetrique est utiliseacuteepour sassurer que chaque ressource ore une bonne progressiviteacute par rapport agrave ses preacutedeacutecesseurset successeurs Pour ce faire nous avons calculeacute o sur la base des premier et dernier eacuteleacutementsdune seacutequence donneacutee pour un utilisateur speacutecique comme le montre lEacutequation 37

on =czn minus can

s(37)

ougrave on est la valeur de progressiviteacute optimale de la n-iegraveme caracteacuteristique dune seacutequencespeacutecique czn est la n-iegraveme caracteacuteristique de la derniegravere ressource z de la seacutequence czn estidentique pour la premiegravere ressource de la seacutequence et s est le nombre de ressources de la seacute-quence LEacutequation 37 sera appliqueacutee pour les caracteacuteristiques de la ressource m ce qui donneun vecteur de taille m de valeurs de progressiviteacute optimales (o1 o2 middot middot middot om) pour la seacutequencespeacutecique Ce vecteur sera ensuite utiliseacute dans le calcul de la distance dun bord (i j) pour lacolonie de progressiviteacute Cette meacutethode implique de disposer de caracteacuteristiques numeacuteriques pourappliquer leacutequation comme par exemple le tempo dune piste musicale ou la date dune divideuvredart

La valeur optimale o de la progressiviteacute est alors utiliseacutee pour calculer la distance d entredeux ndivideuds du graphe dans lEacutequation 38

dij =

msumnwon middot

cjnminuscinon

msumnwon

(38)

ougrave m est le nombre de caracteacuteristiques de la ressource consideacutereacutee on est la valeur de pro-gressiviteacute optimale de la n-iegraveme caracteacuteristiques de la ressource won est le poids de la n-iegravemecaracteacuteristique pour lutilisateur deacutependant de ses preacutefeacuterences et cjn est la valeur de la n-iegravemecaracteacuteristique de la ressource j

LEacutequation 38 produit une valeur de distance dij isin [minusinfin +infin] En fonction de lintervallede d nous pouvons deacuteduire que

dij isin [minusinfin 0] les caracteacuteristiques de la ressource j vont dans la direction inverse parrapport agrave la valeur de progressiviteacute optimale o

dij isin [0 1] la progression est trop lente par rapport agrave la valeur o attendue dij = 1 la progression est ideacuteale dij isin [1 +infin] la progression trop rapide

Dans un souci dhomogeacuteneacuteisation des distances entre toutes les colonies et pour respecterle modegravele initial ACS ougrave d repreacutesentait une distance physique nous avons souhaiteacute garder ladistance d isin [1 +infin] Pour ce faire nous avons donc reacutealiseacute une opeacuteration de transformationlorsque dij lt 1 preacutesenteacutee dans lEacutequation 39

69

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

Si dij isin

[minusinfin 0] alors dij = |dij |

[0 1] alors dij =1

dij

(39)

Inteacutegration compleacutementaire de la progressiviteacute dans le calcul de la distance parcou-rue des agents

Dans la section preacuteceacutedente nous avons deacutecrit le fonctionnement dune colonie deacutedieacutee agrave laprogressiviteacute Cependant nous soutenons le fait que la progressiviteacute ne doit pas ecirctre lapanagedune seule colonie mais doit ecirctre preacutesente dans toutes les colonies La progressiviteacute doit avoirune place preacutepondeacuterante dans les seacutequences que notre modegravele construit car cest une notionfondamentale dans la dieacuterence entre une liste de recommandation et une seacutequence de recom-mandation

An de renforcer la progressiviteacute des seacutequences construites par toutes les colonies nous pro-posons une version modieacutee de la mise agrave jour globale des pheacuteromones deacutecrite dans lEacutequation210 Dans lalgorithme initial ACS Lbest est la longueur du plus court chemin trouveacute par unagent Cette valeur est une simple somme de la distance associeacutee agrave chaque arecircte du meilleurchemin Cette valeur est ensuite utiliseacutee dans le calcul deacuteterminant la quantiteacute de pheacuteromonesagrave ajouter sur chaque arecircte du chemin Ainsi plus un chemin est court plus les arecirctes le com-posant sont reacutecompenseacutees par une plus grande quantiteacute de pheacuteromones Ce meacutecanisme est aucdivideur du renforcement de bonnes solutions et de leacutemergence de comportements intelligents Ande maximiser les seacutequences posseacutedant une progression constante nous avons modieacute le calcul deLbest pour inteacutegrer une notion de progressiviteacute Pour ce faire nous nutilisons plus simplementla distance dune arecircte mais aussi sa deacuteriveacutee comme montreacute dans lEacutequation 310

Lbest =sumeisinE

de +

sumeisinE

partde

|E|(310)

ougrave E est lensemble des arecirctes du meilleur chemin et de est la distance associeacutee agrave larecircte eAvec cette eacutequation modieacutee du calcul de la distance totale dun chemin nous peacutenalisons lesgrandes dieacuterences de distance entre des arecirctes successives tout en continuant de favoriser leschemins les plus courts En dautres termes lobjectif des agents est maintenant de trouver deschemins agrave la fois courts et progressifs les uns par rapport aux autres

35 Tactiques de fusion

Dans les sections preacuteceacutedentes nous avons deacutecrit 4 facteurs humains 4 objectifs agrave optimiserpar notre modegravele ainsi quun cinquiegraveme objectif de contrainte de construction des seacutequencesChacun de ces 4 premiers objectifs est associeacute agrave une colonie de fourmis speacutecique dont le but estde trouver un chemin dans le graphe Par conseacutequent apregraves cette premiegravere eacutetape il existe autantde chemins ou de seacutequences de ressources que de colonies dans le modegravele Le but est cependantde ne proposer agrave la n quune seule recommandation agrave lutilisateur Chaque seacutequence repreacutesentedonc ideacutealement une partie de la recommandation nale de lutilisateur An de construire cetteseacutequence nale il eacutetait neacutecessaire de fusionner ces dieacuterentes seacutequences provenant des coloniesen une seacutequence de recommandation unique Pour reacutesoudre ce problegraveme de nombreuses maniegraverede proceacuteder existent Dans la suite de cette section nous avons exploreacute deux tactiques de fusion

70

35 Tactiques de fusion

que nous allons preacutesenter

351 Colonie de fusion

La premiegravere tactique pour fusionner les dieacuterentes seacutequences produites preacuteceacutedemment a natu-rellement eacuteteacute dutiliser le mecircme modegravele que pour la premiegravere eacutetape agrave savoir une colonie speacuteciquedont les agents se deacuteplacent sur un graphe pour trouver une solution Cette colonie est cependantdieacuterente des preacuteceacutedentes pour deux raisons principales

Premiegraverement le graphe sur lequel cette colonie opegravere na aucun inteacuterecirct agrave contenir lensemblede toutes les ressources existantes du domaine Nous consideacuterons ici que la premiegravere eacutetape dumodegravele eectue une seacutelection dun certain nombre de ressources speacuteciques agrave chaque colonie Cesressources peuvent ensuite ecirctre utiliseacutees pour creacuteer un second graphe posseacutedant beaucoup moinsde ndivideuds sur lequel la colonie de fusion pourra chercher une solution Nous avons utiliseacute toutesles ressources seacutelectionneacutees dans la premiegravere eacutetape en tant que ndivideuds du nouveau graphe Nousavons ensuite ajouteacute des arecirctes agrave chaque paire conseacutecutives de ressources dans les seacutequences de lapremiegravere eacutetape an de conserver les meilleurs chemins trouveacutes par les agents Enn nous avonsajouteacute des arecirctes aleacuteatoires en suivant la mecircme meacutethode que deacutecrite au deacutebut de ce chapitre dansla creacuteation du graphe principal en Eacutequation 31 Le but de ces arecirctes aleacuteatoires est le mecircme quepreacuteceacutedemment agrave savoir permettre aux agents dexplorer de nouveaux chemins potentiels Cettepremiegravere tactique reprend donc les points principaux de la creacuteation du graphe principal

Deuxiegravemement et contrairement agrave la premiegravere eacutetape ougrave toutes les colonies avaient un butpreacutecis la colonie de fusion na pas pour vocation doptimiser une caracteacuteristique speacutecique Aucontraire cette colonie a pour essence de regrouper au mieux dans une solution unique les reacute-sultats speacuteciques trouveacutes auparavant Pour ce faire la colonie de fusion utilise lensemble desfacteurs humains preacutesenteacutes preacuteceacutedemment dans une somme pondeacutereacutee an dattribuer aux arecirctesune distance d prenant en compte tous les objectifs Le calcul de cette distance est preacutesenteacuteci-dessous dans lEacutequation 311

dij =sum

colisincoloniesw(col) middot dij(col) (311)

ougrave w(col) est le poids repreacutesentant limportance estimeacutee de lobjectif de la colonie col dansla recommandation nale Nous proposons ici de calculer les poids moyens de chaque objectif(similariteacute diversiteacute nouveauteacute et preacutefeacuterences) sur les derniegraveres n sessions dactiviteacute de lutilisa-teur Par exemple un utilisateur nayant eacutecouteacute que lalbum Wish you were here des Pink Floyddurant ses derniegraveres sessions deacutecoute se verra attribuer des poids forts pour la similariteacute et lespreacutefeacuterences Inversement les poids des objectifs de diversiteacute et de nouveauteacute seront faibles

Cette meacutethode permet dobtenir limportance relative de chacun des objectifs dans lhisto-rique de consultations reacutecent de lutilisateur En faisant varier n il est aussi possible de fairevarier la taille de lhistorique pris en compte Ainsi une valeur de n faible concernera uniquementles derniegraveres interactions de lutilisateur avec le systegraveme tandis quune valeur de n eacuteleveacutee pren-dra en compte agrave la fois lhistorique reacutecent et plus ancien La variation de la fenecirctre dhistoriquepeut ainsi apporter un comportement dieacuterent du modegravele pour dieacuterents types dutilisateurs(utilisateur reacutecent ou ancien peu actif ou tregraves actif etc)

71

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

352 Fusion de seacutequences

Nous avons souhaiteacute impleacutementer une deuxiegraveme tactique de fusion an davoir un point decomparaison avec la colonie de fusion Dans cette deuxiegraveme tactique nous avons eacutegalement cal-culeacute le poids w(col) de chaque objectif sur lhistorique n de lutilisateur de la mecircme maniegravereque dans lEacutequation 311 Ces poids ont ensuite eacuteteacute utiliseacutes dans la construction dune seacutequencenale ressource par ressource Pour ce faire nous avons reacuteunis toutes les ressources composantles seacutequences des colonies speacutecialiseacutees dans un ensemble agrave la maniegravere dun sac de mots Puis agravechaque iteacuteration lapport de chacune des ressources restantes agrave la seacutequence nale a eacuteteacute mesureacuteet la meilleure ressource a eacuteteacute ajouteacutee Les iteacuterations sont stoppeacutees lorsquil nest plus possibledameacuteliorer la seacutequence nale De la mecircme maniegravere que pour la tactique preacuteceacutedente lapportde chaque ressource agrave la seacutequence de recommandation peut ecirctre mesureacute de multiple maniegraveresDe la mecircme maniegravere que dans lEacutequation 311 nous avons choisi de calculer limportance dechaque objectif de la seacutequence nale en construction puis de choisir les ressources permettantde sapprocher des poids correspondant agrave lhistorique n de lutilisateur

353 Conclusion

Dans ce chapitre nous avons preacutesenteacute le fonctionnement de notre modegravele de recommanda-tion multi-objectifs AntRS Notre modegravele sinspire de lalgorithme multi-agents ACS de MarcoDorigo Au lieu de trouver le plus court chemin dans un graphe agrave laide dune colonie dagentsfourmis nous utilisons 4 colonies en parallegravele qui chacune maximise un aspect de la recomman-dation nale Comme nous lavons montreacute dans leacutetat de lart il est deacutesormais neacutecessaire que lesrecommandations prennent en compte de multiples facteurs comme la diversiteacute la similariteacute oula nouveauteacute Il est tout aussi important pour les systegravemes de recommandation decirctre modulaireset geacuteneacuteriques an de sadapter aux situations toujours plus complexes et aux domaines applicatifstoujours plus varieacutes dans lesquels ils sont utiliseacutes Le choix de sinspirer dun modegravele multi-agentsest une reacuteponse agrave ces deacutes de la recommandation moderne Les systegravemes multi-agents ont unefaible complexiteacute algorithmique et sont particuliegraverement adaptables par nature Le modegravele quenous avons proposeacute est de plus susamment geacuteneacuterique pour sadapter aux domaines applicatifsougrave il est possible de faire de la recommandation de seacutequences

Dans la suite de ce manuscrit nous allons appliquer notre modegravele AntRS a un domaineapplicatif et reacutealiser des expeacuterimentations avec des donneacutees dutilisation concregravete an deacutetudierses performances dans des conditions dutilisation reacuteelles

72

Chapitre 4

Expeacuterimentations et reacutesultats

Sommaire

41 Introduction 74

42 Expeacuterimentations preacuteliminaires portant sur le modegravele ACS initial 74

421 Preacutesentation et inteacuterecircts de ces premiegraveres expeacuterimentations 74

422 Expeacuterimentations preacuteliminaires sur le modegraveles ACS 78

423 Conclusion 84

43 Expeacuterimentations sur le modegravele AntRS 84

431 Base de donneacutees utiliseacutee 84

432 AntRS mono-objectif expeacuterimentations sur chaque colonie isoleacutee 89

433 AntRS multi-objectifs expeacuterimentations sur lensemble des colonies si-

multaneacutement et sur les tactiques de fusion 93

434 Optimisation des meacutetavariables de AntRS 99

44 Conclusion 103

73

Chapitre 4 Expeacuterimentations et reacutesultats

41 Introduction

Dans la section preacuteceacutedente nous avons deacutetailleacute le modegravele AntRS que nous avons deacuteveloppeacutepour reacutepondre aux probleacutematiques de cette thegravese Comme nous lavons expliqueacute AntRS se basesur le travail de [Dorigo and Birattari 2011] qui a modeacuteliseacute le comportement de fourragementdes fourmis dans la nature Son modegravele et le notre par extension ont donc au cdivideur de leur fonc-tionnement le mecircme meacutecanisme permettant agrave des agents teacuteleacuteonomiques de suivre et de deacuteposerdes pheacuteromones sur un graphe An de mettre en exergue le cdivideur de ces modegraveles qui sera parla suite enrichi nous avons en premier lieu deacuteveloppeacute les modegravele Ant Colony System de MarcoDorigo [Dorigo and Birattari 2011] en Java avec une interface visuelle Cela nous a permis detester son fonctionnement dans diverses conditions expeacuterimentales controcircleacutees ainsi que de testerses limites Nous avons ensuite impleacutementeacute lensemble de notre modegravele AntRS en utilisant la basedeacutejagrave deacuteveloppeacutee preacuteceacutedemment puis nous avons reacutealiseacute les expeacuterimentations principales de cettethegravese agrave laide dune base de donneacutees deacutecrivant les habitudes de personnes eacutecoutant de la musique

Ce chapitre est constitueacute de deux sections principales Dans la premiegravere section nous allonsdabord nous inteacuteresser agrave limpleacutementation et au fonctionnement expeacuterimental du modegravele ACS deDorigo Cette section mettra en exergue les points importants permettant le bon fonctionnementdu modegravele classique Agrave laide dexpeacuterimentations simples nous reprendrons et expliquerons dunpoint du vue pratique les notions introduites de maniegravere theacuteorique dans leacutetat de lart lors de lapreacutesentation du modegravele ACS Ces premiegraveres expeacuterimentations permettront au lecteur de mieuxappreacutehender la suite du chapitre dans laquelle les notions abordeacutees seront reacute-utiliseacutees et eacutetenduesDans la deuxiegraveme section de ce chapitre nous nous inteacuteresserons aux expeacuterimentations principalesde cette thegravese portant sur notre modegravele AntRS Nous deacutecrirons dabord la base de donneacutees quenous avons utiliseacute pour tester notre modegravele puis lensemble des expeacuterimentations faites et ennles principaux reacutesultats obtenus

42 Expeacuterimentations preacuteliminaires portant sur le modegravele ACS

initial

421 Preacutesentation et inteacuterecircts de ces premiegraveres expeacuterimentations

La premiegravere eacutetape de ce travail expeacuterimental a consisteacute dans limpleacutementation du modegraveleinitial proposeacute par Dorigo sans modication Le but eacutetait agrave la fois de veacuterier si les reacutesultatsobtenus correspondaient agrave ce qui eacutetait attendu dans la litteacuterature et davoir par ailleurs unprogramme repreacutesentant une base fonctionnelle permettant de tester de nouveaux modegraveles pluscomplexes par la suite Nous avons donc commenceacute par impleacutementer le modegravele Ant ColonySystem deacutecrit par Dorigo dans son article [Dorigo and Birattari 2011] Comme nous avons deacutejagravedeacutecrit en deacutetail ce modegravele dans la Section 243 de leacutetat de lart nous ne reviendrons pas surles eacutequations reacutegissant le fonctionnement dACS Cependant nous allons plutocirct nous inteacuteresserici aux reacutesultats obtenus lors dexpeacuterimentations connues de la litteacuterature scientique Le choixdu langage de programmation dans lequel a eacuteteacute reacutealiseacute limpleacutementation et les expeacuterimentationsdurant toute cette thegravese a eacuteteacute Java Ce choix se justie par 3 principales raisons

1 La connaissance avanceacutee de ce langage

2 les bibliothegraveques 40 disponibles correspondant aux besoins de la thegravese

40 Ensemble de ressources (fonctions algorithmes speacuteciques documentation) permettant la creacuteation acceacuteleacutereacuteede programmes

74

42 Expeacuterimentations preacuteliminaires portant sur le modegravele ACS initial

3 Le fait que Java soit un langage de programmation orienteacute objet qui est un paradigmede programmation particuliegraverement adapteacute pour limpleacutementation dagents (chaque agentpeut ecirctre repreacutesenteacute par un objet Java)

Pour rappel lalgorithme geacuteneacuteral des Ant Colony Optimization servant de base pour toutesles dieacuterentes versions proposeacutees par Dorigo (Ant System Ant Colony System Ant-q ) estsyntheacutetiseacute dans lAlgorithme 3 ci-dessous

Algorithm 3 Meacutetaheuristique Ant Colony Optimization

Initialisation des paramegravetres et des pheacuteromoneswhile conditions darrecircts non atteintes doConstruction des solutionsRecherche locale (optionnelle)Mise agrave jour des pheacuteromones

end while

Agrave partir de lalgorithme geacuteneacuteral Ant Colony Optimization voici le fonctionnement de savariante Ant Colony System syntheacutetiseacute dans lAlgorithme 4 ci-dessous

Algorithm 4 Algorithme Ant Colony System

Initialisation des paramegravetres et des pheacuteromoneswhile conditions darrecircts non atteintes dowhile toutes les fourmis nont pas atteint le but dowhile tous les ndivideuds nont pas eacuteteacute pris en compte doAppliquer la regravegle de transition et choisir le prochain ndivideud agrave atteindreAppliquer la mise agrave jour locale des pheacuteromones sur larecircte traverseacutee

end whileend whileMise agrave jour globale des pheacuteromones

end while

Cet algorithme ACS peut aussi ecirctre deacutecrit sous la forme dun diagramme de ux commela proposeacute [Schlunz 2011] dans la Figure 41 Le format du diagramme de ux permet de bienvisualiser le fonctionnement de lalgorithme et notamment ses boucles iteacuteratives imbriqueacutees tantquun critegravere de n na pas eacuteteacute trouveacute tant quil reste des fourmis agrave deacuteplacer et tant quil restedes ndivideuds agrave explorer pour une fourmi

Apregraves avoir impleacutementeacute en Java lalgorithme ACS deacutecrit ci-dessus nous avons voulu testerson fonctionnement Agrave cette n nous avons repris les expeacuteriences des ponts binaires que nousavons preacutesenteacute dans la section 244 de leacutetat de lart Pour rappel ces types dexpeacuterimentationsconsistent agrave placer des fourmis dans un dispositif comportant un point de deacutepart (la fourmiliegrave-re) un point darriveacutee (la nourriture) et deux chemins y menant Ces chemins peuvent avoirla mecircme distance ou des distances dieacuterentes selon le type dexpeacuterimentation Le but est ensuitedobserver le comportement des fourmis sur quelques dizaines de minutes an de deacuteterminer si unchemin est plus emprunteacute quun autre La Figure 42 preacutesente deux exemples de congurationspossibles de cette expeacuterience utiliseacutee sur de vraies fourmis Le but eacutetant bien sucircr dobserver lecomportement de groupes de fourmis et leurs capaciteacutes agrave trouver le chemin le plus court vers

75

Chapitre 4 Expeacuterimentations et reacutesultats

Figure 41 Diagramme de ux repreacutesentant le deacuteroulement de lalgorithme ACS proposeacute par[Schlunz 2011]

une source de nourriture dans un environnement inconnu

Nous revenons sur ces expeacuterimentations dans ce chapitre de la thegravese apregraves les avoir deacutejagrave

76

42 Expeacuterimentations preacuteliminaires portant sur le modegravele ACS initial

Figure 42 Deux exemples de congurations expeacuterimentales dieacuterentes permettant chacune detester la capaciteacute des fourmis agrave trouver le plus court chemin dans un evironnement [Goss et al1989]

mentionneacutees dans leacutetat de lart car elles peuvent ecirctre utiliseacutees pour veacuterier le comportement dumodegravele ACS que nous avons impleacutementeacute En eet ces expeacuterimentations sont simples agrave mettreen divideuvre et les reacutesultats attendus sont connus De plus le modegravele ACS possegravede plusieurs meacuteta-variables permettant chacune de moduler le comportement de certaines parties du systegraveme Leparameacutetrage de ces meacutetavariables inue de maniegravere importante sur les reacutesultats potentiels dumodegravele il est donc important de bien comprendre le rocircle de chacune dentre elles et de les testerextensivement pour maximiser les capaciteacutes du modegravele Voici toutes les meacutetavariables du modegraveleACS

1 τ0 isin [0 1] valeur initiale des pheacuteromones disposeacutees sur chaque arecircte du graphe avant lepremier passage des agents

2 α isin [0 1] importance des pheacuteromones lorsque lagent fourmi choisit dune nouvelle arecircteagrave explorer Plus la valeur de ce paramegravetre est eacuteleveacutee plus lagent privileacutegiera les arecirctesavec un niveau eacuteleveacute de pheacuteromones

3 β isin [0 1] importance de lheuristique lorsque lagent fourmi deacutecide dune nouvelle arecircteagrave explorer Plus la valeur de ce paramegravetre est eacuteleveacutee plus lagent privileacutegiera les arecirctesposseacutedant une bonne heuristique

4 ρ isin [0 1] paramegravetre geacuterant leacutevaporation des pheacuteromones sur les arecirctes du graphe Plusla valeur de ce paramegravetre est eacuteleveacutee et plus les pheacuteromones seacutevaporent rapidement entrechaque passage dagent

5 Q0 isin [0 1] paramegravetre permettant deacutequilibrer la part dexploration et dexploitationbiaiseacutee du modegravele Plus la valeur de ce paramegravetre est eacuteleveacutee et plus les agents auront ten-dance agrave exploiter les arecirctes ougrave beaucoup dautres agents sont deacutejagrave passeacutes Inversementplus la valeur de ce paramegravetre est basse et plus les agents auront tendance agrave explorer denouveaux chemins encore peu visiteacutes

En plus de ces 5 meacutetavariables utiliseacutees dans le modegravele theacuteorique et les eacutequations dACSdautres meacutetavariables sont inheacuterentes au fonctionnement du modegravele en pratique On peut ainsideacutenombrer 2 autres meacutetavariables

77

Chapitre 4 Expeacuterimentations et reacutesultats

6 a nombre dagents fourmis se deacuteplaccedilant sur le graphe Plus le nombre dagents est eacuteleveacuteet plus lintelligence collective du systegraveme baseacutee sur les pheacuteromones se deacuteveloppera Ungrand nombre dagents allonge cependant la dureacutee de lexeacutecution du programme

7 n nombre diteacuterations du programme Lors dune iteacuteration chaque agent se deacuteplace surle graphe et produit un parcours complet Plus le nombre diteacuterations est grand et plusles agents ont de temps pour renforcer leacutemergence dune solution (un chemin particuliersur le graphe) mais plus lexeacutecution prendra du temps

Linteacuterecirct de mettre en place les expeacuterimentations des ponts binaires est donc double

1 Veacuterier le comportement du modegravele ACS impleacutementeacute en Java sur des expeacuterimentationsconnues

2 Observer limpact des 7 meacutetavariables listeacutees ci-dessus sur le comportement et les reacutesultatsdu modegravele dans le but de mieux appreacutehender les expeacuterimentations principales de cettethegravese qui seront preacutesenteacutees dans la suite de cette section

422 Expeacuterimentations preacuteliminaires sur le modegraveles ACS

Expeacuterimentation 11 ponts binaires de mecircme longueur

La premiegravere expeacuterimentation avait pour but de tester le graphe le plus simple possible agravelimage du dispositif de lexpeacuterimentation de Deneubourg dont nous avons deacutejagrave parleacute dans leacutetatde lart et qui est rappeleacute avec la Figure 43 un point de deacutepart un point darriveacutee et deuxchemins possibles strictement eacutequivalents en terme de distance agrave parcourir

Figure 43 Illustration de lexpeacuterience des ponts binaires par Jean-Louis Deneubourg (a)Apregraves un certain temps les fourmis choisissent majoritairement une des deux voies possibles (b)[Deneubourg et al 1990]

Avec le passage successif des fourmis un chemin va petit agrave petit ecirctre privileacutegieacute et renforceacute viales pheacuteromones deacuteposeacutees par ces derniegraveres Au bout dun certain temps un des deux chemins estemprunteacute par la majoriteacute des fourmis mecircme si quelques-unes dentre elles continuent toujoursdemprunter lautre chemin au cas ougrave celui-ci deviendrait plus avantageux Comme les cheminsrestent strictement identiques dans cette expeacuterience le choix nal du chemin nest pas important

An de pouvoir mieux appreacutecier le fonctionnement du modegravele en temps reacuteel nous avonsimpleacutementeacute une interface graphique permettant dacher le graphe ses ndivideuds ses arecirctes et

78

42 Expeacuterimentations preacuteliminaires portant sur le modegravele ACS initial

toutes leurs informations Cette interface a eacuteteacute deacuteveloppeacutee agrave laide dune bibliothegraveque Java gra-tuite nommeacutee GraphStream 41 orant tout un ensemble de fonctions permettant lachage degraphes Cette couche graphique se rajoute au-dessus de limpleacutementation complegravete du modegravelesans toutefois en modier son fonctionnement daucune maniegravere Linterface graphique reacutecupegraveresimplement les donneacutees agrave acher agrave linitialisation (la disposition du graphe avec ses arecirctes etses ndivideuds) ainsi quagrave chaque iteacuteration du modegravele pour mettre agrave jour les valeurs de pheacuteromonesagrave chaque arecircte Une fois lexeacutecution termineacutee le chemin nal trouveacute par les agents est coloreacutepermettant une rapide visualisation des reacutesultats du modegravele Pour cette sous-section les reacutesultatsdes expeacuterimentations seront preacutesenteacutes agrave laide de GraphStream

Figure 44 Repreacutesentation graphique de lExpeacuterimentation 11 meneacutee sur le modegravele ACSgracircce agrave la bibliothegraveque Java GraphStream Le ndivideud repreacutesenteacute par un carreacute rouge correspondau deacutepart le ndivideud repreacutesenteacute par un carreacute bleu repreacutesente larriveacutee les ndivideuds ronds noirsrepreacutesentent des points de passage possible les nombres noirs accoleacutes aux arecirctes repreacutesentent ladistance pour parcourir larecircte les nombres violets repreacutesentent le taux de pheacuteromones deacuteposeacuteessur larecircte

La Figure 44 est une capture deacutecran de la fenecirctre graphique construite avec les fonction-naliteacutes oertes par GraphStream montrant la conguration de lExpeacuterimentation 11 On y voitnotamment lensemble du graphe avec ses 4 ndivideuds distinguables par leur numeacutero didentication0 1 2 9 Le ndivideud 0 repreacutesente le point de deacutepart ougrave les agents sont initialement placeacutes tandisque le ndivideud 9 repreacutesente le ndivideud darriveacutee ougrave les agents atteignent leur but et cessent de sedeacuteplacer Au niveau des arecirctes du graphe on peut distinguer deux informations en violet laquantiteacute de pheacuteromones τ preacutesente sur larecircte en noir la distance d agrave parcourir pour traverserlarecircte Dans cette conguration lheuristique ηij associeacutee agrave chaque arecircte i j est calculeacutee demaniegravere classique uniquement avec la distance dij agrave savoir ηij = 1

dij Lheuristique est donc ici

41 httpgraphstream-projectorg

79

Chapitre 4 Expeacuterimentations et reacutesultats

eacutequivalente agrave la distance et nest pas acheacutee dans la fenecirctre graphique La conguration repreacute-senteacutee par la Figure 44 correspond agrave leacutetat dinitialisation du systegraveme avant que les agents neparcourent le graphe Toutes les arecirctes ont donc les mecircmes valeurs le taux de pheacuteromones τcorrespond au taux de pheacuteromones initial τ0 ici eacutegal agrave 0 1 et la distance est xeacute agrave 10 uniteacutesLes deux chemins possibles permettant aux agents de se deacuteplacer du ndivideud de deacutepart 0 au ndivideuddarriveacutee 9 sont eectivement strictement identiques

Figure 45 Reacutesultats obtenus apregraves 30 iteacuterations sur lExpeacuterimentation 11 Agrave gauche laconguration nale du graphe agrave droite le pourcentage dagents fourmis ayant emprunteacutes lesdeux chemins

LExpeacuterimentation 11 se deacuteroule donc ainsi 100 agents se deacuteplaceront agrave chaque fois etchercheront un chemin du ndivideud 0 au ndivideud 9 durant 30 iteacuterations La Figure 45 preacutesente lesreacutesultats de cette expeacuterimentation Agrave gauche la fenecirctre graphique montre leacutetat du graphe agrave lan des 30 iteacuterations on peut voir le chemin seacutelectionneacute par les agents passant par les ndivideudslt 0 1 9 gt Agrave droite le graphique preacutesentant leacutevolution du pourcentage dagents prenant soitle chemin 1 (lt 0 1 9 gt) ou le chemin 2 (lt 0 2 9 gt) Leacutevolution des pourcentages est similaireaux reacutesultats trouveacutes par Deneubourg avec de vraies fourmis (Figure 43) Une fois quun cheminest privileacutegieacute par rapport agrave un autre entre 80 et 95 des agents y passent Cet eacutecart saccentuede plus en plus au l des iteacuterations Il est toutefois important de noter quil subsiste un faiblepourcentage dagents deacutecidant quand mecircme de prendre le chemin 2 permettant au systegraveme desadapter agrave un potentiel changement denvironnement On voit ici linteacuterecirct de la meacutetavariableQ0 qui eacutequilibre lexploitation du chemin 1 en majoriteacute mais qui autorise aussi quelques agentsagrave explorer dautres chemins du graphe

Expeacuterimentation 12 ponts binaires de mecircme longueur et inuence des meacutetava-riables

LExpeacuterimentation 12 illustre limportance des meacutetavariables sur le comportement du sys-tegraveme La mecircme topologie du graphe est conserveacutee mais certaines meacutetavariables sont modieacutees Q0 et β La premiegravere gegravere leacutequilibre entre exploration et exploitation tandis que la deuxiegravemeconcerne limportance de lheuristique dans lexploration Contrairement agrave lExpeacuterimentation11 Q0 est ici biaiseacute pour privileacutegier lexploration et β est augmenteacute an de donner plus dimpor-tance agrave lheuristique par rapport au pheacuteromones lors de lexploration Les agents ont donc plus

80

42 Expeacuterimentations preacuteliminaires portant sur le modegravele ACS initial

de probabiliteacute dexplorer de nouvelles arecirctes plutocirct que demprunter des arecirctes ougrave beaucoup depheacuteromones sont deacutejagrave deacuteposeacutes Dans cette conguration lexploration se base principalement surlheuristique qui est ici strictement identique quelle que soit larecircte puisque baseacutee sur la distanceLes agents nont donc en theacuteorie pas vraiment de direction claire quant au chemin agrave prendre Onpeut voir le reacutesultat de lExpeacuterimentation 12 sur la Figure 46 les agents oscillent dun chemin agravelautre selon liteacuteration sans quaucun des deux ne soit vraiment privileacutegieacute Quand bien mecircme unchemin serait plus emprunteacute que lautre pendant une iteacuteration les pheacuteromones suppleacutementairesdeacuteposeacutees sur les arecirctes nont que peu dinuence sur la deacutecision lors des prochaines iteacuterations

Figure 46 Reacutesultats obtenus apregraves 30 iteacuterations sur lExpeacuterimentation 12 Comme les agentsse basent principalement sur lheuristique qui est partout eacutegale ils oscillent entre les deux cheminssans en privileacutegier un

Expeacuterimentation 13 ponts binaires de mecircme longueur et inuence des meacutetava-riables

LExpeacuterimentation 13 dont les reacutesultats sont preacutesenteacutes par la Figure 47 montre quil estaussi possible dobtenir linverse du comportement de lExpeacuterimentation 12 En donnant uneforte importance aux pheacuteromones et en favorisant grandement lexploitation par rapport agrave lex-ploration les agents choisissent tregraves rapidement un chemin et nen changent plus Au bout dequelques iteacuterations seulement 100 des agents prennent le mecircme chemin Lautre chemin aban-donneacute nit par voir toutes ses pheacuteromones seacutevaporer et les agents nont plus aucun moyen dyretourner

Expeacuterimentation 2 ponts binaires avec chemins de longueurs dieacuterentes

Apregraves avoir testeacute le comportement du modegravele ACS sur un graphe ougrave les chemins sont iden-tiques dans lExpeacuterimentation 1 nous allons maintenant creacuteer un graphe ayant la mecircme con-guration que dans la Figure 42 Le but est ici de tester la capaciteacute des agents agrave imiter lesfourmis dans la nature qui sont capables apregraves quelques dizaines de minutes de privileacutegier les 2

81

Chapitre 4 Expeacuterimentations et reacutesultats

Figure 47 Reacutesultats obtenus apregraves 30 iteacuterations sur lExpeacuterimentation 13 Les agents ex-ploitent ici les arecirctes ayant le plus de pheacuteromones Tregraves rapidement tous les agents utilisent lemecircme chemin

arecirctes courtes par rapport aux 2 arecirctes longues Nous allons de plus garder les mecircmes valeursde meacutetavariables que pour lExpeacuterimentation 11 sauf pour la quantiteacute initiale de pheacuteromoneτ0 qui sera augmenteacutee an de rester au-dessus de 0 La Figure 48 montre la conguration dugraphe directement apregraves 30 iteacuterations Toutes les arecirctes courtes avec une distance de 10 ont eacuteteacuteseacutelectionneacutees tandis que toutes les arecirctes longues avec une distance de 20 nont pas eacuteteacute utiliseacutees

Figure 48 Conguration nale du graphe pour lExpeacuterimentation 2 apregraves 30 iteacuterations Lesagents ont en majoriteacute bien seacutelectionneacute le chemin le plus court lt 0 1 3 4 9 gt

82

42 Expeacuterimentations preacuteliminaires portant sur le modegravele ACS initial

Expeacuterimentation 3 graphes aleacuteatoires plus complexes

Dans les preacuteceacutedentes expeacuterimentations le graphe eacutetait le plus simple possible pour pouvoirjouer avec le comportement du modegravele Avant de passer agrave la section suivante nous souhaitionstester les capaciteacutes du modegravele sur des topologies de graphes plus complexes Nous avons donccreacuteeacute aleacuteatoirement 10 graphes posseacutedant chacun 20 ndivideuds et des arecirctes aleacuteatoires selon un degreacutemoyen de 5 sur lesquels 100 agents se deacuteplaceront sur 50 iteacuterations La Figure 49 preacutesente lepremier de ces 10 graphes apregraves 30 iteacuterations On peut voir que le but est de trouver un chemindu ndivideud 0 au ndivideud 19 et les agents ont trouveacute le chemin lt 0 1 4 2 19 gt Ce chemin est eecti-vement le plus court avec une distance de 284 le deuxiegraveme meilleur chemin eacutetant lt 0 5 6 19 gtavec une distance de 315

Figure 49 Exemple de graphe de lExpeacuterimentation 3 agrave la n des 50 iteacuterations Ces graphessont geacuteneacutereacutes aleacuteatoirement

Parmi les 10 graphes aleacuteatoires le modegravele a trouveacute le chemin le plus court pour 9 dentre euxcar dans lun des graphes il neacutetait pas possible de rejoindre le ndivideud de n 19 Autrement dit

83

Chapitre 4 Expeacuterimentations et reacutesultats

les agents ont trouveacute le chemin le plus optimiseacute agrave chaque fois que cela eacutetait possible

423 Conclusion

Dans cette premiegravere section nous avons impleacutementeacute et testeacute le modegravele ACS proposeacute parDorigo Malgreacute la relative simpliciteacute des expeacuterimentations reacutealiseacutees nous avons pu comparer etveacuterier les reacutesultats que nous avons obtenus avec ceux de la litteacuterature scientique du domaineOutre ce point nous avons aussi pu deacuteduire quelques informations cruciales pour la suite de cettesection

Les meacutetavariables jouent un rocircle central dans le comportement les performances etles reacutesultats du modegravele

Les meacutetavariables peuvent donner de bons reacutesultats avec un type de graphemais pas forceacutement avec un autre Il sera donc important de pouvoir les adapter auxgraphes des expeacuterimentations principales

Leacutequilibre de ces meacutetavariables est relativement complexe agrave obtenirMecircme avecces congurations simples de graphes et laide de linterface graphique chaque expeacuterimen-tation a demandeacute un certain nombre dessais avant de trouver des valeurs concluantes Deplus comme ces meacutetavariables sont propres agrave chaque expeacuterimentation leacutetat de lart necontient que tregraves peu dindications sur les valeurs agrave leur donner Il sera donc importantdeacutetudier ce problegraveme pour les expeacuterimentations principales de cette thegravese

Il est important de noter que comme notre modegravele AntRS est une extension du modegravele ACSde Dorigo et reprend ses principes de fonctionnement toutes les conclusions ci-dessus pourrontecirctre appliqueacutees dans la section suivante ougrave nous reacutealiserons plusieurs expeacuterimentations avec lemodegravele AntRS

43 Expeacuterimentations sur le modegravele AntRS

Dans cette section nous allons maintenant deacutecrire les expeacuterimentations meneacutees sur le modegraveleAntRS que nous avons conccedilu dans le cadre de cette thegravese et deacutecrit dans le chapitre 3 preacuteceacutedentNous nallons pas re-deacutetailler la theacuteorie du modegravele AntRS ici comme cela a deacutejagrave eacuteteacute fait dansle chapitre preacuteceacutedent mais nous allons plutocirct nous concentrer sur son application et sur sescomportements dun point de vue expeacuterimental De la mecircme maniegravere que pour le modegravele ACSdans la section preacuteceacutedente il est important de proceacuteder agrave quelques tests pour jauger notremodegravele avant de lancer des expeacuterimentations pouvant ecirctre longues Toutefois et contrairementagrave la section preacuteceacutedente toutes les expeacuterimentations qui vont ecirctre preacutesenteacutees ici ont eacuteteacute reacutealiseacuteessur une base de donneacutees reacuteelles Avant de sinteacuteresser agrave ces expeacuterimentations nous allons doncpreacutesenter la base de donneacutees utiliseacutee

431 Base de donneacutees utiliseacutee

Tout dabord et avant de discuter du choix des donneacutees il est important de preacuteciser pour-quoi nous navons pas eu recours comme dans la section preacuteceacutedente pour le modegravele ACS agrave desdonneacutees simuleacutees Lexplication de cette deacutecision reacuteside dans lobjectif viseacute par ces expeacuterimen-tations Les expeacuterimentations reacutealiseacutees preacuteceacutedemment avaient seulement pour but de tester lebon fonctionnement du modegravele son comportement et linuence de ses meacutetavariables Lobjectifdes expeacuterimentations que nous allons preacutesenter maintenant est dieacuterent proposer des seacutequences

84

43 Expeacuterimentations sur le modegravele AntRS

de ressources correspondant aux preacutefeacuterences de lutilisateur Il serait theacuteoriquement possible desimuler un grand nombre de ressources aleacuteatoires posseacutedant des caracteacuteristiques elles aussi aleacutea-toires Cependant nous souhaitons principalement eacutevaluer la pertinence des seacutequences produitespar notre modegravele Pour ce faire il est neacutecessaire de disposer de donneacutees dusage pour veacuteriera posteriori si ces seacutequences sont susceptibles dinteacuteresser les utilisateurs Lexploitation dunebase de donneacutees reacuteelle posseacutedant ces donneacutees dusages eacutetait essentielle

Choix du domaine applicatif

Le choix du domaine applicatif a eacuteteacute un point crucial pour pouvoir tester notre modegravele dans debonnes conditions La recommandation de seacutequences restreint le choix du domaine en imposantcertaines contraintes

Les utilisateurs doivent consulter reacuteguliegraverement les ressources du domaine applicatif Lors dune peacuteriode dactiviteacute les utilisateurs doivent consulter un nombre susant (au

moins une dizaine) de ressources dans un court intervalle de temps Par conseacutequent les ressources doivent pouvoir ecirctre consulteacutees et consommeacutees rapide-

ment Ces ressources doivent aussi ecirctre disponibles en nombre susant

En se basant sur les eacutetudes de leacutetat de lart explorant les algorithmes de fourmis ou la recom-mandation de seacutequences deux domaines applicatifs sont majoritairement utiliseacutes les ressourceseacuteducatives ou les ressources multimeacutedias Le domaine eacuteducatif permet de geacuteneacuterer des seacutequencesdestineacutees aux apprenants comme le ferait un vrai professeur tandis que le domaine du divertisse-ment multimeacutedia est en plein essor depuis quelques anneacutees gracircce agrave la deacutemocratisation dInternethaut deacutebit et des smartphones permettant agrave tout un chacun de regarder des lms ou deacutecouter dela musique par exemple Un troisiegraveme domaine a aussi eacuteteacute consideacutereacute car il a eacuteteacute le sujet de monstage de n de Master en collaboration avec le projet europeacuteen CrossCult 42 le domaine museacutealautrement dit les seacutequences que creacuteent les visiteurs dun museacutee en se deacuteplaccedilant physiquementdans un museacutee [Osche et al 2016 Osche et al 2019b]

Toutefois mecircme si ces trois domaines sont adapteacutes agrave notre application la reacutecupeacuteration dunebase de donneacutees assez importante pour reacutealiser des expeacuterimentations ne pose pas les mecircmes pro-blegravemes selon le domaine consideacutereacute

Domaine eacuteducatif dans ce domaine les ressources sont des supports peacutedagogiques denatures dieacuterentes 43 et le but est de creacuteer des seacutequences permettant agrave des utilisateurs dat-teindre des connaissances speacutecieacutees Il existe des bases de donneacutees publiques provenantduniversiteacutes ouvertes comme par exemple lUniversiteacute Ouverte des Humaniteacutes 44 maisces derniegraveres nont pas de prols utilisateurs assez fournis pour pouvoir les utiliser icinotamment ducirce agrave une connexion avec une session unique et anonyme sans prol Commeil est preacutefeacuterable davoir plusieurs dizaines (voire centaines) dentreacutees preacute-existantes pourmodeacuteliser le graphe et les prols utilisateurs il est neacutecessaire dutiliser les donneacutees dunsite permettant la connexion de lutilisateur et lenregistrement de ses habitudes pendantune certaine dureacutee

42 httpwwwcrossculteu projet europeacuteen ayant pour but de modier la maniegravere dont les citoyens europeacuteensvoient et sapproprient lHistoire en creacuteant de nouvelles interconnexions entre lheacuteritage culturel des lieux deculture (museacutees villes etc) et le point de vue des citoyens eux-mecircmes43 Les supports peacutedagogiques peuvent inclure des cours eacutecrits oraux des videacuteos des exercices des tests etc44 httpwwwuohfr

85

Chapitre 4 Expeacuterimentations et reacutesultats

Domaine museacuteal ce domaine est unique car il est le seul des trois agrave neacutecessiter dereacutecolter des donneacutees de maniegravere physique et non sur ordinateur Comme nous lavons vudans leacutetat de lart des eacutetudes existent dans ce domaine et ont reacutecolteacute les positions desutilisateurs avec plus ou moins de preacutecision mais il nexiste agrave notre connaissance pas debase de donneacutees publique permettant de savoir ce que le visiteur regarde preacutecisemment 45Or cette information est essentielle agrave notre modegravele car la position seule ne permet pas dedeacuteterminer ce que fait preacuteciseacutement lutilisateur (par exemple il peut sassoir en face dunedivideuvre mais regarder derriegravere lui ou encore discuter avec quelquun sans precircter attentionagrave ldivideuvre devant lui etc) Autrement dit sans savoir ce que regarde lutilisateur il nestpas possible de savoir les ressources quil a consulteacute Eacutetant donneacute le sujet du stage eectueacuteavant cette thegravese cest sur ce problegraveme preacutecis que nous nous sommes dabord concentreacutesCependant devant le coucirct en temps de la mise en place dune telle expeacuterimentation nousavons chercheacute des alternatives plus reacutealisables Il est agrave noter quil existe aussi la possi-biliteacute dun museacutee virtuel ougrave les visiteurs utilisent un ordinateur et un casque de reacutealiteacutevirtuelle pour se deacuteplacer ddivideuvre en divideuvre dans un espace recreacuteeacute pour simuler un museacuteeLa creacuteation de lensemble des composants permettant cette expeacuterimentation ainsi que lerecrutement des visiteurs virtuels est cependant complexe et tregraves coucircteux en temps nechangeant pas le problegraveme principal de la reacutecolte de donneacutees dans notre cas

Domaine du divertissement multimeacutedia depuis le tout deacutebut des systegravemes de re-commandations le domaine multimeacutedia (musique lms etc) occupe une place majeuredans leacutetat de lart On peut citer par exemple la base de donneacutees publique MovieLensqui depuis 1998 a eacuteteacute utiliseacutee dans des milliers deacutetudes sur la recommandation de lms[Harper and Konstan 2015] La raison de cette omnipreacutesence est la grande quantiteacute desites web permettant souvent de maniegravere gratuite de regarder des videacuteos deacutecouter dela musique etc Les donneacutees dutilisation de ce genre de sites sont aussi relativementsimples agrave reacutecupeacuterer et agrave exploiter Leacutecoute de musique en ligne est speacuteciquement inteacute-ressante dans le cadre de cette thegravese car elle est propice agrave la consommation de multiplesressources agrave la suite dans une mecircme session orant ainsi la possibiliteacute de travailler avecdes seacutequences De plus il existe plusieurs sites de diusion de musique en ligne orantla possibiliteacute dacceacuteder agrave leur API et agrave certaines de leurs donneacutees comme Deezer 46 ouencore Spotify 47

Le choix sest nalement porteacute sur le domaine de leacutecoute de musique en ligne dune part pourla possibiliteacute dexploiter et de recommander des seacutequences de musiques et dautre part pour lapossibiliteacute dobtenir une base de donneacutees de la part de nos partenaires dans lindustrie musicaleNotre modegravele AntRS ayant la capaciteacute de sadapter agrave de nombreux domaines applicatifs nousavons pu nous diriger vers une base de donneacutees existante an de commencer les expeacuterimentationsAmaury LHuillier ancien doctorant de leacutequipe KIWI a reacutecupeacutereacute et exploiteacute durant sa thegraveseune base de donneacutees musicale provenant de Deezer [lHuillier 2018] Dans la section suivantenous allons deacutecrire les caracteacuteristiques de cette base de donneacutees

45 Bien que des solutions soient en cours deacutetudes[Mokatren et al 2018]46 httpswwwdeezercom47 httpswwwspotifycom

86

43 Expeacuterimentations sur le modegravele AntRS

Description de la base de donneacutees

La base de donneacutees que nous avons utiliseacute se base sur le comportement dutilisateurs deDeezer pendant un mois entre le 5 deacutecembre 2016 et le 5 janvier 2017 Durant ce mois nousavons pu identier

3561 utilisateurs uniques 1871919 eacutecoutes enregistreacutees 178910 musiques uniques eacutecouteacutees

En plus de ces donneacutees nous avons calculeacute le nombre de sessions uniques durant ce mois Unesession est deacutetermineacutee par un utilisateur se connectant sur le site eacutecoutant un certain nombre demusiques puis se deacuteconnectant Une session se poursuit tant que lutilisateur eacutecoute des musiquessans pause plus longues que 15 minutes Nous avons ainsi pu identier 91468 sessions uniquescomposeacutees en moyenne de 183 morceaux de musique Ces sessions seront la base de travail nouspermettant de construire le graphe de notre modegravele AntRS et de proposer des recommandationsLa Figure 410 preacutesente en scheacutema la deacutetection de sessions dans la base de donneacutees

Figure 410 Exemple de deacutetection de sessions dans la base de donneacutees Lheure agrave laquelleest lanceacutee chaque musique (ici en bas dans le scheacutema) ainsi que sa dureacutee sont enregistreacutees Silutilisateur ne relance pas de musique pendant 15 minutes apregraves la n de sa derniegravere eacutecoute alorsla session en cours est termineacutee et une nouvelle session est commenceacutee agrave la prochaine musiquelanceacutee

Deezer possegravede des meacutetadonneacutees sur chaque musique quil est possible de reacutecupeacuterer et decoupler agrave dautres API 48 (comme par exemple lAPI de Spotify 49) an de les compleacuteter si neacute-cessaire Sans preacutesenter la base de donneacutees dans lensemble de ses deacutetails voici ci-dessous les ca-racteacuteristiques potentiellement exploitables enregistreacutees pour chaque musique que nous pouvonsregrouper en trois cateacutegories Tout dabord nous disposons dinformations textuelles classiques

id identiant unique de la musique title titre de la musique album nom de lalbum auquel appartient la musique artist nom de lartiste (ou du groupe) qui a creacuteeacute la musique artistGenre genre musical de lartiste

Ensuite les API de descriptions de meacutetadonneacutees musicales disposent dun ensemble de va-leurs numeacuteriques correspondant aux caracteacuteristiques de chaque musique

48 API Application Programming Interface

49 httpsdeveloperspotifycomdocumentationweb-api

87

Chapitre 4 Expeacuterimentations et reacutesultats

duration dureacutee de la musique en secondes acousticness isin [0 1] indique agrave quel point la musique est acoustique cest-agrave-dire si

la musique est plutocirct de type eacutelectronique ou plutocirct classique (ie composeacutee avec desinstruments de musique agrave corde ou agrave vents par exemple)

danceability isin [0 1] indique agrave quel point la musique est adapteacutee agrave la danse energy isin [0 1] indique agrave quel point la musique est eacutenergique instrumentalness isin [0 1] indique agrave quel point la musique possegravede ou non des parties

vocales liveness isin [0 1] indique si la musique a eacuteteacute enregistreacutee avec ou sans la preacutesence dun

public loudness isin [0 1] mesure la preacutesence et la puissance des basses dans la musique speechiness isin [0 1] mesure limportance des paroles dans la musique sil y en a tempo rythme de la musique valence indique si leacutemotion geacuteneacuterale de la musique est plutocirct heureuse ou triste

Enn Deezer eacutetant un service de musique en ligne il dispose des donneacutees de freacutequentationsdes musiques les unes par rapport aux autres Il est donc possible de connaicirctre pour chaquemusique et artiste sa populariteacute

trackRankDeezer repreacutesente la populariteacute de la musique sur le site Deezer artistRankDeezer repreacutesente la populariteacute de lartiste sur le site Deezer

La base de donneacutees possegravede aussi une table concernant les utilisateurs Ces derniers sontbien sucircr anonymiseacutes avec un identiant geacuteneacutereacute automatiquement De plus pour chaque chansonDeezer peut connaicirctre quelles actions lutilisateur a eectueacute durant son eacutecoute (sil en a eectueacute)

idUser identiant unique de lutilisateur idTrack identiant unique de la musique eacutecouteacutee timestamp date preacutecise agrave laquelle lutilisateur a lanceacute la musique skip indique si lutilisateur est passeacute agrave la musique suivante durant son eacutecoute ban indique si lutilisateur a banni la musique eacutecouteacutee de ses futures recommandations love indique si lutilisateur a aimeacute la musique durant son eacutecoute

Ces trois derniegraveres informations sont importantes car elles repreacutesentent lavis de lutilisateursur la musique quil eacutecoute On peut par exemple deacuteduire dun utilisateur qui passe la musiqueen cours (skip) quil ne lappreacutecie pas ou alors quil laime mais que ce nest pas le bon momentpour leacutecouter Un utilisateur supprimant une musique de ses futures eacutecoutes (ban) indique quilne souhaite plus eacutecouter cette musique et ce quelles que soient les circonstances Le Tableau 41preacutesente la freacutequence agrave laquelle les utilisateurs se sont servis de ces fonctionnaliteacutes dans notrebase de donneacutees

Discussion sur la base de donneacutees

Dans cette section nous avons justieacute le choix dune base de donneacutees musicale et deacutecritson contenu Mecircme si initialement nous nous sommes plutocirct dirigeacutes vers lespace museacuteal etle-eacuteducation devant le temps et la complexiteacute de la reacutecupeacuteration de donneacutees dans ces deuxdomaines nous avons nalement proceacutedeacute au choix plus pragmatique du domaine musical dont

88

43 Expeacuterimentations sur le modegravele AntRS

Nombre doccurrences Pourcentage

skip 603773 3225ban 3417 018love 14174 076

Total 621364 3319

Table 41 Tableau repreacutesentant le nombre de fois ougrave un utilisateur a cliqueacute sur les boutonspour passer bannir ou aimer une musique durant son eacutecoute On remarque quau total dansnotre base de donneacutees pregraves dun tiers des utilisateurs ont passeacute la musique quils eacutecoutaient

une base de donneacutees eacutetait deacutejagrave disponible et precircte agrave lemploi Le travail preacuteliminaire sur les deuxdomaines applicatifs non seacutelectionneacutes na cependant pas eacuteteacute vain car des projets en parallegravelesur la creacuteation dune base de donneacutees de visiteurs se deacuteplaccedilant dans le museacutee des Beaux-arts deNancy sont en cours de reacutealisation [Osche et al 2019b][Castagnos et al 2019]

Un autre objectif derriegravere la prise en compte de plusieurs domaines sur lesquels appliquernotre modegravele est la geacuteneacutericiteacute de notre approche Ces trois domaines possegravedent de nombreusesdieacuterences les uns par rapports aux autres Le domaine des museacutees est un environnement physiqueougrave les distances entre les divideuvres dart et la foule sont des notions importantes agrave prendre en compteet unique agrave ce domaine Le domaine de le-eacuteducation quant agrave lui neacutecessite de prendre en comptelobjectif peacutedagogique de lapprenant son niveau ou encore sa vitesse dapprentissage plutocirctque les seules preacutefeacuterences quil est dusage dexploiter dans les systegravemes de recommandationNotre modegravele AntRS a eacuteteacute conccedilu dans le but de pouvoir sadapter agrave ces dieacuterentes speacuteciciteacutesAinsi le fonctionnement du cdivideur du modegravele reste le mecircme quel que soit le domaine et seulsles objectifs des colonies ainsi que le type des colonies neacutecessite decirctre adapteacute en fonctiondes objectifs importants du domaine et des caracteacuteristiques de ses ressources Pour illustrer cedernier point tregraves concregravetement les expeacuterimentations qui suivent nincluent pas la colonie deprogressiviteacute Nous avons reacutealiseacute de nombreux tests avec cette colonie avec le corpus de donneacuteesmais les reacutesultats obtenus nont jamais eacuteteacute concluants Cela sexplique par le fait que les seacutequencesdeacutecoutes utilisateurs que nous avons recueilli ne posseacutedaient elles-mecircmes aucun motif deacutetectablede progressiviteacute selon les critegraveres deacutenis dans notre modegravele Nous avons donc deacutecideacute dutiliser lamodulariteacute quore notre modegravele en enlevant cette colonie

432 AntRS mono-objectif expeacuterimentations sur chaque colonie isoleacutee

Apregraves avoir deacutetailleacute la base de donneacutees nous allons maintenant aborder la premiegravere expeacuteri-mentation que nous avons reacutealiseacute avec celle-ci Comme nous lavons fait au deacutebut de ce chapitreavec le modegravele ACS classique nous avons jugeacute important de reacutealiser quelques expeacuterimentationsde tests an dappreacutecier le fonctionnement en pratique de notre modegravele qui jusquagrave maintenantdans ce manuscrit na eacuteteacute preacutesenteacute que de maniegravere theacuteorique Pour rappel notre modegravele simuleen parallegravele plusieurs colonies de fourmis ayant chacune un objectif unique Ensuite un algo-rithme se charge de fusionner les dieacuterents reacutesultats de lensemble des colonies pour ne proposeragrave lutilisateur quune seule seacutequence de ressources Avant de tester lensemble de notre modegravelenous avons voulu tester les colonies seacutepareacutement an dobserver si les reacutesultats quelles produisentsont bien adapteacutes agrave leurs objectifs respectifs Voici les 4 colonies que nous avons preacutesenteacutes dansle chapitre 3 et que nous allons mesurer ici

1 Similariteacute

89

Chapitre 4 Expeacuterimentations et reacutesultats

2 Diversiteacute

3 Nouveauteacute

4 Preacutefeacuterences

An de mesurer les performances de ces 4 colonies nous allons les isoler et les lancer sur ungraphe identique en tous points La modulariteacute dAntRS nous permettant de changer le nombrede colonies utiliseacutees au vol agrave chaque exeacutecution est ici mis agrave prot pour lancer notre modegraveleavec uniquement une colonie au lieu des 4 habituelles La deuxiegraveme phase de notre modegravele lafusion des seacutequences provenant des dieacuterentes colonies nest ici pas utiliseacutee eacutetant donneacute que nousnaurons que les reacutesultats dune seule colonie autrement dit nous naurons agrave la n quune seuleseacutequence unique par utilisateur et par expeacuterimentation (soit 4 seacutequences par utilisateur pourlensemble des 4 expeacuterimentations) Nous allons donc proceacuteder agrave 4 tests dieacuterents pour chaquecolonie avec des conditions de deacutepart strictement identiques Le but est ici de voir si les reacutesultatsobtenus correspondent bien agrave lobjectif de la colonie testeacutee Autrement dit pour un utilisateurdonneacute les agents de la colonie de similariteacute devraient favoriser les musiques similaires au goucirct delutilisateur en question De son cocircteacute la colonie de nouveauteacute devrait dans les mecircmes conditionsproduire des seacutequences de musiques moins familiegraveres pour lutilisateur

Avant de preacutesenter les reacutesultats de ces premiegraveres expeacuterimentations nous allons deacutecrire dequelle maniegravere nous les avons reacutealiseacutees Nous avons deacutejagrave deacutetailleacute la base de donneacutees avec laquellenous travaillons dans la section preacuteceacutedente mais nous navons pas encore expliqueacute commentnous avons utiliseacute ces donneacutees Comme nous lavons preacuteciseacute nous avons agrave notre disposition plusde 3500 utilisateurs et plus de 91400 sessions Parmi lensemble total des utilisateurs nous enavons seacutelectionneacute 500 au hasard an de travailler uniquement sur eux Cette reacuteduction du nombredutilisateurs nous a permis de reacutealiser beaucoup plus rapidement des expeacuterimentations tout engardant une diversiteacute importante Pour chacun de ces 500 utilisateurs nous avons reacutecupeacutereacute leurssessions deacutecoute et gardeacute toutes celles contenant 5 musiques ou plus Ces 500 utilisateurs ontensuite eacuteteacute diviseacutes aleacuteatoirement en 2 groupes de 400 et de 100 les 400 premiers utilisateursont servi pour lentraicircnement du modegravele (dans notre cas la creacuteation du graphe) et cest sur les100 utilisateurs restants que nous avons meneacute les tests Dans le cadre de cette expeacuterimentationpreacutecise les utilisateurs de la base dentraicircnement ont eacutecouteacute 10621 sessions uniques de plus de5 musiques et les utilisateurs de la base de test ont quant agrave eux eacutecouteacute 2569 sessions Pourchacune des sessions deacutecoute des utilisateurs de la base de test notre modegravele a produit uneseacutequence de recommandations en partant de la premiegravere musique eacutecouteacutee Autrement dit pourchaque session les agents de notre modegravele ont eacuteteacute lanceacutes sur le graphe en prenant comme pointde deacutepart la premiegravere musique que lutilisateur avait eacutecouteacute Par exemple pour la session dunutilisateur consistant en leacutecoute de lalbum entier Dark Side of the Moon des Pink Floyd conte-nant 9 musiques les agents eacutetaient placeacutes sur le ndivideud du graphe correspondant agrave la premiegraveremusique de lalbum Speak to me Breathe puis notre modegravele sexeacutecute et les agents trouventun chemin dans le graphe Les agents possegravedent 3 conditions de parcours de graphe une condi-tion de taille minimale de la seacutequence recommandeacutee et deux conditions darrecircts La conditionde taille minimale de la seacutequence recommandeacutee est xeacutee agrave la moitieacute de la longueur de la sessioninitiale de lutilisateur Dans lexemple de lalbum de Pink Floyd un agent sera donc forceacute deparcourir au moins 5 ndivideuds du graphe avant de pouvoir sarrecircter Les deux conditions darrecirctseacutetaient quant agrave elles imposeacutees dans notre modegravele an de limiter la taille maximale de la seacutequencerecommandeacutee des agents Premiegraverement la derniegravere musique de la session initiale eacutecouteacutee parlutilisateur neacutetait pas donneacutee en amont mais si jamais les agents arrivaient agrave cette musique ils

90

43 Expeacuterimentations sur le modegravele AntRS

arrecirctaient ici leur chemin Deuxiegravemement dans le cas ougrave les agents natteignaient pas la derniegraveremusique de la session initiale de lutilisateur ces derniers sarrecirctaient lorsquils avaient parcourudeux fois la taille de la session initiale Dans notre exemple avec lalbum de Pink Floyd les agentspourraient donc parcourir au maximum 18 ndivideuds du graphe et produire ainsi une seacutequence derecommandations de 18 musiques En prenant en compte le nombre de ndivideuds des graphes surlesquels nous avons travailleacute (entre plusieurs dizaines de milliers jusquagrave plusieurs centaines demilliers) cest cette deuxiegraveme condition darrecirct qui eacutetait tregraves largement atteinte Ces trois condi-tions son neacutecessaires et ont eacuteteacute mises en place an dobtenir des seacutequences de recommandationfaisant sens dans le contexte du domaine applicatif musical Sans ces 3 conditions il est pos-sible dobtenir des seacutequences ne faisant que deux musiques ou posseacutedant des centaines voire desmilliers de musiques Comme le reste des paramegravetres de notre modegravele nous avons fait en sortequil soit aiseacute de les changer au vol en fonction du domaine applicatif voire mecircme en fonctionde chaque utilisateur au sein dun mecircme domaine

Nous allons maintenant nous inteacuteresser agrave la creacuteation du graphe Nous avons deacutecrit la maniegraveredont nous creacuteons le graphe sur lequel les agents se deacuteplacent dans la Section 33 du chapitrepreacuteceacutedent Nous avons utiliseacute un sous-ensemble de 500 utilisateurs choisis aleacuteatoirement parmilensemble des utilisateurs de notre base de donneacutees Deezer pour reacutealiser cette expeacuterimentationApregraves cette seacutelection aleacuteatoire nous avons seacutepareacute ces 500 utilisateurs en 5 blocs de 100 utilisateursan de reacutealiser une validation croiseacutee agrave 5 blocs 4 blocs ont constitueacute la base dapprentissage tandisque le dernier bloc restant a constitueacute la base de test Ce processus a eacuteteacute reacutepeacuteteacute 5 fois pour reacutealiserlexpeacuterimentation avec toutes les combinaisons possibles Le choix speacutecique dutiliser lensembledes connaissances disponibles de 80 des utilisateurs et dessayer de preacutevoir les preacutefeacuterences desderniers 20 est deacutelibeacutereacutement voulu Il nous permet de simuler au mieux le fonctionnement dunservice de recommandations en cours dutilisation En eet un nouvel utilisateur arrivant surle site sera inconnu du systegraveme de recommandation La tacircche de preacutediction est plus ardue etsaidera initialement des preacutefeacuterences des autres utilisateurs deacutejagrave connus du modegravele Au fur et agravemesure que le nouvel utilisateur eacutecoute des musiques et apporte ses retours sur ces derniegraveresle modegravele peut inteacutegrer ses preacutefeacuterences speacuteciques et de ce fait ameacuteliorer les recommandationsquil lui propose Pour simuler cette eacutevolution des connaissances du modegravele nous avons inteacutegreacutechaque session de lutilisateur au graphe apregraves avoir proposer une recommandation pour celle-ciAutrement dit une fois que le modegravele a proposeacute une recommandation de seacutequence en se basantsur une session deacutecoute de lutilisateur le graphe est reconstruit en inteacutegrant les informationsde cette nouvelle session deacutecoute Ainsi agrave chaque nouvelle session deacutecoute pour laquelle notremodegravele propose une recommandation le graphe gagne en information et est plus agrave mecircme depreacutedire correctement les preacutefeacuterences de lutilisateur Cependant linconveacutenient majeur de cettemeacutethode est de devoir reconstruire le graphe apregraves chaque recommandation an dinteacutegrer lesnouvelles informations Apregraves cette premiegravere expeacuterimentation nous proposerons une meacutethodeplus classique de reacutepartition des connaissances apporteacutees par les utilisateurs

Le Tableau 42 preacutesente les reacutesultats de cette expeacuterience pour les 4 colonies choisies Ce for-mat de tableau de reacutesultats et les meacutetriques deacutevaluations qui le compose seront utiliseacutes pour lesprochaines expeacuterimentations nous allons donc les expliquer ici avant de discuter des reacutesultatsobtenus An de mesurer les performances de notre modegravele nous avons utiliseacute diverses mesuresnous permettant de capturer dieacuterents aspects que nous consideacuterons ecirctre importants dans unerecommandation de seacutequence Nous allons deacutecrire ces dieacuterentes mesures ci-dessous

Preacutecision Rappel et F-mesure les mesures classiques dans le domaine de la recherche

91

Chapitre 4 Expeacuterimentations et reacutesultats

Preacutecision Rappel F-mesure Similariteacute SIL Diversiteacute DR Nouveauteacute Preacutefeacuterences

Colonie de Similariteacute 0317 0126 0165 0952 0923 0048 0049 072 0447 Colonie de Diversiteacute 0211 0104 0127 0862 077 0138 019 0806 0393 Colonie de Nouveauteacute 0132 0112 0114 0895 0837 0105 0144 0909 079 Colonie de Preacutefeacuterences 0296 0159 0191 0946 091 0054 008 0695 0804

Table 42 Expeacuterimentations avec le modegravele AntRS mono-objectif pour les 4 objectifs desimilariteacute diversiteacute nouveauteacute preacutefeacuterencesLe code couleur fait reacutefeacuterence agrave la signicativiteacute statistique de la p-valeur avec p isin [0 1] 0 0001 001 005 01 1

dinformation [Baeza-Yates et al 1999] Elles permettent de comparer directement lesseacutequences de recommandation produites par notre modegravele avec les sessions deacutecoute ini-tiales des utilisateurs Dans un contexte dutilisation reacuteel ougrave un utilisateur se connecte etle systegraveme propose une recommandation il ne serait pas possible dutiliser ces mesuresCependant dans le cadre dune eacutevaluation hors-ligne elles apportent des informations ma-jeures sur la qualiteacute des recommandations car nous consideacuterons que les sessions deacutecouteque nous posseacutedons sont de bons modegraveles pour nos recommandations

Similariteacute et SIL (Similariteacute Intra-Liste) bien quelles soient sur-utiliseacutees les me-sures de similariteacute et notamment la similariteacute intra-liste sont de bons indicateurs de lacoheacuterence de nos seacutequences de recommandations La mesure de similariteacute intra-liste pro-vient des travaux de Ziegler amp al[Ziegler et al 2005]

Diversiteacute et DR (Diversiteacute Relative) comme nous lavons expliqueacute plus tocirct dans cemanuscrit la diversiteacute est une caracteacuteristique cruciale des systegravemes de recommandationsen plus de la similariteacute Il eacutetait donc important de mesurer agrave quel point les musiques re-commandeacutees ainsi que les seacutequences en elles-mecircmes eacutetaient diverses [McGinty and Smyth2003 Vargas and Castells 2011]

Nouveauteacute et Preacutefeacuterences pour mesurer ces deux derniegraveres caracteacuteristiques nousavons utiliseacute les deux mesures proposeacutees dans larticle de[Vargas and Castells 2011] quenous avons aussi reproduites preacuteceacutedemment dans les Eacutequations 35 et 36

Apregraves avoir expliqueacute en deacutetail lexpeacuterimentation et le processus deacutevaluation nous pouvonsmaintenant nous inteacuteresser aux reacutesultats agrave proprement parler Le Tableau 42 preacutesente les reacutesul-tats de notre premiegravere expeacuterimentation mono-objectif avec 500 utilisateurs pour chacune des 4colonies isoleacutees

An de sassurer que les reacutesultats obtenus et preacutesenteacutes ci-dessus sont signicatifs nous avonsreacutealiseacute pour chacune des cases du tableau un test de signicativiteacute statistique An de savoirsi nos donneacutees suivaient la loi normale nous avons reacutealiseacute un test de Shapiro-Wilk et ce der-nier sest reacuteveacuteleacute neacutegatif Nous avons ainsi ducirc utiliser le test non parameacutetrique de Wilcoxon quinous a permis de comparer les moyennes des deux eacutechantillons connexes (mecircme utilisateurs maisdieacuterentes colonies) Les reacutesultats pour cette expeacuterimentation se sont tous reacuteveacuteleacutes ecirctre tregraves si-gnicatifs avec un p maximal infeacuterieur agrave p lt 0 001 Nous avons preacutesenteacutes la signicativiteacute dechaque case de reacutesultat avec un systegraveme de symboles coloreacutees ougrave les trois premiers symboles (0 0001 001 ) sont signicatifs Ces tests de signicativiteacute ont eacuteteacute systeacutematiquementeectueacutes agrave chaque expeacuterimentation et par conseacutequent tous les reacutesultats que nous preacutesenterons

92

43 Expeacuterimentations sur le modegravele AntRS

dans la suite de cette section seront accompagneacutes de leur signicativiteacute

Nous pouvons maintenant revenir sur les reacutesultats preacutesenteacutes dans le Tableau 42 Commeil eacutetait preacutevu on peut observer que chaque colonie a produit des recommandations orienteacuteesvers son objectif speacutecique Ainsi la colonie de similariteacute a produit des seacutequences de musiquesayant obtenu les plus hauts scores de preacutecision similariteacute et similariteacute intra-liste la colonie dediversiteacute a produit les seacutequences avec le plus haut score de diversiteacute et de diversiteacute relative tandis que les colonies de nouveauteacute et de preacutefeacuterences ont respectivement produit des seacutequencesavec le plus haut score de nouveauteacute et de preacutefeacuterences On peut cependant remarquer que pourcertaines mesures (la preacutecision la similariteacute ou encore la diversiteacute par exemple) les eacutecarts sontrelativement faibles entre les dieacuterentes colonies Nous pouvons reacutepondre agrave cette constatation endeux points Tout dabord et comme nous lavons preacuteciseacute plus haut toutes les cases ougrave 3 eacutetoilesvertes ont eacuteteacute apposeacutees repreacutesentent des reacutesultats tregraves signicatifs dun point de vue statistiqueEnsuite lobjectif principal de cette expeacuterimentation est de prouver que notre modegravele est biencapable de produire des recommandations diverses et complegravetes suivant plusieurs dimensionsLa deuxiegraveme partie de notre modegravele ougrave les reacutesultats de chaque colonie seront fusionneacutes devraproduire des seacutequences eacutequilibrant au mieux chacune des dimensions Les premiegraveres seacutequencesproduites par les colonies mono-objectifs prouvent que cela est possible mais quil est neacutecessairedavoir cette deuxiegraveme eacutetape an de mieux eacutequilibrer les seacutequences nales qui seront proposeacuteesagrave lutilisateur

433 AntRS multi-objectifs expeacuterimentations sur lensemble des colonies

simultaneacutement et sur les tactiques de fusion

Objectifs de lexpeacuterimentation

Apregraves avoir montreacute que toutes les colonies eacutetaient capables de produire des seacutequences demusiques speacutecialiseacutees dans une dimension speacutecique nous pouvons maintenant reacutealiser des ex-peacuterimentations sur notre modegravele AntRS dans son ensemble cest-agrave-dire avec les 4 colonies enparallegravele suivi de leacutetape de fusion pour ne produire quune seacutequence unique posseacutedant toutes lesqualiteacutes de chaque dimension agrave lutilisateur nal Autrement dit avec la premiegravere expeacuterimenta-tion nous avons obtenu 4 seacutequences excellant chacune dans une dimension speacutecique (similariteacutediversiteacute nouveauteacute et preacutefeacuterences) et doreacutenavant lobjectif est dobtenir une seule seacutequencereacuteunissant ces 4 dimensions

Nous nallons pas reacuteexpliquer en deacutetail ici la construction du graphe ni le fonctionnement descolonies eacutetant donneacute que nous lavons deacutejagrave fait preacuteceacutedemment mais les dieacuterences entre cetteexpeacuterimentation et les preacuteceacutedentes seront cependant souligneacutees Contrairement agrave lexpeacuterimenta-tion preacuteceacutedente les 4 colonies ont eacuteteacute exeacutecuteacutees en parallegravele en exploitant les threads de JavaLa deuxiegraveme et principale dieacuterence se trouve dans lexploitation des seacutequences geacuteneacutereacutees par lescolonies Au lieu de les preacutesenter directement comme nous lavons fait dans lexpeacuterimentationmono-objectif ces seacutequences ont eacuteteacute fusionneacutees avec la deuxiegraveme partie du modegravele preacutesenteacutee dansle chapitre preacuteceacutedent dans la Section 35 Le but est ici dobtenir une seule seacutequence combinantau mieux tous les points forts des 4 colonies Les meacutetavariables utiliseacutees sont les mecircmes que pourlexpeacuterience preacuteceacutedente

93

Chapitre 4 Expeacuterimentations et reacutesultats

Comparaison de performances intra-modegravele

Maintenant que nous avons deacutecrit lobjectif de cette expeacuterimentation nous allons deacutecrire lamaniegravere dont nous avons mesureacute et compareacute les reacutesultats obtenus Tout dabord nous avons testeacute3 versions de notre modegravele les voici deacutecrites ci-dessous

AntRS avec les 4 colonies en parallegravele et le fusion de seacutequences Comme nous lavonsexpliqueacute dans le chapitre preacuteceacutedent Section 35 nous avons proposeacute deux tactiques defusion pour les seacutequences trouveacutees par les dieacuterentes colonies lors de la premiegravere eacutetape dumodegravele La fusion de seacutequences est la premiegravere de ces deux tactiques Pour rappel cettetactique consiste agrave geacuteneacuterer une liste de toutes les ressources de chacune des 4 meilleuresseacutequences trouveacutees par les colonies lors de la premiegravere eacutetape du modegravele puis de les reacutear-ranger an de creacuteer la seacutequence nale

AntRS avec les 4 colonies en parallegravele et la colonie de fusion Le deuxiegraveme modegraveletesteacute est identique au premier sauf en ce qui concerne la tactique de fusion Nous avonsutiliseacute ici la deuxiegraveme tactique de fusion preacutesenteacutee dans la Section 35 Pour rappel cettetactique consiste agrave construire un nouveau graphe constitueacute uniquement des ressources quicomposent les seacutequences des colonies de la premiegravere eacutetape cette derniegravere agissant donccomme une sorte de seacutelection pour reacutecupeacuterer les ressources les plus inteacuteressantes

Colonie de fusion uniquement La troisiegraveme et derniegravere version de cette expeacuterimen-tation sur le modegravele AntRS est dieacuterente des deux premiegraveres Au lieu deectuer seacutequen-tiellement la premiegravere eacutetape (les 4 colonies) puis la deuxiegraveme eacutetape avec les reacutesultats dela premiegravere (la fusion) nous avons voulu tester si le fait dexeacutecuter la colonie de fusiondirectement avec lensemble des ressources de tous les utilisateurs pouvait produire desreacutesultats inteacuteressants En eet dans le modegravele AntRS classique cette colonie est exeacutecuteacuteeavec quelques dizaines de ressources tout au plus qui ont eacuteteacute seacutelectionneacutees par les autrescolonies de la premiegravere eacutetape mais rien nempecircche de lancer directement cette colonieavec le mecircme graphe quutilisent les premiegraveres colonies et qui contient quelques dizainesde milliers de sommets Notre hypothegravese est que la seacutequence nale obtenue par ce biaisobtiendra de moins bons reacutesultats que le processus complet de notre modegravele AntRS avecnotamment la preacute-seacutelection de ressources potentiellement inteacuteressantes par les premiegraverescolonies speacutecialiseacutees

Enn les mecircmes meacutetriques ont eacuteteacute utiliseacutees pour mesurer les performances de chaque ver-sion testeacutee du modegravele que pour lexpeacuterimentation mono-objectif preacuteceacutedente an de garder laconsistance des reacutesultats entre toutes les expeacuterimentations meneacutees

Comparaison de performances inter-modegraveles

En plus de mesurer les performances des dieacuterentes versions de notre modegravele nous avonsvoulu comparer nos reacutesultats obtenus avec dautres systegravemes de recommandation deacutejagrave existantsLe but est ici de conrmer que notre modegravele produit des recommandations compeacutetitives parrapport agrave dautres algorithmes souvent utiliseacutes dans leacutetat de lart Pour ce faire nous avonsutiliseacute deux types dalgorithmes (1) trois algorithmes classiques mono-objectif capables de pro-duire des listes de recommandations et (2) un algorithme speacuteciquement multi-objectifs an dedavoir un point de comparaison provenant dun modegravele de la mecircme classe que le nocirctre Nous

94

43 Expeacuterimentations sur le modegravele AntRS

avons choisi ces 2 familles dalgorithmes an de comparer au mieux notre modegravele Les algo-rithmes mono-objectif permettent deacutetablir une base de comparaison an de deacuteterminer si notremodegravele est compeacutetitif face agrave des systegravemes noptimisant quun seul de nos objectifs De plus cesalgorithmes sont classiques dans le domaine de la recommandation et sont tregraves souvent utiliseacutescomme base de comparaison Lalgorithme multi-objectifs de comparaison permet quant agrave lui demesurer nos performances sur lensemble des objectifs que nous optimisons Nous allons deacutecriresuccinctement le principe de ces algorithmes sans entrer dans les deacutetails eacutetant donneacute que nousavons deacutejagrave deacutecrit leur fonctionnement geacuteneacuteral preacuteceacutedemment dans leacutetat de lart

Algorithmes classiques mono-objectifs

1 UserKNN [Breese et al 2013] algorithme classique de ltrage collaboratif ougrave les k plusproches voisins de lutilisateur actif baseacutes sur la similariteacute des preacutefeacuterences sont seacutelectionneacutesan de participer au processus de recommandation

2 TrustMF [Yang et al 2017] dans cette meacutethode plus reacutecente de ltrage collaboratifles auteurs proposent des ameacuteliorations du modegravele classique de factorisation de matricesan dadresser les problegravemes de deacutemarrage agrave froid et de manque de donneacutees Mecircme silsutilisent la meacutethode classique de la factorisation de matrice ils se deacutemarquent en utilisantla conance quont les utilisateurs les uns envers les autres an de reeacuteter leur inuencereacuteciproque sur leurs opinions

3 SVD++ [Koren 2008] dans cet article les auteurs proposent des ameacuteliorations auxtechniques des facteurs latents et des plus proches voisins qui sont les deux approches dultrage collaboratif obtenant les meilleurs reacutesultats Les auteurs combinent ces deux ap-proches ensemble et utilisent agrave la fois les retours explicites et implicites an dobtenir unepreacutecision plus importante Ce modegravele a eacuteteacute creacutee dans le cadre du Netix Prize de 2008une compeacutetition organiseacutee par Netix ougrave le but eacutetait de creacuteer un algorithme de ltragecollaboratif an de preacutedire au mieux les preacutefeacuterences des utilisateurs [Bennett et al 2007]

Ces trois algorithmes ont eacuteteacute seacutelectionneacutes car ils repreacutesentent des techniques connues et bienutiliseacutees du domaine des systegravemes de recommandation Ils ont prouveacute leur ecaciteacute de par lesnombreuses eacutetudes de leacutetat de lart les utilisant comme nous lavons montreacute dans le chapitre 2de ce manuscrit De plus ces algorithmes sont mis agrave disposition dans la librairie Java Librec 50

[Guo et al 2015] Cette librairie propose plus de 70 algorithmes de systegravemes de recommandationen open source et a deux missions principales la preacutediction de preacutefeacuterences (via des notes) et leclassement de ressources Lutilisation de Librec nous a permis de travailler directement sur desalgorithmes agrave jour et sans erreur

Algorithme multi-objectifs

4 PEH [Ribeiro et al 2014] Nous avons souhaiteacute ajouter agrave cette liste un quatriegraveme algo-rithme qui contrairement aux trois premiers est multi-objectifs Cet algorithme nommeacutePEH pour Pareto-Ecient Hybridization a eacuteteacute preacutesenteacute dans la Section 252 de leacutetatde lart de ce manuscrit et nous allons ici discuter de son impleacutementation PEH est unmodegravele ougrave plusieurs algorithmes de recommandation sont exeacutecuteacutes en mecircme temps Lebut est dobtenir une valeur de pertinence pour chaque paire ressourcetimes utilisateur in-diquant agrave quel point il est pertinent de recommander la ressource agrave lutilisateur Chaquealgorithme produit un score et an de nobtenir quune seule valeur unique par paire

50 Librec la librarie Java pour les systegravemes de recommandation

95

Chapitre 4 Expeacuterimentations et reacutesultats

Table 43 Expeacuterimentations avec 3 versions du modegravele AntRS et 4 algorithmes de compa-raison 3 algorithmes mono-objectifs classiques (UserKNN TrustMF SVD++) et 1 algorithmemulti-objectifs (Pareto-Ecient Hybridization)

Preacutecision Rappel F-mesure Similariteacute SIL Diversiteacute DR Nouveauteacute Preacutefeacuterences Couverture

AntRS (4 colonies+ fusion de seacute-quences)

0344 0131 01838 0947 0908 0053 0069 0741 061 9692

AntRS (4 colonies+ colonie de fu-sion)

0288 0151 01836 0945 0905 0055 0082 0702 0612 9692

AntRS (colo-nie de fusionuniquement)

0197 0118 0141 0953 093 0047 0068 0324 0389 9692

UserKNN 0224 0138 0162 095 0905 005 0081 068 0541 6139TrustMF 0195 0117 014 095 0894 0058 009 0697 0458 6817SVD++ 0195 012 014 0941 0892 006 0093 070 0455 6817PEH 0193 0118 014 0941 0892 0059 0096 0697 0452 9752

Signicance codes (compared to AntRS with 4 colonies + lists merging) 0 0001 001 005 01 1

le modegravele PEH associe chacun de ces scores dans une combinaison lineacuteaire selon une hy-bridation speacutecique (ie des poids dieacuterents attribueacutes agrave chaque algorithme mitigeant ouaugmentant ainsi leur importance sur la valeur de pertinence nale) Le reacutesultat de cettecombinaison lineacuteaire est la valeur de pertinence de la recommandation de la ressource agravelutilisateur Plusieurs hybridations sont ainsi testeacutees et repreacutesenteacutees dans un espace en3 dimensions ougrave chaque point correspond aux niveaux de preacutecision de diversiteacute et denouveauteacute atteint par une hybridation Comme ces 3 dimensions sont aussi importantesles unes que les autres les auteurs utilisent le concept dOptimum de Pareto an de seacute-lectionner les meilleurs hybridations cest-agrave-dire les hybridations les plus proches ou surla frontiegravere de Pareto Dans leur article les auteurs utilisent dieacuterents algorithmes clas-sique de recommandation Ayant agrave notre disposition Librec ainsi que les 3 algorithmespreacutesenteacutes ci-dessus repreacutesentant plusieurs techniques de recommandation agrave la fois dieacute-rentes les unes des autres et tregraves utiliseacutees dans la litteacuterature nous les avons inclus dansle processus dhybridation Le reste du modegravele a eacuteteacute impleacutementeacute agrave partir de larticle desauteurs Ce modegravele est tregraves inteacuteressant pour notre comparaison de performance car il estmulti-objectifs comme le nocirctre mais utilise une technique tout agrave fait dieacuterente de An-tRS non baseacutee sur des modegraveles multi-agents et utilisant le concept dOptimum de Pareto

Pour cette expeacuterimentation nous avons donc un total de 4 algorithmes dieacuterents qui vontecirctre exeacutecuteacutes sur exactement la mecircme base de donneacutees et le mecircme nombre dutilisateurs quepour les trois versions de notre modegravele Les reacutesultats de cette expeacuterimentation sont preacutesenteacutesdans le Tableau 43

Reacutesultats

Comme pour lexpeacuterimentation mono-objectif nous avons mesureacute la signicativiteacute statistiqueavec le test des rangs signeacutes de Wilcoxon an de sassurer que les donneacutees obtenues pouvaientecirctre interpreacuteteacutee De plus les valeurs en gras pour chaque colonne montrent les meilleurs reacutesultatsobtenus

Les reacutesultats de cette expeacuterimentation nous reacutevegravelent plusieurs informations importantes Toutdabord nous allons nous inteacuteresser aux performances de notre modegravele AntRS Comme expliqueacute

96

43 Expeacuterimentations sur le modegravele AntRS

ci-dessus nous avons testeacute deux tactiques de fusion pour combiner les reacutesultats de nos quatreobjectifs Nous avons eacutegalement exeacutecuteacute directement la colonie de fusion sur le graphe completet sans la premiegravere eacutetape de notre modegravele

Les deux premiegraveres lignes du Tableau 43 preacutesentent les reacutesultats de notre modegravele AntRScomplet avec ses deux variations la fusion de seacutequences et la colonie de fusion Nous pouvonsvoir que dune maniegravere geacuteneacuterale notre modegravele obtient de tregraves bonnes performances par rapportaux 4 algorithmes de comparaison Les deux variations de notre modegravele obtiennent la meilleurepreacutecision (jusquagrave +7823) de rappel (jusquagrave +2905) et F-mesure (jusquagrave +3128) de tousles modegraveles testeacutes dans cette expeacuterimentation ce qui signie que notre modegravele est le meilleurpour modeacuteliser les preacutefeacuterences agrave partir des sessions initiales eacutecouteacutees par les utilisateurs AntRSa eacutegalement surpasseacute les autres modegraveles pour les preacutefeacuterences et les meacutetriques de nouveauteacute touten parvenant agrave maintenir un niveau correct de similitude et de diversiteacute Il est utile de rappelerici que nous avons deacutelibeacutereacutement choisi des objectifs non compatibles entre eux (Similariteacute vs Di-versiteacute Nouveauteacute vs Preacutefeacuterences) ce qui rend le processus de recommandations plus complexepour les algorithmes multi-objectifs (AntRS et PEH) par rapport aux algorithmes mono-objectifMalgreacute une diversiteacute un peu plus faible par rapport aux algorithmes de comparaison AntRS oreun meilleur compromis entre tous les objectifs que PEH et dans un temps dexeacutecution beaucoupplus court Enn nous pouvons remarquer que les deux modegraveles multi-objectifs AntRS et PEHont une bien meilleure couverture par rapport aux autres algorithmes

Les reacutesultats montrent que notre modegravele AntRS a obtenu de meilleurs reacutesultats que lesautres algorithmes de comparaison Cependant un autre objectif de cette expeacuterimentation eacutetaitde comparer les deux versions de la deuxiegraveme phase de notre modegravele la fusion de seacutequences et lacolonie de fusion Ces deux tactiques permettant dobtenir une seacutequence de recommandation -nale multi-objectifs agrave partir de plusieurs seacutequences mono-objectif repreacutesentent deux philosophiesdieacuterentes de construction de seacutequences et il est inteacuteressant de pouvoir observer leurs dieacuterencesde performance Dapregraves les reacutesultats obtenus ces deux meacutethodes sont relativement proches lunede lautre avec lexception majeure de la preacutecision qui est plus eacuteleveacutee pour la fusion de seacutequences(0 344) que pour la colonie de fusion (0 288) On peut noter aussi une leacutegegravere dieacuterence au ni-veau de la diversiteacute relative (respectivement 0 069 contre 0 082) et de la nouveauteacute (0 741 contre0 702) Limportance de la preacutecision dans la litteacuterature et la dieacuterence entre les deux tactiquesconcernant cette meacutetrique nous permettent de dire que la fusion de seacutequence est la meilleure desdeux tactiques pour cette expeacuterimentation

Nous allons maintenant nous inteacuteresser agrave la troisiegraveme ligne du tableau de reacutesultats repreacute-sentant lexeacutecution de la 2egraveme partie de notre modegravele seule Pour rappel lhypothegravese de cettetroisiegraveme version de notre modegravele est de veacuterier si la premiegravere eacutetape de notre modegravele permet biendameacuteliorer la qualiteacute des reacutesultats en preacute-seacutelectionnant les ressources correspondant le mieux auxquater objectifs agrave maximiser On peut observer en eet avec les reacutesultats que lexeacutecution directede la colonie de fusion sans la premiegravere eacutetape du modegravele deacutegrade bien la qualiteacute des solutionsnales trouveacutees Nous observons une nette diminution de la preacutecision du rappel de la F-mesureainsi que de la diversiteacute de la nouveauteacute et de preacutefeacuterences Ces reacutesultats nous permettent doncde conrmer que la premiegravere eacutetape de notre modegravele ougrave les 4 colonies travaillent simultaneacutementagrave obtenir des seacutequences speacutecialiseacutees dans leur objectif ameacuteliore bien la qualiteacute nale des recom-mandations dune maniegravere signicative Autrement dit les deux tactiques de fusion que nousavons deacuteveloppeacutees (fusion de seacutequences et colonie de fusion) permettent de trouver un compro-mis entre tous les objectifs de maniegravere plus ecace quand elles se basent sur les reacutesultats de la

97

Chapitre 4 Expeacuterimentations et reacutesultats

premiegravere eacutetape de notre modegravele

Expeacuterimentation alternative techniques de validation croiseacutee et de creacuteation degraphe alternative

Dans lexpeacuterimentation preacuteceacutedente nous avons deacutecideacute de seacuteparer les 500 utilisateurs en 5blocs de 100 ougrave agrave tour de rocircle 400 utilisateurs eacutetaient utiliseacutes pour la construction du grapheet 100 utilisateurs correspondaient agrave la base de test Ainsi le modegravele avait pour tacircche de pro-duire des seacutequences de recommandations baseacutees sur les sessions deacutecoute de ces 100 utilisateursUne fois que le modegravele avait produit sa seacutequence recommandeacutee la session deacutecoute initiale surlaquelle eacutetait baseacutee la recommandation eacutetait deacutevoileacutee au modegravele et le graphe eacutetait reconstruitpour en tenir compte Le but de ce fonctionnement eacutetait de simuler un fonctionnement reacuteel dunservice deacutecoute de musique Cependant un certain nombre deacutetudes du domaine de la recom-mandation de la litteacuterature scientique utilisent une meacutethode dieacuterente lors de la seacuteparationdes informations des utilisateurs pour reacutealiser une validation croiseacutee agrave 5 blocs Cette meacutethodeconsiste agrave peupler les 5 blocs non plus agrave partir dutilisateurs mais agrave partir de sessions deacutecoutedans chaque utilisateur Autrement dit au lieu davoir une base dapprentissage contenant 80des utilisateurs et une base de test contenant les derniers 20 dutilisateurs la base dapprentis-sage consiste en 80 des sessions deacutecoute de chaque utilisateur et la base de test correspond aux20 des sessions restantes Le but du modegravele est ici de recommander pour chaque utilisateurdes seacutequences correspondant agrave la base de test Par rapport agrave la premiegravere meacutethode le graphepossegravede donc en permanence 80 des sessions de tous les utilisateurs Cependant le graphe necontient pas les connaissances provenant de prols complets dutilisateurs Ces deux meacutethodessont toutes les deux valides mais proposent deux approches dieacuterentes concernant lexploitationdes donneacutees des utilisateurs et il est inteacuteressant de les comparer

Par ailleurs et comme nous lavons expliqueacute dans le chapitre 3 deacutecrivant notre modegravele AntRSla construction du graphe exploite les transitions trouveacutees dans les sessions deacutecoute des utilisa-teurs pour creacuteer un reacuteseau de ndivideuds et darecirctes repreacutesentant lensemble des donneacutees de la basedapprentissage Aucune emphase nest porteacutee speacuteciquement sur lutilisateur actif pour lequelle systegraveme est en train de construire des recommandations Cependant nous avons proposeacute dansle chapitre 3 une autre meacutethode de construction du graphe portant une emphase particuliegravere surlutilisateur actif Agrave chaque nouvel utilisateur traiteacute nous calculons ses k plus proches voisinsparmi les 499 utilisateurs restants Pour faire cela nous avons calculeacute la similariteacute cosine agrave partirdes preacutefeacuterences existantes de ces utilisateurs Autrement dit pour chaque utilisateur actif nousavons compareacute ses 80 des sessions deacutecoute de la base dapprentissage avec les 80 des sessionsdeacutecoute des 499 autres utilisateurs Les k utilisateurs les plus similaires sont ensuite utiliseacutespour construire le graphe avec la mecircme technique deacutecrite dans le chapitre 3 Lavantage est icide reacuteduire la taille du graphe dacceacuteleacuterer la dureacutee dexeacutecution et de potentiellement augmenterla qualiteacute des recommandations nales notamment en terme de similariteacute puisque cest le critegraverede seacutelection ici Cette variante de construction du graphe agrave partir des n plus proches voisins nestpossible quavec la technique de validation croiseacutee deacutecrite dans le paragraphe preacuteceacutedent puisquilest neacutecessaire davoir accegraves aux sessions deacutecoute des utilisateurs actifs ce qui nest pas le casavec la premiegravere expeacuterimentation de cette section

Dans la suite de la section nous allons reacutealiser la mecircme expeacuterimentation que preacuteceacutedem-ment avec ces deux modications (le changement du processus de validation croiseacutee et le grapheconstruit agrave partir de n plus proches utilisateurs en termes de similariteacute) puis nous allons preacute-

98

43 Expeacuterimentations sur le modegravele AntRS

Table 44 Expeacuterimentation AntRS multi-objectifs avec les modications de validation croiseacuteeet de creacuteation de graphe

Preacutecision Rappel F-mesure Similariteacute SIL Diversiteacute DR Nouveauteacute Preacutefeacuterences Couverture

AntRS grapheclassique (fusionde seacutequences)

0379 0147 0205 0942 0902 0058 0073 0748 0631 7168

AntRS grapheclassique (coloniede fusion)

0339 0176 0215 0943 09 0057 0085 072 0718 7168

AntRS graphe kvoisins (fusion deseacutequences)

0369 0149 0203 0941 0901 0059 0075 0737 0633 7168

AntRS graphe kvoisins (colonie defusion)

0329 0167 0206 0944 0905 0056 0081 0707 068 7168

senter les reacutesultats obtenus

Le Tableau 44 preacutesente les reacutesultats de cette deuxiegraveme expeacuterimentation Nous avons testeacute4 versions de notre modegravele Pour chacune de ces 4 versions la nouvelle technique de validationcroiseacutee a eacuteteacute utiliseacutee Comme pour lexpeacuterimentation suivante nous avons eacutegalement testeacute lesdeux tactiques de fusion de notre modegravele Quant aux modications portant sur la creacuteation dugraphe nous avons exeacutecuteacute notre modegravele selon 2 modaliteacutes avec la mecircme construction de grapheque lexpeacuterimentation preacuteceacutedente (graphe classique) et avec la prise en compte des k voisinsles plus similaires (graphe k voisins) On remarque deacutejagrave que les reacutesultats sont dune maniegraveregeacuteneacuterale relativement similaires agrave la premiegravere expeacuterimentation Les valeurs de preacutecision obte-nues sont plus eacuteleveacutees que pour lexpeacuterimentation preacuteceacutedente suggeacuterant que le modegravele produitdes recommandations plus proches des sessions deacutecoute des utilisateurs Cette augmentation depreacutecision est la conseacutequence logique du fait que 80 des sessions deacutecoute initiales sont connuesdu modegravele Ces reacutesultats sont cependant agrave nuancer avec la couverture qui est signicativementplus basse dans cette version de notre modegravele (7168 par rapport agrave 9692)

La tactique de fusion de seacutequence obtient une nouvelle fois la meilleure preacutecision par rapportagrave la tactique de colonie de fusion Cependant nous nobservons pas de nette dieacuterence entreles deux meacutethodes de construction du graphe Cette expeacuterimentation ne nous permet donc pasde valider lhypothegravese selon laquelle un graphe moins grand et construit agrave partir dutilisateurssimilaires agrave lutilisateur actif pourrait ameacuteliorer les recommandations nales Cependant lautreobjectif de cette expeacuterimentation qui eacutetait de deacutemontrer que notre modegravele obtient eacutegalementdes reacutesultats satisfaisants avec une meacutethode plus classique de validation croiseacutee est valideacutee Latechnique classique de creacuteation du graphe sans connaicirctre par avance 80 des seacutequences deacutecoutesdes utilisateurs reste cependant plus proche dun fonctionnement en conditions reacuteelles de notremodegravele

434 Optimisation des meacutetavariables de AntRS

Inuence du nombre dagents et diteacuterations sur la preacutecision des recommandations

Comme tous les systegravemes multi-agents AntRS est deacutependant du nombre dagents utiliseacutes etdes iteacuterations eectueacutees Un nombre trop faible dagents ou diteacuterations peut empecirccher leacutemer-gence dun comportement intelligent en raison dun manque dinteraction entre les agents Dansle mecircme temps il est eacutegalement crucial de ne pas augmenter aveugleacutement ces paramegravetres car ils

99

Chapitre 4 Expeacuterimentations et reacutesultats

aectent lineacuteairement le temps dexeacutecution de lalgorithme Nous avons ainsi reacutealiseacute des expeacuteri-mentations sur notre modegravele AntRS an de deacuteterminer un bon compromis entre performance ettemps dexeacutecution Dans la gure 411 la preacutecision moyenne des recommandations obtenues estpreacutesenteacutee en fonction du nombre dagents et diteacuterations par increacutementation de 50 allant de 50 agrave300 On observe comme attendu une leacutegegravere augmentation de la preacutecision suivant laccroissementdes agents et des iteacuterations sans toutefois que celle-ci ne soit majeure On remarque visuellementque la preacutecision obtenue atteint rapidement un plateau agrave partir de 100 agents et iteacuterations Cetteobservation a eacuteteacute conrmeacutee par un test de signicativiteacute statistique avec le test de WilcoxonDans un contexte de fonctionnement en ligne ougrave les utilisateurs sattendent agrave des recommanda-tions quasi immeacutediates laugmentation importante du temps dexeacutecution lieacutee agrave un nombre eacuteleveacutedagents et diteacuterations pour un gain minime de preacutecision nest pas recommandable Ce sontaussi ces valeurs de 100 agents et iteacuterations qui ont eacuteteacute utiliseacutees dans les expeacuterimentations de cechapitre

Figure 411 Inuence du nombre dagents et diteacuterations sur la preacutecision moyenne obtenuepar notre modegravele

Principe de fonctionnement et application dun algorithme geacuteneacutetique

Les meacutetavariables des algorithmes multi-agents ont une place importante dans la qualiteacute desreacutesultats obtenus Pour rappel et en plus du nombre diteacuterations et dagents dont nous avonsdeacutejagrave discuteacute dans la section preacuteceacutedente on peut lister

τ0 isin [0 1] quantiteacute de pheacuteromones deacuteposeacutee sur les arecirctes agrave linitialisation du modegravele q0 isin [0 1] gegravere la part dexploration et dexploitation des agents α isin [0 1] importance des pheacuteromones dans la prise de deacutecision des agents

100

43 Expeacuterimentations sur le modegravele AntRS

β isin [0 1] importance de lheuristique dans la prise de deacutecision des agents ρ isin [0 1] taux deacutevaporation des pheacuteromones

Les valeurs de ces 5 meacutetavariables ont eacuteteacute xeacutees agrave laide des expeacuterimentations preacuteliminairespreacutesenteacutees au deacutebut de ce chapitre dans la Section 422 Les valeurs de ces meacutetavariables ontpermis dobtenir des reacutesultats convaincants agrave la fois sur le modegravele ACS classique de Dorigo et surnotre modegravele ACS Cependant et an de maximiser le potentiel de notre modegravele AntRS nousavons voulu tester une optimisation automatique de ces meacutetavariables agrave laide dun algorithmegeacuteneacutetique Ces derniers font partie de la famille des algorithmes eacutevolutionnaires sinspirant de latheacuteorie de leacutevolution Le principe de ces algorithmes est de creacuteer des individus posseacutedant desgegravenes cest-agrave-dire des valeurs agrave des caracteacuteristiques preacute-deacutetermineacutees puis de tester ces individussur le problegraveme agrave optimiser Agrave la n dune iteacuteration les meilleurs individus transmettent unepartie de leurs gegravenes agrave leurs descendants Ainsi de geacuteneacuteration en geacuteneacuteration les gegravenes seacutelection-neacutes provenant des meilleurs individus permettent daugmenter la qualiteacute des reacutesultats Appliqueacuteagrave notre modegravele un gegravene correspond agrave des valeurs pour les 5 meacutetavariables agrave optimiser Cesvaleurs sont ensuite appliqueacutees agrave notre modegravele et testeacutees durant une exeacutecution complegravete dansles mecircmes conditions que les autres expeacuterimentations de ce chapitre Les reacutesultats sont ensuiteeacutevalueacutes selon les 4 meacutetriques correspondant agrave nos objectifs similariteacute diversiteacute nouveauteacute etpreacutefeacuterences Lutilisation dun algorithme geacuteneacutetique sur notre modegravele a cependant poseacute un pro-blegraveme majeur de temps dexeacutecution En eet chaque individu de chaque geacuteneacuteration a ducirc ecirctretesteacute sur une exeacutecution complegravete de notre modegravele Pour rappel une exeacutecution de notre modegravelecorrespond agrave 100 iteacuterations ougrave dans chacune dentre elles 100 agents se deacuteplacent pour trouverune seacutequence sur un graphe de plusieurs dizaines de milliers de ndivideuds et de plusieurs centainesde milliers darecirctes en moyenne Mecircme si la complexiteacute algorithmique est faible ducirce agrave la naturemecircme des modegraveles multi-agents la quantiteacute dopeacuterations agrave reacutesoudre est conseacutequente En plus delutilisation de serveurs de calculs deacutedieacutes une optimisation importante du code de AntRS a eacuteteacuteneacutecessaire pour pouvoir eectuer loptimisation des meacutetavariables avec un algorithme geacuteneacutetiquedans des temps raisonnables

Choix de lalgorithme geacuteneacutetique doptimisation

De nombreuses familles dalgorithmes geacuteneacutetiques ont eacuteteacute deacuteveloppeacutees depuis leur creacuteation agravelinstar des problegravemes algorithmiques complexes neacutecessitant des techniques doptimisation et dereacutesolution avanceacutees Il est donc neacutecessaire de correctement deacutenir le problegraveme agrave optimiser an dechoisir lalgorithme geacuteneacutetique le plus adapteacute agrave la tacircche AntRS est un modegravele multi-objectifs etles paramegravetres agrave optimiser sont les 4 objectifs de similariteacute diversiteacute nouveauteacute et preacutefeacuterencesIl est ainsi neacutecessaire dutiliser une technique parmi la famille des algorithmes eacutevolutionnairesmulti-objectifs (MOEA 51) Nous avons choisi lalgorithme NSGA-II 52 pour sa rapiditeacute et sonecaciteacute pour trouver de meilleurs solutions non-domineacutees agrave des problegravemes multi-objectifs clas-siques de la litteacuterature par rapport agrave dautres MOEA [Deb et al 2002]

Pour les mecircmes raisons que pour limpleacutementation des algorithmes de comparaison utiliseacutesdans cette section nous avons utiliseacute une librairie Java nommeacutee jMetal 53 [Durillo and Nebro2011] Cette librairie est speacutecialiseacutee dans limpleacutementation et la mise agrave disposition dune vingtaine

51 MOEA Multi-objective evolutionary algorithms

52 NSGA-II Non-dominated Sorting Genetic Algorithm 2

53 jMetal Metaheuristic Algorithms in Java

101

Chapitre 4 Expeacuterimentations et reacutesultats

Table 45 Expeacuterimentations preacutesentant AntRS avec les meacutetavariables empiriques et avec lesmeacutetavariables optimiseacutees via NSGA-II)

Preacutecision Rappel F-mesure Similariteacute SIL Diversiteacute DR Nouveauteacute Preacutefeacuterences Couverture

AntRS meacutetava-riables empiriques(fusion de seacute-quences)

0344 0131 01838 0947 0908 0053 0069 0741 061 9692

AntRS meacutetava-riables empiriques(colonie de fusion)

0288 0151 01836 0945 0905 0055 0082 0702 0612 9692

AntRS meacutetava-riables NSGA-II(fusion de seacute-quences)

0382 0153 0221 0953 091 0047 007 0762 0744 9692

AntRS meacutetava-riables NSGA-II(colonie de fusion)

0312 0174 0226 0946 0906 0054 0082 0703 0802 9692

Code de signicativiteacute statistique 0 0001 001 005 01 1

de MOEA permettant de les adapter agrave tous types de problegravemes multi-objectifs

Reacutesultats

La version du modegravele AntRS utiliseacutee est la mecircme que preacutesenteacutee dans le Chapitre 3 et danslexpeacuterimentation 433 Lalgorithme doptimisation NSGA-II a quant agrave lui eacuteteacute lanceacute sur unserveur de calculs deacutedieacute de leacutequipe KIWI et arrecircteacute agrave partir du moment ougrave 10 geacuteneacuterations de suitenameacutelioraient plus les reacutesultats obtenus Les valeurs obtenues pour les 5 meacutetavariables ont ensuiteeacuteteacute utiliseacutees dans une exeacutecution complegravete de AntRS an de mesurer limpact de loptimisationLalgorithme de comparaison PEH [Ribeiro et al 2014] inclut deacutejagrave dans son fonctionnement unMOEA nommeacute SPEA2 54 [Zitzler et al 2001] dont lobjectif est le mecircme que NSGA-II optimiserles recommandations en termes de similariteacute diversiteacute et nouveauteacute Nous ninclurons donc pasPEH dans les reacutesultats de cette derniegravere expeacuterimentation Outre les meacutetavariables lexeacutecution denotre modegravele sest deacuterouleacutee sous les mecircmes conditions que pour les expeacuterimentations preacuteceacutedentes

Le Tableau 45 preacutesente les reacutesultats obtenus Les deux premiegraveres lignes du tableau sont re-prises de lexpeacuterimentation principale AntRS multi-objectifs Section 433 pour plus de clarteacutePour rappel cette expeacuterimentation avait utiliseacute les meacutetavariables empiriques Les deux derniegravereslignes du tableau correspondent agrave AntRS avec les meacutetavariables optimiseacutees via le NSGA-II Lasignicativiteacute statistique de la dieacuterence des reacutesultats obtenus a eacuteteacute mesureacutee entre chaque paireayant la mecircme tactique de fusion (ie AntRS meacutetavariables empiriques (fusion de seacutequences)vs AntRS meacutetavariables NSGA-II (fusion de seacutequences) et AntRS meacutetavariables empiriques(colonie de fusion) vs AntRS meacutetavariables NSGA-II (colonie de fusion)) Les valeurs en grasindiquent les dieacuterences les plus notables entre les mecircmes versions de AntRS sans et avec opti-misation

Ces reacutesultats mettent principalement en exergue un net gain en preacutecision et rappel obtenuavec loptimisation des meacutetavariables Les valeurs obtenues pour ces meacutetriques sont similaires agravelexpeacuterimentation 44 ougrave le modegravele avait connaissance de 80 des seacutequences deacutecoutes des utili-sateurs On note eacutegalement des ameacuteliorations pour les meacutetriques de nouveauteacute et de preacutefeacuterencesmontrant que les seacutequences recommandeacutees eacutetaient agrave la fois plus proches des preacutefeacuterences de luti-

54 SPEA2 Strenght Pareto Evolutionary Algorithm 2

102

44 Conclusion

lisateur tout en introduisant parfois des musiques quil ne connaissait pas

Cependant il est important de nuancer ces reacutesultats Les gains obtenus mecircme sils sontstatistiquement signicatifs restent relativement peu eacuteleveacutes par rapport au temps neacutecessaire de-mandeacute par lalgorithme doptimisation De plus certaines meacutetriques comme la similariteacute ou ladiversiteacute nont que peu eacuteteacute aecteacutees par loptimisation En conclusion cette expeacuterimentation nousa montreacute quil eacutetait possible doptimiser les meacutetavariables de notre modegravele an dameacuteliorer cer-tains aspects des seacutequences recommandeacutees comme la preacutecision la nouveauteacute ou les preacutefeacuterencesToutefois le temps dexeacutecution dun tel processus doptimisation peut ecirctre prohibitif dans uncontexte dutilisation en ligne et en temps reacuteel

44 Conclusion

Dans ce Chapitre nous avons mis en pratique le modegravele multi-agents et multi-objectifs An-tRS Nous avons utiliseacute une base de donneacutees musicale provenant du site Deezer repreacutesentantun mois complet deacutecoutes en ligne Nous avons ensuite reacutealiseacute plusieurs expeacuterimentations por-tant chacune sur un aspect theacuteorique de AntRS La premiegravere expeacuterimentation preacutesenteacutee dans laSection 432 nous a permis de veacuterier que les colonies de notre modegravele permettent bien dobte-nir des recommandations de seacutequences speacutecialiseacutees dans les facteurs humains identieacutes dans leschapitres preacuteceacutedents Dans le cadre de ce travail nous avons testeacute de maniegravere isoleacutee 4 coloniescorrespondant agrave 4 facteurs humains speacuteciques la similariteacute la diversiteacute la nouveauteacute et lespreacutefeacuterences Les reacutesultats obtenus ont permis de prouver quil eacutetait possible de lier des facteurshumains agrave la recherche de chemins dans un graphe par des agents teacuteleacuteonomiques

La deuxiegraveme expeacuterimentation preacutesenteacutee dans la Section 433 sest appuyeacutee sur ces conclu-sions pour tester le modegravele AntRS dans son entiegravereteacute Le but de cette expeacuterimentation eacutetaittriple

1 Prouver que notre modegravele est capable de produire une seacutequence unique posseacutedant desaspects de chacun des 4 facteurs humains en utilisant les reacutesultats des colonies speacutecialiseacutees

2 Tester les performances des deux tactiques de notre modegravele (fusion de seacutequences et coloniede fusion) permettant de fusionner les seacutequences des colonies speacutecialiseacutees

3 Comparer les performances de AntRS avec dautres systegravemes de recommandations mono-objectif et multi-objectifs de la litteacuterature du domaine

Avec cette expeacuterimentation nous avons montreacute que AntRS eacutetait bien capable de syntheacutetiserdans une mecircme seacutequence les dieacuterents aspects humains consideacutereacutes De plus les seacutequences derecommandations produites par AntRS ont obtenu de meilleurs reacutesultats par rapport aux algo-rithmes de comparaison de leacutetat de lart La premiegravere tactique de fusion de seacutequences sest reacuteveacuteleacuteeecirctre plus ecace que la colonie de fusion pour obtenir un compromis entre les dieacuterents objectifs

Lexpeacuterimentation suivante preacutesenteacutee dans la Section 433 avait pour but de tester des va-riantes dans le fonctionnement de AntRS Au cours de cette thegravese nous avons reacutealiseacute et testeacutede multiples modications et variantes de notre modegravele de maniegravere empirique tant le fonction-nement du modegravele initial ACS de Dorigo est modulable Pour mettre en exergue un exemplede cette modulariteacute nous avons testeacute les performances de notre modegravele en modiant la basedapprentissage et la maniegravere dont le graphe eacutetait creacuteeacute Les reacutesultats obtenus ont mis en eacutevidence

103

Chapitre 4 Expeacuterimentations et reacutesultats

le potentiel deacutevolution et dadaptabiliteacute de AntRS agrave des travaux futurs

Enn nous nous sommes inteacuteresseacutes dans la Section 434 agrave loptimisation automatique desmeacutetavariables de notre modegravele Comme nous lavons illustreacute au deacutebut de ce chapitre avec les ex-peacuterimentations preacuteliminaires sur le modegravele ACS les meacutetavariables jouent un rocircle essentiel dans laqualiteacute des reacutesultats Ces derniegraveres gouvernent le comportement des agents comme par exempleleurs tendances agrave explorer lenvironnement ou au contraire agrave exploiter des chemins deacutejagrave connusAn de maximiser le potentiel de notre modegravele dans ce cadre applicatif nous avons utiliseacute lal-gorithme geacuteneacutetique doptimisation de problegravemes multi-objectifs NSGA-II sur 5 meacutetavariables deAntRS Le reacutesultat de cette optimisation a permis dameacuteliorer de maniegravere statistiquement signi-cative les performances de notre modegravele en termes de preacutecision rappel nouveauteacute et preacutefeacuterencesCependant la longueur du processus doptimisation limite pour le moment son application dansle contexte dune utilisation en temps reacuteel du modegravele

Le choix de la base de donneacutees musicale provenant de Deezer a permis de reacutealiser de nom-breuses expeacuterimentations et de tester dieacuterentes facettes de notre modegravele Cependant nousavons aussi rencontreacute beaucoup de problegravemes quant agrave la notion de progressiviteacute avec cette basede donneacutees et les reacutesultats obtenus nont pas eacuteteacute concluants concernant cette meacutetrique Nousdiscuterons de ce point et dautres perspectives dameacuteliorations dans la conclusion geacuteneacuterale decette thegravese

104

Chapitre 5

Conclusion et perspectives

51 Conclusion

Le domaine de la recommandation est en plein essor depuis maintenant une vingtaine dan-neacutees Durant cette peacuteriode la recommandation na cesseacute deacutevoluer an de sadapter agrave lexplosiondu nombre dutilisateurs et de la quantiteacute de donneacutees disponibles Nous pouvons distinguer troisaspects des recommandations modernes qui ont servi de l directeur dans cette thegravese Premiegrave-rement il y a encore 10 ans seulement la majoriteacute de la recherche avait pour but de maximiserla meacutetrique de preacutecision des reacutesultats des algorithmes il est aujourdhui admis quune bonnerecommandation neacutecessite aussi de satisfaire dautres meacutetriques comme la diversiteacute ou la nou-veauteacute Mecircme si la preacutecision reste centrale il est important de consideacuterer ces autres meacutetriquescar elles permettent de reacutepondre agrave une plus grande diversiteacute de situation chez les utilisateurs de-mandant des recommandations Deuxiegravemement la quantiteacute de donneacutees disponibles sur Interneta exploseacute tandis que lutilisation des systegravemes de recommandation sest tregraves largement deacutemocra-tiseacutee La diversiteacute des domaines applicatifs utilisant des systegravemes de recommandations est telleque lhyper-speacutecialisation dun systegraveme pour un seule domaine fait moins de sens quauparavantLes systegravemes de recommandations capables de sadapter rapidement agrave de multiples domainesapplicatifs sont donc aujourdhui particuliegraverement inteacuteressants Troisiegravemement la croissance etla complexication des donneacutees deacutecrivant les ressources et les utilisateurs permettent de propo-ser agrave ces derniers des recommandations plus complexes quauparavant Comme nous lavons ditdautres aspects que la preacutecision sont deacutejagrave exploiteacutes mais il est aussi possible de complexier lesrecommandations en les proposant par seacutequences et non plus par ressource unique En eet lanorme eacutetait avant de ne proposer agrave lutilisateur quune seule recommandation ou au mieux uneliste de recommandations au mecircme niveau les unes que les autres Or de nombreux domainescomme le-eacuteducation la musique ou encore le tourisme peuvent beacuteneacutecier de systegravemes capablesde recommander une seacutequence de ressources dans un ordre preacutecis Lutilisateur dun tel systegravemedispose donc dune seacutequence de ressources permettant datteindre potentiellement des objectifsqui ne seraient pas atteignables avec des recommandations simples ou en liste Ces trois pointseacutevoqueacutes ci-dessus constituent le cdivideur du travail de cette thegravese et nous allons maintenant rappelerles apports de notre travail sur ces trois points

1 Modegravele multi-objectifs En se basant sur larchitecture des colonies de fourmis notremodegravele AntRS permet dinteacutegrer autant de meacutetriques que voulues dans le processus degeacuteneacuteration de recommandations Dans ce travail nous en avons consideacutereacute 4 la similariteacutela diversiteacute la nouveauteacute et les preacutefeacuterences passeacutees Ces 4 meacutetriques sont inteacutegreacutees en

105

Chapitre 5 Conclusion et perspectives

tant que colonies dans notre modegravele et participent toutes agrave la construction de la seacutequencede recommandations Leur importance dans le processus de recommandation peut ecirctremoduleacutee an de mieux correspondre agrave chaque prol dutilisateur

2 Geacuteneacutericiteacute inter-domaine Dans le point preacuteceacutedent nous avons discuteacute de linteacutegrationde dieacuterentes meacutetriques dans les recommandations Comme nous lavons preacutesenteacute dansleacutetat de lart un certain nombre de modegraveles prennent deacutesormais en compte dieacuterentesmeacutetriques Cependant un des points forts de notre modegravele est la modulariteacute avec laquellenous pouvons lexeacutecuter Il est en eet possible denlever ou de rajouter des colonies agrave lademande Autrement dit nous sommes capable de changer agrave la voleacutee les facteurs humainsagrave consideacuterer pour construire les recommandations nales Outre ce point il est relati-vement simple de passer dun domaine applicatif agrave un autre Nous avons construit notremodegravele de sorte quil soit le plus geacuteneacuterique possible eacutetant donneacute que lors de sa conceptionnous navions pas encore deacutecideacute quelle base de donneacutees utiliser Ainsi la seule modica-tion neacutecessaire lors dun changement de domaine est dadapter le calcul de la distance dentre chaque ressource lors de la construction du graphe Apregraves cette modication le restede lalgorithme est le mecircme

3 Seacutequences de recommandation Eacutetant donneacute que notre modegravele AntRS se base sur lemodegravele des colonies de fourmis de Marco Dorigo les reacutesultats que nous obtenons se preacute-sentent sous le mecircme format que pour ce dernier Initialement dans les modegraveles proposeacutespar Dorigo les fourmis ont comme but de chercher un chemin parmi plusieurs possiblesdans un environnement repreacutesenteacute par un graphe et en empruntant des points de passagerepreacutesenteacutes par les ndivideuds du graphe Le reacutesultat obtenu est donc une suite de noeudavec un point de deacutepart un objectif de n et une seacuterie de points de passage dans unordre preacutecis entre les deux autrement dit une seacutequence Nous avons souhaiteacute garder ceprincipe de production naturelle de seacutequences et de ladapter agrave la recommandation Ainsien construisant avec attention le graphe an quil repreacutesente de la maniegravere la plus degravelepossible les liens preacutesents entre les ressources du domaine applicatif et en adaptant lecalcul de la distance d seacuteparant deux ndivideuds notre modegravele AntRS est capable de produiredes seacutequences avec des ressources varieacutees

Les deux premiers apports eacutenumeacutereacutes ci-dessus permettent de sadapter non seulement agrave denombreux prols utilisateurs gracircce aux dieacuterentes meacutetriques mais aussi agrave dieacuterents domainesapplicatifs gracircce agrave la simpliciteacute des changements agrave faire pour passer dun domaine agrave un autreLe troisiegraveme apport eacutenumeacutereacute permet quant agrave lui de proposer non plus des ressources uniques oudes listes de recommandations agrave lutilisateur nal mais bien des seacutequences posseacutedant un senscar baseacutees sur les habitudes de consommation des ressources des utilisateurs passeacutes

52 Perspectives

Dans ce travail nous avons reacutepondu aux probleacutematiques que nous avons deacutenies au deacutebutdu manuscrit mais nous pouvons cependant distinguer des pistes dameacuteliorations futures

Premiegraverement les seacutequences peuvent beacuteneacutecier dameacuteliorations notamment au niveau dela notion de progressiviteacute Pour le moment dans notre modegravele les seacutequences sont creacuteeacutees via

106

52 Perspectives

les agents fourmis parcourant le graphe agrave partir dun point de deacutepart jusquagrave un objectif Laprogressiviteacute des seacutequences est garantie par deux processus

1 La topologie du graphe qui prend en compte les seacutequences creacuteeacutees naturellement par lesutilisateurs lors de preacuteceacutedentes visites

2 La formule du calcul du meilleur chemin une fois les agents ayant termineacute de se deacuteplacersur le graphe

Nous avons exploreacute dautres pistes pour orir des seacutequences plus progressives aux utilisateursPar exemple en incluant une colonie deacutedieacutee uniquement agrave la progressiviteacute ou encore en modiantles calculs de distance totale de chemin Les tests que nous avons reacutealiseacutes nont cependant pasabouti agrave des reacutesultats concluants Nous attribuons ces reacutesultats au fait que le domaine de la mu-sique nest pas optimal pour utiliser ce genre de technique Quand bien mecircme il est courant pourles utilisateurs deacutecouter des musiques sous formes de playlists de reacutecentes eacutetudes ont montreacute quelordre dans lequel les musiques sont proposeacutees nest pas une caracteacuteristique prioritaire dans lasatisfaction de lutilisateur On peut par exemple citer les eacutetudes suivantes [Vall et al 2018 Vallet al 2019] ougrave les auteurs ont chercheacute agrave mesurer limportance de lordre dans lequel eacutetaient preacute-senteacutees les musiques dune playlist Les auteurs nobtiennent pas de dieacuterences de reacutesultats entreplusieurs expeacuterimentations ougrave lordre des musiques eacutetait maintenu ou lorsquil eacutetait rompu Lesauteurs concluent que lordre des musiques nest pas une variable cruciale pour la geacuteneacuteration au-tomatique de playlists Dautres domaines sont ainsi potentiellement plus agrave mecircme decirctre le sujetdeacutetudes plus approfondies sur la progressiviteacute comme par exemple les recommandations de par-cours dans des museacutees ou les recommandations de seacuteries de cours et dexercices dans le-eacuteducation

Une autre perspective dameacutelioration deacutecoulant du paragraphe preacuteceacutedent est lapplication denotre modegravele agrave un ou plusieurs autres domaines applicatifs Nous avons deacutejagrave mentionneacute dans cemanuscrit que nous avions consideacutereacute les domaines museacuteal et de le-eacuteducation en plus du domainemusical Ces deux autres domaines proposent chacun des deacutes uniques et pourraient proter deseacutequences de recommandations reacutepondant aux besoins speacuteciques de leurs utilisateurs Il a mal-heureusement eacutetait trop complexe de reacutecupeacuterer ou de creacuteer une base de donneacutees exploitable surces deux domaines durant cette thegravese Une expeacuterimentation est toutefois meneacutee actuellement enpartenariat avec le Museacutee des Beaux Arts de Nancy an de construire une base de donneacutees deschemins emprunteacutes par les visiteurs du museacutee ce qui permettra alors dappliquer notre modegravelean de proposer des parcours personnaliseacutes dans le museacutee

Une derniegravere perspective dameacutelioration reacuteside dans leacutevaluation des seacutequences geacuteneacutereacutees parnotre modegravele Notre but eacutetait de consideacuterer plusieurs facteurs humains pour geacuteneacuterer et eacutevaluernos recommandations tout en uniant leacutevaluation avec une seule meacutetrique de satisfaction Sinous avons reacuteussi agrave inteacutegrer plusieurs facteurs dans notre modegravele nous avons cependant rencon-treacute des problegravemes quant agrave lunication des eacutevaluations Lobjectif eacutetait de proposer une mesurede progressiviteacute permettant de mesurer la qualiteacute de la seacutequence recommandeacutee mais comme nouslavons expliqueacute nous navons pas obtenu de reacutesultats concluants au regard de la progressiviteacutedans notre base de donneacutees Ainsi la mesure de progressiviteacute optimale on proposeacutee et deacutetailleacuteedans la Section 345 na pas pu ecirctre testeacutee dans de bonnes conditions Mecircme si les expeacuterimenta-tions meneacutees dans ce travail nont pas pu exploiter cette mesure de progressiviteacute optimale nouspensons quelle pourrait agrave termes donner une indication geacuteneacuterale de la qualiteacute dune seacutequence deressources dans dautres domaines comme le-eacuteducation ou le tourisme

107

Chapitre 5 Conclusion et perspectives

Dun point de vue plus geacuteneacuteral sur le fonctionnement de notre modegravele AntRS certaines ameacute-liorations sont possibles si lon considegravere le fonctionnement du systegraveme dans des conditions reacuteelleset non plus pour une expeacuterimentation hors-ligne comme nous lavons fait dans ce travail Dans lecadre dune utilisation en conditions reacuteelles quelques modications du fonctionnement de notrealgorithme pourraient ameacuteliorer la satisfaction de lutilisateur Prenons lexemple dun utilisateurse connectant sur un site de diusion de musique et commenccedilant la lecture dune musique enparticulier Notre systegraveme sera capable agrave partir de ce point de deacutepart et des preacutefeacuterences passeacuteesde lutilisateur de creacuteer une seacutequence de musiques Cependant si lutilisateur ne clique pas surla recommandation de playlist ou eacutecoute une deuxiegraveme chanson complegravetement dieacuterente desrecommandations du systegraveme il serait inteacuteressant de pouvoir consideacuterer et inteacutegrer ces informa-tions dans le modegravele an que ce dernier puisse sadapter et satisfaire au mieux lutilisateur Deplus on voit bien linteacuterecirct de ces adaptations en temps reacuteel dans les domaines museacuteal (re-calculdun nouvel itineacuteraire de visite si lutilisateur ne suit pas la recommandation agrave linstar dunGPS par exemple) et de le-eacuteducation (adapter le contenu peacutedagogique en fonction du chemin delapprenant ou de ses reacutesultats) Une derniegravere remarque geacuteneacuterale concernant notre modegravele peutecirctre faite sur le temps dexeacutecution Malgreacute les optimisations reacutealiseacutees dans la derniegravere sectiondu chapitre preacuteceacutedent le temps dexeacutecution eacutetait relativement eacuteleveacute lors des expeacuterimentationsCependant les expeacuterimentations concernaient 100 utilisateurs agrave la fois et eacutetaient lanceacutees majo-ritairement sur un ordinateur portable Ainsi la recommandation en temps reacuteel dune seacutequencede ressources agrave un seul utilisateur peut ecirctre faite en temps reacuteel en utilisant un serveur deacutedieacute

Le domaine de la recommandation seacutelargit et se complexie chaque anneacutee agrave linstar du mondedans lequel nous vivons Devant la myriade de contenus accessibles sur Internet les utilisateurspeuvent plus que jamais beacuteneacutecier de recommandations intelligentes personnaliseacutees pertinenteset reacutepondant agrave leurs besoins Dans le futur les systegravemes dassistance aux utilisateurs devrontecirctre agrave la fois geacuteneacuteriques adaptables agrave tout types de contextes et toujours plus ecaces Cestdans cette direction que sinscrit le travail de cette thegravese et le modegravele AntRS

108

Bibliographie

[Adomavicius and Tuzhilin 2005] Adomavicius G and Tuzhilin A (2005) Toward the nextgeneration of recommender systems A survey of the state-of-the-art and possible extensionsIEEE Transactions on Knowledge amp Data Engineering (6) 734749

[Adomavicius and Tuzhilin 2011] Adomavicius G and Tuzhilin A (2011) Context-aware re-commender systems In Recommender systems handbook pages 217253 Springer

[Aggarwal et al 2016] Aggarwal C C et al (2016) Recommender systems Springer

[Agrawal et al 1995] Agrawal R Srikant R et al (1995) Mining sequential patterns Inicde volume 95 pages 314

[Alaya et al 2007] Alaya I Solnon C and Ghedira K (2007) Ant colony optimization formulti-objective optimization problems In Tools with Articial Intelligence 2007 ICTAI 200719th IEEE International Conference on volume 1 pages 450457 IEEE

[Angus 2007] Angus D (2007) Crowding population-based ant colony optimisation for themulti-objective travelling salesman problem In 2007 IEEE Symposium on ComputationalIntelligence in Multi-Criteria Decision-Making pages 333340 IEEE

[Angus and Woodward 2009] Angus D and Woodward C (2009) Multiple objective ant co-lony optimisation Swarm intelligence 3(1) 6985

[Antenucci et al 2018] Antenucci S Boglio S Chioso E Dervishaj E Kang S ScarlattiT and Dacrema M F (2018) Artist-driven layering and users behaviour impact on re-commendations in a playlist continuation scenario In Proceedings of the ACM RecommenderSystems Challenge 2018 page 4 ACM

[Aucouturier and Pachet 2002] Aucouturier J-J and Pachet F (2002) Scaling up music play-list generation In Proceedings IEEE International Conference on Multimedia and Expo vo-lume 1 pages 105108 IEEE

[Ausubel 1963] Ausubel D P (1963) The psychology of meaningful verbal learning

[Baeza-Yates et al 1999] Baeza-Yates R Ribeiro-Neto B et al (1999) Modern informationretrieval volume 463 ACM press New York

[Belkin and Croft 1992] Belkin N J and Croft W B (1992) Information ltering and infor-mation retrieval two sides of the same coin In Communications of the ACM Citeseer

[Bell and McMullen 2004] Bell J E and McMullen P R (2004) Ant colony optimizationtechniques for the vehicle routing problem Advanced engineering informatics 18(1) 4148

[Benbasat and Wang 2005] Benbasat I and Wang W (2005) Trust in and adoption of onlinerecommendation agents Journal of the association for information systems 6(3) 4

[Bennett et al 2007] Bennett J Lanning S et al (2007) The netix prize In Proceedingsof KDD cup and workshop volume 2007 page 35 New York

109

Bibliographie

[Bonabeau et al 1999] Bonabeau E Marco D d R D F Dorigo M Theacuteraulaz G The-raulaz G et al (1999) Swarm intelligence from natural to articial systems Number 1Oxford university press

[Borragraves et al 2014] Borragraves J Moreno A and Valls A (2014) Intelligent tourism recommen-der systems A survey Expert Systems with Applications 41(16) 73707389

[Boyer et al 2015] Boyer A Casanova G Roussanaly A and Ducreau F (2015) Periclesor how to assess and to improve quality in higher education

[Breese et al 2013] Breese J S Heckerman D and Kadie C (2013) Empirical analysis ofpredictive algorithms for collaborative ltering arXiv preprint arXiv 13017363

[Brooks 1991] Brooks R A (1991) Intelligence without reason

[Castagnos 2008] Castagnos S (2008) Modeacutelisation de comportements et apprentissage sto-chastique non superviseacute de strateacutegies dinteractions sociales au sein de systegravemes temps reacuteel derecherche et daccegraves agrave linformation PhD thesis Universiteacute Nancy II

[Castagnos and Boyer 2006] Castagnos S and Boyer A (2006) A clientserver user-basedcollaborative ltering algorithm Model and implementation In 17th European Conferenceon Articial Intelligence (ECAI 2006) pages 617621

[Castagnos et al 2013] Castagnos S Brun A and Boyer A (2013) Utiliteacute et perception dela diversiteacute dans les systegravemes de recommandation

[Castagnos et al 2010] Castagnos S Jones N and Pu P (2010) Eye-tracking product re-commenders usage In Proceedings of the fourth ACM conference on Recommender systemspages 2936 ACM

[Castagnos et al 2019] Castagnos S Marchal F Bertrand A Colle M and Mahmoudi D(2019) Inferring art preferences from gaze exploration in a museum In Adjunct Publicationof the 27th Conference on User Modeling Adaptation and Personalization pages 425430

[Castells et al 2015] Castells P Hurley N J and Vargas S (2015) Novelty and diversity inrecommender systems In Recommender Systems Handbook pages 881918 Springer

[Chen and Li 2019] Chen H and Li J (2019) Adversarial tensor factorization for context-aware recommendation In Proceedings of the 13th ACM Conference on Recommender Systemspages 363367

[Cheverst et al 2000] Cheverst K Davies N Mitchell K Friday A and Efstratiou C(2000) Developing a context-aware electronic tourist guide some issues and experiencesIn Proceedings of the SIGCHI conference on Human Factors in Computing Systems pages1724 ACM

[Chou et al 2005] Chou S-C Hsieh W-T Gandon F L and Sadeh N M (2005) Semanticweb technologies for context-aware museum tour guide applications In Advanced InformationNetworking and Applications 2005 AINA 2005 19th International Conference on volume 2pages 709714 IEEE

[Davis 1989] Davis F D (1989) Perceived usefulness perceived ease of use and user acceptanceof information technology MIS quarterly pages 319340

[Deb et al 2002] Deb K Pratap A Agarwal S and Meyarivan T (2002) A fast and elitistmultiobjective genetic algorithm Nsga-ii IEEE transactions on evolutionary computation6(2) 182197

[Deneubourg et al 1990] Deneubourg J-L Aron S Goss S and Pasteels J M (1990) Theself-organizing exploratory pattern of the argentine ant Journal of insect behavior 3(2) 159168

110

[Doerner et al 2004] Doerner K Gutjahr W J Hartl R F Strauss C and Stummer C(2004) Pareto ant colony optimization A metaheuristic approach to multiobjective portfolioselection Annals of operations research 131(1) 7999

[Dorigo 2001] Dorigo M (2001) Ant algorithms solve dicult optimization problems InEuropean Conference on Articial Life pages 1122 Springer

[Dorigo and Birattari 2010] Dorigo M and Birattari M (2010) Ant colony optimizationSpringer

[Dorigo and Birattari 2011] Dorigo M and Birattari M (2011) Ant colony optimization InEncyclopedia of machine learning pages 3639 Springer

[Dorigo et al 2006] Dorigo M Birattari M and Stutzle T (2006) Ant colony optimizationIEEE computational intelligence magazine 1(4) 2839

[Dorigo and Gambardella 1997] Dorigo M and Gambardella L M (1997) Ant colonies forthe travelling salesman problem biosystems 43(2) 7381

[Dorigo et al 1996] Dorigo M Maniezzo V Colorni A et al (1996) Ant system optimiza-tion by a colony of cooperating agents IEEE Transactions on Systems man and cyberneticsPart B Cybernetics 26(1) 2941

[Dorigo and Stuumltzle 2019] Dorigo M and Stuumltzle T (2019) Ant colony optimization overviewand recent advances In Handbook of metaheuristics pages 311351 Springer

[Drachsler et al 2015] Drachsler H Verbert K Santos O C and Manouselis N (2015)Panorama of recommender systems to support learning In Recommender systems handbookpages 421451 Springer

[Durillo and Nebro 2011] Durillo J J and Nebro A J (2011) jmetal A java framework formulti-objective optimization Advances in Engineering Software 42(10) 760771

[Ekstrand et al 2014] Ekstrand M D Harper F M Willemsen M C and Konstan J A(2014) User perception of dierences in recommender algorithms In Proceedings of the 8thACM Conference on Recommender systems pages 161168 ACM

[Ferber 1995] Ferber J (1995) Les systegravemes multi-agents Vers une intelligence collectiveintereditions 1995 Connaissances et compeacutetences requises Cette thegravese s adresse agrave des eacutetu-diants ayant un prol Intelligence ArticielleBase de Donneacutees et elle neacutecessite davoir descompeacutetences theacuteoriques dans les domaines 1

[Ferber and Weiss 1999] Ferber J and Weiss G (1999) Multi-agent systems an introductionto distributed articial intelligence volume 1 Addison-Wesley Reading

[Frolov and Oseledets 2017] Frolov E and Oseledets I (2017) Tensor methods and recom-mender systems Wiley Interdisciplinary Reviews Data Mining and Knowledge Discovery7(3) e1201

[Gambardella et al 1999] Gambardella L M Taillard Eacute and Agazzi G (1999) Macs-vrptw A multiple ant colony system for vehicle routing problems with time windows

[Gan et al 2020] Gan L Nurbakova D Laporte L and Calabretto S (2020) Enhancingrecommendation diversity using determinantal point processes on knowledge graphs In Pro-ceedings of the 43rd International ACM SIGIR Conference on Research and Development inInformation Retrieval pages 20012004

[Gavalas et al 2014] Gavalas D Konstantopoulos C Mastakas K and Pantziou G (2014)Mobile recommender systems in tourism Journal of network and computer applications39 319333

111

Bibliographie

[Goodenough et al 2017] Goodenough A E Little N Carpenter W S and Hart A G(2017) Birds of a feather ock together Insights into starling murmuration behaviour revealedusing citizen science PloS one 12(6) e0179277

[Goss et al 1989] Goss S Aron S Deneubourg J-L and Pasteels J M (1989) Self-organized shortcuts in the argentine ant Naturwissenschaften 76(12) 579581

[Gras et al 2016] Gras B Brun A and Boyer A (2016) Identifying grey sheep users incollaborative ltering a distribution-based technique In Proceedings of the 2016 Conferenceon User Modeling Adaptation and Personalization pages 1726 ACM

[Grasseacute 1959] Grasseacute P-P (1959) La reconstruction du nid et les coordinations interindi-viduelles chez bellicositermes natalensis etcubitermes sp la theacuteorie de la stigmergie Essaidinterpreacutetation du comportement des termites constructeurs Insectes sociaux 6(1) 4180

[Guo et al 2015] Guo G Zhang J Sun Z and Yorke-Smith N (2015) Librec A javalibrary for recommender systems In UMAP Workshops

[Han et al 2007] Han J Cheng H Xin D and Yan X (2007) Frequent pattern mining current status and future directions Data mining and knowledge discovery 15(1) 5586

[Harper and Konstan 2015] Harper F M and Konstan J A (2015) The movielens datasets History and context Acm transactions on interactive intelligent systems (tiis) 5(4) 119

[Herlocker et al 2004] Herlocker J L Konstan J A Terveen L G and Riedl J T (2004)Evaluating collaborative ltering recommender systems ACM Transactions on InformationSystems (TOIS) 22(1) 553

[Houmllldobler et al 1990] Houmllldobler B Wilson E O et al (1990) The ants Harvard UniversityPress

[Honey et al 1992] Honey P Mumford A et al (1992) The manual of learning styles

[Hu et al 2008] Hu Y Koren Y and Volinsky C (2008) Collaborative ltering for implicitfeedback datasets In 2008 Eighth IEEE International Conference on Data Mining pages263272 Ieee

[Iaquinta et al 2008] Iaquinta L De Gemmis M Lops P Semeraro G Filannino M andMolino P (2008) Introducing serendipity in a content-based recommender system In 2008Eighth International Conference on Hybrid Intelligent Systems pages 168173 IEEE

[Iredi et al 2001] Iredi S Merkle D and Middendorf M (2001) Bi-criterion optimizationwith multi colony ant algorithms In Evolutionary Multi-Criterion Optimization pages 359372 Springer

[Jameson et al 2015] Jameson A Willemsen M C Felfernig A de Gemmis M Lops PSemeraro G and Chen L (2015) Human decision making and recommender systems InRecommender Systems Handbook pages 611648 Springer

[Jannach et al 2016] Jannach D Kamehkhosh I and Bonnin G (2016) Biases in auto-mated music playlist generation A comparison of next-track recommending techniques InProceedings of the 2016 Conference on User Modeling Adaptation and Personalization pages281285 ACM

[Jawaheer et al 2010] Jawaheer G Szomszor M and Kostkova P (2010) Comparison ofimplicit and explicit feedback from an online music recommendation service In proceedingsof the 1st international workshop on information heterogeneity and fusion in recommendersystems pages 4751 ACM

112

[Jones 2010] Jones N (2010) User Perceived Qualities and Acceptance of Recommender Sys-tems The Role of Diversity PhD thesis EPFL

[Kaminskas and Bridge 2016] Kaminskas M and Bridge D (2016) Diversity serendipity no-velty and coverage A survey and empirical analysis of beyond-accuracy objectives in recom-mender systems ACM Trans Interact Intell Syst 7(1) 2 12 42

[Kardan et al 2014] Kardan A A Ebrahim M A and Imani M B (2014) A new perso-nalized learning path generation method Aco-map Indian Journal of Scientic Research5(1) 17

[King and Sumpter 2012] King A J and Sumpter D J (2012) Murmurations Current Bio-logy 22(4) R112R114

[Kolb and Fry 1974] Kolb D A and Fry R E (1974) Toward an applied theory of experientiallearning MIT Alfred P Sloan School of Management

[Konstan et al 1998] Konstan J A Riedl J Borchers A and Herlocker J L (1998) Re-commender systems A grouplens perspective In Recommender Systems Papers from the1998 Workshop (AAAI Technical Report WS-98-08) pages 6064 AAAI Press

[Koren 2008] Koren Y (2008) Factorization meets the neighborhood a multifaceted collabo-rative ltering model In Proceedings of the 14th ACM SIGKDD international conference onKnowledge discovery and data mining pages 426434 ACM

[Koren et al 2009] Koren Y Bell R and Volinsky C (2009) Matrix factorization techniquesfor recommender systems Computer (8) 3037

[Kuhlthau 1991] Kuhlthau C C (1991) Inside the search process Information seeking fromthe users perspective Journal of the American society for information science 42(5) 361371

[Kurilovas et al 2015] Kurilovas E Zilinskiene I and Dagiene V (2015) Recommending sui-table learning paths according to learners preferences Experimental research results Com-puters in Human Behavior 51 945951

[lHuillier 2018] lHuillier A (2018) Modeacuteliser la diversiteacute au cours du temps pour comprendrele contexte de lutilisateur dans les systegravemes de recommandation PhD thesis

[LHuillier et al 2014] LHuillier A Castagnos S and Boyer A (2014) Understanding usagesby modeling diversity over time In 22nd Conference on User Modeling Adaptation andPersonalization volume 1181

[Logan 2002] Logan B (2002) Content-based playlist generation Exploratory experimentsIn ISMIR

[Lops et al 2011] Lops P De Gemmis M and Semeraro G (2011) Content-based recom-mender systems State of the art and trends In Recommender systems handbook pages73105 Springer

[Mahmood and Ricci 2009] Mahmood T and Ricci F (2009) Improving recommender sys-tems with adaptive conversational strategies In Proceedings of the 20th ACM conference onHypertext and hypermedia pages 7382 ACM

[March 1991] March J G (1991) Exploration and exploitation in organizational learningOrganization science 2(1) 7187

[McGinty and Smyth 2003] McGinty L and Smyth B (2003) On the role of diversity inconversational recommender systems In Proceedings of the 5th International Conference onCase-based Reasoning Research and Development ICCBR03 pages 276290

113

Bibliographie

[McNee et al 2006] McNee S M Riedl J and Konstan J A (2006) Being accurate is notenough how accuracy metrics have hurt recommender systems In CHI06 extended abstractson Human factors in computing systems pages 10971101 ACM

[Merkle et al 2002] Merkle D Middendorf M and Schmeck H (2002) Ant colony optimi-zation for resource-constrained project scheduling IEEE transactions on evolutionary compu-tation 6(4) 333346

[Mokatren et al 2018] Mokatren M Kuik T and Shimshoni I (2018) Exploring the po-tential of a mobile eye tracker as an intuitive indoor pointing device A case study in culturalheritage Future Generation Computer Systems 81 528541

[Nurbakova et al 2018] Nurbakova D Laporte L Calabretto S and Gensel J (2018) Re-commandation de seacutequences dactiviteacutes lors deacutevegravenements distribueacutes

[Oard et al 1998] Oard D W Kim J et al (1998) Implicit feedback for recommendersystems In Proceedings of the AAAI workshop on recommender systems pages 8183

[Osche et al 2019a] Osche P-E Castagnos S and Boyer A (2019a) Antrs Recommendinglists through a multi-objective ant colony system In European Conference on InformationRetrieval pages 229243 Springer

[Osche et al 2019b] Osche P-E Castagnos S and Boyer A (2019b) From music to museum Applications of multi-objective ant colony systems to real world problems In Adaptive andLearning Agents Workshop at AAMAS (ALA 2019)

[Osche et al 2016] Osche P-E Castagnos S Napoli A and Naudet Y (2016) Walk theline toward an ecient user model for recommendations in museums In Semantic and SocialMedia Adaptation and Personalization (SMAP) 2016 11th International Workshop IEEE

[Oster 1981] Oster G (1981) E 0 wilson 1978 caste and ecology in the social insects Mo-nographs in Population Biology 12 1352

[Qiu et al 2015] Qiu J Lin Z and Li Y (2015) Predicting customer purchase behavior inthe e-commerce context Electronic commerce research 15(4) 427452

[Quadrana et al 2018] Quadrana M Cremonesi P and Jannach D (2018) Sequence-awarerecommender systems ACM Computing Surveys (CSUR) 51(4) 136

[Resnick et al 1994] Resnick P Iacovou N Suchak M Bergstrom P and Riedl J (1994)Grouplens an open architecture for collaborative ltering of netnews In Proceedings of the1994 ACM conference on Computer supported cooperative work pages 175186 ACM

[Reynolds 1987] Reynolds C W (1987) Flocks herds and schools A distributed behavioralmodel volume 21 ACM

[Ribeiro et al 2014] Ribeiro M T Ziviani N Moura E S D Hata I Lacerda A andVeloso A (2014) Multiobjective pareto-ecient approaches for recommender systems ACMTrans Intell Syst Technol 5(4) 53 153 20

[Ricci et al 2015] Ricci F Rokach L and Shapira B (2015) Recommender Systems Hand-book Springer US

[RISK 2002] RISK U (2002) Draft standard for learning object metadata IEEE standard1484(1)

[Rubtsov et al 2018] Rubtsov V Kamenshchikov M Valyaev I Leksin V and IgnatovD I (2018) A hybrid two-stage recommender system for automatic playlist continuation InProceedings of the ACM Recommender Systems Challenge 2018 page 16 ACM

114

[Russell and Norvig 2016] Russell S J and Norvig P (2016) Articial intelligence a modernapproach Malaysia Pearson Education Limited

[Salton 1989] Salton G (1989) Automatic text processing The transformation analysis andretrieval of Reading Addison-Wesley 169

[Salton and McGill 1986] Salton G and McGill M J (1986) Introduction to modern infor-mation retrieval

[Sammut and Webb 2010] Sammut C and Webb G I editors (2010) Mean Absolute Errorpages 652652 Springer US Boston MA

[Schlunz 2011] Schlunz E B (2011) Decision support for generator maintenance scheduling inthe energy sector PhD thesis Stellenbosch Stellenbosch University

[Schnabel et al 2018] Schnabel T Bennett P N Dumais S T and Joachims T (2018)Short-term satisfaction and long-term coverage Understanding how users tolerate algorithmicexploration In Proceedings of the Eleventh ACM International Conference on Web Search andData Mining pages 513521

[Semet et al 2003] Semet Y Lutton E and Collet P (2003) Ant colony optimisation fore-learning Observing the emergence of pedagogic suggestions In Swarm Intelligence Sympo-sium 2003 SIS03 Proceedings of the 2003 IEEE pages 4652 IEEE

[Shani and Gunawardana 2011] Shani G and Gunawardana A (2011) Evaluating recommen-dation systems In Recommender systems handbook pages 257297 Springer

[Shardanand and Maes 1995] Shardanand U and Maes P (1995) Social information ltering Algorithms for automating word of mouth In Chi volume 95 pages 210217 Citeseer

[Silva et al 2009] Silva A R D Lages W S and Chaimowicz L (2009) Boids that see Using self-occlusion for simulating large groups on gpus Computers in Entertainment (CIE)7(4) 51

[Simon 1997] Simon H A (1997) Models of bounded rationality Empirically grounded econo-mic reason volume 3 MIT press

[Smyth and McClave 2001] Smyth B and McClave P (2001) Similarity vs diversity InInternational Conference on Case-Based Reasoning pages 347361 Springer

[Stuumltzle and Hoos 2000] Stuumltzle T and Hoos H H (2000) Maxmin ant system Futuregeneration computer systems 16(8) 889914

[Su and Khoshgoftaar 2009] Su X and Khoshgoftaar T M (2009) A survey of collaborativeltering techniques Advances in articial intelligence 2009 4

[Tesoriero et al 2008] Tesoriero R Gallud J A Lozano M and Penichet V M R (2008) Alocation-aware system using rd and mobile devices for art museums In Fourth InternationalConference on Autonomic and Autonomous Systems (ICAS08) pages 7681 IEEE

[Tesoriero et al 2014] Tesoriero R Gallud J A Lozano M and Penichet V M R (2014)Enhancing visitors experience in art museums using mobile technologies Information SystemsFrontiers 16(2) 303327

[Tintarev et al 2017] Tintarev N Lo C and Liem C (2017) Sequences of diverse songrecommendations An exploratory study in a commercial system In Proceedings of the 25thConference on User Modeling Adaptation and Personalization pages 391392 ACM

[Twardowski 2016] Twardowski B (2016) Modelling contextual information in session-awarerecommender systems with neural networks In Proceedings of the 10th ACM Conference onRecommender Systems pages 273276 ACM

115

Bibliographie

[Vall et al 2018] Vall A Quadrana M Schedl M and Widmer G (2018) The impor-tance of song context and song order in automated music playlist generation arXiv preprintarXiv 180704690

[Vall et al 2019] Vall A Quadrana M Schedl M and Widmer G (2019) Order contextand popularity bias in next-song recommendations International Journal of Multimedia In-formation Retrieval 8(2) 101113

[Van den Berg et al 2005] Van den Berg B Van Es R Tattersall C Janssen J ManderveldJ Brouns F Kurvers H and Koper R (2005) Swarm-based sequencing recommendationsin e-learning In Intelligent Systems Design and Applications 2005 ISDA05 Proceedings 5thInternational Conference on pages 488493 IEEE

[Vargas and Castells 2011] Vargas S and Castells P (2011) Rank and relevance in noveltyand diversity metrics for recommender systems In Proceedings of the fth ACM conferenceon Recommender systems pages 109116 ACM

[Veacuteron and Levasseur 1989] Veacuteron E and Levasseur M (1989) Ethnographie de lexposition lespace le corps et le sens Centre Georges Pompidou Bibliothegraveque publique dinformation

[Volkovs et al 2018] Volkovs M Rai H Cheng Z Wu G Lu Y and Sanner S (2018)Two-stage model for automatic playlist continuation at scale In Proceedings of the ACMRecommender Systems Challenge 2018 page 9 ACM

[Wang et al 2012] Wang X Rosenblum D and Wang Y (2012) Context-aware mobile musicrecommendation for daily activities In Proceedings of the 20th ACM international conferenceon Multimedia pages 99108 ACM

[Weiss 2013] Weiss G (2013) Multiagent systems MIT press

[Yang et al 2017] Yang B Lei Y Liu J and Li W (2017) Social collaborative ltering bytrust IEEE transactions on pattern analysis and machine intelligence 39(8) 16331647

[Yang et al 2018] Yang H Jeong Y Choi M and Lee J (2018) Mmcf Multimodal colla-borative ltering for automatic playlist continuation In Proceedings of the ACM RecommenderSystems Challenge 2018 page 11 ACM

[Yang and Wu 2009] Yang Y J and Wu C (2009) An attribute-based ant colony system foradaptive learning object recommendation Expert Systems with Applications 36(2) 30343047

[Yoshimura et al 2014] Yoshimura Y Sobolevsky S Ratti C Girardin F Carrascal J PBlat J and Sinatra R (2014) An analysis of visitors behavior in the louvre museum a studyusing bluetooth data Environment and Planning B Planning and Design 41(6) 11131131

[Yu and Riedl 2012] Yu H and Riedl M O (2012) A sequential recommendation approachfor interactive personalized story generation In Proceedings of the 11th International Confe-rence on Autonomous Agents and Multiagent Systems-Volume 1 pages 7178 InternationalFoundation for Autonomous Agents and Multiagent Systems

[Zhang 2013] Zhang L (2013) The denition of novelty in recommendation system Journalof Engineering Science amp Technology Review 6(3)

[Zhao et al 2014] Zhao G Lee M L and Wynne H (2014) Utilizing purchase intervals inlatent clusters for product recommendation In Proceedings of the 8th Workshop on SocialNetwork Mining and Analysis page 4 ACM

[Ziegler et al 2005] Ziegler C-N McNee S M Konstan J A and Lausen G (2005) Im-proving recommendation lists through topic diversication In Proceedings of the 14th inter-national conference on World Wide Web pages 2232 ACM

116

[Zitzler et al 2001] Zitzler E Laumanns M and Thiele L (2001) Spea2 Improving thestrength pareto evolutionary algorithm TIK-report 103

117

Bibliographie

118

Reacutesumeacute

Les systegravemes de recommandations repreacutesentent un thegraveme de recherche fondamental agrave linter-section entre plusieurs grandes disciplines telles que lapprentissage automatique linteractionhomme-machine et les sciences cognitives Ils constituent en outre un cadre applicatif ambitieuxpour la communauteacute des chercheurs en Intelligence Articielle de par leur tregraves grande complexiteacuteet les nombreuses contraintes quils geacutenegraverent

Lobjectif de ces systegravemes est dameacuteliorer les interactions entre le grand public et les sys-tegravemes de recherche et daccegraves agrave linformation Il est en eet devenu dicile dans un contexte demasse de donneacutees heacuteteacuterogegravenes didentier les ressources les plus pertinentes Il sagit dassisterles utilisateurs dans leurs explorations (que cela soit dans un environnement virtuel ou physique)mais eacutegalement de proposer des ressources susceptibles de les inteacuteresser mais quils nauraientpas consulteacutees spontaneacutement

Les systegravemes actuels ont largement prouveacute leur valeur ajouteacutee et reposent sur des techniquesdapprentissage varieacutees (numeacuterique ou symbolique superviseacute ou non etc) [Castagnos 2008]Neacuteanmoins ils sourent encore de limitations lorsquil sagit de faire des recommandations deseacutequences (recommandations ditems dans un ordre preacutecis pouvant deacutependre des preacute-requis dela progressiviteacute requise du contexte des contraintes de temps etc) Certains modegraveles tels quele modegravele DANCE [Castagnos 2015] integravegrent cette dimension temporelle en suivant en tempsreacuteel leacutevolution en diversiteacute des ressources consulteacutees par les utilisateurs pour mieux comprendrele contexte dexploration Dans [Bonnin 2010] lauteur propose eacutegalement un modegravele temporelcapable de deacutetecter des motifs de consultations freacutequents dans un historique de consultationsan de fournir des recommandations de ressources a priori lieacutees agrave un mecircme contexte Neacuteanmoinssi la modeacutelisation temporelle et spatiale a eacuteteacute rendue possible [Zheng 2015] les modegraveles de leacutetatde lart sinteacuteressant agrave lordre dans lequel les recommandations doivent ecirctre faites ou agrave la qualiteacuteglobale dune seacutequence de recommandations sont encore trop rares

Dans le cadre de cette thegravese nous nous attacherons agrave deacutenir un nouveau formalisme etun cadre meacutethodologique permettant (1) la deacutenition de facteurs humains menant agrave la prisede deacutecision et agrave la satisfaction des utilisateurs (2) la construction dun modegravele geacuteneacuterique etmulti-critegraveres (contraintes physiques ou temporelles diversiteacute progressiviteacute etc) inteacutegrant cesfacteurs humains dans le but de recommander des ressources pertinentes sinscrivant dans uneseacutequence coheacuterente (3) une eacutevaluation holistique de la satisfaction utilisateur vis-agrave-vis de sonparcours de recommandations Leacutevaluation des recommandations tous domaines confondus sefait pour lheure recommandation par recommandation chaque meacutetrique deacutevaluation prise in-deacutependamment (preacutecision diversiteacute nouveauteacute couverture ) Il sagira de proposer un cadreplus complet mesurant leacutevolutiviteacute et la compleacutetude du parcours

Un tel modegravele de recommandations multi-critegraveres preacutesente de nombreux cadres applicatifs Agravetitre dexemple il peut ecirctre utiliseacute dans le cadre de leacutecoute de musique en ligne avec la recom-mandation de playlists adaptatives (recommandation de seacutequences de musique pour faire eacutevoluerlambiance dans un lieu tel quun bar pour susciter une certaine progressiviteacute de leacutemotion res-

119

sentie par le public ou pour sadapter aux attentes compleacutementairessimilairesdieacuterentes dungroupe) Il peut eacutegalement ecirctre utile pour adapter le parcours de recommandation aux progregraves delapprenant et au sceacutenario peacutedagogique de lenseignant dans un contexte de-eacuteducation Citonsaussi le domaine touristique ougrave ce modegravele pourrait inteacutegrer les contraintes spatiales et tempo-relles dun environnement physique (villes museacutees etc)

Mots-cleacutes Systegravemes de recommandation Systegravemes multi-agents Modeacutelisation utilisateur

120

Abstract

Recommender systems are a fundamental research topic at the intersection of several majordisciplines such as machine learning human-computer interaction and cognitive sciences Theyalso constitute an ambitious application framework for the community of researchers in ArticialIntelligence by their great complexity and the numerous constraints they generate

The purpose of these systems is to improve the interaction between the general audience andthe systems of search and access to information It has become dicult to identify the mostrelevant items in the context of big data The goal is thus to assist users in their explorations(whether in a virtual or physical environment) but also to propose items that may interest thembut that they would not consult spontaneously

Current systems have largely proven their added value and are based on various machinelearning techniques (numerical or symbolic supervised or not etc) [Castagnos 2008] Neverthe-less they still suer from limitations when making recommendations of sequences (recommendingitems in a specic order may depend on requirements progressiveness context time constraintsetc) Some models such as the DANCE model [Castagnos 2015] integrate this temporal di-mension by following in real time the evolution in diversity of resources consulted by users tobetter understand the exploration context In [Bonnin 2010] the author also proposes a temporalmodel capable of detecting frequent consultation patterns in a history of consultations in orderto provide a priori resource recommendations related to the same context Nevertheless whiletemporal and spatial modeling have been made possible [Zheng 2015] state-of-the-art modelsthat focus on sequence recommendations or on the overall quality of the sequence are still too rare

In the framework of this thesis we will focus on dening a new formalism and a method-ological framework allowing (1) the denition of human factors leading to decision making anduser satisfaction (2) the construction of a generic and multi-criteria model (physical or tem-poral constraints diversity progressiveness etc) integrating these human factors in order torecommend relevant resources in a coherent sequence (3) a holistic evaluation of user satisfac-tion with its recommendation path The evaluation of recommendations all domains includedis currently done recommendation by recommendation with each evaluation metric taken inde-pendently (accuracy diversity novelty coverage ) Thus we expect a more comprehensiveevaluation framework measuring the progressiveness and the completeness of the path

Such a multi-criteria recommendation model has many application frameworks As an exam-ple it can be used in the context of online music listening with the recommendation of adaptiveplaylists (recommendation of music sequences to change the atmosphere in a place such as a barto raise or lower the emotion felt by the audience progressively or to adapt to the complemen-tarysimilardierent expectations of a group) It can also be useful to adapt the recommendationpath to the learners progress and the teachers pedagogical scenario in an e-education contextLet us also mention the tourism eld where this model could integrate the spatial and temporalconstraints of a physical environment (cities museums etc)

Keywords Recommender systems Multi-agent systems User modeling

121

122

123

  • Introduction
    • Introduction
    • Preacuteambule
    • Contributions
      • SP1 les facteurs agrave prendre en compte pour satisfaire les utilisateurs
      • SP2 la conception de seacutequences de recommandations en accord avec les facteurs seacutelectionneacutes
      • SP3 et SP4 la creacuteation dun modegravele geacuteneacuterique prenant en compte plusieurs meacutetriques et produisant des seacutequences
        • Plan de la thegravese
          • Eacutetat de lart
            • Les systegravemes de recommandation
              • Le filtrage par contenu
              • Le filtrage collaboratif
              • Les actions des utilisateurs
              • Discussion et limites des systegravemes classiques
                • Les facteurs humains agrave prendre en compte dans la recommandation
                  • La similariteacute
                  • La diversiteacute
                  • La nouveauteacute
                  • Discussion
                    • La recommandation en seacutequence
                      • Deacutefinition et geacuteneacuteraliteacutes sur les seacutequences
                      • Domaines dapplication des modegraveles seacutequentiels
                      • Discussion
                        • Les systegravemes multi-agents
                          • Deacutefinition
                          • Preacutesentation de deux systegravemes multi-agents reacuteactifs
                          • Ant Colony System
                          • Discussion sur le modegravele ACS
                            • Utilisation et eacutevolution reacutecentes des algorithmes de colonies de fourmis
                              • Les algorithmes de colonies de fourmis dans les systegravemes de recommandation
                              • Les algorithmes de colonies de fourmis multi-objectifs
                              • Discussion sur lutilisation de loptimum de Pareto
                                • Discussion geacuteneacuterale
                                  • Notre modegravele de recommandation multi-objectifs AntRS
                                    • Introduction
                                    • Fonctionnement geacuteneacuteral du modegravele
                                    • Graphe
                                    • Objectifs
                                      • Similariteacute
                                      • Diversiteacute
                                      • Nouveauteacute
                                      • Preacutefeacuterences
                                      • Progressiviteacute
                                        • Tactiques de fusion
                                          • Colonie de fusion
                                          • Fusion de seacutequences
                                          • Conclusion
                                              • Expeacuterimentations et reacutesultats
                                                • Introduction
                                                • Expeacuterimentations preacuteliminaires portant sur le modegravele ACS initial
                                                  • Preacutesentation et inteacuterecircts de ces premiegraveres expeacuterimentations
                                                  • Expeacuterimentations preacuteliminaires sur le modegraveles ACS
                                                  • Conclusion
                                                    • Expeacuterimentations sur le modegravele AntRS
                                                      • Base de donneacutees utiliseacutee
                                                      • AntRS mono-objectif expeacuterimentations sur chaque colonie isoleacutee
                                                      • AntRS multi-objectifs expeacuterimentations sur lensemble des colonies simultaneacutement et sur les tactiques de fusion
                                                      • Optimisation des meacutetavariables de AntRS
                                                        • Conclusion
                                                          • Conclusion et perspectives
                                                            • Conclusion
                                                            • Perspectives
                                                              • Bibliographie
Page 4: Recommanding sequences in a multidimensional space

Mis en page avec la classe thesul

Remerciements

Ce manuscrit de thegravese est le fruit dun long travail de recherche qui a eacuteteacute riche en enseigne-ments Durant ces anneacutees jai beaucoup appris tant du point de vue professionnel que personnelplus que je naurais imagineacute avant de commencer cette thegravese Pour tout cela je souhaite remer-cier les personnes qui mont entoureacute durant cette peacuteriode

Je tiens tout dabord agrave particuliegraverement remercier ma directrice Anne Boyer et mon co-directeur Sylvain Castagnos avec qui jai eu la chance de pouvoir travailler durant toute cettethegravese Anne ma apporteacute son expeacuterience et son recul dans le domaine de la recherche et Sylvainma guideacute et soutenu dans chacune des eacutetapes de ce travail Jai beaucoup appreacutecieacute travailleravec vous et je vous remercie encore une fois ici pour vos conseils aviseacutes votre patience votrebonne humeur et pour tout ce que jai pu apprendre agrave vos cocircteacutes

Je remercie Sylvie Calabretto et Laurent Vercouter qui ont rapporteacute ma thegravese et qui ontaccepteacute de faire partie du jury de thegravese Leurs remarques pertinentes mont donneacute un recul etune conance nouvelle en mon travail Je remercie Laurent Vigneron qui a apporteacute un regardexteacuterieur et bienveillant sur mon travail pendant ces anneacutees de thegravese et qui a eacutegalement accepteacutede faire partie du jury comme examinateur

Je remercie aussi leacutequipe KIWI dans son ensemble De nombreuses ideacutees de ce travail sont lefruit de discussions avec les membres de leacutequipe dont certains sont devenus pour moi des amisproches

Je remercie enn ma famille et mes amis leur soutien ma donneacute la motivation de terminerce travail dans cette peacuteriode dicile de pandeacutemie et disolation sociale Tout particuliegraverementje remercie Rose et Ragnar pour leur douce preacutesence quotidienne

i

ii

Sommaire

Chapitre 1

Introduction 1

11 Introduction 1

12 Preacuteambule 4

13 Contributions 8

131 SP1 les facteurs agrave prendre en compte pour satisfaire les utilisateurs 9

132 SP2 la conception de seacutequences de recommandations en accord avec les

facteurs seacutelectionneacutes 9

133 SP3 et SP4 la creacuteation dun modegravele geacuteneacuterique prenant en compte plusieurs

meacutetriques et produisant des seacutequences 9

14 Plan de la thegravese 10

Chapitre 2

Eacutetat de lart 11

21 Les systegravemes de recommandation 12

211 Le ltrage par contenu 12

212 Le ltrage collaboratif 13

213 Les actions des utilisateurs 13

214 Discussion et limites des systegravemes classiques 14

22 Les facteurs humains agrave prendre en compte dans la recommandation 15

221 La similariteacute 17

222 La diversiteacute 19

223 La nouveauteacute 20

224 Discussion 21

23 La recommandation en seacutequence 22

231 Deacutenition et geacuteneacuteraliteacutes sur les seacutequences 22

232 Domaines dapplication des modegraveles seacutequentiels 26

233 Discussion 30

iii

Sommaire

24 Les systegravemes multi-agents 31

241 Deacutenition 31

242 Preacutesentation de deux systegravemes multi-agents reacuteactifs 33

243 Ant Colony System 38

244 Discussion sur le modegravele ACS 40

25 Utilisation et eacutevolution reacutecentes des algorithmes de colonies de fourmis 43

251 Les algorithmes de colonies de fourmis dans les systegravemes de recommandation 43

252 Les algorithmes de colonies de fourmis multi-objectifs 47

253 Discussion sur lutilisation de loptimum de Pareto 50

26 Discussion geacuteneacuterale 50

Chapitre 3

Notre modegravele de recommandation multi-objectifs AntRS 53

31 Introduction 54

32 Fonctionnement geacuteneacuteral du modegravele 54

33 Graphe 55

34 Objectifs 60

341 Similariteacute 63

342 Diversiteacute 64

343 Nouveauteacute 64

344 Preacutefeacuterences 66

345 Progressiviteacute 67

35 Tactiques de fusion 70

351 Colonie de fusion 71

352 Fusion de seacutequences 72

353 Conclusion 72

Chapitre 4

Expeacuterimentations et reacutesultats 73

41 Introduction 74

42 Expeacuterimentations preacuteliminaires portant sur le modegravele ACS initial 74

421 Preacutesentation et inteacuterecircts de ces premiegraveres expeacuterimentations 74

422 Expeacuterimentations preacuteliminaires sur le modegraveles ACS 78

423 Conclusion 84

43 Expeacuterimentations sur le modegravele AntRS 84

431 Base de donneacutees utiliseacutee 84

432 AntRS mono-objectif expeacuterimentations sur chaque colonie isoleacutee 89

iv

433 AntRS multi-objectifs expeacuterimentations sur lensemble des colonies si-

multaneacutement et sur les tactiques de fusion 93

434 Optimisation des meacutetavariables de AntRS 99

44 Conclusion 103

Chapitre 5

Conclusion et perspectives 105

51 Conclusion 105

52 Perspectives 106

Bibliographie 109

v

Sommaire

vi

Table des gures

21 Preacutesentation scheacutematiseacutee du calcul de la preacutecision et du rappel en fonction desressources trouveacutees par rapport agrave lensemble des ressources disponibles (creacuteditimage Datamok UserWalber) 15

22 Vue densemble du fonctionnement dun systegraveme de recommandation sensible auxseacutequences (source [Quadrana et al 2018]) 25

23 Scheacutema repreacutesentant linteraction entre un agent et lenvironnement dans lequel ileacutevolue [Russell and Norvig 2016] 32

24 Simulation de boids ougrave lon peut voir les agents se deacuteplaccedilant dans la mecircme di-rection agrave une certaine distance les uns des autres dans un environnement simuleacute[Reynolds 1987] 35

25 Illustration dun chemin creacuteeacute par des fourmis appartenant agrave lespegravece des fourmisleacutegionnaires (creacutedit photo Mehmet Karatay) 36

26 Exemple de descente de gradient ougrave lon peut voir lexploration au deacutebut avec undeacuteplacement rapide puis lexploitation ensuite vers la solution trouveacutee ( creacuteditimage Joris Gillis 41

27 Illustration de lexpeacuterience des ponts binaires par Jean-Louis Deneubourg (a)Apregraves un certain temps les fourmis choisissent majoritairement une des deuxvoies possibles (b) [Deneubourg et al 1990] 41

28 Scheacutema du dispositif expeacuterimental utiliseacute pour veacuterier si les fourmis sont biencapables demprunter rapidement la voie la plus courte lorsque leur sont preacutesenteacutesdes choix qualitativement dieacuterents [Goss et al 1989] 42

29 Front de Pareto dun problegraveme de minimisation de deux variables f1 et f2 Toutesles solutions sur cette frontiegravere sont optimales (source Wikipedia) 48

31 Graphe repreacutesentant leacutevolution exponentielle du nombre darecirctes selon le nombrede sommets existants dans un graphe complet 57

32 Graphe repreacutesentant leacutevolution lineacuteaire du nombre darecirctes selon le nombre desommets voulus dans un graphe creacuteeacute avec dieacuterentes valeurs de d 60

41 Diagramme de ux repreacutesentant le deacuteroulement de lalgorithme ACS proposeacute par[Schlunz 2011] 76

42 Deux exemples de congurations expeacuterimentales dieacuterentes permettant chacune detester la capaciteacute des fourmis agrave trouver le plus court chemin dans un evironnement[Goss et al 1989] 77

43 Illustration de lexpeacuterience des ponts binaires par Jean-Louis Deneubourg (a)Apregraves un certain temps les fourmis choisissent majoritairement une des deuxvoies possibles (b) [Deneubourg et al 1990] 78

vii

Table des gures

44 Repreacutesentation graphique de lExpeacuterimentation 11 meneacutee sur le modegravele ACS gracircceagrave la bibliothegraveque Java GraphStream Le ndivideud repreacutesenteacute par un carreacute rouge cor-respond au deacutepart le ndivideud repreacutesenteacute par un carreacute bleu repreacutesente larriveacutee lesndivideuds ronds noirs repreacutesentent des points de passage possible les nombres noirsaccoleacutes aux arecirctes repreacutesentent la distance pour parcourir larecircte les nombresviolets repreacutesentent le taux de pheacuteromones deacuteposeacutees sur larecircte 79

45 Reacutesultats obtenus apregraves 30 iteacuterations sur lExpeacuterimentation 11 Agrave gauche laconguration nale du graphe agrave droite le pourcentage dagents fourmis ayantemprunteacutes les deux chemins 80

46 Reacutesultats obtenus apregraves 30 iteacuterations sur lExpeacuterimentation 12 Comme les agentsse basent principalement sur lheuristique qui est partout eacutegale ils oscillent entreles deux chemins sans en privileacutegier un 81

47 Reacutesultats obtenus apregraves 30 iteacuterations sur lExpeacuterimentation 13 Les agents ex-ploitent ici les arecirctes ayant le plus de pheacuteromones Tregraves rapidement tous les agentsutilisent le mecircme chemin 82

48 Conguration nale du graphe pour lExpeacuterimentation 2 apregraves 30 iteacuterations Lesagents ont en majoriteacute bien seacutelectionneacute le chemin le plus court lt 0 1 3 4 9 gt 82

49 Exemple de graphe de lExpeacuterimentation 3 agrave la n des 50 iteacuterations Ces graphessont geacuteneacutereacutes aleacuteatoirement 83

410 Exemple de deacutetection de sessions dans la base de donneacutees Lheure agrave laquelleest lanceacutee chaque musique (ici en bas dans le scheacutema) ainsi que sa dureacutee sontenregistreacutees Si lutilisateur ne relance pas de musique pendant 15 minutes apregravesla n de sa derniegravere eacutecoute alors la session en cours est termineacutee et une nouvellesession est commenceacutee agrave la prochaine musique lanceacutee 87

411 Inuence du nombre dagents et diteacuterations sur la preacutecision moyenne obtenue parnotre modegravele 100

viii

Chapitre 1

Introduction

11 Introduction

Les systegravemes de recommandation existent depuis maintenant plus de deux deacutecennies[Resnick et al 1994] et ont pris leur essor avec la deacutemocratisation dInternet et de laccegraves agravelinformation Le but dun systegraveme de recommandation est comme son nom lindique de recom-mander des ressources agrave lutilisateur pour laiguiller parmi la masse dinformations disponibles Leterme de ressource peut faire reacutefeacuterence agrave un produit une information un lm une musique etcCes ressources doivent correspondre agrave ce quattend lutilisateur pour reacutepondre agrave ses attentesLagrave ougrave dautres meacutethodes daide agrave lutilisateur comme les moteurs de recherche proposerontune liste de sites Internet relatifs agrave une question geacuteneacuterale (ex la requecircte lms super-heacuterosreacutesultera en une liste des lms de super-heacuteros les plus connus etou reacutecents) un systegraveme derecommandation proposera quant agrave lui une reacuteponse plus speacutecique agrave un besoin plus preacutecis (ex un systegraveme recommandera agrave un utilisateur de voir le dernier lm de super-heacuteros du studio Marvelcar ce dernier a appreacutecieacute tous les lms reacutealiseacutes par ce studio speacutecique ces derniegraveres anneacutees) Uneautre speacuteciciteacute majeure des systegravemes de recommandation reacuteside dans le fait que ces derniersreacutepondent agrave un besoin de lutilisateur qui naura pas forceacutement eacuteteacute exprimeacute en amont par cedernier Contrairement aux moteurs de recherche qui se contentent de reacutepondre agrave une requecircte delutilisateur les systegravemes de recommandation proposent quant agrave eux des informations de maniegraverepro-active au moment le plus opportun Un des deacutes majeurs des systegravemes de recommandationen plus de proposer des recommandations au bon moment est de reacuteussir agrave modeacuteliser ce quelutilisateur souhaite reacuteellement alors que les seules donneacutees disponibles proviennent des traceslaisseacutees par les utilisateurs lors des preacuteceacutedentes interactions avec le systegraveme (consultation depages achat de produits visionnage de lms etc) Les systegravemes de recommandation apportentune reacuteelle plus-value par rapport agrave dautres meacutethodes (comme les moteurs de recherche) carlaide proposeacutee se veut tregraves personnaliseacutee selon les preacutefeacuterences de chaque utilisateur Cet objectifde personnalisation entraicircne cependant une complexication du problegraveme car il est neacutecessaire dedeacutenir et de prendre en compte les facteurs humains sous-jacents agrave la satisfaction de lutilisateurlors de la recherche dinformation Nous allons maintenant nous inteacuteresser plus particuliegraverementaux dieacuterentes techniques employeacutees par les systegravemes de recommandation

Les systegravemes de recommandation existent depuis plus de deux deacutecennies et mecircme si les tech-niques ont eacutevolueacute le principe fondamental reste le mecircme identier les besoins et les preacutefeacuterencesdun utilisateur pour lui proposer des ressources adapteacutees Pour ce faire la premiegravere eacutetape estde reacutecolter des informations agrave propos de lutilisateur dans le but didentier ses preacutefeacuterences

1

Chapitre 1 Introduction

Les informations reacutecolteacutees sont deacutependantes du domaine dans lequel est deacuteployeacute le systegraveme derecommandation Sur un site de-commerce le systegraveme pourra par exemple utiliser les produitsconsulteacutes par lutilisateur ainsi que les eacuteventuelles notes sur les produits quil a acheteacute Un sitedeacutecoute de musique exploitera quant agrave lui les titres eacutecouteacutes par lutilisateur ainsi que son com-portement durant leacutecoute (est-ce quil a eacutecouteacute le titre jusquau bout etc)

Durant ces deux deacutecennies dexistence les systegravemes de recommandation ont changeacute pouraccompagner leacutevolution des usages dInternet Les premiegraveres geacuteneacuterations de systegravemes eacutetaientnaturellement adapteacutees aux ressources peu nombreuses et complexes typiques du deacutebut de legraveredInternet Cest agrave cette eacutepoque que les deux grandes cateacutegories de systegravemes de recommandationse sont dieacuterencieacutees agrave savoir le ltrage collaboratif [Resnick et al 1994] et le ltrage par contenu[Belkin and Croft 1992] Dans le ltrage collaboratif les preacutefeacuterences des utilisateurs du systegravemesont utiliseacutees (eg pour un site de recommandation de lms les notes donneacutees par les utilisa-teurs du site sur les lms quils ont vu) Ainsi le systegraveme proposera agrave lutilisateur souhaitant desrecommandations les ressources appreacutecieacutees des autres utilisateurs qui lui sont similaires suivantlhypothegravese selon laquelle les preacutefeacuterences dun ensemble dutilisateurs similaires sont coheacuterentesentre elles Dans le ltrage par contenu les caracteacuteristiques des ressources sont utiliseacutees (egpour un site de recommandation de lms genre acteurs anneacutee de sortie ) Ainsi le systegravemeproposera agrave lutilisateur les ressources similaires agrave celles quil a appreacutecieacutees preacuteceacutedemment Pen-dant longtemps ces deux techniques ont eacuteteacute eacutevalueacutees sur la mesure de preacutecision Pour calculercette mesure les preacutedictions du systegraveme de recommandation sont directement confronteacutees auxdonneacutees reacuteelles recueillies avec de vrais utilisateurs Par exemple un systegraveme calcule quun uti-lisateur pourrait donner agrave un lm une note de 4 sur 5 indiquant quil pourrait eectivementappreacutecier ce lm et quil serait inteacuteressant de lui recommander Cette note calculeacutee de 45 estensuite compareacutee avec la note reacuteelle que cet utilisateur a donneacute agrave ce lm speacutecique note quiavait auparavant eacuteteacute cacheacutee au systegraveme de recommandation pendant les calculs Plus la note preacute-dite et la note reacuteelle sont proches et plus le systegraveme va ecirctre jugeacute preacutecis [Konstan et al 1998]Cette preacutecision peut se mesurer via dieacuterentes meacutetriques comme par exemple lerreur moyenneabsolue qui calcule la deacuteviation entre ce qua preacutedit le systegraveme et les preacutefeacuterences reacuteelles de luti-lisateur [Sammut and Webb 2010] Cette meacutethode bien quintuitive a tendance agrave enfermer lesutilisateurs dans leurs preacutefeacuterences deacutejagrave eacutetablies puisque cest preacuteciseacutement de cette maniegravere queles performances du systegraveme sont jugeacutees Ainsi dans le cas du ltrage par contenu si lutilisateuravait appreacutecieacute par le passeacute un type de ressources particulier le systegraveme tendait agrave lui recomman-der plus de ressources de ce type

Un autre problegraveme provenant de leacutevolution des usages peut ecirctre souleveacute ici Agrave lorigineles systegravemes de recommandation se concentraient dans quelques domaines particuliers commepar exemple les lms ou les produits de sites commerciaux Les recommandations eacutetaient alorspreacutesenteacutees agrave lutilisateur sous forme de ressources uniques ou de liste de ressources similairesCette maniegravere de preacutesenter les recommandations est encore tregraves courante aujourdhui alors queles usages ont eacutevolueacute et que les systegravemes de recommandation sont preacutesents dans un nombre deplus en plus grand de domaines ougrave recevoir une liste de ressources nest pas forceacutement adapteacutePour conclure sur cette partie il est clair que les systegravemes de recommandation ont eacutevolueacute depuisleur creacuteation Cependant des problegravemes demeurent quant agrave leacutevaluation de leurs performances etla satisfaction de lutilisateur nal ainsi que pour la preacutesentation des reacutesultats agrave lutilisateur nal

Prenons maintenant deux exemples qui vont servir agrave illustrer ce propos dans le chapitre Lepremier exemple se concentre sur le problegraveme de leacutevaluation par la preacutecision dans le domaine de

2

11 Introduction

le-commerce Consideacuterons un utilisateur qui consulte depuis quelques temps des appareils photo-graphiques sur un site de vente en ligne Le systegraveme de recommandation deacutetecte ce comportementet calcule les produits les plus similaires disponibles sur le site agrave savoir dautres appareils pho-tographiques Apregraves secirctre deacutecideacute lutilisateur achegravete son appareil et satisfait le reccediloit chez luiquelques jours plus tard Lors de ses prochaines connexions au site de vente en ligne le sys-tegraveme de recommandation proposera encore agrave lutilisateur des appareils photographiques car cesont eectivement toujours ces produits qui correspondent le plus agrave ses preacutefeacuterences mecircme silutilisateur nen a maintenant plus besoin Ce premier exemple montre le problegraveme relatif agrave lasur-utilisation de la preacutecision comme mesure de la performance Si les premiegraveres recommanda-tions baseacutees sur la preacutecision pouvaient ecirctre utiles pour lutilisateur on voit bien quune fois lachateectueacute cette mesure nest plus adapteacutee Des recommandations sur des nouveaux produits pour-raient par exemple ici se reacuteveacuteler inteacuteressantes pour lutilisateur Une autre ameacutelioration possiblepourrait ecirctre la prise en compte de la temporaliteacute Des recommandations dappareils photogra-phiques pourraient ecirctre utiles agrave lutilisateur mais peut-ecirctre dans plusieurs mois ou anneacutees et nonpas directement apregraves son achatOn voit bien ici que le systegraveme de recommandation ne peut passe contenter de la seule mesure de preacutecision et pourrait beacuteneacutecier de lutilisation dautres mesures

Prenons maintenant un deuxiegraveme exemple dans le domaine de le-education pour illustrer lesproblegravemes que peut apporter la preacutesentation des recommandations sous forme de liste agrave lutili-sateur nal Un utilisateur sest inscrit reacutecemment sur un site proposant des cours en ligne caril souhaite apprendre la programmation en Java Il consulte ainsi un cours sur les bases de laprogrammation en Java et le termine avec succegraves Le systegraveme de recommandation du site calculeun certain nombre de ressources eacuteducatives similaires au cours quil vient de suivre et les pro-pose sous forme de liste Lutilisateur se voit donc proposer en tecircte de liste dautres cours pourdeacutebutants en Java ainsi que quelques cours pour deacutebutants dans dautres langages de program-mation dans le reste de la liste Lutilisateur aurait davantage proteacute dune recommandation deplusieurs ressources eacuteducatives sadaptant agrave son niveau et proposant une augmentation de ladiculteacute pour quil poursuive son apprentissage illustrant linteacuterecirct de ne pas uniquement pro-poser des recommandations sous forme de liste On remarque une nouvelle fois que la prise encompte dautres mesures auraient ameacutelioreacute la qualiteacute des recommandations temporaliteacute priseen compte du niveau de lutilisateur diversiteacute des cours proposeacutes etc

Ces deux exemples mettent en exergue la complexiteacute du domaine de la recommandation tantles besoins des utilisateurs peuvent ecirctre varieacutes et complexes agrave satisfaire La satisfaction de lutili-sateur nal est lobjectif central de tout systegraveme de recommandation tout en eacutetant un problegravemeouvert et complexe En eet la satisfaction dun utilisateur nest pas binaire mais continue (unutilisateur nest pas soit satisfait soit non satisfait mais sera plutocirct satisfait de la recommanda-tion agrave un certain degreacute) Nous proposons donc ici daborder ce problegraveme sous un autre angle comment ameacuteliorer la qualiteacute des recommandations fournies agrave lutilisateur dans le but dobtenirde lutilisateur nal une plus haute satisfaction Les deux exemples ci-dessus illustrent leetpotentiellement neacutefaste de proposer des recommandations innaproprieacutees cest-agrave-dire qui ne sa-tisfont pas les besoins de lutilisateur au moment ougrave celui-ci les reccediloit En eet un utilisateur agravequi lon propose de maniegravere reacutecurrente des recommandations innaproprieacutees sera de plus en plusmeacuteant quant agrave la capaciteacute du systegraveme de produire des recommandations adapteacutees agrave ses besoinsau moment t De la mecircme maniegravere un mauvais systegraveme de recommandation ne sera pas utileagrave lutilisateur pour satisfaire ses besoins Il a eacuteteacute prouveacute que ces deux notions de conance etdutiliteacute diminuent chez lutilisateur face agrave un systegraveme de recommandation ne les satisfaisant pas[Benbasat and Wang 2005] Agrave terme ce genre de recommandations peut amener lutilisateur agrave

3

Chapitre 1 Introduction

ne plus utiliser le systegraveme sil ne perccediloit pas la valeur ajouteacutee de celui-ci Les exemples preacuteceacute-dents donnent aussi quelques pistes sur la maniegravere dameacuteliorer la qualiteacute des recommandationsEn eet on peut remarquer que mecircme si les propositions eacutetaient satisfaisantes du point de vueinterne du systegraveme elles ne leacutetaient pas du point de vue externe de lutilisateur Cette contra-diction peut sexpliquer par le fait que le systegraveme ne prend simplement pas assez en compte lesfacteurs deacuteterminant les besoins de lutilisateur Un systegraveme reacuteussissant agrave mieux modeacuteliser unutilisateur et prenant en compte les facteurs les plus importants pour ce dernier dans le processusde recommandation permettrait de mieux satisfaire ses besoins La probleacutematique scientiqueprincipale de cette thegravese peut donc se formuler ainsi

SP0 Comment ameacuteliorer la qualiteacute des recommandations faites aux utili-sateurs

Sinteacuteresser agrave la qualiteacute des recommandations implique de sinteacuteresser agrave leacutevaluation de cesderniegraveres Dans la prochaine section nous deacutetaillerons les deacutes et enjeux de cette probleacutematiqueet son lien avec leacutevaluation puis nous deacutenirons plusieurs sous-probleacutematiques permettant dyapporter des reacuteponses

12 Preacuteambule

Lameacutelioration de la qualiteacute des recommandations des utilisateurs est un vaste sujet auquelil est possible de reacutepondre de multiples faccedilons Il est dabord neacutecessaire de se demander ce quesignie ameacuteliorer la qualiteacute dans cette question Nous avons vu jusquagrave maintenant quun sys-tegraveme de recommandation mesure classiquement la qualiteacute de ses reacutesultats selon une meacutetrique lapreacutecision Cependant la satisfaction de lutilisateur nest pas forceacutement en accord avec cette me-sure comme cela a eacuteteacute illustreacute dans lexemple des appareils photographiques ougrave malgreacute un scorede preacutecision potentiellement tregraves haut lutilisateur peut ne pas ecirctre satisfait des propositionsdu systegraveme La satisfaction de lutilisateur nal peut ecirctre eacutevalueacutee de deux maniegraveres dieacuterentesPremiegraverement elle peut ecirctre mesureacutee directement via un systegraveme deacutevaluation des recommanda-tions ougrave lon demande par exemple agrave lutilisateur de noter la recommandation qui vient de luiecirctre proposeacutee Deuxiegravemement elle peut ecirctre mesureacutee indirectement en observant le comporte-ment de lutilisateur apregraves lui avoir fourni la recommandation [Shani and Gunawardana 2011]Si ce dernier consulte ou consomme la ressource recommandeacutee plutocirct quune autre il est raison-nable de faire lhypothegravese quil est satisfait par cette recommandation cest ce quon appellele taux dacception des recommandations dun systegraveme par rapport agrave un utilisateur Ces deuxmeacutethodes deacutevaluation permettent davoir une ideacutee de la correacutelation entre les meacutetriques internesdu systegraveme et la satisfaction reacuteelle de lutilisateur Il est plus simple de se baser sur des me-sures internes pour eacutevaluer un systegraveme comme la preacutecision plutocirct que sur des mesures externescomme par exemple la satisfaction reacuteelle de lutilisateur eacutetant donneacute que celle-ci demande demettre le systegraveme en ligne et de leacutevaluer apregraves un certain temps dutilisation Leacutevaluation surles seules performances du systegraveme est appeleacutee eacutevaluation hors ligne tandis que leacutevaluation enconditions reacuteelles est appeleacutee eacutevaluation en ligne [Shani and Gunawardana 2011] Leacutevaluationhors ligne mecircme si potentiellement moins apte agrave juger de la satisfaction de lutilisateur oretout de mecircme de nombreux avantages Elle permet premiegraverement de reacutealiser des expeacuteriencesrapidement et agrave bas coucircts eacutetant donneacute quil ny a pas besoin dattendre que les utilisateurs seservent du systegraveme Elle permet ensuite dutiliser des bases de donneacutees deacutejagrave creacuteeacutees permettantaux chercheurs de se concentrer uniquement sur la conception du systegraveme de recommandation(comme par exemple la tregraves connue base de donneacutees MovieLens qui rassemble un grand nombre

4

12 Preacuteambule

deacutevaluations de lms par des utilisateurs sous la forme de notes [Resnick et al 1994]) Ennelle permet de comparer les performances de dieacuterentes techniques de maniegravere objective en lesappliquant agrave un mecircme jeu de donneacutees Autrement dit leacutevaluation en ligne permet dobtenirdes reacutesultats provenant directement dutilisateurs dans un contexte reacuteel mais est tregraves couteuseen temps et en ressource Leacutevaluation hors ligne est quant agrave elle peu couteuse en temps et enressources et permet de reacutealiser autant dexpeacuterimentations que neacutecessaire Dans le contexte decette thegravese ougrave la question de la qualiteacute des recommandations est centrale ces deux meacutethodesdeacutevaluations possegravedent chacune des avantages et des inconveacutenients et seront discuteacutees dans lechapitre deacutedieacutee aux expeacuterimentations du manuscrit

Lameacutelioration de la qualiteacute des recommandations est un point crucial de nos jours tant lessystegravemes de recommandation sont omnipreacutesents dans notre monde Presque tous les grands sitescommerciaux sont deacutesormais doteacutes dun systegraveme de ce genre dans le but de garder lutilisateurplus longtemps sur leur site (Youtube 1 Deezer 2 Netix 3) de le satisfaire pour quil revienne agraveson prochain achat voire mecircme de susciter chez lui de nouvelles envies gracircce agrave la caracteacuteristiquede ces systegravemes decirctre force de proposition (Amazon 4) Les entreprises commerciales ne sontpas les seules agrave exploiter le potentiel des systegravemes de recommandations Les eacutecoles et universiteacutescommencent elles aussi agrave se doter de systegravemes de recommandation permettant aux eacutetudiants desauto-former en utilisant les vastes ressources eacuteducatives mises agrave disposition par celles-ci [Drachs-ler et al 2015] [Boyer et al 2015] De la mecircme maniegravere le domaine de lheacuteritage culturel etdu tourisme seacutequipe petit agrave petit dapplications smartphone permettant aux touristes perdusdevant les possibiliteacutes oertes par certains lieux de culture une aide automatiseacutee et personnaliseacutee[Borragraves et al 2014]

Devant lexplosion de la populariteacute des systegravemes de recommandation devant la complexiteacutegrandissante des ressources agrave recommander et devant laugmentation du nombre dutilisateurs deces systegravemes un constat a eacuteteacute fait proposer constamment des ressources similaires par rapportaux preacutefeacuterences de lutilisateur nest plus susant [McNee et al 2006] De nouvelles eacutetudes etexpeacuterimentations ont montreacute que proposer des recommandations selon dautres modaliteacutes que lapreacutecision pouvait ecirctre beacuteneacuteque Citons ici la mesure de diversiteacute qui a eacuteteacute deacutenie par [Smythand McClave 2001] comme eacutetant linverse de la similariteacute entre deux ressources Ainsi plus deuxressources sont similaires entre elles et moins elles seront diverses et vice versa Proposer desrecommandations plus diversieacutees permet deacuteviter aux utilisateurs de recevoir toujours les mecircmesrecommandations similaires agrave leurs preacutefeacuterences ou encore daugmenter le nombre des ressourcespouvant ecirctre recommandeacutees agrave un utilisateur (cette proportion entre ressources existantes et res-sources pouvant ecirctre recommandeacutees est appeleacutee la couverture dun systegraveme) Citons aussi lamesure de nouveauteacute qui fait quant agrave elle reacutefeacuterence agrave une ressource qui na jamais eacuteteacute vue parlutilisateur [Castells et al 2015] La nouveauteacute permet de remplir un des buts principaux dunsystegraveme de recommandation agrave savoir faire deacutecouvrir agrave lutilisateur des ressources quil nauraitpeut-ecirctre pas trouveacutees sans le systegraveme Il est cependant important de preacuteciser que lapport deces mesures dans les systegravemes de recommandation est aussi discuteacute Par exemple [Ekstrandet al 2014] ont montreacute que si la diversiteacute eacutetait correacuteleacutee positivement avec la satisfaction desutilisateurs ce neacutetait pas le cas de la nouveauteacute Les auteurs expliquent que cette correacutelationneacutegative pourrait ecirctre due au fait quun systegraveme proposant beaucoup de ressources nouvelles sans

1 https wwwyoutubecom2 https wwwdeezercom3 https wwwnetixcom4 https wwwamazoncom

5

Chapitre 1 Introduction

lien avec les preacutefeacuterences de lutilisateur serait mal vu par ce dernier Les auteurs suggegraverent ainside ne pas inteacutegrer de ressources issues de la meacutetrique de nouveauteacute aux nouveaux utilisateurspour leur laisser le temps davoir conance dans le systegraveme avant eacuteventuellement dinteacutegrer dela nouveauteacute dans les recommandations agrave mesure que lutilisateur shabitue au systegraveme

Il apparaicirct donc important dinclure plusieurs critegraveres dans le calcul les recommandationstout en eacutequilibrant ces dieacuterentes recommandations selon lutilisateur Cependant cet eacutequilibreest loin decirctre eacutevident agrave trouver alors que les informations disponibles sur les ressources et les uti-lisateurs sont souvent limiteacutees et que certaines de ces meacutetriques semblent opposeacutees les unes auxautres comme par exemple la similariteacute et la diversiteacute De plus cet eacutequilibre est non seulementameneacute agrave changer selon chaque utilisateur mais il peut aussi varier selon les attentes dun mecircmeutilisateur Ce dernier souhaitera par exemple deacutecouvrir les ressources les plus populaires dansun premier temps apregraves secirctre inscrit sur un site Apregraves avoir consulteacute ces ressources ce mecircmeutilisateur souhaitera peut-ecirctre deacutecouvrir des ressources moins populaires ou plus reacutecentes Il estdonc important de pouvoir modier limportance de chacun de ces facteurs agrave tout moment lorsde la recommandation

Reprenons maintenant le premier exemple de lintroduction sur les appareils photographiquesen proposant cette fois-ci une solution gracircce aux dieacuterentes meacutetriques expliciteacutees ci-dessus Unutilisateur arrive sur un site de vente en ligne et commence agrave consulter du mateacuteriel photogra-phique Le systegraveme neacutetant pas encore certain du but de lutilisateur ses recommandations sontrelativement diverses Apregraves un certain temps lutilisateur qui a aneacute ses recherches sur desappareils photographiques se voit proposer dautres types dappareils similaires agrave celui quil esten train de consulter dans le but de lui faire deacutecouvrir des alternatives possibles Le systegravemedeacutetecte nalement que lutilisateur est sur le point de se deacutecider Il propose alors une liste derecommandations plus diverses permettant agrave lutilisateur deectuer un dernier tour dhorizongeacuteneacuteral avant lachat et de conrmer son choix [Castagnos et al 2010] Apregraves secirctre deacutecideacute aveclaide du systegraveme lutilisateur achegravete son appareil Lors de ses prochaines connexions sur le sitede vente en ligne le systegraveme de recommandation ne proposera peu ou plus dappareils photo-graphiques Agrave la place lutilisateur se verra recommander du mateacuteriel photographique dont ilpourrait maintenant avoir lutiliteacute comme un eacutetui de protection ou encore dieacuterents objectifsLe systegraveme lui recommandera aussi de nouveaux produits quil na encore jamais consulteacute dansle but de lui faire deacutecouvrir la grande varieacuteteacute des produits vendus par le site comme par exempledu mateacuteriel informatique On peut voir ici linteacuterecirct dinteacutegrer de nouveaux facteurs comme ladiversiteacute dans la recommandation La variation du niveau de diversiteacute au cours du temps et enfonction du contexte permet dans cet exemple dameacuteliorer la qualiteacute de la recommandationnale en sadaptant plus nement aux besoins de lutilisateur et en laidant agrave des moments cleacutescomme juste avant ou apregraves son achat Lajout dun facteur comme la diversiteacute permet de plusdeacuteviter la scleacuterose des recommandations passeacute un certain temps cest-agrave-dire la recommandationdes mecircmes ressources en boucle agrave un utilisateur Ce pheacutenomegravene se produit ineacutevitablement dansun systegraveme baseacute uniquement sur la preacutecision ougrave les ressources recommandeacutees nissent toutes parecirctre deacutejagrave connues de lutilisateur ou trop similaires agrave ses goucircts Ce problegraveme peut en fait ecirctreconsideacutereacute comme du sur-apprentissage dans le sens ougrave le systegraveme est tellement speacutecialiseacute sur lespreacutefeacuterences de lutilisateur que quelques ressources obtiennent un tregraves haut score de preacutecisionet sont recommandeacutees en permanence Lintroduction de nouveaux facteurs permettant dautresmaniegraveres de calculer des recommandations ainsi que des variations dimportance entre ces fac-teurs au cours du temps peuvent reacuteduire ce problegraveme

6

12 Preacuteambule

De cet exemple la premiegravere probleacutematique scientique permettant de reacutepondre agrave la questiongeacuteneacuterale poseacutee agrave la n de lintroduction peut ecirctre deacutenie comme suit

SP1 Quels sont les facteurs agrave prendre en compte pour satisfaire les uti-lisateurs et comment adapter leur importance au cas par cas pour chaqueutilisateur

Comme nous lavons eacutevoqueacute preacuteceacutedemment les systegravemes de recommandation se sont gran-dement deacutemocratiseacutes et existent deacutesormais dans la plupart des domaines ougrave se trouvent denombreuses ressources mises agrave disposition de nombreux utilisateurs et ce quelque soit le typede ces ressources Classiquement un systegraveme de recommandation va calculer par divers moyensles ressources que lutilisateur pourraient le plus appreacutecier Le reacutesultat de cette opeacuteration est biensouvent une valeur reacuteelle dutiliteacute ou dinteacuterecirct comprise dans lintervalle [0 1] associeacutee agrave chaqueressource ougrave 1 correspond agrave la preacutediction selon laquelle lutilisateur devrait tregraves fortement appreacute-cier la ressource en question et inversement Ainsi les n ressources ayant les plus hautes valeurssont recommandeacutees agrave lutilisateur Certains domaines comme le-commerce se satisfont tregraves biende recommandations proposeacutees de cette maniegravere sous forme de listes Cependant dautres do-maines comme le-eacuteducation ou le tourisme beacuteneacutecieraient de recommandations proposeacutees auxutilisateurs sous la forme dune seacutequence Nous deacutenissons ici une seacutequence comme une suiteordonneacutee de ressources posseacutedant un deacutebut une n un but et eacuteventuellement une ou plusieurscontrainte(s) agrave respecter lors de sa creacuteation Cette deacutenition implique entre autres de deacutenir ceque signie la notion dordre dans la seacutequence Un ordre correspond agrave un agencement particulierde ressources permettant datteindre le but rechercheacute de maniegravere optimiseacutee Reprenons main-tenant le deuxiegraveme exemple de lintroduction sur le site de-eacuteducation en ajoutant cette fois-cila notion de seacutequence an dillustrer son inteacuterecirct Un utilisateur sest inscrit reacutecemment sur unsite proposant des cours en ligne car il souhaite apprendre la programmation en Java Cepen-dant et avant de commencer le site lui propose de fournir quelques informations sur son objectifeacuteducatif Ainsi lutilisateur explicite lobjectif quil souhaite atteindre (apprendre les bases deJava) ainsi que le temps dont il dispose (exprimeacute par exemple ici sous la forme dun nombre nde ressources eacuteducatives voulues pour atteindre lobjectif) Avec ces informations le systegraveme derecommandation du site va calculer parmi toutes les ressources eacuteducatives disponibles lesquellescorrespondent aux besoins de lutilisateur Le niveau de diculteacute de ces ressources seacutelectionneacuteesest ensuite calculeacute par le systegraveme gracircce agrave leurs caracteacuteristiques Enn le systegraveme construit uneseacutequence de taille n ougrave la place de chaque ressource eacuteducative deacutepend de son niveau de diculteacutede maniegravere agrave ce que lutilisateur deacutebute avec la ressource la moins complexe puis progresse avecdes ressources abordant des notions de plus en plus avanceacutees La seacutequence creacuteeacutee va donc luipermettre datteindre son objectif gracircce agrave des cours agrave la diculteacute croissante tout en respectantla contrainte de temps imposeacutee

Avec cet exemple nous pouvons maintenant expliciter les deuxiegraveme et troisiegraveme probleacutema-tiques scientiques

SP2 Connaissant les facteurs humains agrave prendre en compte (SP1) com-ment passer dune recommandation unitaire agrave une seacutequence de recomman-dations

7

Chapitre 1 Introduction

SP3 Connaissant les facteurs humains agrave prendre en compte (SP1) com-ment les combiner dans un mecircme modegravele permettant de faire varier leurimportance les uns par rapport aux autres agrave tout moment

Le domaine de la recommandation est en plein essor et mecircme si des problegravemes subsistentencore actuellement des solutions existent pour y reacutepondre comme lont illustreacute les exemples ci-dessus La compreacutehension des besoins des utilisateurs la prise en consideacuteration de la dimensiontemporelle et dobjectifs multiples et parfois antagonistes dans le processus de recommandationsont deacutesormais les objectifs principaux du domaine de la recommandation et cest au sein dece mouvement que cette thegravese sinscrit De plus les nouveaux domaines applicatifs souvrantagrave la recommandation (eg le-eacuteducation le tourisme ) sont agrave la fois une chance et un deacute une chance car il devient possible dassister lutilisateur dans un panel de plus en plus grand desituations un deacute dans le sens ougrave les modegraveles doivent ecirctre assez geacuteneacuteriques pour sadapter agravecette grande varieacuteteacute de situations possibles Une derniegravere probleacutematique scientique est toutefoisneacutecessaire dans le cadre de cette thegravese pour compleacuteter ce tour dhorizon Il est en eet neacutecessairede pouvoir quantier agrave quel point SP1 et SP2 ameacuteliorent la qualiteacute des recommandations Nousavons vu dans les exemples preacuteceacutedents que cette qualiteacute neacutetait pas une notion simple agrave mesurermais il est pourtant neacutecessaire de satteler agrave ce problegraveme pour quantier les performances dunmodegravele La 3egraveme et derniegravere probleacutematique de cette thegravese peut donc ecirctre exprimeacutee ainsi

SP4 Comment eacutevaluer les seacutequences produites en SP2 et SP3

Leacutevaluation des recommandations est au cdivideur des nouveaux deacutes eacutevoqueacutes preacuteceacutedemment Ledomaine de la recommandation est intimement lieacute agrave lecirctre humain et il est important de ne plusuniquement se concentrer sur une seule mesure comme la preacutecision Lecirctre humain est complexedans ses besoins et leacutevaluation des recommandations doit reeacuteter cette complexiteacute

13 Contributions

Dans cette thegravese une reacuteponse agrave eacuteteacute apporteacutee agrave chacune des probleacutematiques scientiques eacutenon-ceacutees ci-dessus Ces contributions scientique ont fait lobjet de trois publications

Workshop international SMAP 5 Walk the line Toward an ecient user model

for recommendations in museums [Osche et al 2016] Confeacuterence internationale ECIR 6 AntRS Recommending lists through a multi-

objective ant colony system [Osche et al 2019a] Workshop international ALA 7 organiseacute avec la confeacuterence internationale AAMAS 8

From Music to Museum Applications of Multi-Objective Ant Colony Sys-

tems to Real World Problems [Osche et al 2019b]

Dans la suite de cette section un aperccedilu plus en deacutetail des reacuteponses apporteacutees aux probleacute-matique scientique est donneacute

5 SMAP International Workshop on Semantic Media Adaptation and Personalization

6 ECIR European Conference on Information Retrieval http ecir2019org7 ALA Adaptive and Learning Agents

8 AAMAS International Conference on Autonomous Agents and Multiagent Systems

8

13 Contributions

131 SP1 les facteurs agrave prendre en compte pour satisfaire les utilisateurs

Pour reacutepondre agrave la premiegravere probleacutematique scientique SP1 nous avons seacutelectionneacute un en-semble de quatre critegraveres deacutevaluation repreacutesentant au mieux les besoins de lutilisateur Cescritegraveres ont eacuteteacute choisis car ils apparaissent dans la litteacuterature scientique comme eacutetant lieacutes agravela satisfaction nale de lutilisateur Ils repreacutesentent un panel inteacuteressant de facteurs humainsimportants pour les utilisateurs mais il est important de noter que ce choix nest pas exhaustifComme nous lavons mentionneacute le nombre de facteurs humains rentrant en compte dans la prisede deacutecision est potentiellement inni et varie en fonction de lutilisateur Nous avons donc choisices quatre critegraveres car ils sont les plus eacutetudieacutes dans la litteacuterature mais le but de cette thegravese estde pouvoir inteacutegrer de nouveaux critegraveres de faire varier leur importance si neacutecessaire et de lestraiter comme un problegraveme doptimisation multi-critegraveres Ces quatre critegraveres nous permettentde nous situer par rapport aux travaux existants de la litteacuterature tout en eacutetablissant un modegravelegeacuteneacuterique capable de sadapter agrave de multiples besoins Voici ces quatre critegraveres

1 La similariteacute garantissant agrave lutilisateur des recommandations similaires aux ressourcesquil appreacutecie deacutejagrave

2 La diversiteacute permettant dorir de la varieacuteteacute dans les recommandations

3 La nouveauteacute proposant agrave lutilisateur des ressources quil ne connaicirct et quil nauraitpeut-ecirctre jamais trouveacute lui-mecircme

4 Les preacutefeacuterences orant agrave lutilisateur la possibiliteacute de revoir les ressources quil a deacutejagraveaimeacute par le passeacute

132 SP2 la conception de seacutequences de recommandations en accord avec

les facteurs seacutelectionneacutes

La notion de seacutequence est centrale pour comprendre son inteacuterecirct dans le paysage actuel dessystegravemes de recommandation ainsi que pour ecirctre capable den geacuteneacuterer Dans ce travail nousavons proposeacute une meacutethode permettant de garantir des transitions optimales entre ressourcesau sein dune seacutequence Nous avons ensuite mis en pratique ces contributions dans un jeu dedonneacutees existant provenant de Deezer un site deacutecoute de musique en ligne Ce jeu de donneacuteescorrespond agrave un mois deacutecoutes de titres par plusieurs milliers dutilisateurs et possegravede desinformations sur les titres ainsi que sur les utilisateurs Gracircce agrave ce jeu de donneacutees nous avonspu extraire des seacutequences deacutecoutes et nous avons utiliseacute ces seacutequences reacuteelles comme eacutevaluationpour notre systegraveme Nous avons enn creacuteeacute un modegravele permettant de geacuteneacuterer des seacutequences de lataille voulue posseacutedant un point de deacutepart et darriveacutee deacutenis

133 SP3 et SP4 la creacuteation dun modegravele geacuteneacuterique prenant en compte

plusieurs meacutetriques et produisant des seacutequences

Apregraves avoir deacuteni les meacutetriques agrave utiliser la maniegravere de les calculer et apregraves avoir deacuteni lanotion de seacutequence et la maniegravere de les construire nous avons deacuteveloppeacute un modegravele reacuteunissantlensemble de ces caracteacuteristiques Pour cela nous nous sommes inspireacutes de solutions deacuteveloppeacuteespendant des millions danneacutees par la seacutelection naturelle pour reacutesoudre des problegravemes dexplora-tion et doptimisation de chemins dans la nature Il existe en eet tout un domaine de recherchedeacutedieacute agrave la modeacutelisation informatique de systegravemes vivants complexes et agrave lapplication de cesmodegraveles agrave des problegravemes complexes humains les Systegravemes Multi-Agents [Ferber and Weiss1999] Nous avons utiliseacute lun de ces systegravemes inspireacute des colonies de fourmis pour reacutepondre agrave

9

Chapitre 1 Introduction

notre probleacutematique [Dorigo et al 1996] [Dorigo et al 2006] Dans la nature il a eacuteteacute observeacute queles fourmis empruntaient la plupart du temps le plus court chemin possible entre leur fourmiliegravereet une source de nourriture Une fourmi prise seacutepareacutement na pas des capaciteacutes cognitives tregravesdeacuteveloppeacutees avec ses quelques centaines de milliers de neurones seulement Cependant linter-action entre toutes les fourmis de la fourmiliegravere produit ce quon appelle un eet deacutemergenceLinteraction danimaux simples (ou dagents si lon parle dun systegraveme informatique) provoqueleacutemergence dune intelligence collective capable de reacutesoudre des problegravemes dont la complexiteacute deacute-passe la somme des capaciteacutes des individus [Bonabeau et al 1999] Cest bien ce pheacutenomegravene quiest agrave ldivideuvre lors de loptimisation de la distance dun chemin par toutes les fourmis dune four-miliegravere Nous reviendrons plus en deacutetail sur lensemble des meacutecanismes permettant leacutemergencede cette intelligence collective dans ce manuscrit An de reacutepondre agrave notre probleacutematique nousavons deacuteveloppeacute un modegravele ougrave une multitude dagents tregraves simples (correspondant aux fourmis)sont deacuteployeacutes dans un graphe ougrave les sommets repreacutesentent les ressources dun domaine applicatifet ougrave les arecirctes repreacutesentent les liens entre ces ressources (correspondant agrave lenvironnement agraveparcourir pour les fourmis) An dinteacutegrer les quatre meacutetriques discuteacutees ci-dessus nous avonscreacuteeacute dieacuterentes colonies posseacutedant chacune leurs agents speacutecialiseacutes dans loptimisation dune desmeacutetriques De par le pheacutenomegravene dintelligence collective les agents produisent des seacutequencesoptimiseacutees dans le graphe pouvant ecirctre recommandeacutees agrave lutilisateur Cette approche apporteainsi des solutions aux problegravemes souleveacutes par les probleacutematiques scientiques sus-mentionneacutes

Nous sommes capables de prendre en compte les dieacuterentes meacutetriques expliciteacutees dans unseul et mecircme modegravele De plus nous produisons des solutions repreacutesentant un compromisentre des objectifs parfois divergents entre eux (similariteacute et diversiteacute)

Dans la nature les fourmis creacuteent un chemin entre leur fourmiliegravere et la source de nourri-ture Nous utilisons cette aptitude inheacuterente an de creacuteer des seacutequences entre une ressourcede deacutepart (la fourmiliegravere) et une ressource darriveacutee (la nourriture)

Ladaptation aux changements de lenvironnement est rapide (nouvel utilisateur nouvelleressource suppression dune ressource etc) De la mecircme maniegravere que dans la nature lesfourmis sont capables de retrouver un autre chemin optimiseacute si le premier venait agrave ecirctrebloqueacute par une branche venant de tomber par exemple

Notre modegravele est souple car il permet de modier le poids de chaque meacutetrique dans laseacutequence nale permettant de sadapter agrave chaque utilisateur

Il est possible dajouter ou denlever des colonies agrave la voleacutee dans le systegraveme permettantde sadapter rapidement agrave dieacuterents domaines applicatifs et agrave dieacuterents objectifs

14 Plan de la thegravese

La suite de ce manuscrit se preacutesente ainsi dans le chapitre 2 nous preacutesenterons les travaux dela litteacuterature portant sur les dieacuterents facteurs humains utiliseacutes dans les systegravemes de recomman-dation les approches existantes de recommandations en seacutequences et les systegravemes multi-agentsDans le chapitre 3 nous preacutesenterons notre modegravele et son fonctionnement en deacutetail Ensuitenous preacutesenterons les reacutesultats obtenus par ce modegravele dans le domaine applicatif de leacutecoute demusique en ligne dans le chapitre 4 Enn nous conclurons et discuterons des perspectives de cetravail dans le chapitre 5

10

Chapitre 2

Eacutetat de lart

Sommaire

21 Les systegravemes de recommandation 12

211 Le ltrage par contenu 12

212 Le ltrage collaboratif 13

213 Les actions des utilisateurs 13

214 Discussion et limites des systegravemes classiques 14

22 Les facteurs humains agrave prendre en compte dans la recommandation 15

221 La similariteacute 17

222 La diversiteacute 19

223 La nouveauteacute 20

224 Discussion 21

23 La recommandation en seacutequence 22

231 Deacutenition et geacuteneacuteraliteacutes sur les seacutequences 22

232 Domaines dapplication des modegraveles seacutequentiels 26

233 Discussion 30

24 Les systegravemes multi-agents 31

241 Deacutenition 31

242 Preacutesentation de deux systegravemes multi-agents reacuteactifs 33

243 Ant Colony System 38

244 Discussion sur le modegravele ACS 40

25 Utilisation et eacutevolution reacutecentes des algorithmes de colonies de four-

mis 43

251 Les algorithmes de colonies de fourmis dans les systegravemes de recomman-

dation 43

252 Les algorithmes de colonies de fourmis multi-objectifs 47

253 Discussion sur lutilisation de loptimum de Pareto 50

26 Discussion geacuteneacuterale 50

11

Chapitre 2 Eacutetat de lart

Dans cet eacutetat de lart nous allons tout dabord nous pencher sur le fonctionnement dessystegravemes de recommandation classiques ainsi que sur leurs limites Nous allons ensuite eacutetudierquelques reacuteponses agrave ces limites proposeacutees par la litteacuterature et discuter des ameacuteliorations possibles

21 Les systegravemes de recommandation

Les systegravemes de recommandation ont pour but principal de proposer aux utilisateurs desressources adapteacutees agrave leurs attentes Une ressource peut ecirctre un document une page web unemusique un lm un livre un objet un cours etc Pour eectuer une recommandation une hy-pothegravese simple a eacuteteacute exploiteacutee par les premiers systegravemes les preacutefeacuterences passeacutees dun utilisateurpeuvent ecirctre utiliseacutees pour preacutedire les preacutefeacuterences futures de ce mecircme utilisateur Cette hypothegravesesest deacuteclineacutee dans les deux approches principales des systegravemes de recommandation que sont leltrage par contenu [Belkin and Croft 1992 Lops et al 2011] et le ltrage collaboratif [Resnicket al 1994] La principale dieacuterence entre ces deux approches repose sur lexploitation de dieacute-rents types des donneacutees le ltrage par contenu utilise les informations descriptives caracteacuterisantles utilisateurs et les ressources du systegraveme tandis que le ltrage collaboratif exploite uniquementles interactions entre utilisateurs et ressources comme les consultations ou les votes [Aggarwalet al 2016] Ces deux familles ont par la suite donneacute naissance a de nombreuses techniquesque nous naborderons pas ici Toutes peuvent cependant ecirctre rapporteacutees agrave lune ou lautre deces familles ou agrave une combinaison des deux Dans la suite de cette section nous reviendronsrapidement sur ces deux familles qui ont marqueacute les deacutebuts des systegravemes de recommandationet qui regroupent agrave elles seules un grand nombre darticles de la litteacuterature du domaine Cetteintroduction aux systegravemes de recommandation servira aussi agrave preacutesenter quelques concepts-cleacuteslieacutes agrave ces systegravemes

211 Le ltrage par contenu

Le ltrage par contenu est une des deux approches majeures dans les systegravemes de recomman-dation [Belkin and Croft 1992 Lops et al 2011] Le but dun systegraveme de ltrage par contenu estde proposer des recommandations agrave lutilisateur uniquement en fonction des caracteacuteristiques desressources appreacutecieacutees Ce genre de systegraveme va donc enregistrer les actions de lutilisateur sur lesressources quil a consulteacutees dans le but de trouver dautres ressources quil pourrait appreacutecierCette meacutethode de fonctionnement implique deux principes

1 Le systegraveme doit pouvoir enregistrer les actions de lutilisateur dans le systegraveme 9 Le sys-tegraveme doit ensuite pouvoir interpreacuteter ces dieacuterentes actions an decirctre capable deacutevalueragrave quel point un utilisateur appreacutecie la ressource sur laquelle il a eectueacute des actions Nousdiscuterons de ces actions et des maniegraveres de les interpreacuteter plus en deacutetail dans la suitede cette section

2 Le systegraveme doit pouvoir comparer des ressources entre elles an de deacuteterminer lesquellespourraient ecirctre appreacutecieacutees par lutilisateur en fonction de son historique de consultationsPour reacutealiser cela il est neacutecessaire que les ressources soient deacutecrites par ce que lon appelledes meacuteta-donneacutees cest-agrave-dire des donneacutees deacutecrivant dautres donneacutees ou comme ici desdonneacutees deacutecrivant des ressources Il est dusage de deacutenir ou dutiliser des standards pour

9 Des exemples dactions possibles consulter une ressource donner une note agrave une ressource acheter uneressource bannir une ressource pour ne plus la voir placer une ressource dans ses favoris etc

12

21 Les systegravemes de recommandation

les meacuteta-donneacutees an de deacutecrire toutes les ressources de la mecircme maniegravere et eacuteventuelle-ment de pouvoir partager ou utiliser des bases de donneacutees utilisant les mecircmes standardsOn peut par exemple citer le Learning Object Metadata qui est un standard utiliseacute ene-eacuteducation pour deacutecrire des ressources eacuteducatives [RISK 2002] Des domaines commele web seacutemantique ou les systegravemes agrave base dontologie ont comme but de structurer cesdonneacutees descriptives lorsquelles ne le sont initialement pas

Le ltrage par contenu a lavantage de pouvoir fournir des recommandations agrave un utilisateurmecircme sil est le seul agrave utiliser le systegraveme tant que ce dernier possegravede des informations sur lesressources consulteacutees Cependant la qualiteacute des recommandations deacutependra directement de laqualiteacute de ces informations Si les actions de lutilisateur ou les descriptions de ressources sontinsusantes un systegraveme de ltrage par contenu ne sera pas capable de proposer de recommanda-tions de grande qualiteacute Une autre limite majeure de ce genre de systegraveme reacuteside dans le manquede nouveauteacute En eet apregraves un certain temps les recommandations proposeacutees par le systegravemeont un risque de scleacuterose provoqueacute par un manque de nouvelles informations dans le systegraveme

212 Le ltrage collaboratif

La deuxiegraveme approche majeure des systegravemes de recommandation est donc le ltrage colla-boratif [Resnick et al 1994] Cette technique utilise les preacutefeacuterences des autres utilisateurs dusystegraveme sur les ressources pour estimer les preacutefeacuterences de lutilisateur Lhypothegravese sous-jacentea cette meacutethode est quil est possible de preacutedire les preacutefeacuterences dun utilisateur en eacutetudiant ce quedautres utilisateurs similaires en termes de preacutefeacuterences ont aimeacute Si beaucoup de ces utilisateurssimilaires ont appreacutecieacute une ressource alors il est probable que lutilisateur appreacutecie aussi cetteressource Cette meacutethode repose ici aussi sur deux principes

1 Comme pour le ltrage par contenu il faut dabord pouvoir collecter les actions de nom-breux utilisateurs sur les ressources du systegraveme an den deacuteterminer leurs preacutefeacuterences

2 Le systegraveme doit ensuite deacuteterminer les utilisateurs les plus similaires agrave lutilisateur enterme de preacutefeacuterences avec pour but nal de lui recommander des ressources quil na pasencore consulteacute et qui sont appreacutecieacutees par ces utilisateurs similaires

Le ltrage collaboratif permet par rapport au ltrage par contenu de proposer des recom-mandations agrave lutilisateur sans forceacutement connaicirctre le contenu des ressources recommandeacutees Eneet le systegraveme ne manipule que des preacutefeacuterences geacuteneacuterales souvent repreacutesenteacutees numeacuteriquementpar une note associeacutee agrave une ressource et agrave un utilisateur En dautres termes le ltrage col-laboratif sinteacuteresse agrave lusage qui est fait des ressources et non aux ressources en elles-mecircmesUne fois ces preacutefeacuterences eacutetablies ce genre de systegraveme peut donc sadapter agrave des domaines ougraveles ressources sont dieacuterentes Cependant il est aussi neacutecessaire davoir agrave disposition un grandnombre dutilisateurs ainsi que leurs preacutefeacuterences an de pouvoir utiliser ce genre de systegravemecorrectement

213 Les actions des utilisateurs

Comme nous lavons deacutecrit plus haut peu importe le type de systegraveme de recommandationutiliseacute il est neacutecessaire de reacutecolter les actions des utilisateurs an dobtenir une eacutevaluation desressources quils ont consulteacutees Cette eacutevaluation prend la plupart du temps la forme dune noter entiegravere variant de 1 agrave 5 ou dune valeur continue r isin [0 1] ougrave dans les deux cas une preacutefeacuterence

13

Chapitre 2 Eacutetat de lart

marqueacutee correspond agrave une valeur haute et inversement Dune maniegravere geacuteneacuterale on nommeretours les informations reacutecupeacutereacutees par un systegraveme sur un utilisateur permettant daboutir agravecette note Dans les systegravemes de recommandation on peut distinguer deux types de retours le retour explicite et le retour implicite Le retour explicite est le plus simple des deux puisquilcorrespond agrave la situation ougrave lutilisateur fournit naturellement de lui-mecircme la note associeacutee agrave uneressource quil a consulteacutee Cette maniegravere de proceacuteder est courante dans le-commerce ou dansle divertissement ougrave les utilisateurs peuvent geacuteneacuteralement noter de 1 agrave 5 le produit quils ontacheteacute ou encore le lm quils ont vu Cette meacutethode permet dacceacuteder agrave leacutevaluation reacuteelle delutilisateur et agrave ses preacutefeacuterences orant de maniegravere directe des donneacutees de haute qualiteacute [Korenet al 2009] Agrave linverse le retour implicite repreacutesente les traces laisseacutees par lutilisateur lors desa preacutesence dans le systegraveme Ces traces ne sont pas directement des eacutevaluations ou des notes maisrepreacutesentent bien les dieacuterentes possibiliteacutes dactions quore un systegraveme agrave ses utilisateurs Cesactions diegraverent donc selon le domaine dapplication du systegraveme Pour un site web de-commerceles actions pourront ecirctre la consultation dune page la consultation dune che produit la misedun produit dans le panier ou encore lachat dun produit Pour un site web deacutecoute de musiqueles actions pourront ecirctre leacutecoute dune musique en entier larrecirct de leacutecoute dune musique avantla n la consultation de la page dun artiste etc On voit bien ici que les actions possiblessont deacutependantes du domaine mais aussi que toutes les actions nont pas la mecircme importanceni la mecircme signication On peut en eet supposer quun utilisateur appreacuteciera davantage unproduit sil lachegravete que sil consulte seulement sa page On retrouve cette distinction dans [Oardet al 1998] ougrave les auteurs deacutenissent trois cateacutegories permettant de grouper les actions de mecircmeimportance ensemble (1 consultation de la ressource 2 conservation de la ressource 3 partagede la ressource) On peut aussi citer [Castagnos 2008] qui dune maniegravere plus geacuteneacuterale proposeune meacutethode permettant de calculer linteacuterecirct preacutesumeacute dun utilisateur pour une ressource selonles types dactions eectueacutees par lutilisateur et leurs importances respectives An de conclurecette section il est important de preacuteciser que mecircme si le retour explicite semble plus deacutesirablepour les systegravemes de recommandation il a eacuteteacute montreacute que ces deux types de retours apportentdes informations dieacuterentes et quil peut justement ecirctre inteacuteressant de les prendre tous les deuxen compte [Jawaheer et al 2010]

214 Discussion et limites des systegravemes classiques

Dans les deux approches de recommandation preacutesenteacutees ci-dessus le problegraveme et la solutionsont fondamentalement les mecircmes Le problegraveme peut se formuler ainsi comment estimer linteacuterecirctr qua un utilisateur u sur une ressource i encore non consulteacutee en se basant sur les connaissancesincomplegravetes repreacutesenteacutees par le prol de lutilisateur u Le prol de lutilisateur est incompletcar les informations sur ses preacutefeacuterences proviennent uniquement des interactions que ce dernier aeu avec le systegraveme Autrement dit il nest pas possible de connaicirctre les facteurs ayant abouti auxactions de lutilisateur puisque ces derniegraveres sont le fruit des meacutecanismes de raisonnement internede lutilisateur Il nest par exemple pas possible de savoir reacuteellement pourquoi un utilisateur adonneacute la note de 5 sur 5 agrave un lm Est-ce parce quil considegravere que cest le meilleur lm quil a vude sa vie et quil aimerait deacutecouvrir plus de lms de ce genre Ou bien est-ce parce que cest unlm quil a vu dans un contexte particulier et que mecircme sil la beaucoup aimeacute il ne souhaiteraitpas revoir des lms similaires aujourdhui Il existe ainsi probablement une multitude de facteursjouant dans les actions que nous eectuons et il nest pas possible de tous les appreacutehender Devantce constat la solution adopteacutee par les deux approches est la mecircme se baser sur les preacutefeacuterencesconnues de lutilisateur pour extrapoler ses preacutefeacuterences futures potentielles Cependant et commenous lavons vu dans lexemple de lintroduction sur les appareils photo il est aiseacute de concevoir

14

22 Les facteurs humains agrave prendre en compte dans la recommandation

des situations ougrave les preacutefeacuterences et actions passeacutees dun utilisateur ne sont pas forceacutement lesmeilleurs indicateurs de ses besoins actuels ou futurs

22 Les facteurs humains agrave prendre en compte dans la recom-

mandation

Comme nous lavons vu dans la section preacuteceacutedente la performance des premiers systegravemes derecommandation a eacuteteacute mesureacutee avec les outils du domaine de la recherche dinformation Parmiceux-ci on peut citer la preacutecision et le rappel qui sont deux mesures permettant de jauger la per-tinence des ressources seacutelectionneacutees en les comparant avec lensemble des ressources disponiblesLa Figure 21 preacutesente bien la maniegravere dont ces deux mesures sont calculeacutees 10

Figure 21 Preacutesentation scheacutematiseacutee du calcul de la preacutecision et du rappel en fonction desressources trouveacutees par rapport agrave lensemble des ressources disponibles (creacutedit image Datamok UserWalber)

Plusieurs raisons peuvent expliquer pourquoi les systegravemes de recommandations ont initiale-ment emprunteacute des techniques venant de la recherche dinformation et en voici trois parmi lesplus eacutevidentes Premiegraverement les systegravemes de recommandation sont agrave la croiseacutee de plusieurs

10 httpsfrwikipediaorgwikiPreacutecision_et_rappel

15

Chapitre 2 Eacutetat de lart

disciplines parmi lesquelles entre autres la recherche dinformation [Adomavicius and Tuzhilin2005] Ce domaine a beaucoup utiliseacute et utilise toujours les mesures de preacutecision et de rappel[Salton 1989] il est donc naturel que les premiers systegravemes de recommandation aient utiliseacuteces mesures de performance Deuxiegravemement tregraves tocirct dans le domaine des systegravemes de recom-mandation des corpus de donneacutees ont eacuteteacute mis agrave disposition de tous tel que MovieLens 11 gracircceagrave GroupLens [Resnick et al 1994] Ces corpus de donneacutees ont beaucoup aideacute le domaine enpermettant agrave tous les chercheurs de mesurer la performance de leurs algorithmes en les com-parant avec les reacutesultats obtenus par dautres eacutetudes de la litteacuterature sur les mecircmes donneacuteesLa populariteacute toujours haute du corpus MovieLens depuis maintenant 25 ans illustre linteacuterecirctscientique de partager des donneacutees initiales Cependant lutilisation principale des meacutetriquesde preacutecision pour eacutevaluer la performance des premiers systegravemes de recommandation a meacutecani-quement pousseacute les autres auteurs voulant comparer leurs algorithmes agrave utiliser eux aussi cesmecircmes meacutetriques rareacuteant potentiellement le travail sur dautres meacutetriques Troisiegravemement lemesure de la performance des algorithmes en fonction de la preacutecision megravene forceacutement agrave la creacutea-tion dalgorithmes de plus en plus performants dans ce domaine Les chercheurs sont en eet plusenclins agrave deacutevelopper des algorithmes optimisant la mesure de preacutecision si la performance de lamajoriteacute des algorithmes existants est mesureacutee via cette meacutetrique Ce point mecircme sil est lieacute aupreacuteceacutedent nest pas agrave neacutegliger et explique en partie la concentration des premiers systegravemes surla meacutetrique de preacutecision La recherche dans le domaine de linformatique est compeacutetitive et lesrevues scientiques accepteront plus facilement de publier un article montrant quun algorithmeobtient de meilleures performances sur une meacutetrique bien connue plutocirct quune eacutetude reposantsur dautres meacutetriques moins communes

Apregraves ces explications donnant quelques raisons systeacutemiques de lutilisation de la preacutecisioncomme mesure deacutevaluation il est neacutecessaire de nuancer ce constat La preacutecision a beaucoup eacuteteacuteutiliseacutee car avant toute chose elle est au cdivideur des systegravemes de recommandation et doit doncecirctre consideacutereacutee par tous ces systegravemes Le but de lutilisation de la preacutecision est dobtenir desrecommandations proches de ce que lutilisateur a deacutejagrave consulteacute et donc appreacutecie deacutejagrave Il est im-portant de preacuteciser aussi ici que malgreacute les critiques faites dans le paragraphe preacuteceacutedent sur cettemesure il est indispensable de la conserver et de lutiliser lors du processus de recommandationUn utilisateur souhaite avant tout se voir proposer des ressources pertinentes et il convient pourun systegraveme dutiliser la preacutecision pour arriver agrave cet objectif Il est cependant neacutecessaire de ne pasuniquement consideacuterer la preacutecision pour produire de bonnes recommandations et nous allons levoir dans la suite de cette section

Nous venons de voir quelques-unes des raisons de lomnipreacutesence de leacutevaluation par la preacuteci-sion au deacutebut des systegravemes de recommandation Nous allons maintenant eacutetudier les conseacutequencesque la sur-utilisation de la preacutecision a pu avoir sur les utilisateurs en se basant agrave la fois sur lalitteacuterature et sur des constatations empiriques Pour comprendre les limites de cette meacutetrique ilest tout dabord neacutecessaire de sinteacuteresser agrave ce que repreacutesente une recommandation preacutecise pourlutilisateur nal Nous lavons vu preacuteceacutedemment plus un modegravele sapproche des preacutefeacuterences deacutejagraveconnues dun utilisateur et plus il obtiendra de bonnes performances dans les meacutetriques mesurantla preacutecision Dans la pratique cela se traduit par le systegraveme proposant agrave lutilisateur nal desressources souvent deacutejagrave connues de celui-ci ou a minima des ressources tregraves proches de ce quilaime deacutejagrave [McNee et al 2006] Un utilisateur dun site de recommandation de lms indiquantquil a aimeacute le premier lm Star Wars se verra probablement recommander une liste de tous les

11 httpsgrouplensorgdatasetsmovielens

16

22 Les facteurs humains agrave prendre en compte dans la recommandation

lms Star Wars suivants Intuitivement on voit bien que ces recommandations ne seront proba-blement pas satisfaisantes pour lutilisateur bien queacutetant les plus preacutecises possibles par rapportagrave ses preacutefeacuterences Ces lms sont anciens connus et il ny a donc que tregraves peu de chances pour quelutilisateur nen ait pas deacutejagrave connaissance On peut imaginer que lutilisateur aurait souhaiteacuteque le systegraveme lui propose des lms de science-ction ou de guerre spatiale reacutecents ou du moinsquil ne connaissait pas encore Plus que de ne pas ecirctre utiles ce genre de recommandations peutmecircme deacutegrader linteacuterecirct et la conance que lutilisateur porte au systegraveme En eet un utilisa-teur recevant beaucoup de recommandations inutiles ou deacutejagrave connues de la part dun systegravemenira par ne plus lui accorder de limportance Cet argument peut ecirctre rapprocheacute du TechnologyAcceptance Model de Fred Davis sur la maniegravere dont les utilisateurs appreacutehendent une technolo-gie [Davis 1989] et notamment sur la notion dutiliteacute perccedilue qui fait reacutefeacuterence agrave la tendancequont les personnes agrave utiliser une technologie si cela leur permet de reacutealiser plus ecacementleur tacircche en cours (comme par exemple trouver un bon lm ou deacutecouvrir une nouvelle musique)Pour conclure il semble eacutevident que de nouvelles maniegraveres de concevoir et deacutevaluer les systegravemesde recommandation sont neacutecessaires Dans la suite de cette section nous allons voir commentlinteacutegration de facteurs humains suppleacutementaires dans le processus de recommandation et lamise en place de nouvelles maniegraveres deacutevaluer la qualiteacute des recommandations nales doiventpermettre de palier les problegravemes eacutevoqueacutes preacuteceacutedemment

221 La similariteacute

Comme nous lavons vu dans la section preacuteceacutedente limportance de la similariteacute dans lessystegravemes de recommandation est eacutevidente tant ces derniers ont longtemps eu comme but principalde proposer des ressources proches autrement dit similaires de ce quappreacuteciait deacutejagrave lutilisateurNous avons vu que la preacutecision a beaucoup eacuteteacute utiliseacutee pour eacutevaluer ces systegravemes mais il eacutetaitaussi neacutecessaire de deacuteterminer agrave quel point des ressources etou des utilisateurs eacutetaient prochesles uns des autres En eet les approches les plus utiliseacutees comme le ltrage collaboratif ou leltrage par contenu neacutecessitent souvent de deacuteterminer un ensemble dutilisateurs ou un ensemblede ressources proches des goucircts de lutilisateur Pour ce faire ces systegravemes vont utiliser desmeacutetriques permettant de juger la similariteacute de deux variables entre elles On retrouve parmi cesmeacutetriques le coecient de correacutelation de Pearson qui calcule la correacutelation lineacuteaire r entre deuxvariables agrave laide de leur covariance Cette correacutelation peut ecirctre appliqueacutee agrave des prols utilisateurs[Shardanand and Maes 1995] posseacutedant des eacutevaluations communes sur des ressources LEacutequation21 deacutecrit son calcul pour deux prols utilisateurs ux et uy

ruxuy =

sumn1 (uxi minus ux)times (uyi minus uy)radicsumn

1 (uxi minus ux)2 timessumn

1 (uyi minus uy)2(21)

ougrave n est le nombre de co-consultations des deux prols utilisateurs ux et uy uxi est une noteindividuelle du prol de lutilisateur ux et ux est la moyenne des notes dans le prol ux Classi-quement les eacutevaluations des ressources co-consulteacutees sont consideacutereacutees pour calculer la correacutelationde Pearson dont la valeur r isin [minus1 1] ougrave une valeur proche de 1 signie une correacutelation posi-tive entre les utilisateurs (autrement dit une forte similariteacute entre les deux) minus1 une correacutelationneacutegative (autrement dit une forte dissimilariteacute entre les deux utilisateurs) et 0 une absence decorreacutelation lineacuteaire entre les deux prols 12

12 Une valeur de correacutelation de Pearson r = 0 signie uniquement une absence de correacutelation lineacuteaire entre lesdeux variables eacutetudieacutees Il est cependant possible quune correacutelation non lineacuteaire existe entre ces deux variables

17

Chapitre 2 Eacutetat de lart

On peut aussi citer la tregraves utiliseacutee similariteacute cosinus permettant de calculer langle formeacute pardeux vecteurs Cette ideacutee a dabord eacuteteacute proposeacutee dans le domaine de la recherche dinformationan de comparer deux documents repreacutesenteacutes sous forme de vecteurs doccurrences de mots[Salton and McGill 1986] Cette mesure a ensuite eacuteteacute adapteacutee pour le ltrage collaboratif enremplacant les documents par les utilisateurs les mots par les ressources et les occurrences parles votes [Breese et al 2013] 13 Le calcul de la similariteacute cosinus est preacutesenteacute dans lEacutequation22

Cosine_Similarity(u1 u2) =

sumu1u2radicsumu21radicsum

u22(22)

ougrave comme pour le coecient de correacutelation de Pearson on considegravere uniquement les eacuteva-luations des ressources co-consulteacutees par les deux utilisateurs dans le calcul Beaucoup dautresmesures de similariteacute existent dans le cadre de la comparaison de deux variables entre elles etchacune possegravede des avantages et des inconveacutenients Lensemble de ces mesures ont cependantpour point commun de mesurer la similariteacute entre deux ressources uniquement et on peut tou-tefois apporter quelques critiques agrave ce genre de mesures En eet [McNee et al 2006] critiquejustement le fait que les mesures classiques calculent geacuteneacuteralement la preacutecision de chaque res-source recommandeacutee une par une Cependant limmense majoriteacute des recommandations sontproposeacutees via des listes agrave lutilisateur et non via une seule ressource On peut le voir chez tousles grands sites utilisant un systegraveme de recommandation tels que Netix 14 Youtube 15 Ama-zon 16 Deezer etc Cette maniegravere de calculer la preacutecision ressource par ressource peut provoquerleacutemergence de listes de recommandations posseacutedant des ressources toutes similaires entre ellesLe site de recommandation de lms proposant agrave un utilisateur la liste de tous les lms Star Warssoure de ce problegraveme Toutes ces recommandations sont preacutecises et similaires par rapport auxpreacutefeacuterences de lutilisateur mais les meacutetriques classiques ne donnent aucune indication sur ledegreacute de similariteacute de ces recommandations entre elles dans la liste proposeacutee agrave lutilisateur Unemaniegravere de mitiger ce problegraveme est de calculer la similariteacute non plus ressource par ressourcemais pour la liste entiegravere La similariteacute intra-liste permet justement de calculer agrave quel point lesressources dune liste sont similaires entre elles [Ziegler et al 2005] La similariteacute de chaque pairede ressources est calculeacutee et la moyenne est ensuite calculeacutee pour obtenir agrave une valeur uniquemesurant agrave quel point la liste dans son ensemble possegravede des ressources similaires entre elles

ILS(u) =

sumijisinL

sumikisinLij 6=ik sim(ij ik)

2(23)

ougrave ILSu est la similariteacute intra-liste dun utilisateur u ij et ik sont deux ressources de laliste recommandeacutee L et sim(ij ik) est la similariteacute des deux items ij et ik similariteacute pouvantecirctre calculeacutee dieacuteremment selon la meacutethode utiliseacutee (similariteacute cosinus similariteacute de Jaccardetc) Cette maniegravere de proceacuteder est inteacuteressante car premiegraverement elle deacutenote avec les mesuresclassiques et permet de proposer une liste plus homogegravene plaisante pour lutilisateur et nonplus uniquement sur les performances pures des systegravemes Deuxiegravemement le fait de consideacutererla liste de recommandations comme un tout et non plus uniquement comme des ressourcesaligneacutees les unes agrave la suite des autres permet de se rapprocher de la notion de seacutequence dontnous allons parler dans la suite de cette section Enn larticle de [McNee et al 2006] dont

13 Il est agrave noter quune variante de la mesure de similariteacute cosine sappliquant aux ressources et non auxutilisateurs a aussi eacuteteacute deacuteveloppeacutee14 httpswwwnetixcom15 httpswwwyoutubecom16 httpswwwamazoncom

18

22 Les facteurs humains agrave prendre en compte dans la recommandation

est tireacutee cette reacuteexion marque un tournant dans le domaine des systegravemes de recommandationavec la critique de la sur-utilisation de la similariteacute et linteacutegration dautres facteurs humainsToutefois dans le contexte de cette thegravese ce constat doit ecirctre nuanceacute En eet la similariteacute a eacuteteacutela meacutetrique reine pendant plusieurs anneacutees dans le domaine de la recommandation pour mesurerla performance des modegraveles Cette omnipreacutesence a provoqueacute lessor dun nouveau pan de larecherche portant sur dautres facteurs humains et dautres meacutetriques deacutevaluation Neacuteanmoinsla similariteacute reste une meacutetrique centrale dans la mesure des performances dun algorithme etdans la qualiteacute perccedilue des recommandations des utilisateurs comme lont montreacute les multitudesdeacutetudes utilisant principalement cette meacutetrique Il est donc naturel que cette meacutetrique soitinteacutegreacute dans notre modegravele comme un objectif Notre approche se veut cependant multi-objectifset nous allons preacutesenter dans la suite de cette section les autres objectifs agrave consideacuterer

222 La diversiteacute

La diversiteacute est une des meacutetriques ayant attireacute le plus lattention de la communauteacute scien-tique des recommandations ces derniegraveres anneacutees La diversiteacute est au cdivideur du changement deparadigme du domaine et larticle de McNee amp al justement intituleacute Being accurate is not en-ough how accuracy metrics have hurt recommender systems 17 repreacutesente bien ce changement[McNee et al 2006] Dans cet article les auteurs expliquent que jusqualors la majoriteacute desrecherches seacutetaient eacutetroitement concentreacutees sur lameacutelioration de la preacutecision des systegravemes Ilssoutiennent cependant que cet eacutetat de fait a nui au domaine en nencourageant pas les recherchesallant dans dautres directions et a aussi nui aux utilisateurs car les recommandations les pluspreacutecises ne sont pas forceacutement les meilleures pour ces derniers Mecircme si ce constat a eacuteteacute fait il y aplus dune deacutecennie la preacutecision est toujours tregraves utiliseacutee dans le domaine des recommandationsPar conseacutequent il nest pas rare de trouver des eacutetudes tregraves reacutecentes se deacutemarquant encore enprocircnant lutilisation dautres mesures [Gan et al 2020]

La diversiteacute et la similariteacute sont deux mesures extrecircmement lieacutees et ont souvent eacuteteacute deacutecritesensemble La similariteacute intra-liste preacutesenteacutee dans la section preacuteceacutedente est un exemple de ce lienpuisque cette mesure permet de faire varier le taux de similariteacute ou inversement de diversiteacutedune liste de ressources Dans [Smyth and McClave 2001] les auteurs soutiennent lideacutee quelorsque plusieurs ressources sont proposeacutees il est important de mesurer agrave la fois la similariteacutede chacune de ces ressources par rapport agrave la cible (pouvant ecirctre par exemple un modegraveleutilisateur) mais aussi la diversiteacute de chacune de ces ressources entre elles Le deacute revient alorsagrave ameacuteliorer la diversiteacute des ressources entre elles sans compromettre leur similariteacute par rapport agravela cible Les auteurs deacutenissent ainsi la diversiteacute dun ensemble de ressources (i1 in) commela dissimilariteacute moyenne entre toutes les paires de ressources illustreacute dans lEacutequation 24 ougrave ladissimilariteacute est deacutenie comme eacutetant linverse de la similariteacute

Diversity(i1 in) =

sumi=1n

sumj=1n(1minus Similarity(ii ij))

n2 lowast (nminus 1)

(24)

Il existe plusieurs interpreacutetations et deacutenitions de la diversiteacute dans les systegravemes de recom-mandation mais nous nutiliserons ici que la plus reacutepandue vue ci-dessus la diversiteacute sappliqueagrave un ensemble de ressources et correspond agrave la mesure moyenne de la dissimilariteacute par rapportagrave chacune dentre elles Pour compleacutementer cette deacutenition qui permet dintroduire une valeurgeacuteneacuterale de diversiteacute pour une liste de ressources nous pouvons preacutesenter ici la notion de diversiteacute

17 Ecirctre preacutecis nest pas susant comment les mesures de preacutecision ont nui aux systegravemes de recommandation

19

Chapitre 2 Eacutetat de lart

relative RD 18 qui consiste agrave calculer lapport en diversiteacute de chaque ressource i agrave un ensemblede ressources C 19 [Smyth and McClave 2001] La RD permet dobserver les changements dansla diversiteacute de la liste au moment mecircme de sa construction agrave chaque fois que le systegraveme ajouteune nouvelle ressource agrave la liste deacutejagrave existante La maniegravere de la calculer est expliqueacutee danslEacutequation 25

RD(i C) =

0 si C = sum

i=1m(1minus Similarity(i cj))

m sinon

(25)

La diversiteacute est aujourdhui reconnue comme une mesure importante agrave prendre en comptedans les systegravemes de recommandation car permettant dameacuteliorer la satisfaction de lutilisateur[Jones 2010] Cependant il est important de savoir utiliser la diversiteacute agrave bon escient et au bonmoment Comme lexemple donneacute dans lintroduction agrave propos des appareils photos le montraitlinteacuterecirct de la diversiteacute dans la recommandation deacutepend de nombreux facteurs comme lutilisa-teur son ancienneteacute dans le systegraveme le contexte de sa visite le moment de la recommandationetc Certains travaux se sont ainsi concentreacutes sur la dimension temporelle de la diversiteacute et surlimpact que cette derniegravere avait selon le contexte de la recommandation On peut citer [Mc-Ginty and Smyth 2003] dont leurs travaux portent sur le rocircle de la diversiteacute dans les systegravemesde recommandation conversationnels 20 et sur linteacuterecirct dapporter de la diversiteacute dans ce genrede systegravemes Les auteurs ont ainsi montreacute que lajout de diversiteacute durant le processus de re-commandation eacutetait beacuteneacuteque pour lutilisateur Cependant ils ont aussi montreacute que mecircme silinteacuterecirct de la diversiteacute est indeacuteniable il nest pas forceacutement justieacute dintroduire de la diversiteacuteagrave chaque recommandation sous peine de nuire agrave lecaciteacute du systegraveme [Castagnos et al 2013]De la mecircme maniegravere on peut rappeler les travaux de [Castagnos et al 2010] prouvant quilest beacuteneacuteque pour lutilisateur de se voir proposer des recommandations diverses juste avant unachat sur un site de-commerce

223 La nouveauteacute

La nouveauteacute est un facteur humain qui sous la mecircme impulsion que la diversiteacute est ap-parue comme une reacuteponse possible au problegraveme de la sur-utilisation de la preacutecision Mecircme siles deux mesures de diversiteacute et de nouveauteacute sont lieacutees il convient de ne pas les confondreLa nouveauteacute dune ressource se deacutenit geacuteneacuteralement par rapport aux autres ressources deacutejagraveconsulteacutees par lutilisateur La notion de diversiteacute sapplique quant agrave elle agrave un ensemble deressources en deacuteterminant si elles sont diverses les unes par rapport aux autres [Castells et al2015] La nouveauteacute reacutepond de plus agrave un besoin bien speacutecique de lutilisateur En eet etcomme lexpliquent [Vargas and Castells 2011] dans la majoriteacute des sceacutenarios le but dune re-commandation est de faire deacutecouvrir agrave lutilisateur des ressources quil naurait pas deacutecouvertesautrement Les auteurs preacutecisent aussi que la nouveauteacute est une caracteacuteristique importante dansun systegraveme de recommandation car elle contribue agrave diminuer la preacutevisibiliteacute des recommanda-tions et donc agrave maintenir linteacuterecirct des utilisateurs pour le systegraveme En partant de ce principeles recommandations eacutevidentes ne sont pas forceacutement de grande utiliteacute mecircme si elles possegravedentun haut niveau de preacutecision avec les preacutefeacuterences de lutilisateur On peut illustrer ce point en

18 RD pour Relative Diversity19 C pour Class soit classeensemble de ressources20 Un systegraveme de recommandation conversationnel consiste en un systegraveme interactif qui va dialoguer avec

lutilisateur sous la forme deacutechange de propositions et de critiques de ces propositions par ce dernier [Mahmoodand Ricci 2009]

20

22 Les facteurs humains agrave prendre en compte dans la recommandation

citant le classique exemple du fan de musique rock qui apregraves avoir eacutecouteacute quelques musiquesde lalbum Dark Side of the Moon de Pink Floyd se voit recommander le reste des musiquesde lalbum En terme de preacutecision la recommandation est quasi parfaite mais lutiliteacute dunetelle recommandation peut laisser agrave deacutesirer On retrouve le mecircme constat chez [Zhang 2013] ougravelomnipreacutesence de la preacutecision et de ses mesures y est critiqueacutee Les auteurs proposent ainsi unedeacutenition de la nouveauteacute en deacutenissant les trois caracteacuteristiques quune ressource doit posseacutederpour ecirctre consideacutereacutee comme nouvelle pour un utilisateur

1 Inconnue la ressource doit ecirctre inconnue de lutilisateur

2 Satisfaisante la ressource doit ecirctre satisfaisante par rapport aux besoins de lutilisateur

3 Dissimilaire la ressource doit ecirctre dissimilaire aux autres ressources que lutilisateur ap-preacutecie

En utilisant les 3 caracteacuteristiques eacutenonceacutees ci-dessus les auteurs ont ensuite proposeacute deacutevaluerla nouveauteacute dune ressource i pour un utilisateur u comme preacutesenteacute dans lEacutequation 34

Novelty(i u) = p(i|unknown u) middot dis(i prefu) middot p(i|like u) (26)

ougrave p(i|unknown u) est la probabiliteacute que lutilisateur u ne connaisse pas la ressource idis(i prefu) est la dissimilariteacute entre i et lensemble des ressources consulteacutees par lutilisateur etp(i|like u) est la probabiliteacute que u appreacutecie i On retrouve ainsi dans cette maniegravere de mesurerla nouveauteacute les 3 caracteacuteristiques mises en avant par [Zhang 2013] pour que le score de nou-veauteacute dune ressource soit haut elle doit ecirctre pour lutilisateur agrave la fois inconnue satisfaisanteet dissimilaire avec ce quil a lhabitude de voir

De reacutecentes eacutetudes ont exploreacute plus avant le lien entre nouveauteacute et satisfaction de lutilisateurNous pouvons citer ici [Schnabel et al 2018] ougrave les auteurs ont testeacute limpact de nouvellesrecommandations par rapport agrave lexploitation des preacutefeacuterences deacutejagrave connues des utilisateurs Ilsen concluent quune petite dose de nouveauteacute permet dameacuteliorer la satisfaction de lutilisateurmais que trop de ressources nouvelles nuisent fortement agrave sa satisfaction

224 Discussion

Au travers de ces quelques exemples un changement de vision dans le domaine de la re-commandation a eacuteteacute illustreacute Dun domaine ougrave la majeure partie des eacutetudes eacutetait initialementconcentreacutee sur la maximisation dune seule meacutetrique la preacutecision [Ricci et al 2015] nous avonsvu que de plus en plus de travaux sinteacuteressaient agrave dautres maniegraveres de proposer des recomman-dations Ainsi on peut deacutesormais trouver pleacutethore deacutetudes tentant de trouver des compromisentre plusieurs des facteurs discuteacutes ci-dessus comme la preacutecision et la diversiteacute [Ziegler et al2005 LHuillier et al 2014] ou encore entre la preacutecision la seacuterendipiteacute 21 et la nouveauteacute [Ka-minskas and Bridge 2016] Ces nouvelles maniegraveres de proceacuteder ont pour but didentier lesfacteurs explicatifs de la satisfaction des utilisateurs an de les prendre en compte dans des mo-degraveles plus complexes et plus geacuteneacuteraux

Il est cependant important de noter que outre ceux citeacutes dans les sections preacuteceacutedentes denombreux autres facteurs humains ont eacuteteacute eacutetudieacutes dans la litteacuterature pour reacutepondre au problegraveme

21 La notion de seacuterendipiteacute fait reacutefeacuterence agrave lheureuse deacutecouverte soit le fait de deacutecouvrir par hasard quelquechose dinteacuteressant qui naurait potentiellement pas eacuteteacute deacutecouvert sans aide [Iaquinta et al 2008]

21

Chapitre 2 Eacutetat de lart

de la satisfaction utilisateur et de la sur-utilisation de la preacutecision On peut citer la seacuterendipiteacutela couverture le contexte la personnaliteacute de lutilisateur Nous avons fait le choix de nous ba-ser sur 4 facteurs couramment dans la litteacuterature an de tester la probleacutematique de cette thegravesesur la recommandation multi-objectifs La multitude de facteurs humains eacutetudieacutes ces derniegraveresanneacutees pour enrichir les recommandations soulignent agrave quel point il est important de nos joursde penser des modegraveles geacuteneacuteriques capables dinteacutegrer de nouveaux facteurs humains agrave la demande

Cette premiegravere grande section de leacutetat de lart a montreacute que le domaine de la recommanda-tion est passeacute dun problegraveme doptimisation mono-objectif agrave un problegraveme doptimisation multi-objectifs Un systegraveme de recommandation agrave lheure actuelle se doit de prendre en compte lesfacteurs humains tels que ceux preacutesenteacutes dans les sections preacuteceacutedentes an decirctre performant etcapable de satisfaire le plus grand nombre de type dutilisateurs dans le maximum de situationspossibles Cest dans ce contexte multi-objectif que cette thegravese se positionne Dans la deuxiegraveme etderniegravere grande section de cet eacutetat de lart nous allons preacutesenter et comparer dieacuterentes maniegraveresde proposer des recommandations agrave lutilisateur la recommandation unitaire la recommanda-tion en liste et la recommandation en seacutequences Nous allons notamment nous attarder sur leslistes et les seacutequences car elles sont les plus agrave mecircmes de fournir des recommandations complexesinteacutegrant de multiples objectifs

23 La recommandation en seacutequence

231 Deacutenition et geacuteneacuteraliteacutes sur les seacutequences

Pour comprendre linteacuterecirct des seacutequences il est neacutecessaire de sattarder sur les listes En eetdegraves les premiers systegravemes de recommandation les utilisateurs se sont la plupart du temps vuproposer soit des ressources uniques soit des listes de ressources On peut deacutenir une liste ainsi

Dans le domaine de la recommandation une liste est un ensemble de res-sources ordonneacutees selon un ou plusieurs critegraveres orant agrave lutilisateur lechoix de consulter ces ressources indeacutependamment les unes des autres

Preacutesenter une liste de recommandations a ainsi pour but de proposer les ressources ayantobtenu le score le plus haut selon un ou plusieurs critegraveres choisis par le systegraveme pour produiredes recommandations Comme nous lavons vu dans la section preacuteceacutedente un des critegraveres les plusutiliseacutes eacutetait originellement la preacutecision Lautre speacuteciciteacute dune liste est dorir agrave un utilisateurplusieurs ressources adapteacutees agrave ses preacutefeacuterences agrave un temps t Ainsi le but nest pas moins desatisfaire lobjectif agrave moyenlong terme de lutilisateur que de simplement lui proposer une listede ressources alternatives adapteacutees agrave son prochain choix Autrement dit le but dune liste derecommandations est de satisfaire les besoins dun utilisateur au temps t+ 1 (soit agrave sa prochaineaction) Le format des listes a donc souvent eacuteteacute utiliseacute car il permet agrave la fois de maximiser leschances de satisfaire lutilisateur tout en tirant parti des meacutecanismes internes de production derecommandations geacuteneacuterant la plupart du temps des listes de ressources de la plus preacutecise agrave lamoins preacutecise pour chaque utilisateur Ce mode de repreacutesentation de par sa capaciteacute agrave pro-poser des alternatives se rapproche deacutejagrave un peu plus du cadre de notre travail doptimisationmulti-critegraveres contrairement aux recommandations unitaires Il nest donc pas question ici deremettre en cause linteacuterecirct dutiliser des listes de ressources comme format de recommandationsces derniegraveres eacutetant adapteacutees agrave de nombreux domaines dapplication De tregraves populaires sites

22

23 La recommandation en seacutequence

de-commerce ou de divertissement utilisent dailleurs principalement des recommandations parlistes comme Netix Youtube ou encore Amazon Un client sur un site de-commerce pourrapar exemple ecirctre satisfait de se voir proposer par le systegraveme une liste darticles similaires agrave sesrecherches an de laider dans son choix Cependant certains domaines peuvent ne pas beacuteneacuteciervoire ecirctre desservis par ce format de recommandation On peut ici agrave nouveau rappeler lexempledirecteur de lintroduction agrave ce sujet ougrave un apprenant se voyait proposer une liste de ressourceseacuteducatives toutes similaires au cours quil avait deacutejagrave suivi sans tenir compte de sa progression nide ses objectifs De la mecircme maniegravere un visiteur dun museacutee ne sera pas forceacutement satisfait de sevoir proposer une liste de 10 divideuvres dart similaires agrave ce quil vient de voir mais potentiellementeacuteparpilleacutees dans tous le museacutee Dans ces deux exemples on devine bien que dautres maniegraveresde proposer les recommandations seraient beacuteneacuteques Cest ici que lon peut deacutenir la notion deseacutequence qui pourrait permettre de reacutepondre agrave des situations ougrave une liste de ressources nest passusante pour satisfaire lutilisateur et ougrave la composante temporelle entre en ligne de compte

Dans le domaine de la recommandation une seacutequence est une suite de res-sources permettant datteindre un ou plusieurs objectifs speacutecieacutes ou nonpar lutilisateur (eg une compeacutetence speacutecique la sortie dun museacutee unapprentissage des recommandations diverses pour un parcours eacuteclectiqueetc) Une seacutequence possegravede donc un deacutebut une n et une progression deacute-nie sous forme dun ordonnancement temporel Une seacutequence est reacutegiepar les objectifs agrave atteindre ces derniers eacutetant speacutecique au domaine et agravelutilisateur

Une seacutequence peut donc ecirctre vue comme une liste ameacutelioreacutee de ressources prenant uncompte un nombre plus grand de variables et une dimension temporelle dans le but de mieuxsatisfaire lutilisateur Nous allons ici deacutetailler la notion de progression qui est importante dansune seacutequence Le principe dune seacutequence reacuteside dans lexistence dau moins un objectif agrave at-teindre et cest ce qui la dieacuterencie dune liste Comme nous lavons vu une liste de ressourcesna pas fondamentalement dobjectif agrave atteindre si ce nest satisfaire lutilisateur agrave t + 1 en luiproposant des ressources adapteacutees De part la notion dobjectif agrave atteindre une seacutequence a pourbut de satisfaire les besoins de lutilisateur non plus agrave t + 1 mais agrave t + n Il nest donc plusquestion daider lutilisateur pour sa prochaine action mais bien daider lutilisateur agrave atteindreun objectif plus complexe qui neacutecessitera n actions ou paliers intermeacutediaires Avec ces deux deacute-nitions on se rend bien compte que les notions de liste et de seacutequence ne sont pas opposeacutees maiscompleacutementaires Certains domaines ne neacutecessitent pas forceacutement lutilisation de seacutequences carlutilisateur naura pas dobjectif agrave moyenlong terme agrave satisfaire (ex la recherche dun lmsur une plateforme de videacuteos agrave la demande) tandis que dans dautres domaines une liste serainsusante pour satisfaire lutilisateur (ex e-eacuteducation heacuteritage culturel playlist musicale)De la mecircme maniegravere il nest pas neacutecessaire de recommander des seacutequences agrave un utilisateur si cedernier na pas dobjectif agrave atteindre et souhaite simplement une aide pour sa prochaine actionet ce mecircme si le domaine dapplication est propice agrave lutilisation de seacutequences

Linteacuterecirct des seacutequences na pas eacutechappeacute aux chercheurs du domaine des systegravemes de recom-mandation qui les ont consideacutereacute comme eacutetant un moyen suppleacutementaire permettant de mieuxsatisfaire lutilisateur Cette prise de conscience sest dailleurs deacutemocratiseacutee au mecircme momentque la prise en compte des facteurs humains autre que la preacutecision dans larticle deacutejagrave citeacute preacute-ceacutedemment [McNee et al 2006] Ainsi on peut lire en 2004 dans le tregraves complet article sur

23

Chapitre 2 Eacutetat de lart

leacutevaluation des systegravemes de recommandation de [Herlocker et al 2004] une liste des tacircchesusuelles que doivent reacutealiser ces systegravemes Dans cette liste se trouve entre autres une reacuteexiondes auteurs sur la recommandation de seacutequences dans le cadre de lutilisation dun site deacutecoutede musiques en ligne

[] Cependant le deacute que repreacutesente le fait de passer dune recommandation dune seulemusique agrave une recommandation dune seacutequence de musiques satisfaisante dans son ensemblenous a intrigueacute Cette mecircme tacircche peut sappliquer agrave la recommandation darticles de recherchean dappreacutehender un domaine (lire cette introduction puis lire cette eacutetude ) Alors que ledomaine de la recherche dinformation a exploreacute le timing et les seacutequences dachat de produitsnous navons connaissance daucun systegraveme de recommandation ou de recherche sattelant direc-tement agrave la reacutesolution de cette tacircche (ie la recommandation en seacutequences)

Les auteurs expliquent donc clairement ici que la recommandation de seacutequences mecircme sielle navait pas encore eacuteteacute traiteacutee agrave leacutepoque eacutetait un point inteacuteressant agrave deacutevelopper et pouvaitsatisfaire des besoins speacuteciques comme la recommandation de musiques en ligne ou encore lac-quisition de nouvelles connaissances en ligne La premiegravere partie de leur reacuteexion qui na pas eacuteteacutetraduite ici sur les speacuteciciteacutes des recommandations musicales sera eacutetudieacutee plus en deacutetail dans lechapitre suivant Mecircme si les recommandations de ressources uniques ou de listes de ressourcessont resteacutees tregraves largement majoritaires dans le domaine quelques travaux se sont tout de mecircmeatteleacutes au problegraveme des seacutequences Il est tout dabord neacutecessaire de distinguer deux utilisationsde la notion de seacutequence dans la litteacuterature lutilisation de seacutequences deacutejagrave existantes en entreacuteedun systegraveme et la production de seacutequences en sortie dun systegraveme Dans la suite de cette sec-tion nous allons eacutetudier ces deux maniegraveres de proceacuteder ainsi que leurs avantages et inconveacutenients

Comme nous lavons vu dans la majoriteacute des cas les systegravemes de recommandation se basentsur la matrice deacutevaluations utilisateurs times ressources pour preacutedire les ressources encore nonconsulteacutees pouvant inteacuteresser lutilisateur Cependant mecircme si elle permet lapplication de nom-breuses et puissantes meacutethodes de preacutediction que nous ne deacutetaillerons pas ici 22 lutilisationdune matrice ne permet pas en leacutetat de tenir compte de lordre dans lequel les ressources onteacuteteacute consulteacutees ni de distinguer les variances agrave court ou moyen-terme des prols utilisateurs [Qua-drana et al 2018] De la mecircme maniegravere une cellule de cette matrice rui repreacutesente uniquementune eacutevaluation r dun utilisateur u sur une ressource i pouvant cacher une reacutealiteacute plus complexeougrave un utilisateur a consulteacute plusieurs fois cette ressource au cours du temps potentiellement dansdieacuterents contextes et avec une eacutevaluation dieacuterente agrave chaque fois Pour remeacutedier agrave ce problegravemedes approches agrave base de tenseurs ont eacuteteacute proposeacutees permettant dutiliser plusieurs matrices re-preacutesentant dieacuterents moments ou critegraveres dans le prol de lutilisateur [Frolov and Oseledets2017] Il est donc clair que les seacutequences de consultation contiennent des informations richespouvant ecirctre exploiteacutees dans un systegraveme de recommandation Lexploitation de lordre des res-sources dans des seacutequences nest cependant pas nouvelle et provient principalement du domainede la recherche dinformation [Agrawal et al 1995] Aujourdhui on retrouve lexploitation delordre des seacutequences dans de nombreux autres domaines comme la fouille de motifs seacutequentielsou encore la reconnaissance de la parole [Han et al 2007] Lexplosion des services proposeacutes parla deacutemocratisation dInternet et du numeacuterique en geacuteneacuteral ces derniegraveres anneacutees a ameneacute la recom-mandation agrave sadapter agrave de nombreux domaines ougrave lordre dans lequel les utilisateurs reacutealisent

22 On peut par exemple citer les techniques de factorisation de matrice qui dominent le domaine [Koren et al2009]

24

23 La recommandation en seacutequence

des actions a de limportance Ces systegravemes de recommandation portant une attention particu-liegravere aux seacutequences sont regroupeacutes sous le terme de systegravemes de recommandation sensiblesaux seacutequences (sequence-aware recommender system) [Quadrana et al 2018] Dans leur tourdhorizon du domaine les auteurs proposent une vue densemble de la maniegravere dont un systegravemede recommandation sensible aux seacutequences fonctionne agrave laide dun scheacutema en 3 parties preacutesenteacutepar la Figure 22

Figure 22 Vue densemble du fonctionnement dun systegraveme de recommandation sensible auxseacutequences (source [Quadrana et al 2018])

Dans la Figure 22 on peut donc bien distinguer 3 parties distinctes dans le fonctionnementinterne dun systegraveme de recommandation sensible aux seacutequences

1 Les entreacutees les entreacutees se caracteacuterisent par des donneacutees relatives aux actions eectueacuteespar les utilisateurs du systegraveme Ces actions doivent ecirctre classeacutees selon lordre dans lequelelles ont eacuteteacute eectueacutees par chaque utilisateur an de pouvoir exploiter toutes les infor-mations disponibles (si les actions ne sont pas reccedilues de maniegravere ordonneacutee ces derniegraveresdoivent au minimum ecirctre associeacutees agrave un timestamp agrave une date preacutecise pour pouvoir ecirctrereacute-ordonneacutees et traiteacutees dans le bon ordre par le systegraveme de recommandation)

2 Le processus de recommandation le processus de recommandation est geacuteneacuteralementdieacuterent des systegravemes de recommandation classiques utilisant des matrices 23 mais leprincipe geacuteneacuteral reste le mecircme utiliser lensemble des informations fournies par les entreacuteespour produire des recommandations adapteacutees agrave lutilisateur nal On retrouve dans cettepartie les tacircches purement lieacutees agrave la recommandation la prise en compte des facteurshumains du contexte eacuteventuellement des contraintes sil y en a etc Dans la Figure 22les auteurs distinguent 4 types de tacircches lieacutees aux systegravemes de recommandation sensiblesaux seacutequences Nous discuterons de ces 4 tacircches dans la suite de ce manuscrit lors de lapreacutesentation du modegravele et des expeacuterimentations meneacutees pour le tester

23 Mecircme si quelques modegraveles utilisant agrave la fois des seacutequences et des meacutethodes de factorisation de matrices onteacuteteacute proposeacutes ces derniegraveres anneacutees [Yu and Riedl 2012 Zhao et al 2014 Twardowski 2016 Chen and Li 2019]

25

Chapitre 2 Eacutetat de lart

3 Les sorties les auteurs distinguent ici deux types de sorties possibles Le premier typede sortie concerne dabord les listes ordonneacutees de ressources que nous avons deacutejagrave expli-citeacutees auparavant dans ce manuscrit Une liste aura pour but de proposer agrave lutilisateurun ensemble de ressources ordonneacutees de la meilleure agrave la moins bonne selon une ou plu-sieurs meacutetriques speacuteciques Une liste propose dans les faits un ensemble dalternatives dechoix possibles que le systegraveme met agrave disposition de lutilisateur an que ce dernier puissechoisir une (ou eacuteventuellement plusieurs) ressource(s) parmi toutes celles proposeacutees Cepremier type de sortie est donc identique aux systegravemes de recommandation classiques Ledeuxiegraveme type de sortie concerne les seacutequences de ressources Contrairement aux listesconsistant en un ensemble dalternatives les ressources dune seacutequence ont pour but decirctretoutes consulteacutees dans lordre donneacute par le systegraveme Lagrave ougrave pour les listes une recomman-dation consiste en une ressource pour les seacutequences une recommandation consiste en unesuite de ressources agrave consulter dans lordre proposeacute Ainsi une seacutequence peut ecirctre consi-deacutereacutee comme une unique recommandation de la mecircme maniegravere que dans une liste chaqueressource est une recommandation unique

232 Domaines dapplication des modegraveles seacutequentiels

Comme nous lavons expliqueacute auparavant il est eacutevident que certains domaines dapplicationssont adapteacutes aux systegravemes de recommandation sensibles aux seacutequences comme par exemple lamusique ou le tourisme [Nurbakova et al 2018] Inversement certains domaines semblent moinsbeacuteneacutecier de tels systegravemes Le domaine de le-commerce est un cas particulier dans le sens ougraveil a vu un grand nombre de ces systegravemes y ecirctre testeacutes quand bien mecircme il semble agrave premiegraverevue ecirctre moins adapteacutes aux seacutequences Deux raisons peuvent expliquer cet eacutetat de fait Premiegrave-rement il a statistiquement eacuteteacute prouveacute que la tregraves grande majoriteacute des clients consultant un sitede-commerce ne le font en reacutealiteacute que dans le but de trouver un seul produit speacutecique avantde quitter le site [Qiu et al 2015] Deuxiegravemement le domaine de le-commerce est geacuteneacuteralementtregraves repreacutesenteacute dans les systegravemes de recommandation [Quadrana et al 2018] potentiellement ducircaux forts inteacuterecircts nanciers et agrave lancienneteacute de lutilisation de ce domaine dapplication Dansla suite de cette section nous allons nous inteacuteresser agrave quelques exemples de systegravemes sensiblesaux seacutequences dans les domaines de la musique et du tourisme an dillustrer leacutetat du domaineainsi que les directions potentielles pour de futurs travaux

Dans le domaine musical

Le domaine de la musique est un deacuteboucheacute naturel des systegravemes de recommandation sinteacute-ressant aux seacutequences autant quand il sagit dexploiter les seacutequences creacuteeacutees par les utilisateursque lorsquil sagit den produire en sortie dun systegraveme Cet eacutetat de fait sexplique par la speacuteci-citeacute du domaine musical ougrave les utilisateurs eacutecoutent tregraves souvent plusieurs musiques les unes agravela suite des autres Ces utilisateurs produisent des seacutequences signicatives de par leurs eacutecoutes etpeuvent ecirctre demandeurs de seacutequences de musiques ou playlists adapteacutees agrave leurs preacutefeacuterences Ilnest donc pas eacutetonnant de trouver degraves le deacutebut des anneacutees 2000 dans la litteacuterature des travauxportant sur ce sujet Les travaux de leacutepoque souraient cependant dun certain nombre de pro-blegravemes comme un manque de personnalisation et dexpressiviteacute ou encore des diculteacutes pourgeacuterer le grand nombre de musiques des catalogues en ligne problegravemes qui ont par la suite eacuteteacutereacutesolus avec la production de nouveaux systegravemes et laugmentation de la puissance de calcul desmachines [Aucouturier and Pachet 2002] On peut cependant aussi trouver des eacutetudes dont le

26

23 La recommandation en seacutequence

but eacutetait dexploiter les caracteacuteristiques speacuteciques du domaine musical pour proposer des adap-tations des techniques classiques de recommandation utiliseacutees dans le-commerce [Logan 2002]Plus reacutecemment le domaine des recommandations musicales a beaucoup gagneacute en populariteacutecomme lillustre le ceacutelegravebre ACM RecSys Challenge dont leacutedition 2018 en partenariat avec Spo-tify 24 sest porteacutee sur la musique avec comme challenge de creacuteer un systegraveme capable de prolongerdes playlists deacutejagrave existantes 25 Au total plus de 100 eacutequipes ont participeacute agrave ce deacute et plus de15 articles ont eacuteteacute publieacutes Voici un court reacutesumeacute des 4 approches ayant eacuteteacute les plus performantes

[Volkovs et al 2018] ont proposeacute un modegravele en deux eacutetapes baseacute sur des meacutethodes deltrage collaboratif utilisant la factorisation de matrice (Weighted Regularized Matrix Fac-torization[Hu et al 2008]) et de renforcement de gradient (gradient boosting) La premiegravereeacutetape est optimiseacutee pour reacutecupeacuterer rapidement une liste de musiques candidates tandisque le deuxiegraveme stage reacuteordonne ces musiques en maximisant la preacutecision au deacutebut de laliste ainsi creacuteeacutee [Rubtsov et al 2018] ont proposeacute une approche relativement similaireavec un modegravele posseacutedant aussi deux eacutetapes la premiegravere utilisant des techniques de l-trage collaboratif pour seacutelectionner des candidats potentiels et la deuxiegraveme utilisant uneplaylist avec ces candidats agrave laide de techniques de renforcement de gradient

[Yang et al 2018] ont proposeacute un modegravele multimodal de ltrage collaboratif en deuxparties utilisant chacune des reacuteseaux de neurones (autoencoder pour la premiegravere partie etreacuteseau neuronal convolutif pour la deuxiegraveme partie) Le but des auteurs eacutetait de prendreen compte 3 des problegravemes les plus communs aux systegravemes de recommandation musicauxagrave savoir (1) le problegraveme du deacutemarrage agrave froid (2) les biais de populariteacute ougrave des musiquesse retrouvent soit dans la plupart des playlists soit dans tregraves peu dentre elles (3) et ennle contexte de la playlist originale (autrement dit le fait dutiliser les preacutefeacuterences agrave courtterme de lutilisateur dans la session deacutecoute en cours pour continuer du mieux possiblela playlist)

[Antenucci et al 2018] ont proposeacute une approche mecirclant agrave la fois des techniques de l-trage collaboratif et de ltrage par contenu Les preacutedictions de ces dieacuterentes techniquessont ensuite agreacutegeacutees ensemble dans le but de maximiser la qualiteacute de la recommandation

On peut remarquer que ces 4 approches ayant obtenu les 4 premiegraveres places de la compeacute-tition possegravedent des points communs et orent des perspectives inteacuteressantes sur la maniegraverede concevoir des systegravemes de recommandation performants dans ce domaine Premiegraverementon remarque que toutes ces approches sont relativement complexes et utilisent des meacutethodesvarieacutees pour la recommandation (ltrage collaboratif ltrage par contenu factorisation de ma-trice reacuteseaux neuronaux gradient boosting etc) prouvant que les systegravemes de recommandationperformants utilisent plus que jamais des techniques hybrides Deuxiegravemement chacune de ces 4approches propose un modegravele en deux parties La premiegravere partie est geacuteneacuteralement utiliseacutee pourseacutelectionner un certain nombre de candidats parmi les 22 millions de musiques disponibles quiavaient eacuteteacute mises agrave disposition et ce an de limiter lespace de recherche et donc le temps decalcul La deuxiegraveme partie consiste en la creacuteation de la playlist nale baseacutee sur les candidats deacutejagraveseacutelectionneacutes Cette partie peut potentiellement ecirctre plus complexe dun point de vue algorith-mique car lespace de recherche est beaucoup plus restreint quinitialement

Par ailleurs chacune de ces 4 approches a aussi tenteacute de prendre en compte un maximum

24 https wwwspotifycom25 http wwwrecsyschallengecom2018

27

Chapitre 2 Eacutetat de lart

dinformations an de satisfaire au mieux lutilisateur (caracteacuteristiques des musiques preacutecisiondiversiteacute contexte de la playlist initiale utilisation de la session deacutecoute en cours) validantainsi lapproche deacuteveloppeacutee depuis le deacutebut de ce manuscrit qui consiste agrave prendre en compte unmaximum dobjectifs associeacutes agrave des facteurs humains dans la recommandation Cette constata-tion se retrouve aussi chez [Jannach et al 2016] ougrave les auteurs expliquent que le but des systegravemesde recommandation dans le domaine de la musique est dacqueacuterir et dexploiter des informationssuppleacutementaires agrave propos des musiques an de comprendre le thegraveme sous-jacent des playlistscreacuteeacutees par les utilisateurs [] Le but ultime serait ainsi de concevoir de nouvelles approchesalgorithmiques qui seraient explicitement conccedilues pour creacuteer des playlists correspondant agrave une ouplusieurs caracteacuteristiques signicatives pour lutilisateur En dehors des facteurs humains deacutejagravedeacuteveloppeacutes au deacutebut de cette section (similariteacute diversiteacute nouveauteacute) les auteurs explicitentces caracteacuteristiques signicatives comme pouvant aussi ecirctre lhomogeacuteneacuteiteacute de la playlist dansson ensemble ou encore les transitions entre chacune des musiques dune playlist Le but seraitdonc ici de reacuteussir agrave creacuteer des playlists semblables agrave ce quun ecirctre humain pourrait faire tout entenant compte au maximum des besoins en similariteacute diversiteacute et nouveauteacute [Quadrana et al2018] deacuteveloppent aussi cette ideacutee en expliquant quun systegraveme de recommandation musical peutsoit proposer des musiques correspondant dune maniegravere geacuteneacuterale au thegraveme de la playlist soitproposer une playlist avec un ordre speacutecique permettant de garantir des transitions douces entrechaque musique comme par exemple une augmentation graduelle du tempo Les notions de pro-gression et de transitions douces dans une playlist correspondent agrave la deacutenition dune seacutequencedonneacutee plus haut dans le manuscrit et sont donc particuliegraverement inteacuteressantes dans le cadre decette thegravese Il est cependant agrave noter que dans le domaine des recommandations musicales undeacutebat est reacutecemment apparu sur limportance de lordre des musiques dans les recommandationsde playlist En eet une eacutetude exploratoire reacutecente a montreacute que si les utilisateurs jugent posi-tivement un systegraveme recommandant des musiques diverses et nouvelles ces derniers ne portaientque peu dinteacuterecirct agrave lordre dans lequel les musiques eacutetaient proposeacutees (voire dans certains casne percevaient mecircme pas dordre speacutecique dans les recommandations) [Tintarev et al 2017]Mecircme si cette eacutetude na porteacute que sur 20 participants les reacutesultats obtenus sont inteacuteressantset soulignent agrave quel point chaque domaine agrave des particulariteacutes propres dont il est neacutecessairede tenir compte pour la conception dun systegraveme de recommandation sensible aux seacutequencesPour renforcer encore cette derniegravere constatation nous allons nous inteacuteresser dans la prochainesous-section aux systegravemes de recommandation touristiques

Dans le domaine touristique

Le domaine du tourisme a lui aussi vu sa populariteacute croicirctre dans la litteacuterature gracircce agrave lexplo-sion des teacuteleacutephones portables et tablettes orant un nouveau support pour les recommandationsDe la mecircme maniegravere que pour le domaine de la musique le tourisme a vu ses premiegraveres appli-cations de recommandation apparaicirctre au deacutebut des anneacutees 2000 Dans [Cheverst et al 2000]par exemple les auteurs ont deacuteveloppeacute un guide mobile permettant daider les visiteurs de laville de Lancaster en leur fournissant des informations contextuelles (localisation date heure dela journeacutee ouvertures et fermetures dattractions heures de visites etc) ainsi quen proposantau visiteur plusieurs services comme avoir plus dinformations sur un monument ou geacuteneacuterer unparcours prenant en compte ces informations contextuelles Cette eacutetude a permis de proposer unstandard dans la recommandation touristique comme la prise en compte du contexte et eacutetaittregraves complegravete pour son eacutepoque mecircme si lon peut critiquer labsence dun modegravele utilisateurne permettant pas de prendre en compte les besoins speacuteciques de chaque visiteur Toujours audeacutebut des anneacutees 2000 nous pouvons aussi citer [Chou et al 2005] dont les auteurs ont modeacuteliseacute

28

23 La recommandation en seacutequence

agrave laide dun systegraveme de repreacutesentation de connaissances (OWL pour Web Ontology Language)les inteacuterecircts dun visiteur ainsi que les divideuvres dun museacutee dans un systegraveme de recommandationproposant des parcours Il est agrave noter que dans cette eacutetude les auteurs ont pu prouver que letemps passeacute par un visiteur devant un objet eacutetait positivement correacuteleacute avec son appreacuteciationpositive sur cet objet Le terme objet est utiliseacute ici car les auteurs ont reacutealiseacute cette expeacuteriencesur un site proposant des vecirctements et non dans le museacutee comme le reste de leur application

Plus reacutecemment les systegravemes de recommandation touristiques de ces derniegraveres anneacutees ontproteacute des nombreuses avanceacutees technologiques leur donnant plus de possibiliteacutes quant agrave la lo-calisation de lutilisateur et agrave laide personnaliseacutee dans des lieux autrefois complexes agrave atteindreEn eet la deacutemocratisation des smartphones recevant tous un signal GPS de bonne qualiteacute per-met deacutesormais agrave des applications de connaicirctre relativement preacuteciseacutement la position dun visiteurtant quil est dehors Dune maniegravere geacuteneacuterale les systegravemes utilisant des donneacutees geacuteographiquesdans le processus de recommandation sont regroupeacutes sous le terme systegravemes de recommandationsensibles agrave la position (Location-Aware Recommender Systems (LARS)) Pour les systegravemes derecommandation destineacutes agrave ecirctre utiliseacutes agrave linteacuterieur dun bacirctiment ougrave le signal GPS ne peutpas passer (comme un museacutee par exemple) il existe maintenant plusieurs solutions eacutetudieacutees etdeacuteveloppeacutees dans le domaine de recherche des systegravemes de localisation en interne comme parexemple le Wi-Fi [Tesoriero et al 2014] les puces RFID 26 [Tesoriero et al 2008] les senseursde proximiteacute Bluetooth [Yoshimura et al 2014] et mecircme le geacuteomagneacutetisme 27 Les moyens tech-niques permettant de localiser preacuteciseacutement un visiteur ou de lui fournir des recommandations agravedistance via une application ne seront pas deacutetailleacutes ici Cependant il est important de prendreen compte ces problegravemes lorsque lon passe dun domaine agrave un autre Mecircme si lobjectif est lemecircme agrave savoir recommander les meilleures seacutequences agrave un utilisateur dun systegraveme les moyenstechniques agrave mettre en divideuvre ainsi que les caracteacuteristiques agrave prendre en compte pour produire debonnes recommandations peuvent drastiquement changer Ainsi alors que certains systegravemes derecommandations musicaux commencent depuis quelques anneacutees agrave prendre en compte le contextede lutilisateur quand cela est possible [Wang et al 2012] les systegravemes deacuteployeacutes dans le domainedu tourisme doivent neacutecessairement tenir compte du contexte de lutilisateur au minimum pourpouvoir le guider activement [Adomavicius and Tuzhilin 2011 Gavalas et al 2014] De la mecircmemaniegravere les modegraveles utilisateurs requis dans les recommandations touristiques diegraverent de ceuxdes autres domaines Il est par exemple important de prendre en compte la maniegravere dont lesvisiteurs se deacuteplacent physiquement agrave la fois pour proposer des recommandations satisfaisantesdun point de vue individuel mais aussi pour avoir une vision globale de la foule et de ses ef-fets sur les individus Ainsi [Veacuteron and Levasseur 1989] ont reacutealiseacute une eacutetude ethnographiqueau centre Pompidou montrant que les visiteurs pouvaient ecirctre classeacutes en 4 cateacutegories selon leurmaniegravere de se deacuteplacer tandis que [Yoshimura et al 2014] ont observeacute pendant 3 semaines lecomportement de plus de 27000 visiteurs au museacutee du Louvre permettant de discerner 2 typesde visiteurs selon la dureacutee de leur visite ainsi que linuence de la foule sur les comportements

Ces deux eacutetudes toujours tregraves utiliseacutees aujourdhui reacutevegravelent que le domaine des recomman-dations touristiques possegravede des speacuteciciteacutes quil est important de prendre en compte an decorrectement modeacuteliser le comportement de lutilisateur et de lui fournir des recommandationspertinentes Dune maniegravere geacuteneacuterale et peut-ecirctre encore plus que dans dautres domaines la

26 Acronyme de Radio-Frequency IDentication deacutesignant lutilisation de radio-eacutetiquettes adheacutesives permet-tant de recevoir et de reacutepondre agrave des signaux agrave courte distance27 IndoorAtlas

29

Chapitre 2 Eacutetat de lart

recommandation de points dinteacuterecircts physiques neacutecessite une attention toute particuliegravere agrave uncertain nombre de caracteacuteristiques quant agrave la modeacutelisation de lutilisateur parmi lesquelles onpeut citer [Osche et al 2016]

Le style de visite repreacutesente le style de visite de lutilisateur en rapport avec les deuxeacutetudes citeacutees ci-dessus [Veacuteron and Levasseur 1989 Yoshimura et al 2014]

Le niveau de fatigue repreacutesente agrave quel point lutilisateur est mentalement etouphysiquement fatigueacute

Les preacutefeacuterences implicites repreacutesente les preacutefeacuterences sur les ressources deacuteduites ducomportement de lutilisateur

La toleacuterance agrave la distance repreacutesente agrave quel point lutilisateur souhaite se deacuteplacer La toleacuterance agrave la foule repreacutesente agrave quel point lutilisateur est deacuterangeacute par les autres

visiteurs autour de lui La toleacuterance agrave la preacutecision repreacutesente le souhait de lutilisateur concernant la balance

entre recommandations preacutecises et recommandations diverses La toleacuterance agrave lintrusion technologique repreacutesente agrave quelle freacutequence lutilisateur

souhaite recevoir des recommandations du systegraveme Le niveau de controcircle repreacutesente le niveau de choix que lutilisateur attend cest-agrave-

dire le nombre dalternatives proposeacutees

Outre ces points relatifs agrave la modeacutelisation de lutilisateur il est aussi important de prendreen compte lenvironnement dans lequel il se trouve comme par exemple la geacuteographie du lieu etses contraintes les distances physiques entre les points dinteacuterecircts les donneacutees meacuteteacuteorologiquesles horaires douvertures et de fermetures sil y en a etc

Mecircme si agrave premiegravere vue le domaine touristique semble dieacuterent du domaine musical denombreux points communs peuvent ecirctre trouveacutes comme par exemple la gestion de la distance(distance physique entre deux points dinteacuterecircts ou distance matheacutematiques entre deux ressourcesles preacutefeacuterences implicites les divers niveaux de toleacuterances etc) Dans la prochaine section nousallons discuter des points communs entre ces dieacuterents domaines et des caracteacuteristiques quunmodegravele se voulant geacuteneacuterique et multi-domaines se doit de posseacuteder

233 Discussion

Cette section a eu pour but de preacutesenter un certain nombre de travaux lieacutes de pregraves ou de loinagrave la notion de seacutequence Nous avons vu que dans le domaine des recommandations musicales lacreacuteation ou la continuation de playlists sont des objectifs de plus en plus consideacutereacutes par les cher-cheurs Ce domaine sy precircte en eet tregraves bien car la majoriteacute des utilisateurs eacutecoutent plusieursmusiques les unes agrave la suite des autres permettant dexploiter linformation contenue dans cesseacutequences deacutejagrave existantes et de tenter den creacuteer de nouvelles De la mecircme maniegravere le rapidetour dhorizon du domaine des recommandations touristiques a permis de mettre en exerguemecircme sil existe des dieacuterences notables avec le domaine musical dont il faut tenir compte unobjectif principal commun consideacuterer le maximum de donneacutees pertinentes disponibles (compor-tements preacuteceacutedents des utilisateurs informations sur les ressources caracteacuteristiques personnellesde chaque utilisateur etc) dans le but de produire des seacutequences adapteacutees agrave chaque utilisateurLes eacutetudes de ces domaines ont permis de faire ressortir 5 directions majeures dans la conceptiondun tel systegraveme de recommandation

1 Les approches les plus performantes actuellement semblent geacuteneacuteralement composeacutees de

30

24 Les systegravemes multi-agents

deux parties distinctes La premiegravere partie consiste en une preacute-seacutelection avec pour but dediminuer lespace de recherche en seacutelectionnant une liste de candidats potentiels tandisque dans la deuxiegraveme partie une seacutequence est produite en utilisant les meilleurs candidatspreacute-seacutelectionneacutes dans leacutetape 1

2 Ces approches ne se limitent plus uniquement agrave lutilisation de techniques provenantdes systegravemes de recommandation classiques mais mecirclent deacutesormais dieacuterentes techniquesprovenant de divers domaines de la recherche en informatique

3 Les seacutequences deacutejagrave creacuteeacutees en amont par les utilisateurs peuvent ecirctre utiliseacutees an dexploi-ter les informations quelles contiennent et produire en aval des seacutequences plus conformesagrave ce quun ecirctre humain ferait

4 Le mouvement geacuteneacuteral des eacutetudes produites ces derniegraveres anneacutees va dans le sens dune priseen compte conjointe et toujours plus importante de facteurs et caracteacuteristiques humains

5 Un systegraveme geacuteneacuterique permettant de produire des seacutequences personnaliseacutees quelque soit ledomaine reste possible mais ce dernier devra ecirctre susamment modulable pour sadapteraux dieacuterences bien reacuteelles entre tous les domaines concerneacutes

Dans la suite de cette section nous allons nous concentrer sur un domaine de linformatiquedont les meacutethodes saccordent avec lensemble des points eacutevoqueacutes ci-dessus les systegravemes multi-agents et plus particuliegraverement les algorithmes de colonies de fourmis Cest dans le cadre de ceparadigme que nous reacutepondrons aux probleacutematiques de cette thegravese

24 Les systegravemes multi-agents

241 Deacutenition

Les systegravemes multi-agents deacutesignent lensemble des systegravemes ougrave de nombreux agents co-opegraverent dans le but de reacutesoudre un problegraveme trop complexe pour un agent seul [Ferber andWeiss 1999 Weiss 2013] Un agent dans sa deacutenition la plus large repreacutesente toute entiteacute pou-vant percevoir son environnement agrave travers ses senseurs et pouvant agir dans cet environnementavec ses actuateurs [Russell and Norvig 2016] comme le preacutesente la Figure 23

Selon cette deacutenition limmense majoriteacute des ecirctres vivants robots machines et programmesinformatiques peuvent ecirctre consideacutereacutes comme des agents Nous allons aner petit agrave petit cettedeacutenition an de rentrer dans le cadre speacutecique des systegravemes multi-agents Un premier eacuteleacutementpouvant ecirctre ajouteacute est la notion de rationaliteacute Un agent rationnel est un agent dont le com-portement est le bon eacutetant donneacute un environnement speacutecique dans lequel il eacutevolue Avoir lebon comportement autrement dit eectuer une bonne seacutequence dactions implique de deacutenirun but preacutecis ainsi quune maniegravere deacutevaluer les seacutequences dactions que lagent eectue commepar exemple la maximisation dune fonction dutiliteacute An de reacutealiser des actions dans son en-vironnement un agent a besoin de pouvoir prendre des deacutecisions de lui-mecircme Il existe dans lalitteacuterature deux types dagents repreacutesentant deux conceptions dieacuterentes pour la reacutesolution dunproblegraveme [Ferber 1995]

Le premier type dagent est appeleacute agent cognitif et fait reacutefeacuterence agrave des agents pos-seacutedant une repreacutesentation symbolique du monde avec laquelle ils peuvent appliquer desraisonnements Ces agents possegravedent donc une repreacutesentation interne de leur environ-nement et sont capables dinteragir entre eux de maniegravere sophistiqueacutee Ce type dagent

31

Chapitre 2 Eacutetat de lart

Figure 23 Scheacutema repreacutesentant linteraction entre un agent et lenvironnement dans lequel ileacutevolue [Russell and Norvig 2016]

correspond plus geacuteneacuteralement agrave une approche cognitive qui a pour but de faire commu-niquer et coopeacuterer des systegravemes experts classiques [ougrave] chaque agent dispose dune base deconnaissance comprenant lensemble des informations et des savoir-faire neacutecessaires agrave lareacutealisation de sa tacircche et agrave la gestion des interactions avec les autres agents et avec sonenvironnement [Ferber and Weiss 1999]

Le deuxiegraveme type dagent nommeacute agent reacuteactif ne possegravede pas de repreacutesentation sym-bolique du monde et est donc limiteacute par ses propres perceptions Ces agents et leursinteractions sont geacuteneacuteralement moins complexes que les agents cognitifs Ce type dagentcorrespond plus geacuteneacuteralement agrave une approche reacuteactive qui quant agrave elle preacutetend quil nestpas neacutecessaire que les agents soient intelligents individuellement pour que le systegraveme aitun comportement global intelligent Des meacutecanismes de reacuteaction aux eacuteveacutenements ne pre-nant en compte ni une explicitation des buts ni des meacutecanismes de planication peuventalors reacutesoudre des problegravemes qualieacutes de complexes [Ferber and Weiss 1999]

En plus de ces deux types dagents dieacuterencieacutes par leur repreacutesentation du monde Ferberpropose un autre type de distinction sur les comportements ces derniers peuvent ecirctre teacuteleacuteono-miques cest-agrave-dire dirigeacutes vers des buts explicites ou bien reacuteexes cest-agrave-dire reacutegis par lesperceptions Ces 4 dieacuterents types dagents peuvent se combiner comme illustreacute dans le Tableau21

Nous allons plus particuliegraverement nous inteacuteresser ici aux agents reacuteactifs et agrave leurs dieacuterencesavec les agents cognitifs Malgreacute leur relative simpliciteacute les interactions entre agents reacuteactifsexistent bien Mais contrairement aux agents cognitifs elles seectuent au travers de lenvi-ronnement geacuteneacuteralement par des traces laisseacutees dans ce dernier comme des donneacutees visuellesolfactives auditives etc Lagrave ougrave les agents cognitifs raisonnent avant de prendre une deacutecisionles agents reacuteactifs ne font que reacuteagir agrave des stimuli externes Ils possegravedent bien des senseurs ande deacutetecter leur environnement et des actuateurs pour agir mais leur fonctionnement reste tregraves

32

24 Les systegravemes multi-agents

Agents cognitifs Agents reacuteactifsTeacuteleacuteonomiques Agents intentionnels Agents pulsionnels

Reacuteexes Agents modules Agents tropiques

Table 21 Description des dieacuterents types dagents selon leur relation au monde et selon leursconduites [Ferber 1995]

simple par rapport aux agents cognitifs La relative simpliciteacute de ces agents est inteacuteressante carelle sinscrit dans un changement de paradigme par rapport agrave la vision classique des lintelligencearticielle dans le domaine de linformatique En eet le domaine de lintelligence articielleexiste depuis pregraves de 60 ans maintenant et agrave lorigine les systegravemes intelligents creacuteeacutes dans cedomaine pour reacutesoudre des problegravemes lont eacuteteacute selon une approche dite top-down cest-agrave-direde haut en bas avec les notions de penseacutee et de raison au centre de ces systegravemes Ainsi cessystegravemes manipulaient les connaissances agrave laide de symboles et de regravegles et navaient aucune in-teraction ni avec leur environnement ni avec dautres systegravemes intelligents Cest ce quon appellecommuneacutement la Good Old Fashioned Articial Intelligence Depuis les anneacutees 1990 une autreapproche est apparue pour eacutetudier lintelligence et creacuteer des systegravemes intelligents lapprochebottom-up soit de bas en haut dont certains systegravemes tregraves populaires sinspirent de systegravemesbiologiques incarneacutes dans un environnement et pouvant communiquer entre eux Cest dans cemouvement que sinscrivent les systegravemes multi-agents et comme le dit Rodney A Brooks dansson article justement intituleacute Intelligence without Reason [Brooks 1991]

Les comportements intelligents peuvent ecirctre geacuteneacutereacutes sans laide de systegravemes de raisonne-ment explicites

Lintelligence est une proprieacuteteacute eacutemergente de certains systegravemes complexes apparaissantparfois sans quelle nait de raison speacutecique dapparaicirctre

Une premiegravere implication de la simpliciteacute des agents reacuteactifs est quil est neacutecessaire de faireinteragir un certain nombre de ces agents pour pouvoir solutionner des problegravemes Lagrave ougrave unagent cognitif peut potentiellement ecirctre tregraves complexe et capable de solutionner des problegravemesprincipalement par lui-mecircme (en deacuteleacuteguant ou coopeacuterant parfois avec dautres agents) un agentreacuteactif seul nen sera pas capable de par sa simpliciteacute Cependant cette simpliciteacute ore aussides avantages dans le sens ougrave il est aiseacute de comprendre de programmer ou de modier cesagents Apregraves cette partie theacuteorique nous allons voir dans la sous-section suivante deux modegravelesmulti-agents an dillustrer la maniegravere dont ils fonctionnent reacuteellement Ces deux systegravemes nouspermettrons par la suite de tirer quelques conclusions sur leur utiliteacute dans le cadre de cette thegravese

242 Preacutesentation de deux systegravemes multi-agents reacuteactifs

Nous avons pour le moment seulement deacutecrit le principe des modegraveles multi-agents et lesagents pouvant les composer Cependant ces systegravemes ne puisent pas leur origine uniquementdans linformatique Beaucoup de systegravemes multi-agents sinspirent agrave lorigine de comportementsdanimaux ou dinsectes observeacutes en milieu naturel par des eacutethologues En eet certaines espegravecesanimales semblent agir en groupe de maniegravere tregraves intelligente sans quil ny ait de meneur ou sansquun individu pris seacutepareacutement ne soit speacutecialement intelligent On parle alors dauto-organisationet deacutemergence de lintelligence quand une masse dindividus peu intelligents se coordonne ainsidans la nature Ce pheacutenomegravene a eacuteteacute eacutetudieacute par le biologiste franccedilais Pierre-Paul Grasseacute en 1959

33

Chapitre 2 Eacutetat de lart

et a eacuteteacute nommeacute stigmergie [Grasseacute 1959] La stigmergie est le meacutecanisme par lequel des agentsvont se synchroniser et travailler ensemble dans un but commun sans quaucun nait lideacutee agravelavance de laction agrave faire ou nait le plan nal de la construction agrave reacutealiser (une fourmiliegravereou un nid de termites par exemple) Pour deacutecrire le pheacutenomegravene de stigmergie agrave ldivideuvre chezcertains animaux Pierre-Paul Grasseacute explique ainsi Louvrier ne dirige pas son travail maisil est guideacute par lui Cette phrase signie quun agent na pas dintention et dideacutee de ce quildoit faire mais quil sait cependant exactement quoi faire au moment ougrave il est preacutesent devant letravail Cette capaciteacute sexplique par le fait que les individus sont geacuteneacutetiquement preacuteprogrammeacutespour eectuer certaines tacircches [Oster 1981] Cest de cette maniegravere que des espegraveces ne posseacutedantquune tregraves faible intelligence individuelle comme les fourmis ou les termites sont capables deproduire des constructions extrecircmement grandes et sophistiqueacutees On peut par exemple citer uneespegravece nommeacutee la fourmi coupe-feuille du Texas aussi appeleacutee fourmi champignonniste dontles individus vivent dans de grandes colonies de plusieurs millions dindividus et cultivent deschampignons dans des piegraveces souterraines doteacutees dune structure particuliegravere et dune aeacuterationspeacutecique destineacutee agrave favoriser la pousse du champignon [Houmllldobler et al 1990] La cleacute de lacapaciteacute de ces animaux agrave agir de la bonne maniegravere face agrave tel ou tel stimulus reacuteside dans lADNmecircme de lespegravece faccedilonneacute par des millions danneacutees deacutevolution Cest ainsi quune ouvriegraverevaquera agrave ses tacircches jusquagrave ce quun pan de mur de son nid seondre et que devant ce nouveaustimulus elle deacuteploie une nouvelle panoplie de comportements approprieacutes agrave la situation agrave laquelleelle fait soudainement face Ces exemples deacutemontrent que lintelligence est bien preacutesente dans cessystegravemes biologiques vivants et dans la suite de cette section nous allons donner deux exemplesde modeacutelisation de ces systegravemes biologiques en systegravemes multi-agents dans linformatique

Murmuration deacutetourneaux le modegravele des boids

Les eacutetourneaux repreacutesentent une famille dune quinzaine despegraveces doiseaux et vivent surles 5 continents Ces oiseaux se regroupent parfois dans la nature sous forme de nueacutees pouvantcontenir des dizaines de milliers dindividus La raison de ces murmurations nest pas encoreconnue avec certitude mais des theacuteories existent expliquant par exemple que ces regroupementspermettraient une plus grande chance de survie face aux preacutedateurs [King and Sumpter 2012]ou bien que le regroupement et la haute densiteacute dindividus leur permettraient de se reacutechauerdurant les peacuteriodes les plus froides de lanneacutee [Goodenough et al 2017] Ce pheacutenomegravene est beau-coup eacutetudieacute car tous les oiseaux semblent se deacuteplacer dans la mecircme direction et modient leurtrajectoire en mecircme temps sans quaucun oiseau ne se touche en vol ce qui est remarquable eacutetantdonneacute le nombre dindividus et la vitesse agrave laquelle ils volent Malgreacute cette complexiteacute il ny apas doiseau meneur deacutecidant de la direction agrave prendre et un individu seul na pas la capaciteacuteintellectuelle susante pour planier ce genre de deacuteplacements complexes dans un environne-ment en 3 dimensions On retrouve bien lagrave les caracteacuteristiques dun systegraveme multi-agents ougrave desagents simples provoquent de par leurs interactions un comportement intelligent et complexedeacutepassant de loin les capaciteacutes dun individu seul Le domaine des systegravemes multi-agents sestdonc inteacuteresseacute agrave creacuteer un modegravele permettant agrave laide de simulations informatiques de recreacuteer lesmumurations deacutetourneaux Ce modegravele ougrave les agents sont appeleacutes des boids 28 permet dobtenirinformatiquement des murmurations dagents dans un environnement simuleacute gracircce agrave trois regraveglesimplanteacutees dans chaque agent donneacutees ici par ordre de prioriteacute [Reynolds 1987]

28 Le terme boid provient de la contraction de lexpression bird-oid object et signiant objet ressemblant agrave unoiseau

34

24 Les systegravemes multi-agents

1 Eacutevitement des collisions eacuteviter les collisions avec les agents se trouvant agrave proximiteacuteSi un agent est trop proche seacuteloigner dans une autre direction

2 Coordination de la vitesse aller agrave la mecircme vitesse que les agents se trouvant agraveproximiteacute

3 Centrage rester le plus proche possible des autres agents se trouvant agrave proximiteacute sansdeacuteclencher la regravegle deacutevitement de collision

Ces trois regravegles sont donc exeacutecuteacutees par les agents en permanence de la plus prioritaire agravela moins prioritaire et permettent dobtenir virtuellement un comportement de murmurationougrave tous les agents restent proches les uns des autres et changent de direction ensemble commemontreacute dans la Figure 24 Ce modegravele a par exemple eacuteteacute utiliseacute dans lindustrie du divertissementpour simuler des foules coheacuterentes dans des jeux videacuteos ou des lms [Silva et al 2009]

Figure 24 Simulation de boids ougrave lon peut voir les agents se deacuteplaccedilant dans la mecircme directionagrave une certaine distance les uns des autres dans un environnement simuleacute [Reynolds 1987]

Le fourragement des fourmis algorithme de colonies de fourmis

Un autre exemple de systegraveme biologique complexe ougrave lon peut observer leacutemergence duneintelligence collective est le comportement des fourmis dans la nature Dans la section preacuteceacutedentenous avons deacutejagrave vu que par un meacutecanisme de stigmergie certains insectes sociaux comme lesfourmis ou les termites eacutetaient capables de construire des structures tregraves complexes Un autrepheacutenomegravene dauto-organisation a eacuteteacute observeacute lors du fourragement 29 des fourmis de lespegravece de lafourmi dArgentine En eet les ouvriegraveres de cette espegravece se deacuteplacent de maniegravere aleacuteatoire auxalentours de la fourmiliegravere jusquagrave trouver une source de nourriture Une fois que des fourmis onttrouveacute de la nourriture elles retournent agrave la fourmiliegravere Apregraves un certain temps de plus en plusdouvriegraveres se dirigent vers cette source de nourriture jusquagrave ce quun chemin de fourmis allantde la fourmiliegravere jusquagrave la nourriture se forme Ce chemin a cependant la particulariteacute decirctreoptimiseacute en termes de distance agrave parcourir et dobstacles agrave eacuteviter de sorte que les ouvriegraveres em-pruntent eectivement le plus court chemin possible entre leur nid et la nourriture [Deneubourg

29 Le fourragement deacutesigne le comportement des fourmis recherchant de la nourriture et revenant avec celle-ciagrave la fourmiliegravere

35

Chapitre 2 Eacutetat de lart

et al 1990] La Figure 25 donne un exemple de ce agrave quoi peut ressembler un de ces chemins unefois emprunteacute par beaucoup dindividus Ce comportement est remarquable quand on le replacedans le contexte des individus qui en sont agrave lorigine Les ouvriegraveres ne font pas plus de 1 ou 2centimegravetre(s) de long et peuvent couvrir des distances jusquagrave 100 megravetres an de trouver de lanourriture Lenvironnement dans lequel elles se deacuteplacent est complexe joncheacute dobstacles eteacutevolue en permanence alors quelles nont quun sens de lorientation limiteacute et une faible capaciteacutede traitement ducirce agrave leur tregraves petit nombre de neurones (environ 250000)

Figure 25 Illustration dun chemin creacuteeacute par des fourmis appartenant agrave lespegravece des fourmisleacutegionnaires (creacutedit photo Mehmet Karatay)

An de comprendre les meacutecanismes permettant leacutemergence de ce comportement intelligentdes expeacuterimentations ont eacuteteacute meneacutees en laboratoire avec de petites colonies de fourmis dansun environnement controcircleacute [Goss et al 1989] Voici donc le principe de fonctionnement de lacreacuteation de chemins optimiseacutes chez les fourmis

1 Des fourmis se deacuteplacent aleacuteatoirement autour de la colonie agrave la recherche de nourriture

2 Quand une fourmi trouve de la nourriture elle retourne du mieux possible agrave la fourmiliegravereen deacuteposant des pheacuteromones

3 Dautres fourmis attireacutees par ces pheacuteromones vont avoir tendance agrave suivre ce cheminLes nouvelles fourmis atteignant la nourriture vont elles aussi revenir agrave la fourmiliegravere endeacuteposant des pheacuteromones

4 Les fourmis reacuteussissant agrave revenir plus rapidement avec des chemins plus courts agrave la four-miliegravere vont redeacuteposer plus rapidement de nouvelles pheacuteromones eacutetant donneacute quellesmettront moins de temps pour faire des allers-retours entre la nourriture et la fourmi-liegravere

5 Agrave linverse les fourmis ayant emprunteacute des chemins plus longs vont deacuteposer de nouvellespheacuteromones moins rapidement puisquelles mettront plus de temps agrave faire leurs allers-retours

6 Petit agrave petit le chemin le plus court va ecirctre emprunteacute par de plus en plus de fourmisdeacuteposant chacune des pheacuteromones renforccedilant de plus en plus ce mecircme chemin

36

24 Les systegravemes multi-agents

7 Les chemins les plus longs sont peu agrave peu abandonneacutes dautant plus que les pheacuteromonesseacutevaporent avec le temps renforccedilant encore plus les chemins fortement emprunteacutes

8 Au bout dun certain temps seul le chemin le plus court est emprunteacute par la majoriteacute desfourmis

9 Quelques fourmis ne prennent cependant pas ce chemin permettant la recherche de nou-velles sources de nourriture ou de nouveaux chemins En eet si jamais le chemin em-prunteacute par la majoriteacute des individus se voit perturbeacute par un nouvel obstacle (un arbrevenant de tomber par exemple) alors ces quelques fourmis pourront eacuteventuellement trou-ver le nouveau meilleur chemin le plus court et le cycle de renforcement recommencera

Comme pour les murmurations deacutetourneaux on retrouve bien les caracteacuteristiques de lauto-organisation dans un systegraveme multi-agents aucun meneur nest preacutesent les agents suivent seule-ment quelques regravegles simples permettant leacutemergence dun comportement deacutepassant les capaciteacutescognitives de lespegravece Ces regravegles ont eacuteteacute deacutecrites de maniegravere formelle par Marco Dorigo durant sathegravese dans un modegravele appeleacute Ant System (AS) permettant de recreacuteer le comportement des four-mis au sein dune simulation informatique [Dorigo et al 1996] Dans ce modegravele lenvironnementest repreacutesenteacute par un graphe dont les sommets sont les points dinteacuterecircts ougrave lagent peut se rendreet dont les arecirctes sont les chemins disponibles permettant de se deacuteplacer de point en point Agravechaque arecircte (i j) est associeacutee deux valeurs numeacuteriques la premiegravere repreacutesentant la distanceagrave parcourir pour se deacuteplacer du sommet i au sommet j la deuxiegraveme repreacutesentant la quantiteacutede pheacuteromones preacutesente sur cette arecircte Un agent se trouvant agrave un sommet i a connaissancede lensemble des sommets Vi accessibles directement agrave partir de i Pour deacutecider quelle arecircteemprunter lagent prend en compte la distance et la quantiteacute de pheacuteromones associeacutees agrave chaquearecircte Une fois que lagent a atteint un sommet speacutecique deacutesigneacute agrave lavance comme objectif ildeacutepose des pheacuteromones sur chacune des arecirctes emprunteacutees La quantiteacute de pheacuteromones deacuteposeacuteeest deacutependante de la longueur du chemin emprunteacute de sorte quun agent ayant trouveacute un chemincourt deacuteposera plus de pheacuteromones quun agent ayant trouveacute un chemin plus long Ce cycle peutensuite recommencer avec une multitude dagents jusquagrave ce quune solution eacutemerge de la mecircmemaniegravere que pour les fourmis dans la nature Marco Dorigo a dans la suite de ses travaux deacuteve-loppeacute dautres modegraveles ayant tous comme base le modegravele AS mais posseacutedant quelques variationsou ajouts orant une plus grande varieacuteteacute doutils pour reacutesoudre les nombreux problegravemes de larecherche en informatique Dans les faits le modegravele original AS a aujourdhui pratiquement dis-paru au prot de ses descendants et cest pour cette raison que nous nallons pas ici deacutetailler plusavant le modegravele AS [Dorigo and Birattari 2010] Tous ces dieacuterents modegraveles sont maintenantregroupeacutes sous le nom de Ant Colony Optimization (ACO) [Dorigo and Birattari 2011] Cesderniers ont eacuteteacute exploiteacutes dans de nombreux domaines de la recherche scientique pour reacutesoudredes problegravemes varieacutes On peut par exemple citer trois de ces problegravemes tregraves connus et eacutetudieacutesen informatique de par leur complexiteacute qui ont chacun vu des solutions leur ecirctre trouveacutees gracircceagrave ACO

Le problegraveme du voyageur de commerce [Dorigo and Gambardella 1997] Le problegraveme des tourneacutees de veacutehicules [Bell and McMullen 2004] Le problegraveme de gestion de projet agrave contraintes de ressources [Merkle et al 2002]

Dans la prochaine section nous allons nous inteacuteresser plus particuliegraverement agrave lun des modegravelesde la famille ACO nommeacute Ant Colony System (ACS) Nous allons voir son fonctionnement deacutetailleacuteet expliquer les speacuteciciteacutes qui le rendent particuliegraverement inteacuteressant dans le cadre de cette thegravese

37

Chapitre 2 Eacutetat de lart

243 Ant Colony System

Le modegravele ACS possegravede plusieurs modications majeures par rapport au modegravele initial ASnotamment par rapport aux meacutecanismes lieacutes aux pheacuteromones et agrave la prise de deacutecision des agents[Dorigo and Birattari 2010] Premiegraverement seul lagent ayant trouveacute le meilleur chemin est au-toriseacute agrave deacuteposer des pheacuteromones sur les arecirctes quil a emprunteacute alors que dans AS tous les agentsdeacuteposaient des pheacuteromones Deuxiegravemement et pour contrer la relatif manque de pheacuteromones en-gendreacute par cette premiegravere modication les agents possegravedent un nouveau comportement appeleacutemise agrave jour locale de pheacuteromones (locale pheromone update) consistant en la mise agrave jour despheacuteromones par chaque agent sur la derniegravere arecircte emprunteacutee durant la construction dun che-min Cette mise agrave jour sarticule autour dun seuil de pheacuteromones speacutecieacute comme meacutetavariableavant lexeacutecution du programme Si une arecircte traverseacutee par un agent possegravede une quantiteacute depheacuteromones infeacuterieure agrave ce seuil alors lagent deacutepose des pheacuteromones Agrave linverse si la quantiteacutede pheacuteromone sur cette arecircte est supeacuterieure au seuil alors lagent retire une certaine quantiteacute depheacuteromones En dautres termes dans ACS degraves quun agent emprunte une arecircte il met agrave jourla quantiteacute de pheacuteromones sur cette arecircte et ce quelle que soit la qualiteacute du chemin quil est entrain de construire Marco Dorigo explique lui-mecircme les avantages que possegravede ACS par rapportagrave dautres versions existantes [Dorigo and Birattari 2011]

ACS permet de diversier lexploration eectueacutee par les agents pendant une iteacuterationde lalgorithme en diminuant la quantiteacute des pheacuteromones sur les arecirctes les plusutiliseacutees les agents suivants sont encourager agrave se deacuteplacer sur dautres arecirctes moinsexploreacutees permettant de diversier les solutions trouveacutees agrave la n dune iteacuterationCette meacutecanique rend moins probable le fait que plusieurs agents puissent produiredes solutions identiques durant une iteacuteration

Une autre modication du modegravele ACS par rapport au modegravele AS concerne le deacuteplacementdes agents Il est maintenant possible gracircce agrave une nouvelle meacutetavariable de donner limportancesouhaiteacutee entre les pheacuteromones et la distance lors du processus de choix de la prochaine arecircte agraveemprunter par un agent Dans le reste de cette sous-section nous allons expliquer les principalesformules reacutegissant le comportement des agents et la mise agrave jour des pheacuteromones dans ACS

Regravegle de transition deacutetat - la regravegle de transition (state transition rule) deacutetat utilise laregravegle proportionnelle pseudo-aleacuteatoire (pseudo-random proportional rule) ougrave une variable aleacutea-toire q isin [0 1] est compareacutee agrave une meacutetavariable q0 an de deacutecider si lagent courant va explorerle graphe ou sil va exploiter la connaissance produite par les autres agents avant lui En dautrestermes il est possible deacutequilibrer avec cette variable limportance des pheacuteromones et de la dis-tance lors du choix des arecirctes q0 = 0 entraicircne lexploration du graphe en tenant uniquementcompte de la distance associeacutee aux arecirctes tandis que q0 = 1 correspond agrave un comportement derenforcement pur via les pheacuteromones sans aucune exploration LEacutequation 27 permet de choisirentre lexploitation de la connaissance ou lexploration du graphe donnant plus de latitude aumodegravele ACS par rapport agrave AS

Exploitation (Equation 28) si q le q0Exploration biaiseacutee (Equation 29) si q ge q0

(27)

LEacutequation 28 repreacutesente lexploitation directe du graphe ougrave la meilleure arecircte est toujourschoisie

arg maxlisinVi ταil middot η

βil (28)

38

24 Les systegravemes multi-agents

ougrave Vi est lensemble des sommets accessibles depuis le sommet i τil isin [0 1] est la quantiteacute depheacuteromones deacuteposeacutee sur larecircte (i l) par les agents preacuteceacutedents ηil est linformation heuristique delarecircte (i l) α et β sont deux meacutetavariables repreacutesentant respectivement le poids des pheacuteromoneset celui de lheuristique dans le calcul Lheuristique ηil repreacutesente classiquement linformationrelative agrave la distance seacuteparant les sommets i et l et sera deacutecrite apregraves

Il est agrave noter quon ne parle pas ici de pure exploration mais dexploration biaiseacutee dans lesens ougrave les meilleures arecirctes ont une probabiliteacute plus eacuteleveacutee decirctre seacutelectionneacutees Lexpressionmeilleure arecircte est ici deacutenie comme le produit de lheuristique avec la quantiteacute de pheacuteromonesassocieacutees agrave cette arecircte LEacutequation 29 correspond agrave lexploration biaiseacutee du graphe

pij =

ταij middot η

βijsum

lisinViταil middot η

βil

si j isin Vi

0 sinon

(29)

Mise agrave jour globale des pheacuteromones - Apregraves chaque iteacuteration cest-agrave-dire apregraves que tousles agents aient termineacute leur chemin seul lagent qui a trouveacute le meilleur chemin est autoriseacute agravemettre agrave jour le niveau de pheacuteromones τij sur chaque arecircte (i j) quil a emprunteacute

τij =

(1minus ρ) middot τij + ρ middot∆τij si (i j) appartient au meilleur chemin

τij sinon(210)

ougrave ρ est le taux deacutevaporation des pheacuteromones et ∆τij = 1Lbest ougrave Lbest est la longueur dumeilleur chemin

Mise agrave jour locale des pheacuteromones - Un autre ajout du modegravele ACS par rapport aumodegravele AS est la mise jour locale des pheacuteromones Eacutetant donneacute que seul lagent ayant trouveacute lemeilleur chemin deacutepose des pheacuteromones dans ACS (contrairement agrave tous les agents proportion-nellement agrave la qualiteacute de leur solution dans AS) tregraves peu de pheacuteromones sont deacuteposeacutes avec laregravegle de mise agrave jour globale des pheacuteromones Pour contrer ce problegraveme tous les agents mettentagrave jour la quantiteacute de pheacuteromones agrave chaque arecircte emprunteacutee lors de la construction du chemincomme deacutecrit dans lEacutequation 211

τij = (1minus ρ) middot τij + ρ middot τ0 (211)

ougrave τ0 est le niveau de pheacuteromones placeacute sur chaque arecircte du graphe agrave linitialisation du modegravele

Information heuristique - linformation heuristique ηij repreacutesente linformation que lafourmi possegravede a priori sur une arecircte (i j) Dans lalgorithme ACS linformation heuristiqueest calculeacutee en se basant sur la distance entre les deux sommets i et j de larecircte (i j) plus lesdeux sommets sont eacuteloigneacutes lun de lautre et plus la valeur de ηij sera basse indiquant agrave unagent situeacute sur le sommet i quil nest a priori pas inteacuteressant pour lui demprunter larecircte (i j)LEacutequation 212 deacutecrit comment obtenir la valeur de linformation heuristique ηij de larecircte (i j)

ηij =1

dij (212)

ougrave dij est la distance entre les sommets i et j

39

Chapitre 2 Eacutetat de lart

244 Discussion sur le modegravele ACS

Dans cette sous-section nous allons revenir sur un des principes de lalgorithme ACS laregravegle proportionnelle pseudo-aleacuteatoire et son importance danc le fonctionnement du modegraveleCette regravegle comme deacutetailleacutee ci-dessus permet de geacuterer leacutequilibre dans lexploration et lex-ploitation de maniegravere semi-aleacuteatoire (ie avec une variable aleacuteatoire servant agrave xer le seuil debasculement dun comportement vers lautre) Cette dualiteacute explorationexploitation est bienconnue des systegravemes de recherche et de creacuteation de connaissances [March 1991] en voici leurdeacutenition

Lexploration est deacutenie comme eacutetant lexpeacuterimentation avec de nouvelles alternatives sanstenir compte de la connaissance du domaine Les reacutesultats obtenus via cette tactique sont incer-tains mais peuvent aussi aboutir agrave de nouveaux et potentiellement meilleurs reacutesultats que ceuxdeacutejagrave deacutecouverts

Lexploitation quant agrave elle est deacutenie comme le perfectionnement et lextension de reacute-sultats deacutejagrave connus Les reacutesultats obtenus via cette tactique sont plutocirct certains et preacutevisiblesCependant un processus trop axeacute sur lexploitation aura des diculteacutes agrave trouver de tregraves bonnessolutions agrave un problegraveme et aura tendance agrave deacutevelopper la premiegravere solution trouveacutee mecircme sidautres solutions de meilleures qualiteacutes pourraient ecirctre deacutecouvertes en explorant plus avant les-pace de recherche

Il est donc important de trouver un eacutequilibre entre lexploration de lespace de recherchepour trouver de nouvelles solutions et lexploitation permettant daner ces solutions Dautresmeacutethodes dexploration et de deacutecouverte de solutions dans un espace de recherche proposent destechniques speacuteciques pour solutionner ce problegraveme On peut par exemple citer la meacutethode dela descente du gradient consistant agrave minimiser une fonction reacuteelle dans un espace de rechercheCette meacutethode procegravede par iteacuterations successives et se deacuteplace dabord de maniegravere importantedans lespace de recherche an dexplorer un maximum de solutions Puis une fois quune bonnesolution est trouveacutee la meacutethode va diminuer son deacuteplacement dans lespace de recherche andaner la solution trouveacutee La descente de gradient utilise donc une approche ougrave lexplorationest dabord privileacutegieacutee puis petit agrave petit se dirige vers de lexploitation comme illustreacute dans laFigure 26

On pourrait penser agrave premiegravere vue que lexploitation autrement dit le fait que lagent prennela meilleure arecircte disponible agrave chaque choix sorant agrave lui permettrait dobtenir les meilleursreacutesultats En eet le but est ici de trouver le meilleur chemin soit le plus court chemin dans lecadre dune distance euclidienne dun sommet a agrave un sommet b Le fait de permettre agrave lagentde ne pas forceacutement prendre la meilleure arecircte lors de la construction du chemin est donc relati-vement contre-intuitif On peut cependant lever cette intuition avec une seacuterie dexpeacuterimentationsprovenant de la litteacuterature et des observations meneacutees sur les fourmis dans la nature Jean-LouisDeneubourg dont nous avons deacutejagrave parleacute au deacutebut de cette section a beaucoup eacutetudieacute le compor-tement des fourmis en milieu reacuteel et la modeacutelisation de leur processus deacutecisionnel collectif Il aainsi proposeacute en 1990 une expeacuterience appeleacutee le pont binaire [Deneubourg et al 1990] pouvantecirctre reacutesumeacutee ainsi le nid dune colonie de fourmis est seacutepareacutee dune source de nourriture par deuxchemins de longueurs identiques Pour ramener la nourriture au nid les fourmis peuvent doncemprunter lune de ces deux voies sans conseacutequence sur la longueur du chemin total Au deacutepartles fourmis empruntent les deux voies sans distinctions puis une fois un certain temps passeacute

40

24 Les systegravemes multi-agents

Figure 26 Exemple de descente de gradient ougrave lon peut voir lexploration au deacutebut avecun deacuteplacement rapide puis lexploitation ensuite vers la solution trouveacutee ( creacutedit image JorisGillis

une des voies est privileacutegieacutee par rapport agrave lautre et la majoriteacute des fourmis lempruntent Cecomportement est la conseacutequence des pheacuteromones deacuteposeacutees par les fourmis au bout de quelquestemps une des deux voies est emprunteacutee par plus de fourmis que lautre et comme les four-mis deacuteposent des pheacuteromones et sont attireacutees par celles-ci cette dieacuterence saccentue jusquagrave cequune voie soit majoritairement emprunteacutee Il est agrave noter que ce comportement de renforcementnest pas forceacutement vrai pour toutes les espegravece de fourmis dans la nature Cependant cest surce principe que Deneubourg a modeacuteliseacute les eacutequations deacuteterminant le choix eectueacutee par chaquefourmi Ces eacutequations sont agrave la base mecircme des modegraveles ACO deacuteveloppeacutes par Dorigo quelquesanneacutees plus tard Le dispositif de lexpeacuterience des ponts binaires est preacutesenteacute par la Figure 27

Figure 27 Illustration de lexpeacuterience des ponts binaires par Jean-Louis Deneubourg (a)Apregraves un certain temps les fourmis choisissent majoritairement une des deux voies possibles (b)[Deneubourg et al 1990]

Une autre expeacuterimentation du mecircme genre a eacuteteacute reacutealiseacutee par la mecircme eacutequipe de chercheurs ougraveles fourmis doivent se deacuteplacer dun point A agrave un point B en choisissant parmi dieacuterentes voiespossibles [Goss et al 1989] Le dispositif expeacuterimental contient cependant une dieacuterence notable

41

Chapitre 2 Eacutetat de lart

avec lexpeacuterience initiale dans le sens ougrave les dieacuterentes voies ne font pas la mecircme longueurComme le montre la Figure 28 pour aller du nid jusquagrave la nourriture les fourmis disposentdun chemin ougrave deux embranchements similaires sont proposeacutes Chacun de ces embranchementspossegravede une voie courte et une voie longue La fourmi a donc 4 choix agrave eectuer lors dun aller-retour pour partir de son nid et ramener de la nourriture Au deacutebut de lexpeacuterimentation lesfourmis ont besoin de 5 agrave 10 minutes pour explorer leur environnement et trouver la nourritureTous les chemins sont dabord choisis de maniegravere aleacuteatoire puis quelques minutes plus tard etde maniegravere abrupte le meacutecanisme de renforcement rentre en jeu et les voies les plus courtes sontprivileacutegieacutees Une trentaine de minutes apregraves le deacutebut de lexpeacuterimentation les fourmis empruntentmajoritairement le chemin le plus court

Figure 28 Scheacutema du dispositif expeacuterimental utiliseacute pour veacuterier si les fourmis sont biencapables demprunter rapidement la voie la plus courte lorsque leur sont preacutesenteacutes des choixqualitativement dieacuterents [Goss et al 1989]

Alors que la premiegravere expeacuterience a montreacute que les fourmis possegravedent bien un meacutecanismedexploration aleacuteatoire menant au choix puis au renforcement dune des deux voies possibles ladeuxiegraveme expeacuterience montre que les fourmis sont bien capables de choisir le chemin le plus courtlorsquelles sont confronteacutees agrave deux voies possibles ayant des distances dieacuterentes Une critiquepeut ecirctre formuleacutee dans le sens ougrave ces deux expeacuterimentations se sont deacuterouleacutees en laboratoireavec un dispositif expeacuterimental relativement petit (quelques dizaines de centimegravetres pour allerdu nid agrave la nourriture) De par la taille reacuteduite des dispositifs les expeacuterimentations ne duraientgeacuteneacuteralement pas plus dune trentaine de minutes Durant ce laps de temps relativement courtle meacutecanisme deacutevaporation des pheacuteromones ne pouvait pas entrer en jeu car les pheacuteromonesnavaient pas le temps de seacutevaporer

Ces deux expeacuteriences sont inteacuteressantes et illustrent chacune des capaciteacutes fondamentalesdes fourmis dans la nature quant agrave leur deacuteplacement et agrave leur survie Jean-Louis Deneubourg[Deneubourg et al 1990] et Marco Dorigo [Dorigo 2001] ont montreacute comment il eacutetait possible dereproduire ces comportements via des simulations informatiques Dans la tradition des systegravemesmulti-agents les principes permettant de modeacuteliser ces comportements sont relativement simpleset comme montreacute dans la section preacuteceacutedente seules quelques eacutequations susent agrave obtenir unemodeacutelisation de la reacutealiteacute et leacutemergence de comportements intelligents Dans la suite de cettesection nous allons voir quelques exemples dutilisation dalgorithmes provenant des modegraveles

42

25 Utilisation et eacutevolution reacutecentes des algorithmes de colonies de fourmis

ACO dans les systegravemes de recommandation

25 Utilisation et eacutevolution reacutecentes des algorithmes de colonies

de fourmis

Nous avons vu dans les sections preacuteceacutedentes que les algorithmes de colonies de fourmis onteacuteteacute utiliseacutees dans des problegravemes connus comme le voyageur de commerce les tourneacutees de veacutehi-cules ou la gestion de projet agrave contraintes Chacun de ces exemples a la particulariteacute decirctre unproblegraveme doptimisation ougrave le but est de minimiser une distance agrave parcourir ou un temps dexeacute-cution avec certaines contraintes ce qui correspond bien au but premier des ACO La versatiliteacutedes systegravemes multi-agents leur a permis de sadapter dans des domaines comme les systegravemesde recommandation et ils ont particuliegraverement eacuteteacute exploiteacute pour le-eacuteducation Dans la suite decette section nous allons eacutetudier quelques applications des algorithmes de la famille des ACOdans ce domaine particulier

251 Les algorithmes de colonies de fourmis dans les systegravemes de recomman-

dation

Lune des premiegraveres applications des ACO dans le domaine des systegravemes de recommandationa eacuteteacute proposeacutee par [Semet et al 2003] dans le-education Le but de leacutetude eacutetait de recomman-der des cours et des exercices agrave des lyceacuteens avec lobjectif peacutedagogique dameacuteliorer leur reacuteussitescolaire Cette eacutetude est inteacuteressante car en plus de proposer une modication des modegraveles ACOpour la recommandation elle a eacuteteacute reacutealiseacutee en partenariat avec Paraschool 30 une entreprise deacute-dieacutee agrave lapprentissage en ligne pour les lyceacuteens franccedilais permettant aux auteurs de tester leurmodegravele Dans ce dernier le domaine peacutedagogique est repreacutesenteacute par un graphe valueacute ougrave les som-mets sont des items peacutedagogiques et les arcs sont les liens hypertextes ougrave des probabiliteacutes depassage sont associeacutees Les eacutetudiants sont repreacutesenteacutes par des agents se deacuteplaccedilant dans le grapheen laissant des pheacuteromones sur les arcs quils suivent Chaque page de cours ou dexercice (re-preacutesenteacute par un sommet unique dans le graphe) est doteacute dun bouton NEXT amenant leacutetudiantvers un nouveau cours selon une arecircte choisie par lalgorithme selon les facteurs suivants

Poids peacutedagogique W cest la valeur principale de chaque arecircte Il est impleacutementeacutecomme une variable globale accessible agrave tous les agents W est manuellement deacuteni enamont par les professeurs et reegravete limportance des arecirctes venant dun sommet particulier(ie cet exercice est important apregraves la leccedilon x donc W = 0 8 la leccedilon y nest pas tregravesimportante apregraves la leccedilon x donc W = 0 3)

Pheacuteromones S and F S repreacutesente la pheacuteromone de succegraves tandis que F repreacutesente lapheacuteromone deacutechec S est increacutementeacutee quand les eacutetudiants ont reacuteussi agrave compleacuteter lexercicecorrespondant et inversement pour F Ces pheacuteromones sont associeacutees agrave larecircte qui ameneacute lagent au sommet courant mais aussi aux preacuteceacutedents sommets emprunteacutes avec unequantiteacute de plus en plus reacuteduite limiteacutee agrave 4 sommets en arriegravere Le but est de repreacutesenterle fait que le reacutesultat dun exercice deacutepend de lensemble du parcours emprunteacute et nondu dernier sommet uniquement 31 Les pheacuteromones seacutevaporent aussi au fur et agrave mesure

30 http wwwparaschoolcom31 Cette meacutethode est similaire dans son fonctionnement agrave la technique de reacutetropropagation du gradient dans

lapprentissage des reacuteseaux de neurones

43

Chapitre 2 Eacutetat de lart

chaque jour Historique personnel H cest une variable propre agrave chaque sommet visiteacute pour chaque

agent Quand un eacutetudiant valide le module peacutedagogique associeacute au sommet alors la valeurh associeacutee agrave ce sommet particulier est eacutegale agrave 0 5 quand un eacutetudiant eacutechoue le modulepeacutedagogique alors h = 0 75 Cette valeur est ensuite utiliseacutee comme facteur multiplicatifpour reacuteduire la probabiliteacute de visiter le sommet agrave nouveau Si le sommet est revisiteacute Hest agrave nouveau multiplieacute par ces mecircmes valeurs H seacutevapore avec le temps pour tendrevers 1 symbolisant le fait que plus le temps passe et plus un eacutetudiant aura tendance agraveoublier le module peacutedagogique visiteacute

Pour chaque arc a une tness value est calculeacutee selon lEacutequation f(a) = H(ω1W + ω2S minusω3F ) ougrave ω1 ω2 et ω3 sont les poids permettant de moduler limportance des 3 facteurs pris encompte Plus la valeur de f(a) est haute et plus larc sera consideacutereacute attractif Un arc sera doncattractif quand

son ndivideud darriveacutee na jamais eacuteteacute visiteacute ou na pas eacuteteacute visiteacute depuis longtemps (H rarr 1) il est pleacutebisciteacute par les professeurs (W important) il y a une atmosphegravere de succegraves autour de cet arc (S important) peu deacutechecs ont eu lieu pregraves de cet arc (F faible)

An de choisir le prochain arc pour leacutetudiant le systegraveme seacutelectionne aleacuteatoirement un cer-tain nombre darcs possibles et garde celui posseacutedant la plus haute valeur f(a) La seacutelection dunsous-ensemble darcs permet de varier un minimum les recommandations et deacuteviter de proposertout le temps les arcs les plus attractifs

Les auteurs proposent donc ici une adaptation complegravete des ACO pour un systegraveme de recom-mandation dans le-eacuteducation tout en inteacutegrant des principes peacutedagogiques importants Luti-lisation de plusieurs types de pheacuteromones et de dieacuterentes valuations sur les arecirctes du graphepermettent dentrevoir le potentiel et ladaptabiliteacute des algorithmes ACO Quelques critiquespeuvent cependant ecirctre proposeacutees

Une premiegravere critique possible est quil nexiste pas de modegravele utilisateur prenant en compteles caracteacuteristiques personnelles de chaque eacutetudiant (notes niveau style dapprentissage) Pos-seacuteder et utiliser un modegravele par eacutetudiant pourrait permettre agrave lalgorithme de mieux sadapteraux cas particuliers nombreux dans le domaine des systegravemes de recommandation [Gras et al2016] Dans cet article les auteurs montrent que les techniques classiques de ltrage collaboratifnarrivent pas agrave bien deacutetecter les utilisateurs atypiques 32 alors quil est possible de deacutetecter etde satisfaire ces derniers avec des techniques speacuteciques

Une autre critique possible concerne le fait que les professeurs doivent au preacutealable eacutevaluerles chemins possibles agrave partir de chaque sommet sous la forme du poids peacutedagogique W Ce faitreacutevegravele que lexpeacuterimentation na pas utiliseacute un grand nombre de ressources peacutedagogiques (ce quiest le cas car le graphe utiliseacute par les auteurs ne posseacutedait que 20 ndivideuds et 47 arecirctes soit 20ressources peacutedagogiques) Dans la pratique cette meacutethode nest pas adapteacutee pour trois raisonsmajeures Premiegraverement il est dicilement concevable deacutevaluer manuellement la probabiliteacute de

32 Les utilisateurs atypiques (Grey Sheep Users) sont des utilisateurs posseacutedant des preacutefeacuterences dieacuterentes dela majoriteacute des autres utilisateurs du systegraveme

44

25 Utilisation et eacutevolution reacutecentes des algorithmes de colonies de fourmis

passage de chaque arecircte dans des domaines deacutepassant les quelques dizaines de ressources Deuxiegrave-mement lutilisation dexperts du domaine comme les professeurs dans le-eacuteducation nest pasforceacutement possible selon le domaine consideacutereacute Qui peut par exemple juger de la qualiteacute destransitions agrave partir dune musique speacutecique Troisiegravemement un tel modegravele nest que dicile-ment transfeacuterable en leacutetat dun domaine applicatif agrave un autre pour les raisons eacutevoqueacutees ci-dessus

Inteacuteressons-nous maintenant agrave une autre eacutetude dans le-eacuteducation qui propose une solutionpour permettre une plus grande personnalisation des recommandations Dans leur article [Kurilo-vas et al 2015] utilisent eux aussi les ACO avec comme but de fournir des seacutequences composeacutees demodules dapprentissage aux eacutetudiants en fonction de leur style dapprentissage Des recherchesont montreacute quil existait de grands styles dapprentissage et que les apprenants posseacutedaient despreacutefeacuterences pour certains styles plus que dautres Les auteurs utilisent ici la cateacutegorisation en 4grands styles proposeacutee par [Honey et al 1992] 33 Ainsi les agents ne sont deacutesormais plus tousidentiques mais possegravedent un ou plusieurs style(s) dapprentissage preacutefeacutereacute(s) et la mise agrave jourdes pheacuteromones est elle aussi modieacutee an de prendre en compte ces preacutefeacuterences Ainsi un agentpreacutefeacuterera un chemin composeacute de modules dapprentissage correspondant agrave son ou ses propre(s)style(s) dapprentissage et deacuteposera plus de pheacuteromones le cas eacutecheacuteant Ces changements reegravetentune volonteacute de personnalisation des recommandations sinscrivant dans le reacutecent changement deparadigme du domaine des systegravemes de recommandation ougrave les preacutefeacuterences des utilisateurs sontde plus en plus prises en compte Il est neacuteanmoins agrave noter pour cette eacutetude quil est neacutecessairede faire passer un long questionnaire pour deacutenir les styles dapprentissage des apprenants avantde pouvoir utiliser le systegraveme De plus ces styles dapprentissage sont xes et ne peuvent plusecirctre modieacutes apregraves le deacutemarrage du systegraveme empecircchant potentiellement un apprenant deacutevoluerdans sa maniegravere dapprendre

Lideacutee de modier le modegravele ACO pour prendre en compte plusieurs types dutilisateurs aaussi eacuteteacute exploiteacutee dans une autre eacutetude en e-eacuteducation par [Kardan et al 2014] Cette eacutetude a lemecircme but que la preacuteceacutedente agrave savoir recommander des seacutequences personnaliseacutees eacuteducatives avecACO mais les auteurs proposent une autre solution tout aussi inteacuteressante Ils se basent ainsi surla theacuteorie de David Ausubel selon laquelle lapprentissage est faciliteacute lorsque lapprenant peutmettre en relation les nouveaux concepts quil est en train de deacutecouvrir avec ce quil connaicirct deacutejagrave[Ausubel 1963] Les auteurs proposent un algorithme en deux parties

1 Les apprenants sont dabord eacutevalueacutes avec des items de tests correspondant chacun agrave unou plusieurs concepts devant ecirctre appris An de deacuteterminer le degreacute de familiariteacute agraveun concept par un apprenant le score quil a obtenu agrave chaque item de test est utiliseacuteen combinaison avec le degreacute de lien entre les concepts et chaque item pour creacuteer unematrice learners times concepts Lalgorithme des k-means est ensuite utiliseacute an de diviserles apprenants en groupes ayant les mecircmes familiariteacutes avec les concepts

2 lalgorithme ACO est appliqueacute avec autant de groupes dagents speacuteciques quil y a degroupes dapprenants deacutecouverts preacuteceacutedemment avec les k-means Ainsi un chemin opti-mal est trouveacute pour chaque groupe permettant de naviguer parmi tous les concepts dansun ordre preacutecis et speacutecique au degreacutes de familiariteacute de chaque groupe Autrement dit lesystegraveme recommande pour chaque groupe dapprenants une seacutequence eacuteducative person-naliseacutee en fonction de ses connaissances initiales

33 Activist Theorist Pragmatist Reector

45

Chapitre 2 Eacutetat de lart

On retrouve donc ici lideacutee de creacuteer dieacuterents types dagents pour reacutesoudre dieacuterents pro-blegravemes Cette constatation nest pas eacutetonnante dans le sens ougrave lorsquil sagit doptimisationun seul groupe dagents peut sure agrave optimiser une variable unique comme par exemple la dis-tance En revanche dans le domaine des systegravemes de recommandation il nest pas envisageablede proposer la mecircme recommandation agrave tous les utilisateurs Au contraire lapproche agrave privi-leacutegier est de pouvoir sadapter au cas par cas agrave chaque utilisateur et de prendre en compte sespreacutefeacuterences pour lui proposer une solution adapteacutee On peut dailleurs eacutemettre deux critiques decette eacutetude agrave la lumiegravere de cette analyse Premiegraverement mecircme si le modegravele propose un certaindegreacute de personnalisation sa granulariteacute nest encore pas assez ne puisquil traite des groupesdindividus et non un individu unique Ensuite il ny a encore une fois pas de moyen pour unapprenant de changer dynamiquement de groupe eacutetant donneacute que ces derniers doivent ecirctre creacuteeacutesen amont du processus de recommandation

Toujours dans la famille des algorithmes ACO nous pouvons eacutegalement citer le modegraveleAttribute-based Ant Colony System qui est similaire aux derniers modegraveles deacutecrits ci-dessus touten proposant un degreacutes de personnalisation plus n [Yang and Wu 2009] Les auteurs utilisentle modegravele dapprentissage de Kolb [Kolb and Fry 1974] an dassigner agrave chaque ressource eacuteduca-tive et agrave chaque apprenant deux attributs les deacutecrivant (type dapprentissage de la ressourcedelapprenant et niveau de compeacutetence de la ressourcede lapprenant) Les agents possegravedent aussices attributs puisquils correspondent aux apprenants Les auteurs calculent ensuite un niveaude correspondance entre lapprenant et la ressource eacuteducative permettant de juger de la qualiteacutedu chemin trouveacute Finalement la seacutequence dont les ressources eacuteducatives la composant corres-pondent le plus aux caracteacuteristiques de lagent est recommandeacutee agrave lapprenant Ce travail estinteacuteressant car il pousse encore un peu plus la personnalisation des recommandations Cependanton commence agrave remarquer ici que la neacutecessiteacute de personnaliser toujours plus les recommandationscommence agrave complexier de maniegravere importante les systegravemes proposeacutes Nous discuterons plusen deacutetail de ce point dans la conclusion de cette section

Prenons enn une derniegravere eacutetude dans le domaine de le-eacuteducation qui sest particuliegravere-ment inteacuteresseacutee agrave la notion de seacutequence et dobjectif agrave atteindre pour lapprenant [Van den Berget al 2005] En eet les auteurs expliquent que les plateformes deacuteducation en ligne proposentde plus en plus datteindre des objectifs peacutedagogiques de haut niveau (eg acqueacuterir une com-peacutetence speacutecique posseacuteder un certain niveau de connaissance dans un domaine ) tout enlaissant les apprenants libres de suivre les modules quils souhaitent Cependant cette exibiliteacutede fonctionnement complexie les programmes de ces plateformes et peut amener agrave labandondes apprenants Pour remeacutedier agrave ce problegraveme les auteurs proposent un systegraveme de guidage desapprenants utilisant ACO baseacute sur la speacutecication au preacutealable de plusieurs concepts pour chaqueapprenant

Le but de lapprenant cest la description du niveau de compeacutetence que lapprenant veutatteindre)

Le parcours le plan pour atteindre le but de lapprenant deacutecrit comme une seacuterie deseacutequences de ressources eacuteducatives Les plateformes dapprentissage en ligne proposentsouvent elles-mecircmes des parcours via lesquels les apprenants peuvent atteindre leur but

La position de lapprenant repreacutesente lensemble des ressources eacuteducatives ayant eacuteteacutecompleacuteteacutees par lapprenant

Autrement dit an de pouvoir satisfaire un apprenant il est neacutecessaire de savoir quel est

46

25 Utilisation et eacutevolution reacutecentes des algorithmes de colonies de fourmis

le but quil souhaite atteindre la maniegravere dont il veut latteindre et sa position actuelle Cestrois informations sont primordiales pour comprendre la trajectoire dun utilisateur et pour ecirctrecapable de lui recommander une seacutequence adapteacutee agrave ses besoins

Nous avons vu dans cette section le potentiel des algorithmes de colonies de fourmis pour larecommandation Neacuteanmoins la premiegravere partie de leacutetat de lart a montreacute agrave quel point il eacutetaitimportant pour les systegravemes actuels de pouvoir prendre en compte plusieurs facteurs humainsan de satisfaire au mieux les utilisateurs Dans la section suivante nous allons nous inteacuteresseragrave la maniegravere dont les algorithmes de colonies de fourmis sont capables de minimiser non plus unseul objectif (la distance) mais bien plusieurs objectifs pouvant ecirctre opposeacutes les uns aux autres

252 Les algorithmes de colonies de fourmis multi-objectifs

En parallegravele du deacuteveloppement des algorithmes de colonies de fourmis mono-objectif dans lalitteacuterature une partie de la communauteacute scientique sest inteacuteresseacutee aux algorithmes de coloniesde fourmis multi-objectifs dans le but de reacutesoudre de nouvelles classes de problegravemes En eetles algorithmes ACO ont agrave lorigine eacuteteacute conccedilus pour minimiser une valeur souvent repreacutesenteacuteepar la notion de distance Cependant de nombreux problegravemes neacutecessitent la minimisation demultiples valeurs en parallegravele an dobtenir une solution On peut par exemple citer les variantesmulti-objectifs de problegravemes vus dans la section preacuteceacutedente

Le problegraveme du voyageur de commerce multi-objectifs (multi-objective travelling salesmanproblem) ougrave la distance agrave minimiser ainsi que le temps de voyage sont les deux objectifsagrave minimiser (avec lintroduction de contraintes de circulation rendant certains cheminsplus ou moins longs agrave emprunter)

Le problegraveme de la tourneacutee de veacutehicules avec fenecirctre de temps (vehicle routing problem withtime windows) ougrave en plus de minimiser le nombre de veacutehicules utiliseacutes et le trajet totalparcouru par ceux-ci les clients doivent ecirctre livreacutes dans une certaine fenecirctre de temps

Dans le cas de ces deux problegravemes ainsi que pour beaucoup de problegravemes multi-objectifstraiteacutes dans la litteacuterature scientique les objectifs agrave minimiser sont souvent incompatibles entreeux dans le sens ougrave minimiser un objectif speacutecique tend agrave peacutenaliser un ou plusieurs des autresobjectifs Prenons comme exemple le problegraveme du voyageur de commerce multi-objectifs Le butest de trouver le plus court chemin dun point A agrave un point B non seulement dun point devue de la distance parcourue mais aussi du temps neacutecessaire pour faire le chemin Cependantminimiser la distance parcourue impliquera potentiellement demprunter des chemins encombreacutesrallongeant le temps de voyage En dautres termes minimiser lobjectif de distance parcouruepeut deacutegrader lobjectif de temps Inversement optimiser lobjectif de temps demanderait po-tentiellement dutiliser des chemins moins emprunteacutes mais plus longs deacutegradant ainsi lobjectifde minimisation de la distance totale parcourue Ces problegravemes ougrave loptimisation dun objectifaecte les performances des autres objectifs ne possegravedent souvent pas de solution optimale Eneet dans un problegraveme mono-objectif plus un algorithme reacuteussira agrave minimiser cet objectif etmeilleure sera la solution Un problegraveme mono-objectif possegravede donc une solution optimale ougravelobjectif agrave optimiser possegravede une valeur minimale et corollairement il est possible de classerles solutions trouveacutees en fonction de cette valeur Autrement dit pour deux solutions dieacuterentess1 s2 devant minimiser la valeur v pour le mecircme problegraveme si vs1 lt vs2 alors s1 est strictementune meilleure solution que s2 Pour les problegravemes multi-objectifs il nest pas directement possiblede deacuteterminer si une solution est meilleure quune autre Lexemple du voyageur de commerce

47

Chapitre 2 Eacutetat de lart

multi-objectifs avec la distance d et le temps t illustre bien ce fait comment deacuteterminer si une

solution s1 =

d = 13 kmt = 23 mn

est meilleure quune autre solution s2 =

d = 11 kmt = 26 mn

Devant

la multitude de solutions possibles sans moyen direct de les classer il est utile de consideacutererle concept doptimum de Pareto Le principe de Pareto a dabord eacuteteacute inventeacute dans le domainesocio-eacuteconomique pour deacutecrire la distribution de pouvoir et de richesses au sein dune populationIl a ensuite eacuteteacute eacutetendu avec la notion doptimum de Pareto deacutecrivant lensemble des solutionsagrave un problegraveme multi-objectifs ougrave il nest pas possible dameacuteliorer un des objectifs sans deacutegraderles autres 34 Toutes les solutions Pareto-optimales agrave un problegraveme sont donc eacutequivalentes entreelles (mecircme si elles sont bien toutes dieacuterentes les unes des autres) et sont strictement meilleuresque toutes les autres solutions non optimales agrave ce mecircme problegraveme (aussi appeleacutees solutions do-mineacutees) La Figure 29 illustre lespace des solutions sur un problegraveme de minimisation de deuxvariables On remarque la preacutesence dune frontiegravere aussi appeleacute front de Pareto ougrave toutes lessolutions sont optimales

Figure 29 Front de Pareto dun problegraveme de minimisation de deux variables f1 et f2 Toutesles solutions sur cette frontiegravere sont optimales (source Wikipedia)

On peut trouver dans la litteacuterature des exemples de reacutesolution de problegravemes multi-objectifsavec ACO utilisant le concept de Pareto [Alaya et al 2007] proposent un algorithme geacuteneacuteriquebaseacute sur le MAX-MIN Ant System 35 ougrave les nombres de colonies et de structures de pheacuteromonesvarient en fonction du nombre dobjectifsm agrave optimiser Les auteurs proposent ainsi plusieurs va-riantes de leur algorithme ayant des paramegravetres dieacuterents (nombres de colonies de pheacuteromonesde fourmis de cycles et valeur des meta-paramegravetres) Ces dieacuterentes versions sont ensuite testeacuteesavec le problegraveme du sac-agrave-dos multi-objectifs 36 et montrent que la version posseacutedant 1 seulecolonie et m pheacuteromones obtient les meilleurs reacutesultats Outre les reacutesultats obtenus ce travailest inteacuteressant car il propose plusieurs strateacutegies dieacuterentes pour pouvoir adapter les algorithmes

34 On peut deacutecliner ce concept en socio-eacuteconomie ougrave le but est deacutetudier les richesses dune socieacuteteacute an quellessoient reacuteparties selon une solution optimale de Pareto entre toutes les personnes Ce concept a cependant deslimites que nous verrons par la suite35 Le MAX-MIN Ant System [Stuumltzle and Hoos 2000] est une version dieacuterente de lalgorithme initial de

Marco Dorigo posseacutedant deux dieacuterences majeures avec ce dernier seule la fourmi ayant reacutealiseacutee le meilleurparcours peut mettre agrave jour les pheacuteromones du chemin emprunteacute et la quantiteacute de pheacuteromones est limiteacute dans unintervalle speacutecique sur chaque arc36 Le plus souvent reacutefeacuterenceacute dans la litteacuterature en anglais via lacronyme MOKP Multi-Objective Knapsack

Problem

48

25 Utilisation et eacutevolution reacutecentes des algorithmes de colonies de fourmis

ACO aux problegravemes multi-objectifs agrave savoir

Traces de pheacuteromones 2 strateacutegies existent lorsquun problegraveme possegravede plusieurs objec-tifs La premiegravere est de nutiliser quun seul type de pheacuteromones Dans ce cas la quantiteacutede pheacuteromones deacuteposeacutee par les fourmis est deacutenie par une agreacutegation des dieacuterents objec-tifs La deuxiegraveme strateacutegie consiste agrave utiliser plusieurs pheacuteromones Dans ce cas chaqueobjectif est geacuteneacuteralement associeacute agrave une colonie de fourmis unique chacune posseacutedant sonpropre type de pheacuteromones

Deacutenition des heuristiques encore une fois 2 strateacutegies existent pour la partie heuristiqueUne premiegravere solution consiste agrave agreacuteger tous les objectifs en une seule heuristique Unedeuxiegraveme solution consiste agrave consideacuterer chaque objectif seacutepareacutement Dans ce cas il y ageacuteneacuteralement une colonie par objectif

Mise-agrave-jour des pheacuteromones lors de la mise agrave jour des pheacuteromones il est neacutecessaire dedeacutecider sur quelle solution des pheacuteromones doivent ecirctre deacuteposeacutees Une premiegravere possibi-liteacute est de reacutecompenser les meilleures solutions agrave chaque objectif Une seconde possibiliteacuteest de reacutecompenser toutes les solutions appartenant agrave lensemble des solutions Pareto-optimales

Le concept doptimisation multi-objectifs est aussi utiliseacute pour reacutesoudre des problegravemes sansutiliser des algorithmes de type ACO Ces travaux sont inteacuteressants dans le cadre de cette thegravesecar ils peuvent orir un point de comparaison aux modegraveles deacuteveloppeacutes dans le chapitre suivantougrave le but est le mecircme mais la technique utiliseacutee pour y parvenir est dieacuterente Nous allons main-tenant voir plus en deacutetails le travail de [Ribeiro et al 2014] ougrave les auteurs ont proposeacute deuxmeacutethodes de recommandation multi-objectifs sans utiliser dalgorithmes de type ACO

Pareto-ecient ranking dans cette premiegravere meacutethode le principe est ici de re-preacutesenter chaque ressource recommandable agrave un point dans un espace agrave n dimensionsappeleacute le user-interest space Un point dans cet espace est repreacutesenteacute par n coordon-neacutees [c1 c2 cn] ougrave chacune repreacutesente un score de pertinence de la ressource pourlutilisateur estimeacute par dieacuterents algorithmes Les points situeacutes agrave la frontiegravere de Paretocorrespondent aux cas ougrave aucune Pareto-ameacutelioration nest possible dans les dieacuterentesdimensions

Pareto-Ecient Hybridization (PEH) dans cette deuxiegraveme meacutethode le principe estdassocier chaque ressource avec une valeur de pertinence unique pour lutilisateur Cettevaleur est elle-mecircme estimeacutee par une combinaison lineacuteaire des scores de pertinence obtenuspar n dieacuterents algorithmes de recommandation existants (ie αtimesc1+βtimesc2+ +θtimescn)Dans cette tactique lespace appeleacute objective space comporte 3 dimensions ougrave chaquepoint correspond aux niveaux de preacutecision de diversiteacute et de nouveauteacute atteint par unetechnique dhybridation possible Le but est de chercher les poids (ie α β θ) pourlesquels lhybridation des dieacuterents algorithmes permet dobtenir le meilleur reacutesultat pourlutilisateur Il est ensuite possible de moduler cette hybridation an de correspondre aumieux aux prioriteacutes de lutilisateur au moment de la recommandation (eg pour un utilisa-teur reacutecent le systegraveme pourrait proposer des ressources pertinentes et classiques pour luiprouver linteacuterecirct du systegraveme de recommandation tandis que pour un utilisateur ancienil pourrait ecirctre inteacuteressant de privileacutegier la diversiteacute et la nouveauteacute an de lui apporterde nouvelles ressources quil ne connaicirct pas encore)

Selon les auteurs la premiegravere meacutethode permet de trouver un ordonnancement partiel entre

49

Chapitre 2 Eacutetat de lart

les ressources tout en eacutevitant les ressources positionneacutees aux positions extrecircmes de la frontiegravere dePareto La deuxiegraveme meacutethode quant agrave elle utilise la frontiegravere de Pareto pour trouver des hybri-dations capable de sadapter aux demandes et dorir des recommandations eacutetant simultaneacutementpertinentes en termes de preacutecision de diversiteacute et de nouveauteacute Dans le cadre de cette thegravese ladeuxiegraveme technique pareto-ecient hybridization (PEH) est particuliegraverement inteacuteressante carelle correspond aux probleacutematiques poseacutees au chapitre preacuteceacutedent De plus cet article est agrave lafois reacutecent est beaucoup reacutefeacuterenceacute dans la litteacuterature scientique de par la qualiteacute des solutionsproposeacutees Ainsi nous preacuteciserons le fonctionnement de lalgorithme PEH proposeacute par [Ribeiroet al 2014] et nous utiliserons ses reacutesultats comme comparaison pour eacutevaluer les performancesde notre modegravele dans la chapitre preacutesentant les expeacuterimentations meneacutees et les reacutesultats obtenus

253 Discussion sur lutilisation de loptimum de Pareto

Dans ces derniegraveres pages nous nous sommes attardeacutes sur lutilisation du concept doptimumde Pareto dans la litteacuterature Cependant mecircme si lutilisation de cette technique est courantepour reacutesoudre des problegravemes multi-objectifs elle nest pas forceacutement la plus adapteacutee selon lessituations rencontreacutees et les solutions attendues On peut deacutenombrer au moins quatre problegravemesengendreacutes par lutilisation du concept de Pareto

1 Comme le souligne [Iredi et al 2001] lutilisation du front de Pareto est utile lorsquilnest pas possible dordonner limportance des dieacuterents objectifs du problegraveme Lorsquecela est possible des poids sont attribueacutes agrave chacun des objectifs et il devient possible declasser les dieacuterentes solutions obtenues selon ces poids

2 Il est neacutecessaire decirctre capable de geacuteneacuterer beaucoup de solutions pour un problegraveme donneacutean de pouvoir deacuteterminer les solutions Pareto-optimales et les solutions domineacutees

3 Une solution Pareto-optimale nest pas forceacutement une solution inteacuteressante pour le pro-blegraveme Un exemple connu illustre ce fait une socieacuteteacute ougrave un seul homme possegravede lensembledes richesses est optimale car partager ces richesses entraicircnerait la reacuteduction du bien-ecirctredau moins un individu

4 Si le problegraveme exige le choix dune solution le front de solutions Pareto-optimales nepermet pas a priori de faire un choix eacutetant donneacute que toutes les solutions du front sonteacutequivalentes les unes aux autres Le problegraveme dispose alors dun ensemble de solutions lereacutesolvant et non dune seule solution

Le dernier point ci-dessus est eacutegalement eacutevoqueacute dans [Dorigo and Birattari 2010] ougrave lesauteurs expliquent que deux maniegraveres de reacutesoudre les problegravemes multi-objectifs existent dans lalitteacuterature soit il est possible de classer les objectifs par ordre dimportance ou eacuteventuellementde combiner tous les objectifs en un seul gracircce agrave une somme pondeacutereacutee soit les preacutefeacuterences ou lespoids a priori ne sont pas connus et dans ce cas il est inteacuteressant de deacuteterminer un ensemblede solutions Pareto optimales Dans le cadre dun systegraveme de recommandation et comme nouslavons illustreacute dans la Section 22 il est possible destimer les besoins des utilisateurs danschacune des dimensions eacutevalueacutees (diversiteacute nouveauteacute preacutecision ) et donc de moduler leurimportance en amont de la recommandation (eg en leur attribuant des poids par exemple)

26 Discussion geacuteneacuterale

Dans cet eacutetat de lart nous avons fait un tour dhorizon du domaine de la recommandationet de son eacutevolution au cours de ces derniegravere anneacutees Avec la deacutemocratisation dInternet de plus

50

26 Discussion geacuteneacuterale

en plus dutilisateurs ont eacuteteacute ameneacutes agrave utiliser ces systegravemes et aujourdhui ils accompagnentlimmense majoriteacute des grands sites web et prennent une place de plus en plus importante Cettedeacutemocratisation a permis la mise en relief des besoins toujours plus varieacutes des utilisateurs et amontreacute que les systegravemes mono-objectif baseacutes uniquement sur la preacutecision des recommandationsneacutetaient plus susants Agrave la lumiegravere de ce constat nous nous sommes particuliegraverement inteacute-resseacutes aux techniques permettant de prendre en compte le plus de dimensions possibles dans lesbesoins des utilisateurs que nous avons appeleacutes facteurs humains Les travaux de la litteacuteraturedu domaine preacutesenteacutes dans cette section ont permis de mettre en exergue un certain nombre depoints inteacuteressants qui seront utiliseacutes pour reacutepondre aux probleacutematiques de cette thegravese ils sontreacutesumeacutes dans la liste suivante

[Dorigo and Birattari 2011] les auteurs ont preacutesenteacute dieacuterents modegraveles dalgorithmes defourmis permettant de reacutesoudre un grand nombre de problegravemes Ces modegraveles sont inteacuteres-sants notamment de par leur capaciteacute de reacutesoudre des problegravemes multi-objectifs complexesgracircce aux notions dintelligence collective et deacutemergence Ils sont utiliseacutes dans dieacuterentsdomaines dapplication (optimisation recommandation) ils sont tregraves modulables etorent de nombreuses possibiliteacutes pour les probleacutematiques de cette thegravese

[Semet et al 2003] cette eacutetude est lune des premiegraveres agrave proposer lutilisation de plusieurspheacuteromones dieacuterentes dans les ACO dans le cadre dun systegraveme de recommandation dansle-education Ces dieacuterents pheacuteromones eacutetaient chacun destineacutes agrave reacutesoudre une facettedu problegraveme Ce travail a neacuteanmoins aussi montreacute les limites de la creacuteation manuelle dungraphe sur lequel appliquer les ACO deacutemontrant linteacuterecirct davoir une meacutethode automa-tique de creacuteation et de valuation dun graphe repreacutesentant le domaine dapplication et sesressources

[Kurilovas et al 2015] les auteurs ont deacutemontreacute dans cette eacutetude linteacuterecirct de pouvoircateacutegoriser les utilisateurs dun systegraveme an de personnaliser davantage les recommanda-tions mais elle a aussi montreacute le besoin de pouvoir modier en cours de fonctionnementces cateacutegories pour ne pas enfermer les utilisateurs dans les mecircmes recommandations

[Kardan et al 2014] les auteurs ont ici montreacute lutilisation de plusieurs types dagentsdieacuterents qui chacun cherchaient dieacuterentes solutions Cette technique est proche de luti-lisation des dieacuterents types de pheacuteromones de [Semet et al 2003] et permet de chercherdes solutions plus varieacutees agrave des problegravemes complexes

[Yang and Wu 2009] cette eacutetude utilise les modegraveles ACO dans le-education en eacutetoantencore le niveau de personnalisation pour chaque utilisateur Elle illustre cependant leproblegraveme courant ougrave lameacutelioration de la personnalisation des recommandations reacutesultesouvent dans laugmentation de la complexiteacute du modegravele

[Van den Berg et al 2005] cet article propose de recommander des seacutequences de res-sources eacuteducatives agrave des apprenants Il illustre linteacuterecirct de deacutenir une seacutequence de recom-mandation avec des buts peacutedagogiques agrave atteindre un objectif nal et un point de deacutepartougrave lutilisateur se trouve actuellement

[Ribeiro et al 2014] ce dernier article nutilise pas les ACO mais une hybridation de plu-sieurs algorithmes permettant de proposer des recommandations de ressources pertinentespour chaque utilisateur sur 3 dimensions (preacutecision diversiteacute nouveauteacute) Il propose doncde reacutesoudre un problegraveme similaire agrave celui poseacute dans cette thegravese mais avec une techniquedieacuterente des travaux preacutesenteacutes preacuteceacutedemment il sera par conseacutequent une solide base decomparaison pour mesurer les performances dun algorithme de type ACO

Dune maniegravere geacuteneacuterale cette revue des travaux sur les algorithmes de colonies de fourmis

51

Chapitre 2 Eacutetat de lart

ont montreacute leur puissance de reacutesolution de problegravemes varieacutes et leur modulariteacute Cependant nousavons aussi constateacute ici une tendance geacuteneacuterale ces derniegraveres anneacutees agrave complexier toujours plusle modegravele initial et les agents le composant illustrant un certain eacuteloignement avec la philosophiedes modegraveles multi-agents Celle-ci repose sur la reacutesolution de problegravemes complexes gracircce agrave laproprieacuteteacute de leacutemergence et de lauto-organisation dagents simples reacutegis par des regravegles simplesCette complexication deacutecoule cependant de la direction prise par le domaine des systegravemes de re-commandation ces derniegraveres anneacutees avec la deacutemocratisation de nombreuses mesures deacutevaluationtelles que la diversiteacute la nouveauteacute etc Dans la suite de cette thegravese nous eacutetudierons la maniegraveredont il est possible de combiner la neacutecessaire complexication des recommandations an decirctrele plus pertinent possible pour lutilisateur et la simpliciteacute inheacuterente aux modegraveles multi-agents

En conclusion nale de cet eacutetat de lart nous pouvons deacutenir deux enjeux qui guiderontla suite de ce travail la recommandation multi-objectifs et la recommandation enseacutequences Le but de cette thegravese est donc de sinscrire agrave lintersection de ces deux enjeux gracircceagrave un modegravele de colonies de fourmis multi-objectifs qui sera deacutecrit dans le chapitre suivant

52

Chapitre 3

Notre modegravele de recommandationmulti-objectifs AntRS

Sommaire

31 Introduction 54

32 Fonctionnement geacuteneacuteral du modegravele 54

33 Graphe 55

34 Objectifs 60

341 Similariteacute 63

342 Diversiteacute 64

343 Nouveauteacute 64

344 Preacutefeacuterences 66

345 Progressiviteacute 67

35 Tactiques de fusion 70

351 Colonie de fusion 71

352 Fusion de seacutequences 72

353 Conclusion 72

53

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

31 Introduction

Apregraves cet eacutetat des lieux de la recherche sur les systegravemes de recommandation il peut ecirctre utilede rappeler ici les principaux objectifs que nous nous sommes xeacutes pour ecirctre satisfaits par notremodegravele multi-objectifs de recommandation de seacutequences

Ecirctre susamment geacuteneacuterique pour quil puisse ecirctre utiliseacute dans plusieurs domaines touten sadaptant aux diverses contraintes et eacutevolutions de lenvironnement de ces domaines

Permettre de prendre des facteurs humains Pouvoir geacuterer dimportantes quantiteacute de donneacutees cest-agrave-dire ecirctre capable de produire des

recommandations satisfaisantes dans un grand espace de recherche Produire des recommandations sous forme de seacutequences

Tous ces objectifs sont neacutecessaires pour produire un modegravele reacutepondant aux probleacutematiqueseacutenonceacutees dans lintroduction de ce manuscrit Le modegravele que nous avons conccedilu prend inspirationdes modegraveles de colonies de fourmis preacutesenteacutes dans leacutetat de lart et plus particuliegraverement dela variante ACS (Ant Colony System) car cette version possegravede des qualiteacutes intrinsegraveques im-portantes notamment sa capaciteacute supeacuterieure dexploration de lenvironnement pour reacutepondreaux probleacutematiques poseacutees Pour rappel les avantages du modegravele ACS ont eacuteteacute deacutetailleacutes dans laSection 243 En se basant sur Dans la suite de ce chapitre nous deacutetaillerons le fonctionnementgeacuteneacuteral du modegravele dans la Section 32 Ensuite nous preacutesenterons la creacuteation du graphe dansla Section 33 et les facteurs humains consideacutereacutes et leur inteacutegration dans la Section 34 Nousdeacutetaillerons par la suite les deux tactiques de fusion des reacutesultats pour la recommandation naledans la Section 35 et enn nous discuterons du modegravele dans son ensemble

32 Fonctionnement geacuteneacuteral du modegravele

Dans le chapitre preacuteceacutedent sur leacutetat de lart nous avons preacutesenteacute dans la Section 243 lemodegravele ACS de Dorigo et son fonctionnement [Dorigo and Birattari 2010] Notre modegravele sinspiredACS dans le sens ougrave nous reprenons les grandes eacutetapes de ce dernier tout en ladaptant aucontexte et aux contraintes des systegravemes de recommandation Pour rappel voici lalgorithme 1de haut niveau sur lequel se base le fonctionnement de lensemble des algorithmes des ACO

Algorithm 1 Meacutetaheuristique Ant Colony Optimization

Initialisation des paramegravetres et des pheacuteromoneswhile conditions darrecircts non atteintes doConstruction des solutionsRecherche Locale (optionnelle)Mise agrave jour des pheacuteromones

end while

Chaque version existante des ACO a introduit des variations dans une ou plusieurs deseacutetapes centrales de lalgorithme La variante ACS a par exemple introduit la mise agrave jour localedes pheacuteromones dans la derniegravere eacutetape UpdatePheromones Notre modegravele suit cette philosophieen prolongeant les travaux de Dorigo agrave travers une variante multi-colonies et multi-objectifs quenous avons nommeacute AntRS Avant de deacutenir plus en deacutetail ces modications dans le reste duchapitre voici lalgorithme 2 modieacute correspondant au fonctionnement de notre modegravele

54

33 Graphe

Algorithm 2 AntRS

Initialisation des paramegravetres et des pheacuteromonesCreacuteation du grapheInitialisation des dieacuterentes colonieswhile conditions darrecircts non atteintes doConstruction des solutions pour chaque colonieMise agrave jour locale et globale des pheacuteromones modieacutee

end whileFusion des dieacuterentes solutionsRecommandation

Dans notre modegravele inspireacute dACS nous pouvons distinguer un certain nombre dapports quiseront approfondis dans la suite de ce chapitre La creacuteation du graphe prend ainsi une placepreacutepondeacuterante en amont de lexeacutecution de lalgorithme an de pouvoir repreacutesenter correctementle domaine dapplication et ses ressources De plus alors que dans les modegraveles initiaux de Dorigoune seule colonie de fourmis avait pour but de trouver des solutions notre modegravele possegravedeplusieurs colonies travaillant chacune agrave optimiser un objectif (ie un aspect correspondant agraveun facteur humain) de la recommandation nale Ces dieacuterentes colonies constituent le cdivideurde notre approche et seront expliqueacutees en deacutetail Enn apregraves la convergence dune solutiondans chacune des colonies (ie un chemin dans le graphe correspondant agrave une seacutequence deressources dans un ordre preacutecis) un dernier processus de fusion de ces solutions a lieu an dene proposer agrave lutilisateur nal quune seule seacutequence orant le meilleur compromis entre lesdieacuterents objectifs de chaque colonie Apregraves cette derniegravere eacutetape la recommandation peut ecirctreproposeacutee agrave lutilisateur Dans la suite de ce chapitre ces dieacuterentes eacutetapes seront deacutetailleacutees ande mettre en exergue le fonctionnement de notre modegravele

33 Graphe

La premiegravere eacutetape de fonctionnement du modegravele est la creacuteation du graphe Celui-ci repreacute-sente lenvironnement dans lequel les agents eacutevoluent Dans ce contexte les ndivideuds repreacutesententles ressources du domaine (musiques oeuvres dart contenu peacutedagogique etc) tandis que lesarecirctes sont les chemins permettant dacceacuteder agrave ces ressources Les agents se deacuteplacent ainsi dendivideuds en ndivideuds en empruntant des arecirctes Le processus de creacuteation du graphe nest souvent quepeu deacutetailleacute dans la litteacuterature pour plusieurs raisons Premiegraverement un certain nombre deacutetudesse focalisent sur un jeu de test composeacute de peu de ressources limitant linteacuterecirct de deacutevelopperdes tactiques eacutelaboreacutees de creacuteation dun graphe Cela peut ecirctre ducirc agrave la simpliciteacute dutiliser unpetit jeu de donneacutees aux limites poseacutees par le domaine dapplication ou encore agrave la diculteacute dereacutecolter des donneacutees Par exemple si le but est de deacutevelopper un systegraveme de recommandationdans un museacutee contenant 100 divideuvres dart le graphe repreacutesentant le domaine sera relativementpeu complexes (ie 100 ndivideuds et quelques centaines ou milliers darecirctes) De la mecircme maniegraverelorsque le jeu de donneacutees est limiteacute en taille il est possible pour des experts du domaine decreacuteer et de valuer manuellement les arecirctes entre les dieacuterentes ressources comme cela a eacuteteacute faitdans [Semet et al 2003] Cependant la conception dun algorithme permettant de construire latopologie du graphe de maniegravere automatique possegravede agrave la fois des avantages et des inconveacutenients

55

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

Avantages Inconveacutenientsbull La conception algorithmique du graphepermet de sadapter rapidement agrave dieacute-rents domaines applicatifs ayant dieacuterentstypes et nombres de ressources

bull La qualiteacute dun graphe produit automa-tiquement deacutepend fortement de la qualiteacutede son algorithme et peut potentiellementecirctre moins pertinent quun graphe creacutee parun expert du domaine

bull Il devient possible dinteacutegrer untregraves grand nombre de ressources du do-maine applicatif si cela est neacutecessaire (parexemple toutes les musiques dun sitedeacutecoute de musiques en ligne)

bull La prise en compte dun grand nombrede ressources a pour conseacutequence daug-menter signicativement le temps de calculde lalgorithme travaillant sur ce graphe enaval

bull Lintervention dexperts humains ne de-vient plus neacutecessaire pour creacuteer la topolo-gie du graphe et valuer ses arecirctes

bull Lalgorithme de creacuteation automatiquedu graphe doit capturer les informationsdun domaine et les reeacuteter dans la topolo-gie du graphe (ie pourquoi une ressourceest lieacutee par une arecircte agrave une autre etc)

Le but de cette section sera donc de deacutetailler lalgorithme de creacuteation du graphe ainsi que lesreacuteponses proposeacutees aux inconveacutenients eacutenonceacutes ci-dessus

Avant de preacutesenter la meacutethode de creacuteation du graphe il est important de discuter de ceque repreacutesente ce graphe dans le modegravele ACO et de son pendant pour les fourmis Une desdieacuterences principales entre le comportement reacuteel des fourmis dans la nature et les simulationsinformatiques des algorithmes ACO reacuteside dans la deacutenition de lespace de recherche Les four-mis reacuteelles eacutevoluent dans un espace de recherche continu sans aucun point de repegravere ni cheminpreacute-eacutetabli Les fourmis sont en outre libres dexplorer lenvironnement ougrave bon leur semble Lesagents simuleacutes avec ACO sont quant agrave eux limiteacutes agrave un espace de recherche discret (le graphe)et ne peuvent se mouvoir quagrave certains points dinteacuterecircts (les sommets) en empruntant certainschemins deacutejagrave eacutetablis (arecirctes) Cette simplication de lespace de recherche est neacutecessaire agrave la foispour reacuteduire la complexiteacute de lalgorithme et pour permettre de repreacutesenter des domaines dap-plication posseacutedant des ressources connues contrairement agrave un environnement naturel inconnuet potentiellement inni du point de vue dune fourmi Cependant les algorithmes ACO ontavant tout un but de simulation du comportement de ces fourmis An de combiner agrave la fois lescontraintes dune simulation informatique avec le comportement reacuteel observeacute des fourmis dansla creacuteation du graphe plusieurs solutions sont possibles

Lun des moyens les plus simples pour approcher le comportement reacuteel des fourmis dansla nature consiste agrave creacuteer des arecirctes entre chaque sommet du graphe dans le but de creacuteer unenvironnement ougrave lagent simuleacute pourra se deacuteplacer ougrave il veut en empruntant le chemin quildeacutesire Le graphe creacuteeacute serait ainsi complet Neacuteanmoins cette approche nest pas reacutealiste pour deuxraisons principales Premiegraverement lenvironnement peut contenir des obstacles infranchissablespour des fourmis et elles ne peuvent donc pas se deacuteplacer partout Dans un graphe cela setraduirait par une absence darecircte entre deux sommets Deuxiegravemement cette solution est aussipeu pratique degraves que le nombre de sommets deacutepasse plusieurs centaines car le nombre darecirctesn creacuteeacutees se calcule avec |E| = n(nminus1)

2 Le nombre darecirctes dun graphe de 100 sommets est doncde 4950 tandis que pour un graphe de 1000 sommets ce nombre atteint deacutejagrave 499500 comme lemontre la Figure 31 Cette augmentation exponentielle nest eacutevidemment pas envisageable degraveslors que lon traite de domaines pouvant posseacuteder plusieurs dizaines de milliers de ressources agrave

56

33 Graphe

repreacutesenter dans le graphe

Figure 31 Graphe repreacutesentant leacutevolution exponentielle du nombre darecirctes selon le nombrede sommets existants dans un graphe complet

Un des objectifs de cette thegravese eacutetant dappliquer notre modegravele agrave un domaine applicatif reacuteelposseacutedant de tregraves nombreuses ressources la creacuteation dun graphe complet neacutetait pas une op-tion Nous avons donc opteacute pour une approche plus reacutealiste dans la creacuteation du graphe ande diminuer sa taille et les temps de calculs potentiels Pour reacutealiser cette tacircche nous navonsque deux solutions possibles supprimer des sommets etou supprimer des arecirctes La premiegraverepossibiliteacute a rapidement eacuteteacute eacutecarteacutee car supprimer des sommets aecte directement la qualiteacutedes solutions trouveacutees en faisant meacutecaniquement baisser la mesure de couverture du systegraveme derecommandation cest-agrave-dire la capaciteacute qua un systegraveme agrave recommander toutes les ressourcesdun domaine De plus il nest pas eacutevident de justier la suppression de certains sommets parrapport agrave dautres Chaque sommet du graphe repreacutesentant une ressource unique du domainedapplication la suppression de certains sommets ne pourrait se faire que par la creacuteation de regraveglesgeacuteneacuterales Une solution possible pourrait ecirctre par exemple de ne pas inteacutegrer dans le graphe lesressources nayant jamais eacuteteacute consulteacutees ou nayant pas eacuteteacute consulteacutees lors des 6 derniers moisCependant on voit bien que ces regravegles ne sont pas forceacutement adapteacutees agrave chaque utilisateur etont un grand risque de supprimer des ressources que ces derniers auraient pu appreacutecier Nousavons donc preacutefeacutereacute la deuxiegraveme solution supprimer des arecirctes Cette meacutethode a lavantage degarder lensemble des ressources du domaine recommandables par le systegraveme tout en reacuteduisantgrandement la complexiteacute du graphe 37 La question sest donc poseacutee didentier les arecirctes agraveseacutelectionner le but eacutetant de permettre au systegraveme de proposer des recommandations agrave la foisqualitatives adapteacutees mais aussi potentiellement nouvelles agrave lutilisateur tout en reacuteduisant lataille du graphe Pour ce faire nous avons formuleacute deux hypothegraveses aidant agrave la seacutelection desarecirctes

37 Tant quil y a un chemin dans le graphe permettant de se deacuteplacer dun sommet quelconque vers tous lesautres sommets alors toutes les ressources peuvent theacuteoriquement ecirctre recommandeacutees par le systegraveme

57

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

1 Les seacutequences de ressources deacutejagrave consulteacutees par le passeacute contiennentdes informations sur le comportement des utilisateurs qui peuventecirctre exploiteacutees pour la topologie du graphe

2 Les seacutequences de ressources deacutejagrave consulteacutees par les utilisateurs au-paravant ne sont pas toujours les meilleures possibles et auraient puecirctre ameacutelioreacutees avec des recommandations pertinentes

La premiegravere hypothegravese H1 se justie par le fait que lutilisateur est le premier agrave connaicirctreses envies ses besoins et les ressources qui le satisferaient le plus agrave un moment t [Jones 2010]Il est donc neacutecessaire de consideacuterer ces seacutequences de consultations passeacutees an de comprendrelutilisation que font les utilisateurs des ressources du domaine La deuxiegraveme hypothegravese se justiequant agrave elle par le fait quun utilisateur ne peut pas dans la majoriteacute des cas avoir une vue den-semble de toutes les ressources dun domaine Il est en eet courant pour un site de e-commerceou deacutecoute de musiques de posseacuteder plusieurs dizaines de milliers de ressources La deuxiegravemehypothegravese H2 se base donc sur le problegraveme fondamental que les systegravemes de recommandationessaient de reacutesoudre agrave savoir aider les utilisateurs agrave faire les meilleurs choix possibles dans desenvironnements toujours plus complexes et vastes Cette discussion sur les deacutes ameneacutes par cesdeux hypothegraveses nous amegravene agrave consideacuterer le travail dHerbert Simon qui a eacuteteacute deacutecoreacute dun prixnobel deacuteconomie et dun prix Turing Ce dernier a theacuteoriseacute et nommeacute le problegraveme de rationaliteacutelimiteacutee devant des contraintes alteacuterant et limitant les capaciteacutes dun individu (domaine tropvaste manque dinformation etc) il est preacutefeacuterable de se diriger vers des solutions satisfaisantesplutocirct quoptimales [Simon 1997] En reacuteponse agrave ce problegraveme les utilisateurs procegravedent donc paressais-erreurs pour reacutepondre agrave leurs besoins de maniegravere empirique [Jameson et al 2015] Les seacute-quences dinteractions creacuteeacutees par les utilisateurs durant ces processus contiennent donc beaucoupdinformations exploitables par un systegraveme de recommandation mais aussi beaucoup de bruitset dapproximations [Kuhlthau 1991 Castagnos et al 2010] La philosophie de notre modegraveleest les reacuteponses que nous apportons aux problegravemes ci-dessus sont inspireacutees par cette theacuteorie

An de prendre en compte ces deux hypothegraveses nous proposons dans la suite de cette sectionune meacutethode permettant de creacuteer un graphe orienteacute en se basant agrave la fois sur les seacutequencespasseacutees des utilisateurs ainsi que sur la creacuteation de nouvelles arecirctes Lobjectif est dexploiterles informations contenues dans les seacutequences passeacutees des utilisateurs mais aussi de garantirune certaine seacuterendipiteacute du systegraveme de recommandation via la creacuteation de nouvelles arecirctes Lapremiegravere eacutetape de ce processus est de creacuteer un sommet par ressource du domaine Ensuite pourconstruire les arecirctes reliant ou non ces sommets nous calculons les poids associeacutes aux nombrede co-consultations preacutesentes dans lensemble des seacutequences de consultations passeacutees Autrementdit quand un utilisateur consulte une ressource A puis une ressource B directement apregraves nousconsideacuterons que la transition A rarr B est une co-consultation Pour deacuteterminer si une arecircte estconstruire entre deux sommets nous calculons ensuite le poids de la co-consultation cest-agrave-direle nombre de fois quelle apparaicirct dans les seacutequences des utilisateurs En fonction de ce poidsdeux opeacuterations sont reacutealiseacutees

1 Toutes les co-consultations posseacutedant un poids supeacuterieur agrave seuil speacutecique sont ajouteacuteescomme arecirctes orienteacutees dans le graphe reliant les deux sommets concerneacutes Le seuil estdeacutetermineacute de maniegravere empirique car il est deacutependant de chaque domaine et de la base dedonneacutees utiliseacutees

2 En dessous du seuil seules certaines co-consultations sont seacutelectionneacutees pour devenir des

58

33 Graphe

arecirctes selon un processus inteacutegrant une part daleacuteatoire que nous deacutetaillerons dans la suitede cette section

Ces deux opeacuterations permettent de peupler le graphe darecirctes correspondant agrave la fois agrave toutesles transitions les plus eectueacutees par les utilisateurs ainsi quagrave certaines des transitions moinsusiteacutees par ces derniers Apregraves ces deux opeacuterations le graphe possegravede donc un certain nombredarecirctes reliant ses sommets mais rien ne garantit que chaque sommet est bien relieacute au reste dugraphe (si par exemple un sommet repreacutesente une ressource tregraves peu consulteacutee du domaine) Deplus et malgreacute la deuxiegraveme opeacuteration mitigeant cet eet les transitions tregraves usiteacutees (entre desressources populaires par exemple) seront sur-repreacutesenteacutees avec cette meacutethode de constructionCette sur-repreacutesentation produira forceacutement en aval des solutions que lon pourrait qualier declassique dans le sens ougrave elles reprendraient en majoriteacute ces transitions tregraves utiliseacutees et connuesdes utilisateurs An de limiter cet eet et de sassurer que tous les sommets sont bien connecteacutesau graphe une troisiegraveme et derniegravere opeacuteration est eectueacutee

3 Pour chaque sommet si un certain niveau de connectiviteacute nest pas atteint autrement ditsi le sommet possegravede moins darecirctes quun seuil xeacute agrave lavance alors des arecirctes aleacuteatoiressont ajouteacutees an datteindre ce seuil

Cette troisiegraveme opeacuteration permet de sassurer quaucun sommet repreacutesentant une ressourcepeu consulteacutee ne soit laisseacute sans connexion avec le reste du graphe Ainsi chaque sommet pos-seacutedera un certain niveau de connectiviteacute aussi appeleacute degreacute avec le reste du graphe Le grapheainsi obtenu apregraves ces 3 opeacuterations possegravede dans sa topologie agrave la fois les liens les plus usiteacutes parles utilisateurs ainsi que des liens aleacuteatoires permettant la creacuteation de recommandations poten-tiellement nouvelles Lensemble du processus de creacuteation du graphe est repris dans lEacutequation31 ci-dessous

(1) si tij ge m alors creacuteer eij(2) si tij lt m et q lt tij ougrave q isin [min til log(max til)] alors creacuteer eij(3) si deg(i) lt d alors choisir un sommet k aleacuteatoire

et creacuteer eik jusquagrave deg(i) = d

(31)

(1) et (2) sappliquent pour chaque co-consultation tandis que (3) sapplique pour chaque som-met du graphe eij repreacutesente larecircte entre les sommets i et j tij est le poids de la co-consultationde la ressource i vers la ressource j par les utilisateurs dans les seacutequences de consultations passeacuteesm est le seuil au-dessus duquel les co-consultations sont automatiquement ajouteacutees au graphecomme arecirctes q isin [min til log(max til)] est une variable aleacuteatoire uniformeacutement distribueacutee danslintervalle deacutecrit min til est le nombre minimal de co-consultations entre la ressource i et toutesles autres ressources l isin Vi ougrave au moins une co-consultation a eacuteteacute trouveacutee deg(i) est le degreacutedu ndivideud i dans le graphe et d est un paramegravetre speacuteciant le degreacute minimal de connectiviteacute quedoit posseacuteder chaque sommet dans le graphe nal Il est agrave noter quagrave ce stade du processus decreacuteation du graphe les arecirctes ne sont pas valueacutees car les valeurs attribueacutees aux arecirctes varientpour chaque utilisateur Ce processus sera deacutetailleacute dans la suite de la section

Avec cette technique de construction la taille du graphe deacutepend deacutesormais principalementde la variable d deacutenissant le degreacute minimal de connectiviteacute agrave atteindre (en plus du nombrede sommets comme preacuteceacutedemment) La Figure 32 ci-dessous repreacutesente leacutevolution du nombredarecirctes uniquement en fonction de la variable d Dans la pratique le nombre darecirctes sera

59

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

supeacuterieur aux nombres preacutesenteacutes dans la gure eacutetant donneacute que les deux premiegraveres eacutetapes de lacreacuteation du graphe ajoutent des arecirctes en fonction des transitions trouveacutees dans les consultationspasseacutees des utilisateurs

Figure 32 Graphe repreacutesentant leacutevolution lineacuteaire du nombre darecirctes selon le nombre desommets voulus dans un graphe creacuteeacute avec dieacuterentes valeurs de d

Ce processus de construction de graphe a pour double objectif dexploiter les informationsdes seacutequences des utilisateurs et de creacuteer de nouvelles seacutequences possibles Il existe potentiel-lement une inniteacute de creacuteer un graphe agrave partir des ressources dont nous disposons et il esteacutevident que la topologie du graphe a une inuence importante sur les reacutesultats possibles carle graphe repreacutesente lentiegravereteacute de lenvironnement dans lequel les agents vont eacutevoluer Le pro-cessus de construction que nous avons deacutecrit nest quune maniegravere parmi dautres daboutir agraveun graphe Cependant nous faisons lhypothegravese que la combinaison darecirctes repreacutesentant desco-consultations aux poids importants darecirctes repreacutesentant certaines co-consultations moinspreacutesentes et darecirctes creacuteant de nouvelles transitions permet de capturer linformation preacutesentedans le domaine tout en garantissant une certaine seacuterendipiteacute avec leacutemergence possible nouvellesseacutequences

34 Objectifs

Une fois le graphe creacuteeacute le modegravele peut ecirctre appliqueacute sur ce dernier an de produire des recom-mandations Dans cette section nous allons deacutenir comment fonctionne le modegravele pour produiredes recommandations agrave partir du graphe ainsi que les facteurs humains ie les objectifs quilcherche agrave satisfaire

Comme nous lavons vu dans le chapitre preacuteceacutedent sur leacutetat de lart il est deacutesormais lar-gement admis que la mesure de preacutecision seule nest pas susante pour produire de bonnesrecommandations aux utilisateurs Dautres facteurs humains doivent ecirctre consideacutereacutes pour satis-faire la plus grande varieacuteteacute dutilisateurs et de contextes possible Nous proposons donc de deacutenirun ensemble de 4 facteurs humains parmi les plus eacutetudieacutes dans la litteacuterature et de les prendre encompte dans notre modegravele de recommandation Ces facteurs humains seront par la suite appe-

60

34 Objectifs

leacutes objectifs car pour notre modegravele ces facteurs humains sont en eet consideacutereacutes comme desobjectifs agrave atteindre et agrave maximiser Les voici accompagneacutee dune courte description

1 Similariteacute recommander des ressources similaires agrave ce que lutilisateur a aimeacute par lepasseacute

2 Diversiteacute recommander des ressources diverses par rapport agrave ce que lutilisateur a aimeacutepar le passeacute

3 Nouveauteacute recommander des ressources nouvelles que lutilisateur ne connaicirct pas en-core

4 Preacutefeacuterences recommander des ressources que lutilisateur a deacutejagrave appreacutecieacute dans le passeacute

La similariteacute et les preacutefeacuterences sont proches des notions de preacutecision et de rappel mais diegraverenttoutefois dans le sens ougrave lon ne cherche pas agrave reproduire exactement les mecircmes seacutequences quelutilisateur a consulteacute mais agrave lui recommander des seacutequences pouvant le satisfaire Ces objectifsrepreacutesentent des facteurs humains important dans la creacuteation dune bonne recommandationIls seront deacutetailleacutes dans la suite de cette section Agrave ces 4 objectifs concernant les ressourcesrecommandeacutees nous ajoutons un cinquiegraveme objectif sinteacuteressant quant agrave lui agrave la maniegravere dontsont proposeacutees les recommandations agrave un utilisateur

5 Progressiviteacute recommander une seacutequence de ressources de sorte que la transition entrechacune de ces ressources soit uide et adapteacutee aux preacutefeacuterences de lutilisateur

Ces 5 objectifs consideacutereacutes sont tous transposables dans dieacuterents domaines applicatifs ga-rantissant la geacuteneacutericiteacute de cette approche Cependant il est eacutevident que dun domaine applicatifagrave lautre certaines dieacuterences peuvent justier la mise en avant dun objectif plutocirct quun autreDe la mecircme maniegravere les besoins et preacutefeacuterences pour ces objectifs peuvent varier dun utilisateuragrave un autre au sein du mecircme domaine Pour reacutepondre agrave ces deux problegravemes nous expliqueronsaussi dans cette section comment adapter limportance de chaque objectif Il est aussi importantde consideacuterer le fait que nous nous appuyons sur ces objectifs car ils sont les plus freacutequemmentciteacutes dans la litteacuterature Lobjectif est de deacutemontrer que notre modegravele est capable de produiredes seacutequences satisfaisant les objectifs consideacutereacutes Ce faisant nous montrons par la mecircme occa-sion que les objectifs peuvent ecirctre adapteacutes enleveacutes ou ajouteacutes En eet on pourrait tregraves bienconsideacuterer dautres objectifs (personnaliteacute point de congestion si lon est dans un museacutee etc)En dautres termes le but est de deacutemontrer la geacuteneacutericiteacute de notre modegravele

Avant de deacutetailler comment calculer ces objectifs nous allons expliquer ici comment les in-teacutegrer dans le modegravele Le but de notre modegravele est de proposer des recommandations orant unbon compromis entre les dieacuterents objectifs ougrave limportance de ces derniers peut ecirctre ajusteacutees agravevolonteacute Pour ce faire notre modegravele doit ecirctre capable de transformer ces objectifs listeacutes plus hauten valeurs pouvant ecirctre chireacutees et optimiseacutees Autrement dit notre modegravele a pour but de reacute-soudre un problegraveme de recommandation multi-objectifs Le choix des algorithmes ACO est ici dusens eacutetant donneacutes ces besoins speacuteciques En eet nous avons montreacute dans leacutetat de lart que lemodegravele ACS faisant partie des ACO eacutetait capable de reacutesoudre des problegravemes posseacutedant plusieursobjectifs comme par exemple avec le vehicle routing problem with time windows [Gambardellaet al 1999] ou encore avec le multi-objective travelling salesman problem [Angus 2007] Devantla complexiteacute et les dimensions toujours croissantes des problegravemes agrave reacutesoudre en informatique lesapproches multi-dimensionnelles des algorithmes ACO se sont multiplieacutees ces derniegraveres anneacutees

61

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

[Doerner et al 2004 Alaya et al 2007 Angus and Woodward 2009 Dorigo and Stuumltzle 2019]Mecircme si chacune de ces approches a pour but de reacutesoudre un problegraveme multi-objectif la maniegraveredy arriver est dieacuterente tant les algorithmes ACO sont modulaires Pour rappel notre problegravemeconsiste en la recommandation de seacutequences agrave partir dun graphe et prenant en compte plusieursobjectifs pouvant potentiellement ecirctre incompatible entre eux Il est important dinsister sur cedernier point an de comprendre la solution mise en place dans notre modegravele Les objectifs quenous avons deacutecrits ci-dessus peuvent en eet ecirctre incompatibles les uns avec les autres quandbien mecircme le but est de geacuteneacuterer une recommandation posseacutedant un certain eacutequilibre parmi cha-cun dentre eux Lobjectif de preacutefeacuterences dont le but est de proposer des ressources deacutejagrave connueset appreacutecieacutees ainsi que lobjectif de nouveauteacute dont le but est de proposer des ressources en-core non connues sont par exemple en contradiction claire Chaque objectif traiteacute seacutepareacutementproduira potentiellement des recommandations mutuellement exclusives et pourtant il peut ecirctreinteacuteressant de proposer agrave lutilisateur une seacutequence de recommandations posseacutedant ces deux as-pects speacuteciques Partant de ce constat nous avons deacutecideacute dinteacutegrer chaque objectif comme unecolonie dieacuterente dans le modegravele ACS Ainsi nos 4 premiers objectifs (similariteacute diversiteacute nou-veauteacute preacutefeacuterences) seront repreacutesenteacutes par 4 colonies dans notre modegravele tandis que le cinquiegravemeobjectif la progressiviteacute sera quant agrave lui traiteacute agrave part eacutetant donneacute quil concerne la structure dela recommandation et non les ressources recommandeacutees en elles-mecircmes

Inteacutegrer ces objectifs par le biais de plusieurs colonies a neacutecessiteacute quelques changements danslalgorithme ACS Dans le modegravele initial les agents dune seule colonie se deacuteplacent sur le graphedont chacune des arecirctes est valueacutee en fonction de la distance seacuteparant les 2 sommets la consti-tuant Le but des agents est ensuite de se deacuteplacer sur ce graphe an de trouver le plus courtchemin dun sommet A agrave un sommet B agrave laide des pheacuteromones quils y deacuteposent Une fois quunesolution eacutemerge comme eacutetant la meilleure gracircce au meacutecanisme de stigmergie lalgorithme peutsarrecircter et la meilleure solution est retenue

La philosophie derriegravere cette solution deacutecoule des principes mecircme des systegravemes multi-agentsLeacutetat de lart du chapitre preacuteceacutedent la montreacute lapproche multi-agent pour la reacutesolution deproblegravemes est agrave la fois simple eacuteleacutegante et ecace Dautres solutions auraient eacuteteacute possiblescomme par exemple complexier les agents en leur ajoutant de nouveaux comportementS maisnous avons voulu garder lessence des systegravemes multi-agents reacuteactifs leacutemergence de comporte-ments intelligents de par les interactions entre agents tregraves simples An de rester aussi procheque possible des principes de base de lalgorithme nous avons voulu converser le fonctionnementgeacuteneacuteral des colonies et de la deacutecouverte de solutions sur le graphe tout en les adaptant agrave notrecontexte Pour ce faire nous avons jouer sur la maniegravere dont se deacutenit et se calcule la notionde distance dans le graphe Dans les algorithmes ACO la distance d associeacutee agrave chaque arecirctedu graphe repreacutesente comme son nom lindique la distance physique neacutecessaire pour aller dunsommet agrave lautre de larecircte Cette distance ne demande a priori pas de calcul et est simple-ment deacuteduite ou mesureacutee de lenvironnement repreacutesenteacute par le graphe Elle est ensuite utiliseacuteepour calculer lheuristique ηij comme montreacute dans lEacutequation 212 (pour rappel lheuristiquese calcule ainsi ηij = 1

dij) Nous navons pas modieacute le calcul de ηij mais nous avons modieacute

le sens de la distance d qui le compose Au lieu de repreacutesenter la distance physique entre deuxsommets d repreacutesente dans notre modegravele une distance calculeacutee entre deux ressources sa valeureacutetant directement deacutependante de lobjectif de la colonie Prenons un exemple pour illustrer lamaniegravere dont cette distance peut varier entre deux sommets pour dieacuterentes colonies

62

34 Objectifs

Supposons un systegraveme de recommandation dans le domaine museacuteal dont le but est de proposerdes parcours composeacutes de dieacuterentes peintures Le museacutee possegravede entre autres deux tableauxde Vincent van Gogh appartenant agrave la seacuterie des Tournesols Ces tableaux sont tous les deux desnatures mortes repreacutesentant un vase et 15 tournesols ils ont tous les deux eacuteteacute peints en 1889 les palettes de couleurs et le style sont quasi similaires Dans le graphe les sommets A et Brepreacutesentent ces deux tableaux et (AB) repreacutesente larecircte les reliant Pour toutes les raisonseacutevoqueacutees ci-dessus on peut raisonnablement penser que ces deux ressources sont tregraves similairesentre elles La distance dsimilarit de la colonie axeacutee sur la similariteacute sera donc faible indiquant auxagents que les deux sommets sont eectivement proches lun de lautre et favorisant le passagepar cette arecircte pour minimiser la distance totale de la solution Agrave linverse la colonie relativeagrave la diversiteacute aura agrave traverser une plus longue distance ddiversit entre les deux sommets commeces derniers sont tregraves similaires entre eux Agrave travers ces exemples sont illustreacutees les dieacuterencespossibles dans le calcul de la distance d en fonction de lobjectif consideacutereacute La conseacutequence agrave celaest que mecircme si la topologie du graphe peut rester la mecircme pour tous les objectifs le calculdes distances et la valuation des arecirctes seront quant agrave eux dieacuterents selon lobjectif Le reste decette section propose une maniegravere de calculer ces distances pour chaque objectif

341 Similariteacute

Cest lun des facteurs humains les plus importants des systegravemes de recommandation et il estpris en compte par limmense majoriteacute de ces systegravemes En eet un des objectifs majeurs dunsystegraveme de recommandation est de proposer des ressources similaires agrave celles que lutilisateura aimeacute auparavant ou proche des ressources quil consultait reacutecemment La similariteacute est unecaracteacuteristique bien connue et largement utiliseacutee dans la litteacuterature Nous adheacuterons au principeselon lequel un systegraveme de recommandation ne peut pas la neacutegliger et doit linclure pour produiredes recommandations satisfaisantes Cependant la similariteacute ne devrait pas non plus ecirctre lapierre angulaire de chaque systegraveme de recommandation comme elle la eacuteteacute par le passeacute Le butde cette colonie est donc de trouver une liste avec des eacuteleacutements aussi proches que possible dece que lutilisateur appreacutecie ou est en train de consulter Il existe de nombreuses meacutethodespour calculer la similariteacute entre deux ressources Dune maniegravere geacuteneacuterale les ressources dundomaine sont deacutecrites par des meacutetadonneacutees numeacuteriques textuelles binaires etc Le format deces meacutetadonneacutees est entiegraverement deacutependant de chaque domaine applicatif Nous avons deacutecideacutede geacuteneacuteraliser ce problegraveme et de le consideacuterer comme une comparaison entre deux vecteursNous avons ensuite deacutecideacute dutiliser la mesure de la similariteacute cosinus entre ces deux vecteurs depar sa populariteacute dans la litteacuterature scientique et sa pertinence quand aux donneacutees dont nousdisposons [Su and Khoshgoftaar 2009] La maniegravere dimpleacutementer cette similariteacute dun point devue applicatif deacutepend des meacutetadonneacutees disponibles Dans le cas de donneacutees non numeacuteriques il estpossible dobtenir des valeurs numeacuteriques de similariteacute agrave partir de listes ou de valeurs qualitatives[lHuillier 2018] De mecircme dautres maniegravere de calculer la similariteacute peuvent ecirctre utiliseacutees enfonction de leur pertinence par rapport au domaine applicatif Dans notre contexte geacuteneacuteralisteet an de deacuteterminer la valeur de la distance d associeacutee agrave chaque arecircte du graphe nous avonstout dabord calculeacute la similariteacute cosinus entre les deux ressources repreacutesenteacutees par les sommetsPlus formellement pour une arecircte (i j) la similariteacute de ses deux ressources sij est calculeacutee avecla similariteacute cosinus entre les deux vecteurs des caracteacuteristiques descriptives C des ressources iet j comme montreacute dans lEacutequation 32

sij =1

sim(Ci Cj)(32)

63

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

ougrave Ci repreacutesentent les caracteacuteristiques de la ressource i Le terme de caracteacuteristiques estgeacuteneacuterique et peut inclure toutes les meacutetadonneacutees exploitables de domaine applicatif sur une res-source Comme expliqueacute plus haut ces caracteacuteristiques sont donc deacutependantes de chaque basede donneacutees et de chaque domaine dapplication Nous avons ici geacuteneacuteraliseacute ces donneacutees avec laformalisation suivante chaque ressource (ou item) i du domaine dapplication est deacutecrite par ncaracteacuteristiques c comme suit Ci = c1 c2 cn

Dans lexemple donneacute plus haut avec les deux tableaux de van Gogh nous avons expliqueacute quela distance seacuteparant deux sommets sur le graphe repreacutesentait intuitivement leur eacuteloignementselon lobjectif consideacutereacute Ainsi pour la similariteacute deux sommets repreacutesentant des ressourcessimilaires verront larecircte les reliant posseacuteder une faible distance et inversement Le but est icidecirctre le plus proche possible du fonctionnement du modegravele initial ougrave une petite distance entredeux sommets repreacutesentent eectivement une petite distance physique entre ces deux points(par exemple deux points geacuteographiques proches lun de lautre) La similariteacute cosinus produitcependant une valeur comprise entre [0 1] ne correspondant pas agrave la valuation des arecirctes dansle modegravele initial An de convertir cette similariteacute s isin [0 1] en distance d isin [1 +infin] nous avonssimplement utiliseacute linverse multiplicatif d = 1

s Ainsi et agrave linstar du modegravele initial de Dorigoune distance proche de 1 associeacutee agrave une arecircte (i j) signie que les deux ressources i et j sontsimilaires

342 Diversiteacute

Ce facteur est souvent preacutesenteacute en mecircme temps que la similariteacute eacutetant donneacute quils sont tousdeux lieacutes agrave la distance ou agrave la correacutelation entre les ressources consulteacutees par lutilisateur etses recommandations Mais contrairement agrave la similariteacute la diversiteacute illustre agrave quel point deuxeacuteleacutements sont dissemblables lun par rapport agrave lautre La similariteacute et la diversiteacute se complegravetentdans la mesure ougrave elles sont toutes deux neacutecessaires pour adapter le systegraveme de recommandationaux besoins des dieacuterents utilisateurs [Jones 2010] Nous avons choisi dutiliser linterpreacutetationclassique consistant agrave consideacuterer la diversiteacute comme linverse de la similariteacute La diversiteacute divijentre deux ressources i et j est donc obtenue en calculant linverse de la similariteacute entre i etj comme indiqueacute dans Eacutequation 33 De la mecircme maniegravere que pour la similariteacute nous avonsensuite utiliseacute linverse multiplicatif de la diversiteacute pour obtenir une distance d isin [1 +infin]

divij =1

1minus sim(Ci Cj)(33)

Toutefois cette seule mesure ne capture pas lensemble de la diversiteacute dune seacutequence Destravaux de la litteacuterature ont eacuteteacute meneacutes sur les seacutequences et les dieacuterentes maniegraveres de les ca-racteacuteriser On peut citer la diversiteacute relative (RD Relative Diversity) qui permet de mesurerlapport de chaque ressource ajouteacutee agrave une seacutequence existante en cours de construction ou encorela similariteacute intra-liste (ILS Intra-List Similarity) qui est la moyenne des similariteacutes cosinusde toutes les ressources composant une seacutequence [Ziegler et al 2005] Nous navons pas utiliseacuteces deux mesures agrave ce stade de notre modegravele mais nous les exploiteront an de mesurer lesperformances de notre modegravele

343 Nouveauteacute

Ce facteur humain repreacutesente les ressources encore non connues de lutilisateur Il peut sagirde nouvelles ressources reacutecemment ajouteacutees au systegraveme ou de ressources plus anciennes mais

64

34 Objectifs

moins populaires que lutilisateur na pas consulteacutees Selon le domaine dapplication etou selonlancienneteacute de lutilisateur les ressources non consulteacutees peuvent ne constituer quune faible par-tie des ressources totales (eg dans un petit museacutee ne posseacutedant que quelques dizaines ddivideuvres)comme elles peuvent aussi repreacutesenter limmense majoriteacute des ressources totales (eg sur des sitesdeacutecoute de musiques en ligne qui ont souvent des catalogues de plusieurs centaines de milliers demusiques disponibles) La nouveauteacute ne doit cependant pas ecirctre confondue avec la diversiteacute carles ressources consideacutereacutees comme nouvelles peuvent ecirctre soit similaires soit dieacuterentes de cellesque lutilisateur aime habituellement La nouveauteacute est une caracteacuteristique importante dans unsystegraveme de recommandation car elle permet deacuteviter un deacutesinteacuterecirct potentiel des utilisateurs an-ciens En eet apregraves un certain temps passeacute agrave produire des recommandations un systegraveme peutavoir tendance agrave enfermer lutilisateur dans les mecircmes recommandations agrave linstar dun algo-rithme dapprentissage automatique trop bien entraicircneacute 38 Ce problegraveme dans les systegravemes derecommandation reacutesulte en une trop grande preacutevisibiliteacute des ressources recommandeacutees [Vargasand Castells 2011] Lintroduction de la nouveauteacute permet entre autres de mitiger ce problegravemeet de produire des recommandations inattendues agrave lutilisateur

An de deacuteterminer si une ressource est nouvelle ou pas pour un utilisateur en particuliernous avons utiliseacute le travail de Zhang [Zhang 2013] qui a deacuteni la nouveauteacute comme une mesurecomposeacutee de trois caracteacuteristiques

1 Unknown (notion dinconnue) repreacutesente si la ressource est connue ou non de lutilisa-teur

2 Satisfactory (satisfaction) repreacutesente si la ressource est aimeacutee ou non par lutilisateur

3 Dissimilarity (dissimilariteacute) repreacutesente si la ressource est dissimilaire aux autres res-sources connues par lutilisateur

Lauteur a ensuite proposeacute deacutevaluer formellement la nouveauteacute dune ressource i pour luti-lisateur u en proposant lEacutequation 34

Novelty(i u) = p(i|unknown u) middot dis(i prefu) middot p(i|like u) (34)

ougrave p(i|unknown u) est la probabiliteacute que lutilisateur u ne connaisse pas la ressource idis(i prefu) est la dissimilariteacute entre i et les ressources consulteacutees par lutilisateur et p(i|like u)est la probabiliteacute que lutilisateur u appreacutecie la ressource i Cette eacutequation est inteacuteressante maisdans le contexte de ce travail les notions de satisfaction et de dissimilariteacute de lutilisateur enversla ressource i sont proches des autres objectifs de notre modegravele agrave savoir respectivement pour lasatisfaction par lobjectif de diversiteacute et pour la dissimilariteacute par les deux objectifs de similariteacuteet de preacutefeacuterences Nous avons donc deacutecideacute de reacuteduire lEacutequation 34 agrave lEacutequation 35 an deacuteviterune redondance entre les objectifs

p(i|unknown u) = minuslog(1minus popi) (35)

ougrave popi est la populariteacute de la ressource i La notion de populariteacute est ici volontairement lais-seacutee geacuteneacuterale car largement deacutependante du domaine dapplication et des ressources consideacutereacuteesEn eet la populariteacute peut prendre la forme dun nombre de vues dun nombre deacutecoutes dunevaleur calculeacutee de maniegravere interne par des sites dune comparaison entre les consultations des

38 Cest le problegraveme statistique classique de lovertting ou du surentrainement souvent rencontreacute dans ledomaine de lapprentissage automatique

65

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

ressources etc On peut toutefois consideacuterer que cette valeur sera geacuteneacuteralement numeacuterique

Il est important ici de preacuteciser un point de dieacuterence important avec les deux autres objectifsqui ont eacuteteacute vu jusquagrave preacutesent Dans les eacutequations ci-dessus on peut en eet remarquer que lecalcul de la distance se fait non plus en consideacuterant deux ressources mais uniquement avec uneressource et le prol de lutilisateur Ainsi une arecircte du graphe ne repreacutesente plus la distanceentre les deux sommets la composant mais la distance neacutecessaire pour atteindre le sommet selonchaque utilisateur Autrement dit lagrave ougrave jusquagrave maintenant la distance associeacutee agrave larecircte (AB)repreacutesentait la distance entre le sommet A et le sommet B (la similariteacute ou la diversiteacute entreA et B) cette distance repreacutesente maintenant la distance de lutilisateur avec ce sommet BLe sommet dorigine ne rentre plus en compte dans le calcul de la distance dune arecircte maisuniquement son sommet de destination Par conseacutequent toutes les arecirctes arrivant agrave un sommetunique posseacutederont la mecircme valuation Les calculs de valuation des arecirctes du graphe sont doncmoins nombreux mais en contrepartie il est neacutecessaire de recalculer ces valuations pour chaqueutilisateur eacutetant donneacute quelles deacutependent maintenant du prol de ce dernier

344 Preacutefeacuterences

Le facteur que nous avons appeleacute preacutefeacuterences correspond aux ressources que lutilisateur aparticuliegraverement appreacutecieacutees dans le passeacute Cet objectif bien quassez proche de la similariteacute aupremier abord exprime un autre aspect dune recommandation satisfaisante que nous pensonsimportant En eet le but nest pas ici de recommander des ressources proches et potentiellementnouvelles de ce que lutilisateur connaicirct deacutejagrave comme la similariteacute mais bien de lui reproposer desressources quil a deacutejagrave consulteacutees et aimeacutees par le passeacute Autrement dit cet objectif cherche agraverecommander agrave lutilisateur les ressources les plus en accord avec ses preacutefeacuterences (ses ressourcespreacutefeacutereacutees) sans essayer de faire des preacutedictions Par conseacutequent le but de lobjectif de simila-riteacute est de proposer agrave lutilisateur des ressources proches de ce que lutilisateur a consulteacute ouconsulte mais il nest pas possible de savoir si ce dernier va reacuteellement appreacutecier ces recomman-dations Il est par exemple commun dappreacutecier une musique particuliegravere dun artiste et de nepas aimer les autres musiques appartenant pourtant au mecircme album Toutes les musiques de cetalbum sont tregraves similaires les unes aux autres (mecircme artiste mecircme date de sortie mecircme albumprobablement mecircme genre) elles auraient donc de tregraves hautes valeurs de similariteacute entre ellesmais lutilisateur qui se verrait proposer le reste de lalbum jugerait ces recommandations nonsatisfaisantes Lobjectif de preacutefeacuterences favorisera quant agrave lui les ressources connues et aimeacuteespar lutilisateur et pourrait donc recommander dans cette situation uniquement la musique quelutilisateur appreacutecie

Le but des agents de la colonie preacutefeacuterences est donc de trouver un chemin ougrave les ressourcessont connues et aimeacutees de lutilisateur On peut dores et deacutejagrave lister deux conseacutequences agrave cefait Tout dabord nous nous retrouvons dans le mecircme cas de gure que pour lobjectif denouveauteacute ougrave une arecircte du graphe ne repreacutesente plus la distance entre ses deux sommets maisla distance neacutecessaire pour atteindre le sommet darriveacutee Ensuite il est neacutecessaire de deacutenir desmoyens de calculer les preacutefeacuterences des utilisateurs envers les ressources mises agrave leur dispositionComme nous lavons vu dans leacutetat de lart il y a deux grandes maniegraveres de calculer linteacuterecirctdun utilisateur envers une ressource avec des retours explicites (eg notes sur les ressourcesbouton jaime et je naime pas) avec des retours implicites (eg temps passeacute agrave consulterles ressources nombre de consultations) 39 La nature des retours va donc eacutenormeacutement varier

39 Ces deux types de retours ne sont pas redondants mais plutocirct compleacutementaires Lorsque cela est possible

66

34 Objectifs

selon le domaine dapplication mais nous pouvons tout de mecircme formaliser la maniegravere dont ilssont consideacutereacutes Chaque information collecteacutee par le systegraveme concernant le comportement dunutilisateur doit ecirctre prise en compte Plus preacuteciseacutement chaque interaction directe ou indirectequun utilisateur peut avoir avec une ressource doit ecirctre inteacutegreacutee dans lestimation de son inteacuterecirctsur cette ressource Soit Cu lensemble de tous les types dinteractions possibles quun utilisateuru peut avoir avec les ressources du systegraveme cui repreacutesente alors la somme des interactions dunmecircme type c dun utilisateur u sur une ressource i Voici un rapide exemple toujours dans ledomaine musical an dillustrer ces derniers points

Cu eacutecouter une musique noter une musique passer une musique avant la n mettre unemusique dans sa playlist

cui pourrait par exemple renseigner sur le fait que lutilisateur u agrave eacutecouter la musiquei 15 fois

An dagreacuteger tous les types dinteractions possibles dans une unique valeur dinteacuterecirct dunutilisateur envers une ressource nous avons utiliseacute la formule proposeacutee par Castagnos [Castagnosand Boyer 2006] et deacutecrite dans lEacutequation 36

presumed interestui = vmin +

sumcisinC

(w(c) middot c(ui))sumcisinC

w(c)middot (vmax minus vmin)

cmax(36)

ougrave c(u i) correspond aux valeurs normaliseacutees donneacutees agrave la ressource i par lutilisateur u agravechaque type dinteraction c w(c) est le poids ou limportance de chaque type dinteraction cvmin et vmax sont les valeurs minimales et maximales attendues pour linteacuterecirct preacutesumeacute et cmaxest la valeur maximale que c(u i) peut prendre peu importe le critegravere c consideacutereacute

Linteacuterecirct de cette colonie peut ecirctre discuteacute selon les domaines dapplications auquel le mo-degravele est appliqueacute Lexemple preacuteceacutedant portant sur la musique illustre bien linteacuterecirct dinteacutegrerun tel facteur humain dans un systegraveme de recommandations En eet il est rare de neacutecou-ter quune seule fois une musique que lon appreacutecie Comme lont montreacute divers travaux il estbeaucoup plus courant deacutecouter plusieurs fois ses musiques preacutefeacutereacutees parfois de suite parfois agravedieacuterents moments de la journeacutee parfois sur plusieurs semaines mois ou anneacutees etc [lHuillier2018][Jones 2010] Lideacutee davoir une colonie deacutedieacutee agrave la revisite de ressources deacutejagrave consulteacuteespeut ecirctre eacutetendue agrave dautres domaines a priori moins eacutevidents que la musique Cet objectif depreacutefeacuterences peut par exemple ecirctre inteacuteressant dans le domaine de le-eacuteducation ougrave une ressourceeacuteducative peut avoir eacuteteacute consulteacutee par un utilisateur sans pour avoir eacuteteacute comprise (apregraves avoirpasseacute une eacutevaluation sur les thegravemes de cette ressource par exemple) Dans ce cas il peut ecirctreinteacuteressant de recommander une nouvelle fois agrave lutilisateur cette ressource an quil puisse mieuxla comprendre En conclusion lobjectif de preacutefeacuterences est certes plus speacutecique agrave certains do-maines que les autres objectifs plus geacuteneacuteralistes preacutesenteacutes jusquagrave maintenant mais nous pensonsneacuteanmoins quil a sa place dans le modegravele notamment pour les possibiliteacutes quil apporte dansces domaines dapplication speacuteciques

345 Progressiviteacute

Le concept de la progressiviteacute fait partie inteacutegrante du but de notre modegravele qui est de trouveret de recommander une bonne seacutequence de ressources Contrairement agrave la majoriteacute des systegravemes

il est beacuteneacuteque de les prendre tous les deux en comptes pour estimer linteacuterecirct de lutilisateur

67

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

de recommandation actuels nous ne souhaitons pas proposer quune simple liste agrave lutilisateurnal mais bien une seacutequence construite dans un but posseacutedant un deacutebut une n et une progres-sion entre ses divers eacuteleacutements An de bien faire la dieacuterence entre une liste et une seacutequence derecommandation voici 3 exemples dans 3 domaines dapplications dieacuterents

Listes

1 Musique Les musiques les plus similaires aux derniegraveres eacutecoutes voire agrave la toutederniegravere eacutecoute de lutilisateur sans ordre particulier

2 Museacutee Des divideuvres dart correspondant agrave ce que lutilisateur vient de voir Si lecritegravere principal de la creacuteation de liste est la similariteacute les ressources de celles-ci neseront pas forceacutement adapteacutees agrave la topologie du museacutee ou agrave sa sceacutenographie

3 E-eacuteducation Des ressources eacuteducatives sans ordre particulier (cours videacuteos expli-catives exercices) tous proches de ce que lutilisateur eacutetait en train de consulter

Seacutequences

1 Musique Une playlist de musiques proposant par exemple les titres dun mecircmeartiste selon leur date de sortie ou bien posseacutedant un tempo de plus en plus rythmeacuteou encore proposant une transition douce dun style de musical agrave un autre

2 Museacutee Un chemin composeacute de plusieurs divideuvres dart prenant compte de la distancephysique entre chaque divideuvre an davoir un parcours adapteacute au museacutee et en inteacutegrantune progression dans les divideuvres proposeacutees (par date styles auteurs etc)

3 E-eacuteducation Une seacutequence composeacutee de ressources eacuteducatives adapteacutees au niveauactuel de lutilisateur et agrave son objectif inteacutegrant des cours et des exercices proposantune progression mesureacutee (ni trop rapide ni trop lente) entre chaque ressources eacuteduca-tives de la seacutequences

Comme le montrent ces exemples lideacutee geacuteneacuterale derriegravere la recommandation de seacutequencesest de proposer une suite de ressources eacutetant toutes en lien les unes avec les autres et posseacutedantune progression sur un ou plusieurs critegraveres Cette progression se manifeste alors par de leacutegegraverestransitions entre chaque ressource an de faire avancer petit agrave petit la seacutequence vers un but Lebut est donc ici de parvenir agrave construire une seacutequence dont la progression nest ni trop lenteni trop rapide mais adapteacutee agrave lutilisateur et agrave son but Nous donnons agrave cet objectif le nom deprogressiviteacute optimale o Cette meacutetrique est utiliseacutee an de sassurer que les agents de la colo-nie de progressiviteacute trouvent un chemin dans le graphe ougrave chaque sommet seacutelectionneacute ore unebonne progressiviteacute par rapport agrave son preacutedeacutecesseur et agrave son successeur Pour ce faire nous avonscalculeacute la valeur de o en prenant en compte une ressource de deacutepart et une ressource darriveacuteerepreacutesenteacutee dans le graphe par deux sommets speacuteciques

Colonie de progressiviteacute

Le concept de progressiviteacute est lieacute agrave notre objectif de construire une bonne seacutequence deressources Contrairement agrave la majoriteacute des systegravemes de recommandation nous ne souhaitonspas seulement recommander une liste de ressources mais une seacutequence ayant un deacutebut unen et un ordre speacutecique Comme indiqueacute preacuteceacutedemment dans un museacutee une bonne seacutequencerecommandeacutee pourrait consister en des divideuvres dart lieacutees dune maniegravere ou dune autre (ie du

68

34 Objectifs

mecircme artiste ou de la mecircme peacuteriode) et situeacutees agrave proximiteacute les unes des autres Une telle seacutequencepourrait ensuite progresser lentement vers un autre artiste ou une section dieacuterente du museacuteeNotre objectif est donc de recommander une seacutequence qui ne progresse ni trop lentement ni troprapidement cest ce que nous appelons la progressiviteacute optimale o Cette meacutetrique est utiliseacuteepour sassurer que chaque ressource ore une bonne progressiviteacute par rapport agrave ses preacutedeacutecesseurset successeurs Pour ce faire nous avons calculeacute o sur la base des premier et dernier eacuteleacutementsdune seacutequence donneacutee pour un utilisateur speacutecique comme le montre lEacutequation 37

on =czn minus can

s(37)

ougrave on est la valeur de progressiviteacute optimale de la n-iegraveme caracteacuteristique dune seacutequencespeacutecique czn est la n-iegraveme caracteacuteristique de la derniegravere ressource z de la seacutequence czn estidentique pour la premiegravere ressource de la seacutequence et s est le nombre de ressources de la seacute-quence LEacutequation 37 sera appliqueacutee pour les caracteacuteristiques de la ressource m ce qui donneun vecteur de taille m de valeurs de progressiviteacute optimales (o1 o2 middot middot middot om) pour la seacutequencespeacutecique Ce vecteur sera ensuite utiliseacute dans le calcul de la distance dun bord (i j) pour lacolonie de progressiviteacute Cette meacutethode implique de disposer de caracteacuteristiques numeacuteriques pourappliquer leacutequation comme par exemple le tempo dune piste musicale ou la date dune divideuvredart

La valeur optimale o de la progressiviteacute est alors utiliseacutee pour calculer la distance d entredeux ndivideuds du graphe dans lEacutequation 38

dij =

msumnwon middot

cjnminuscinon

msumnwon

(38)

ougrave m est le nombre de caracteacuteristiques de la ressource consideacutereacutee on est la valeur de pro-gressiviteacute optimale de la n-iegraveme caracteacuteristiques de la ressource won est le poids de la n-iegravemecaracteacuteristique pour lutilisateur deacutependant de ses preacutefeacuterences et cjn est la valeur de la n-iegravemecaracteacuteristique de la ressource j

LEacutequation 38 produit une valeur de distance dij isin [minusinfin +infin] En fonction de lintervallede d nous pouvons deacuteduire que

dij isin [minusinfin 0] les caracteacuteristiques de la ressource j vont dans la direction inverse parrapport agrave la valeur de progressiviteacute optimale o

dij isin [0 1] la progression est trop lente par rapport agrave la valeur o attendue dij = 1 la progression est ideacuteale dij isin [1 +infin] la progression trop rapide

Dans un souci dhomogeacuteneacuteisation des distances entre toutes les colonies et pour respecterle modegravele initial ACS ougrave d repreacutesentait une distance physique nous avons souhaiteacute garder ladistance d isin [1 +infin] Pour ce faire nous avons donc reacutealiseacute une opeacuteration de transformationlorsque dij lt 1 preacutesenteacutee dans lEacutequation 39

69

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

Si dij isin

[minusinfin 0] alors dij = |dij |

[0 1] alors dij =1

dij

(39)

Inteacutegration compleacutementaire de la progressiviteacute dans le calcul de la distance parcou-rue des agents

Dans la section preacuteceacutedente nous avons deacutecrit le fonctionnement dune colonie deacutedieacutee agrave laprogressiviteacute Cependant nous soutenons le fait que la progressiviteacute ne doit pas ecirctre lapanagedune seule colonie mais doit ecirctre preacutesente dans toutes les colonies La progressiviteacute doit avoirune place preacutepondeacuterante dans les seacutequences que notre modegravele construit car cest une notionfondamentale dans la dieacuterence entre une liste de recommandation et une seacutequence de recom-mandation

An de renforcer la progressiviteacute des seacutequences construites par toutes les colonies nous pro-posons une version modieacutee de la mise agrave jour globale des pheacuteromones deacutecrite dans lEacutequation210 Dans lalgorithme initial ACS Lbest est la longueur du plus court chemin trouveacute par unagent Cette valeur est une simple somme de la distance associeacutee agrave chaque arecircte du meilleurchemin Cette valeur est ensuite utiliseacutee dans le calcul deacuteterminant la quantiteacute de pheacuteromonesagrave ajouter sur chaque arecircte du chemin Ainsi plus un chemin est court plus les arecirctes le com-posant sont reacutecompenseacutees par une plus grande quantiteacute de pheacuteromones Ce meacutecanisme est aucdivideur du renforcement de bonnes solutions et de leacutemergence de comportements intelligents Ande maximiser les seacutequences posseacutedant une progression constante nous avons modieacute le calcul deLbest pour inteacutegrer une notion de progressiviteacute Pour ce faire nous nutilisons plus simplementla distance dune arecircte mais aussi sa deacuteriveacutee comme montreacute dans lEacutequation 310

Lbest =sumeisinE

de +

sumeisinE

partde

|E|(310)

ougrave E est lensemble des arecirctes du meilleur chemin et de est la distance associeacutee agrave larecircte eAvec cette eacutequation modieacutee du calcul de la distance totale dun chemin nous peacutenalisons lesgrandes dieacuterences de distance entre des arecirctes successives tout en continuant de favoriser leschemins les plus courts En dautres termes lobjectif des agents est maintenant de trouver deschemins agrave la fois courts et progressifs les uns par rapport aux autres

35 Tactiques de fusion

Dans les sections preacuteceacutedentes nous avons deacutecrit 4 facteurs humains 4 objectifs agrave optimiserpar notre modegravele ainsi quun cinquiegraveme objectif de contrainte de construction des seacutequencesChacun de ces 4 premiers objectifs est associeacute agrave une colonie de fourmis speacutecique dont le but estde trouver un chemin dans le graphe Par conseacutequent apregraves cette premiegravere eacutetape il existe autantde chemins ou de seacutequences de ressources que de colonies dans le modegravele Le but est cependantde ne proposer agrave la n quune seule recommandation agrave lutilisateur Chaque seacutequence repreacutesentedonc ideacutealement une partie de la recommandation nale de lutilisateur An de construire cetteseacutequence nale il eacutetait neacutecessaire de fusionner ces dieacuterentes seacutequences provenant des coloniesen une seacutequence de recommandation unique Pour reacutesoudre ce problegraveme de nombreuses maniegraverede proceacuteder existent Dans la suite de cette section nous avons exploreacute deux tactiques de fusion

70

35 Tactiques de fusion

que nous allons preacutesenter

351 Colonie de fusion

La premiegravere tactique pour fusionner les dieacuterentes seacutequences produites preacuteceacutedemment a natu-rellement eacuteteacute dutiliser le mecircme modegravele que pour la premiegravere eacutetape agrave savoir une colonie speacuteciquedont les agents se deacuteplacent sur un graphe pour trouver une solution Cette colonie est cependantdieacuterente des preacuteceacutedentes pour deux raisons principales

Premiegraverement le graphe sur lequel cette colonie opegravere na aucun inteacuterecirct agrave contenir lensemblede toutes les ressources existantes du domaine Nous consideacuterons ici que la premiegravere eacutetape dumodegravele eectue une seacutelection dun certain nombre de ressources speacuteciques agrave chaque colonie Cesressources peuvent ensuite ecirctre utiliseacutees pour creacuteer un second graphe posseacutedant beaucoup moinsde ndivideuds sur lequel la colonie de fusion pourra chercher une solution Nous avons utiliseacute toutesles ressources seacutelectionneacutees dans la premiegravere eacutetape en tant que ndivideuds du nouveau graphe Nousavons ensuite ajouteacute des arecirctes agrave chaque paire conseacutecutives de ressources dans les seacutequences de lapremiegravere eacutetape an de conserver les meilleurs chemins trouveacutes par les agents Enn nous avonsajouteacute des arecirctes aleacuteatoires en suivant la mecircme meacutethode que deacutecrite au deacutebut de ce chapitre dansla creacuteation du graphe principal en Eacutequation 31 Le but de ces arecirctes aleacuteatoires est le mecircme quepreacuteceacutedemment agrave savoir permettre aux agents dexplorer de nouveaux chemins potentiels Cettepremiegravere tactique reprend donc les points principaux de la creacuteation du graphe principal

Deuxiegravemement et contrairement agrave la premiegravere eacutetape ougrave toutes les colonies avaient un butpreacutecis la colonie de fusion na pas pour vocation doptimiser une caracteacuteristique speacutecique Aucontraire cette colonie a pour essence de regrouper au mieux dans une solution unique les reacute-sultats speacuteciques trouveacutes auparavant Pour ce faire la colonie de fusion utilise lensemble desfacteurs humains preacutesenteacutes preacuteceacutedemment dans une somme pondeacutereacutee an dattribuer aux arecirctesune distance d prenant en compte tous les objectifs Le calcul de cette distance est preacutesenteacuteci-dessous dans lEacutequation 311

dij =sum

colisincoloniesw(col) middot dij(col) (311)

ougrave w(col) est le poids repreacutesentant limportance estimeacutee de lobjectif de la colonie col dansla recommandation nale Nous proposons ici de calculer les poids moyens de chaque objectif(similariteacute diversiteacute nouveauteacute et preacutefeacuterences) sur les derniegraveres n sessions dactiviteacute de lutilisa-teur Par exemple un utilisateur nayant eacutecouteacute que lalbum Wish you were here des Pink Floyddurant ses derniegraveres sessions deacutecoute se verra attribuer des poids forts pour la similariteacute et lespreacutefeacuterences Inversement les poids des objectifs de diversiteacute et de nouveauteacute seront faibles

Cette meacutethode permet dobtenir limportance relative de chacun des objectifs dans lhisto-rique de consultations reacutecent de lutilisateur En faisant varier n il est aussi possible de fairevarier la taille de lhistorique pris en compte Ainsi une valeur de n faible concernera uniquementles derniegraveres interactions de lutilisateur avec le systegraveme tandis quune valeur de n eacuteleveacutee pren-dra en compte agrave la fois lhistorique reacutecent et plus ancien La variation de la fenecirctre dhistoriquepeut ainsi apporter un comportement dieacuterent du modegravele pour dieacuterents types dutilisateurs(utilisateur reacutecent ou ancien peu actif ou tregraves actif etc)

71

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

352 Fusion de seacutequences

Nous avons souhaiteacute impleacutementer une deuxiegraveme tactique de fusion an davoir un point decomparaison avec la colonie de fusion Dans cette deuxiegraveme tactique nous avons eacutegalement cal-culeacute le poids w(col) de chaque objectif sur lhistorique n de lutilisateur de la mecircme maniegravereque dans lEacutequation 311 Ces poids ont ensuite eacuteteacute utiliseacutes dans la construction dune seacutequencenale ressource par ressource Pour ce faire nous avons reacuteunis toutes les ressources composantles seacutequences des colonies speacutecialiseacutees dans un ensemble agrave la maniegravere dun sac de mots Puis agravechaque iteacuteration lapport de chacune des ressources restantes agrave la seacutequence nale a eacuteteacute mesureacuteet la meilleure ressource a eacuteteacute ajouteacutee Les iteacuterations sont stoppeacutees lorsquil nest plus possibledameacuteliorer la seacutequence nale De la mecircme maniegravere que pour la tactique preacuteceacutedente lapportde chaque ressource agrave la seacutequence de recommandation peut ecirctre mesureacute de multiple maniegraveresDe la mecircme maniegravere que dans lEacutequation 311 nous avons choisi de calculer limportance dechaque objectif de la seacutequence nale en construction puis de choisir les ressources permettantde sapprocher des poids correspondant agrave lhistorique n de lutilisateur

353 Conclusion

Dans ce chapitre nous avons preacutesenteacute le fonctionnement de notre modegravele de recommanda-tion multi-objectifs AntRS Notre modegravele sinspire de lalgorithme multi-agents ACS de MarcoDorigo Au lieu de trouver le plus court chemin dans un graphe agrave laide dune colonie dagentsfourmis nous utilisons 4 colonies en parallegravele qui chacune maximise un aspect de la recomman-dation nale Comme nous lavons montreacute dans leacutetat de lart il est deacutesormais neacutecessaire que lesrecommandations prennent en compte de multiples facteurs comme la diversiteacute la similariteacute oula nouveauteacute Il est tout aussi important pour les systegravemes de recommandation decirctre modulaireset geacuteneacuteriques an de sadapter aux situations toujours plus complexes et aux domaines applicatifstoujours plus varieacutes dans lesquels ils sont utiliseacutes Le choix de sinspirer dun modegravele multi-agentsest une reacuteponse agrave ces deacutes de la recommandation moderne Les systegravemes multi-agents ont unefaible complexiteacute algorithmique et sont particuliegraverement adaptables par nature Le modegravele quenous avons proposeacute est de plus susamment geacuteneacuterique pour sadapter aux domaines applicatifsougrave il est possible de faire de la recommandation de seacutequences

Dans la suite de ce manuscrit nous allons appliquer notre modegravele AntRS a un domaineapplicatif et reacutealiser des expeacuterimentations avec des donneacutees dutilisation concregravete an deacutetudierses performances dans des conditions dutilisation reacuteelles

72

Chapitre 4

Expeacuterimentations et reacutesultats

Sommaire

41 Introduction 74

42 Expeacuterimentations preacuteliminaires portant sur le modegravele ACS initial 74

421 Preacutesentation et inteacuterecircts de ces premiegraveres expeacuterimentations 74

422 Expeacuterimentations preacuteliminaires sur le modegraveles ACS 78

423 Conclusion 84

43 Expeacuterimentations sur le modegravele AntRS 84

431 Base de donneacutees utiliseacutee 84

432 AntRS mono-objectif expeacuterimentations sur chaque colonie isoleacutee 89

433 AntRS multi-objectifs expeacuterimentations sur lensemble des colonies si-

multaneacutement et sur les tactiques de fusion 93

434 Optimisation des meacutetavariables de AntRS 99

44 Conclusion 103

73

Chapitre 4 Expeacuterimentations et reacutesultats

41 Introduction

Dans la section preacuteceacutedente nous avons deacutetailleacute le modegravele AntRS que nous avons deacuteveloppeacutepour reacutepondre aux probleacutematiques de cette thegravese Comme nous lavons expliqueacute AntRS se basesur le travail de [Dorigo and Birattari 2011] qui a modeacuteliseacute le comportement de fourragementdes fourmis dans la nature Son modegravele et le notre par extension ont donc au cdivideur de leur fonc-tionnement le mecircme meacutecanisme permettant agrave des agents teacuteleacuteonomiques de suivre et de deacuteposerdes pheacuteromones sur un graphe An de mettre en exergue le cdivideur de ces modegraveles qui sera parla suite enrichi nous avons en premier lieu deacuteveloppeacute les modegravele Ant Colony System de MarcoDorigo [Dorigo and Birattari 2011] en Java avec une interface visuelle Cela nous a permis detester son fonctionnement dans diverses conditions expeacuterimentales controcircleacutees ainsi que de testerses limites Nous avons ensuite impleacutementeacute lensemble de notre modegravele AntRS en utilisant la basedeacutejagrave deacuteveloppeacutee preacuteceacutedemment puis nous avons reacutealiseacute les expeacuterimentations principales de cettethegravese agrave laide dune base de donneacutees deacutecrivant les habitudes de personnes eacutecoutant de la musique

Ce chapitre est constitueacute de deux sections principales Dans la premiegravere section nous allonsdabord nous inteacuteresser agrave limpleacutementation et au fonctionnement expeacuterimental du modegravele ACS deDorigo Cette section mettra en exergue les points importants permettant le bon fonctionnementdu modegravele classique Agrave laide dexpeacuterimentations simples nous reprendrons et expliquerons dunpoint du vue pratique les notions introduites de maniegravere theacuteorique dans leacutetat de lart lors de lapreacutesentation du modegravele ACS Ces premiegraveres expeacuterimentations permettront au lecteur de mieuxappreacutehender la suite du chapitre dans laquelle les notions abordeacutees seront reacute-utiliseacutees et eacutetenduesDans la deuxiegraveme section de ce chapitre nous nous inteacuteresserons aux expeacuterimentations principalesde cette thegravese portant sur notre modegravele AntRS Nous deacutecrirons dabord la base de donneacutees quenous avons utiliseacute pour tester notre modegravele puis lensemble des expeacuterimentations faites et ennles principaux reacutesultats obtenus

42 Expeacuterimentations preacuteliminaires portant sur le modegravele ACS

initial

421 Preacutesentation et inteacuterecircts de ces premiegraveres expeacuterimentations

La premiegravere eacutetape de ce travail expeacuterimental a consisteacute dans limpleacutementation du modegraveleinitial proposeacute par Dorigo sans modication Le but eacutetait agrave la fois de veacuterier si les reacutesultatsobtenus correspondaient agrave ce qui eacutetait attendu dans la litteacuterature et davoir par ailleurs unprogramme repreacutesentant une base fonctionnelle permettant de tester de nouveaux modegraveles pluscomplexes par la suite Nous avons donc commenceacute par impleacutementer le modegravele Ant ColonySystem deacutecrit par Dorigo dans son article [Dorigo and Birattari 2011] Comme nous avons deacutejagravedeacutecrit en deacutetail ce modegravele dans la Section 243 de leacutetat de lart nous ne reviendrons pas surles eacutequations reacutegissant le fonctionnement dACS Cependant nous allons plutocirct nous inteacuteresserici aux reacutesultats obtenus lors dexpeacuterimentations connues de la litteacuterature scientique Le choixdu langage de programmation dans lequel a eacuteteacute reacutealiseacute limpleacutementation et les expeacuterimentationsdurant toute cette thegravese a eacuteteacute Java Ce choix se justie par 3 principales raisons

1 La connaissance avanceacutee de ce langage

2 les bibliothegraveques 40 disponibles correspondant aux besoins de la thegravese

40 Ensemble de ressources (fonctions algorithmes speacuteciques documentation) permettant la creacuteation acceacuteleacutereacuteede programmes

74

42 Expeacuterimentations preacuteliminaires portant sur le modegravele ACS initial

3 Le fait que Java soit un langage de programmation orienteacute objet qui est un paradigmede programmation particuliegraverement adapteacute pour limpleacutementation dagents (chaque agentpeut ecirctre repreacutesenteacute par un objet Java)

Pour rappel lalgorithme geacuteneacuteral des Ant Colony Optimization servant de base pour toutesles dieacuterentes versions proposeacutees par Dorigo (Ant System Ant Colony System Ant-q ) estsyntheacutetiseacute dans lAlgorithme 3 ci-dessous

Algorithm 3 Meacutetaheuristique Ant Colony Optimization

Initialisation des paramegravetres et des pheacuteromoneswhile conditions darrecircts non atteintes doConstruction des solutionsRecherche locale (optionnelle)Mise agrave jour des pheacuteromones

end while

Agrave partir de lalgorithme geacuteneacuteral Ant Colony Optimization voici le fonctionnement de savariante Ant Colony System syntheacutetiseacute dans lAlgorithme 4 ci-dessous

Algorithm 4 Algorithme Ant Colony System

Initialisation des paramegravetres et des pheacuteromoneswhile conditions darrecircts non atteintes dowhile toutes les fourmis nont pas atteint le but dowhile tous les ndivideuds nont pas eacuteteacute pris en compte doAppliquer la regravegle de transition et choisir le prochain ndivideud agrave atteindreAppliquer la mise agrave jour locale des pheacuteromones sur larecircte traverseacutee

end whileend whileMise agrave jour globale des pheacuteromones

end while

Cet algorithme ACS peut aussi ecirctre deacutecrit sous la forme dun diagramme de ux commela proposeacute [Schlunz 2011] dans la Figure 41 Le format du diagramme de ux permet de bienvisualiser le fonctionnement de lalgorithme et notamment ses boucles iteacuteratives imbriqueacutees tantquun critegravere de n na pas eacuteteacute trouveacute tant quil reste des fourmis agrave deacuteplacer et tant quil restedes ndivideuds agrave explorer pour une fourmi

Apregraves avoir impleacutementeacute en Java lalgorithme ACS deacutecrit ci-dessus nous avons voulu testerson fonctionnement Agrave cette n nous avons repris les expeacuteriences des ponts binaires que nousavons preacutesenteacute dans la section 244 de leacutetat de lart Pour rappel ces types dexpeacuterimentationsconsistent agrave placer des fourmis dans un dispositif comportant un point de deacutepart (la fourmiliegrave-re) un point darriveacutee (la nourriture) et deux chemins y menant Ces chemins peuvent avoirla mecircme distance ou des distances dieacuterentes selon le type dexpeacuterimentation Le but est ensuitedobserver le comportement des fourmis sur quelques dizaines de minutes an de deacuteterminer si unchemin est plus emprunteacute quun autre La Figure 42 preacutesente deux exemples de congurationspossibles de cette expeacuterience utiliseacutee sur de vraies fourmis Le but eacutetant bien sucircr dobserver lecomportement de groupes de fourmis et leurs capaciteacutes agrave trouver le chemin le plus court vers

75

Chapitre 4 Expeacuterimentations et reacutesultats

Figure 41 Diagramme de ux repreacutesentant le deacuteroulement de lalgorithme ACS proposeacute par[Schlunz 2011]

une source de nourriture dans un environnement inconnu

Nous revenons sur ces expeacuterimentations dans ce chapitre de la thegravese apregraves les avoir deacutejagrave

76

42 Expeacuterimentations preacuteliminaires portant sur le modegravele ACS initial

Figure 42 Deux exemples de congurations expeacuterimentales dieacuterentes permettant chacune detester la capaciteacute des fourmis agrave trouver le plus court chemin dans un evironnement [Goss et al1989]

mentionneacutees dans leacutetat de lart car elles peuvent ecirctre utiliseacutees pour veacuterier le comportement dumodegravele ACS que nous avons impleacutementeacute En eet ces expeacuterimentations sont simples agrave mettreen divideuvre et les reacutesultats attendus sont connus De plus le modegravele ACS possegravede plusieurs meacuteta-variables permettant chacune de moduler le comportement de certaines parties du systegraveme Leparameacutetrage de ces meacutetavariables inue de maniegravere importante sur les reacutesultats potentiels dumodegravele il est donc important de bien comprendre le rocircle de chacune dentre elles et de les testerextensivement pour maximiser les capaciteacutes du modegravele Voici toutes les meacutetavariables du modegraveleACS

1 τ0 isin [0 1] valeur initiale des pheacuteromones disposeacutees sur chaque arecircte du graphe avant lepremier passage des agents

2 α isin [0 1] importance des pheacuteromones lorsque lagent fourmi choisit dune nouvelle arecircteagrave explorer Plus la valeur de ce paramegravetre est eacuteleveacutee plus lagent privileacutegiera les arecirctesavec un niveau eacuteleveacute de pheacuteromones

3 β isin [0 1] importance de lheuristique lorsque lagent fourmi deacutecide dune nouvelle arecircteagrave explorer Plus la valeur de ce paramegravetre est eacuteleveacutee plus lagent privileacutegiera les arecirctesposseacutedant une bonne heuristique

4 ρ isin [0 1] paramegravetre geacuterant leacutevaporation des pheacuteromones sur les arecirctes du graphe Plusla valeur de ce paramegravetre est eacuteleveacutee et plus les pheacuteromones seacutevaporent rapidement entrechaque passage dagent

5 Q0 isin [0 1] paramegravetre permettant deacutequilibrer la part dexploration et dexploitationbiaiseacutee du modegravele Plus la valeur de ce paramegravetre est eacuteleveacutee et plus les agents auront ten-dance agrave exploiter les arecirctes ougrave beaucoup dautres agents sont deacutejagrave passeacutes Inversementplus la valeur de ce paramegravetre est basse et plus les agents auront tendance agrave explorer denouveaux chemins encore peu visiteacutes

En plus de ces 5 meacutetavariables utiliseacutees dans le modegravele theacuteorique et les eacutequations dACSdautres meacutetavariables sont inheacuterentes au fonctionnement du modegravele en pratique On peut ainsideacutenombrer 2 autres meacutetavariables

77

Chapitre 4 Expeacuterimentations et reacutesultats

6 a nombre dagents fourmis se deacuteplaccedilant sur le graphe Plus le nombre dagents est eacuteleveacuteet plus lintelligence collective du systegraveme baseacutee sur les pheacuteromones se deacuteveloppera Ungrand nombre dagents allonge cependant la dureacutee de lexeacutecution du programme

7 n nombre diteacuterations du programme Lors dune iteacuteration chaque agent se deacuteplace surle graphe et produit un parcours complet Plus le nombre diteacuterations est grand et plusles agents ont de temps pour renforcer leacutemergence dune solution (un chemin particuliersur le graphe) mais plus lexeacutecution prendra du temps

Linteacuterecirct de mettre en place les expeacuterimentations des ponts binaires est donc double

1 Veacuterier le comportement du modegravele ACS impleacutementeacute en Java sur des expeacuterimentationsconnues

2 Observer limpact des 7 meacutetavariables listeacutees ci-dessus sur le comportement et les reacutesultatsdu modegravele dans le but de mieux appreacutehender les expeacuterimentations principales de cettethegravese qui seront preacutesenteacutees dans la suite de cette section

422 Expeacuterimentations preacuteliminaires sur le modegraveles ACS

Expeacuterimentation 11 ponts binaires de mecircme longueur

La premiegravere expeacuterimentation avait pour but de tester le graphe le plus simple possible agravelimage du dispositif de lexpeacuterimentation de Deneubourg dont nous avons deacutejagrave parleacute dans leacutetatde lart et qui est rappeleacute avec la Figure 43 un point de deacutepart un point darriveacutee et deuxchemins possibles strictement eacutequivalents en terme de distance agrave parcourir

Figure 43 Illustration de lexpeacuterience des ponts binaires par Jean-Louis Deneubourg (a)Apregraves un certain temps les fourmis choisissent majoritairement une des deux voies possibles (b)[Deneubourg et al 1990]

Avec le passage successif des fourmis un chemin va petit agrave petit ecirctre privileacutegieacute et renforceacute viales pheacuteromones deacuteposeacutees par ces derniegraveres Au bout dun certain temps un des deux chemins estemprunteacute par la majoriteacute des fourmis mecircme si quelques-unes dentre elles continuent toujoursdemprunter lautre chemin au cas ougrave celui-ci deviendrait plus avantageux Comme les cheminsrestent strictement identiques dans cette expeacuterience le choix nal du chemin nest pas important

An de pouvoir mieux appreacutecier le fonctionnement du modegravele en temps reacuteel nous avonsimpleacutementeacute une interface graphique permettant dacher le graphe ses ndivideuds ses arecirctes et

78

42 Expeacuterimentations preacuteliminaires portant sur le modegravele ACS initial

toutes leurs informations Cette interface a eacuteteacute deacuteveloppeacutee agrave laide dune bibliothegraveque Java gra-tuite nommeacutee GraphStream 41 orant tout un ensemble de fonctions permettant lachage degraphes Cette couche graphique se rajoute au-dessus de limpleacutementation complegravete du modegravelesans toutefois en modier son fonctionnement daucune maniegravere Linterface graphique reacutecupegraveresimplement les donneacutees agrave acher agrave linitialisation (la disposition du graphe avec ses arecirctes etses ndivideuds) ainsi quagrave chaque iteacuteration du modegravele pour mettre agrave jour les valeurs de pheacuteromonesagrave chaque arecircte Une fois lexeacutecution termineacutee le chemin nal trouveacute par les agents est coloreacutepermettant une rapide visualisation des reacutesultats du modegravele Pour cette sous-section les reacutesultatsdes expeacuterimentations seront preacutesenteacutes agrave laide de GraphStream

Figure 44 Repreacutesentation graphique de lExpeacuterimentation 11 meneacutee sur le modegravele ACSgracircce agrave la bibliothegraveque Java GraphStream Le ndivideud repreacutesenteacute par un carreacute rouge correspondau deacutepart le ndivideud repreacutesenteacute par un carreacute bleu repreacutesente larriveacutee les ndivideuds ronds noirsrepreacutesentent des points de passage possible les nombres noirs accoleacutes aux arecirctes repreacutesentent ladistance pour parcourir larecircte les nombres violets repreacutesentent le taux de pheacuteromones deacuteposeacuteessur larecircte

La Figure 44 est une capture deacutecran de la fenecirctre graphique construite avec les fonction-naliteacutes oertes par GraphStream montrant la conguration de lExpeacuterimentation 11 On y voitnotamment lensemble du graphe avec ses 4 ndivideuds distinguables par leur numeacutero didentication0 1 2 9 Le ndivideud 0 repreacutesente le point de deacutepart ougrave les agents sont initialement placeacutes tandisque le ndivideud 9 repreacutesente le ndivideud darriveacutee ougrave les agents atteignent leur but et cessent de sedeacuteplacer Au niveau des arecirctes du graphe on peut distinguer deux informations en violet laquantiteacute de pheacuteromones τ preacutesente sur larecircte en noir la distance d agrave parcourir pour traverserlarecircte Dans cette conguration lheuristique ηij associeacutee agrave chaque arecircte i j est calculeacutee demaniegravere classique uniquement avec la distance dij agrave savoir ηij = 1

dij Lheuristique est donc ici

41 httpgraphstream-projectorg

79

Chapitre 4 Expeacuterimentations et reacutesultats

eacutequivalente agrave la distance et nest pas acheacutee dans la fenecirctre graphique La conguration repreacute-senteacutee par la Figure 44 correspond agrave leacutetat dinitialisation du systegraveme avant que les agents neparcourent le graphe Toutes les arecirctes ont donc les mecircmes valeurs le taux de pheacuteromones τcorrespond au taux de pheacuteromones initial τ0 ici eacutegal agrave 0 1 et la distance est xeacute agrave 10 uniteacutesLes deux chemins possibles permettant aux agents de se deacuteplacer du ndivideud de deacutepart 0 au ndivideuddarriveacutee 9 sont eectivement strictement identiques

Figure 45 Reacutesultats obtenus apregraves 30 iteacuterations sur lExpeacuterimentation 11 Agrave gauche laconguration nale du graphe agrave droite le pourcentage dagents fourmis ayant emprunteacutes lesdeux chemins

LExpeacuterimentation 11 se deacuteroule donc ainsi 100 agents se deacuteplaceront agrave chaque fois etchercheront un chemin du ndivideud 0 au ndivideud 9 durant 30 iteacuterations La Figure 45 preacutesente lesreacutesultats de cette expeacuterimentation Agrave gauche la fenecirctre graphique montre leacutetat du graphe agrave lan des 30 iteacuterations on peut voir le chemin seacutelectionneacute par les agents passant par les ndivideudslt 0 1 9 gt Agrave droite le graphique preacutesentant leacutevolution du pourcentage dagents prenant soitle chemin 1 (lt 0 1 9 gt) ou le chemin 2 (lt 0 2 9 gt) Leacutevolution des pourcentages est similaireaux reacutesultats trouveacutes par Deneubourg avec de vraies fourmis (Figure 43) Une fois quun cheminest privileacutegieacute par rapport agrave un autre entre 80 et 95 des agents y passent Cet eacutecart saccentuede plus en plus au l des iteacuterations Il est toutefois important de noter quil subsiste un faiblepourcentage dagents deacutecidant quand mecircme de prendre le chemin 2 permettant au systegraveme desadapter agrave un potentiel changement denvironnement On voit ici linteacuterecirct de la meacutetavariableQ0 qui eacutequilibre lexploitation du chemin 1 en majoriteacute mais qui autorise aussi quelques agentsagrave explorer dautres chemins du graphe

Expeacuterimentation 12 ponts binaires de mecircme longueur et inuence des meacutetava-riables

LExpeacuterimentation 12 illustre limportance des meacutetavariables sur le comportement du sys-tegraveme La mecircme topologie du graphe est conserveacutee mais certaines meacutetavariables sont modieacutees Q0 et β La premiegravere gegravere leacutequilibre entre exploration et exploitation tandis que la deuxiegravemeconcerne limportance de lheuristique dans lexploration Contrairement agrave lExpeacuterimentation11 Q0 est ici biaiseacute pour privileacutegier lexploration et β est augmenteacute an de donner plus dimpor-tance agrave lheuristique par rapport au pheacuteromones lors de lexploration Les agents ont donc plus

80

42 Expeacuterimentations preacuteliminaires portant sur le modegravele ACS initial

de probabiliteacute dexplorer de nouvelles arecirctes plutocirct que demprunter des arecirctes ougrave beaucoup depheacuteromones sont deacutejagrave deacuteposeacutes Dans cette conguration lexploration se base principalement surlheuristique qui est ici strictement identique quelle que soit larecircte puisque baseacutee sur la distanceLes agents nont donc en theacuteorie pas vraiment de direction claire quant au chemin agrave prendre Onpeut voir le reacutesultat de lExpeacuterimentation 12 sur la Figure 46 les agents oscillent dun chemin agravelautre selon liteacuteration sans quaucun des deux ne soit vraiment privileacutegieacute Quand bien mecircme unchemin serait plus emprunteacute que lautre pendant une iteacuteration les pheacuteromones suppleacutementairesdeacuteposeacutees sur les arecirctes nont que peu dinuence sur la deacutecision lors des prochaines iteacuterations

Figure 46 Reacutesultats obtenus apregraves 30 iteacuterations sur lExpeacuterimentation 12 Comme les agentsse basent principalement sur lheuristique qui est partout eacutegale ils oscillent entre les deux cheminssans en privileacutegier un

Expeacuterimentation 13 ponts binaires de mecircme longueur et inuence des meacutetava-riables

LExpeacuterimentation 13 dont les reacutesultats sont preacutesenteacutes par la Figure 47 montre quil estaussi possible dobtenir linverse du comportement de lExpeacuterimentation 12 En donnant uneforte importance aux pheacuteromones et en favorisant grandement lexploitation par rapport agrave lex-ploration les agents choisissent tregraves rapidement un chemin et nen changent plus Au bout dequelques iteacuterations seulement 100 des agents prennent le mecircme chemin Lautre chemin aban-donneacute nit par voir toutes ses pheacuteromones seacutevaporer et les agents nont plus aucun moyen dyretourner

Expeacuterimentation 2 ponts binaires avec chemins de longueurs dieacuterentes

Apregraves avoir testeacute le comportement du modegravele ACS sur un graphe ougrave les chemins sont iden-tiques dans lExpeacuterimentation 1 nous allons maintenant creacuteer un graphe ayant la mecircme con-guration que dans la Figure 42 Le but est ici de tester la capaciteacute des agents agrave imiter lesfourmis dans la nature qui sont capables apregraves quelques dizaines de minutes de privileacutegier les 2

81

Chapitre 4 Expeacuterimentations et reacutesultats

Figure 47 Reacutesultats obtenus apregraves 30 iteacuterations sur lExpeacuterimentation 13 Les agents ex-ploitent ici les arecirctes ayant le plus de pheacuteromones Tregraves rapidement tous les agents utilisent lemecircme chemin

arecirctes courtes par rapport aux 2 arecirctes longues Nous allons de plus garder les mecircmes valeursde meacutetavariables que pour lExpeacuterimentation 11 sauf pour la quantiteacute initiale de pheacuteromoneτ0 qui sera augmenteacutee an de rester au-dessus de 0 La Figure 48 montre la conguration dugraphe directement apregraves 30 iteacuterations Toutes les arecirctes courtes avec une distance de 10 ont eacuteteacuteseacutelectionneacutees tandis que toutes les arecirctes longues avec une distance de 20 nont pas eacuteteacute utiliseacutees

Figure 48 Conguration nale du graphe pour lExpeacuterimentation 2 apregraves 30 iteacuterations Lesagents ont en majoriteacute bien seacutelectionneacute le chemin le plus court lt 0 1 3 4 9 gt

82

42 Expeacuterimentations preacuteliminaires portant sur le modegravele ACS initial

Expeacuterimentation 3 graphes aleacuteatoires plus complexes

Dans les preacuteceacutedentes expeacuterimentations le graphe eacutetait le plus simple possible pour pouvoirjouer avec le comportement du modegravele Avant de passer agrave la section suivante nous souhaitionstester les capaciteacutes du modegravele sur des topologies de graphes plus complexes Nous avons donccreacuteeacute aleacuteatoirement 10 graphes posseacutedant chacun 20 ndivideuds et des arecirctes aleacuteatoires selon un degreacutemoyen de 5 sur lesquels 100 agents se deacuteplaceront sur 50 iteacuterations La Figure 49 preacutesente lepremier de ces 10 graphes apregraves 30 iteacuterations On peut voir que le but est de trouver un chemindu ndivideud 0 au ndivideud 19 et les agents ont trouveacute le chemin lt 0 1 4 2 19 gt Ce chemin est eecti-vement le plus court avec une distance de 284 le deuxiegraveme meilleur chemin eacutetant lt 0 5 6 19 gtavec une distance de 315

Figure 49 Exemple de graphe de lExpeacuterimentation 3 agrave la n des 50 iteacuterations Ces graphessont geacuteneacutereacutes aleacuteatoirement

Parmi les 10 graphes aleacuteatoires le modegravele a trouveacute le chemin le plus court pour 9 dentre euxcar dans lun des graphes il neacutetait pas possible de rejoindre le ndivideud de n 19 Autrement dit

83

Chapitre 4 Expeacuterimentations et reacutesultats

les agents ont trouveacute le chemin le plus optimiseacute agrave chaque fois que cela eacutetait possible

423 Conclusion

Dans cette premiegravere section nous avons impleacutementeacute et testeacute le modegravele ACS proposeacute parDorigo Malgreacute la relative simpliciteacute des expeacuterimentations reacutealiseacutees nous avons pu comparer etveacuterier les reacutesultats que nous avons obtenus avec ceux de la litteacuterature scientique du domaineOutre ce point nous avons aussi pu deacuteduire quelques informations cruciales pour la suite de cettesection

Les meacutetavariables jouent un rocircle central dans le comportement les performances etles reacutesultats du modegravele

Les meacutetavariables peuvent donner de bons reacutesultats avec un type de graphemais pas forceacutement avec un autre Il sera donc important de pouvoir les adapter auxgraphes des expeacuterimentations principales

Leacutequilibre de ces meacutetavariables est relativement complexe agrave obtenirMecircme avecces congurations simples de graphes et laide de linterface graphique chaque expeacuterimen-tation a demandeacute un certain nombre dessais avant de trouver des valeurs concluantes Deplus comme ces meacutetavariables sont propres agrave chaque expeacuterimentation leacutetat de lart necontient que tregraves peu dindications sur les valeurs agrave leur donner Il sera donc importantdeacutetudier ce problegraveme pour les expeacuterimentations principales de cette thegravese

Il est important de noter que comme notre modegravele AntRS est une extension du modegravele ACSde Dorigo et reprend ses principes de fonctionnement toutes les conclusions ci-dessus pourrontecirctre appliqueacutees dans la section suivante ougrave nous reacutealiserons plusieurs expeacuterimentations avec lemodegravele AntRS

43 Expeacuterimentations sur le modegravele AntRS

Dans cette section nous allons maintenant deacutecrire les expeacuterimentations meneacutees sur le modegraveleAntRS que nous avons conccedilu dans le cadre de cette thegravese et deacutecrit dans le chapitre 3 preacuteceacutedentNous nallons pas re-deacutetailler la theacuteorie du modegravele AntRS ici comme cela a deacutejagrave eacuteteacute fait dansle chapitre preacuteceacutedent mais nous allons plutocirct nous concentrer sur son application et sur sescomportements dun point de vue expeacuterimental De la mecircme maniegravere que pour le modegravele ACSdans la section preacuteceacutedente il est important de proceacuteder agrave quelques tests pour jauger notremodegravele avant de lancer des expeacuterimentations pouvant ecirctre longues Toutefois et contrairementagrave la section preacuteceacutedente toutes les expeacuterimentations qui vont ecirctre preacutesenteacutees ici ont eacuteteacute reacutealiseacuteessur une base de donneacutees reacuteelles Avant de sinteacuteresser agrave ces expeacuterimentations nous allons doncpreacutesenter la base de donneacutees utiliseacutee

431 Base de donneacutees utiliseacutee

Tout dabord et avant de discuter du choix des donneacutees il est important de preacuteciser pour-quoi nous navons pas eu recours comme dans la section preacuteceacutedente pour le modegravele ACS agrave desdonneacutees simuleacutees Lexplication de cette deacutecision reacuteside dans lobjectif viseacute par ces expeacuterimen-tations Les expeacuterimentations reacutealiseacutees preacuteceacutedemment avaient seulement pour but de tester lebon fonctionnement du modegravele son comportement et linuence de ses meacutetavariables Lobjectifdes expeacuterimentations que nous allons preacutesenter maintenant est dieacuterent proposer des seacutequences

84

43 Expeacuterimentations sur le modegravele AntRS

de ressources correspondant aux preacutefeacuterences de lutilisateur Il serait theacuteoriquement possible desimuler un grand nombre de ressources aleacuteatoires posseacutedant des caracteacuteristiques elles aussi aleacutea-toires Cependant nous souhaitons principalement eacutevaluer la pertinence des seacutequences produitespar notre modegravele Pour ce faire il est neacutecessaire de disposer de donneacutees dusage pour veacuteriera posteriori si ces seacutequences sont susceptibles dinteacuteresser les utilisateurs Lexploitation dunebase de donneacutees reacuteelle posseacutedant ces donneacutees dusages eacutetait essentielle

Choix du domaine applicatif

Le choix du domaine applicatif a eacuteteacute un point crucial pour pouvoir tester notre modegravele dans debonnes conditions La recommandation de seacutequences restreint le choix du domaine en imposantcertaines contraintes

Les utilisateurs doivent consulter reacuteguliegraverement les ressources du domaine applicatif Lors dune peacuteriode dactiviteacute les utilisateurs doivent consulter un nombre susant (au

moins une dizaine) de ressources dans un court intervalle de temps Par conseacutequent les ressources doivent pouvoir ecirctre consulteacutees et consommeacutees rapide-

ment Ces ressources doivent aussi ecirctre disponibles en nombre susant

En se basant sur les eacutetudes de leacutetat de lart explorant les algorithmes de fourmis ou la recom-mandation de seacutequences deux domaines applicatifs sont majoritairement utiliseacutes les ressourceseacuteducatives ou les ressources multimeacutedias Le domaine eacuteducatif permet de geacuteneacuterer des seacutequencesdestineacutees aux apprenants comme le ferait un vrai professeur tandis que le domaine du divertisse-ment multimeacutedia est en plein essor depuis quelques anneacutees gracircce agrave la deacutemocratisation dInternethaut deacutebit et des smartphones permettant agrave tout un chacun de regarder des lms ou deacutecouter dela musique par exemple Un troisiegraveme domaine a aussi eacuteteacute consideacutereacute car il a eacuteteacute le sujet de monstage de n de Master en collaboration avec le projet europeacuteen CrossCult 42 le domaine museacutealautrement dit les seacutequences que creacuteent les visiteurs dun museacutee en se deacuteplaccedilant physiquementdans un museacutee [Osche et al 2016 Osche et al 2019b]

Toutefois mecircme si ces trois domaines sont adapteacutes agrave notre application la reacutecupeacuteration dunebase de donneacutees assez importante pour reacutealiser des expeacuterimentations ne pose pas les mecircmes pro-blegravemes selon le domaine consideacutereacute

Domaine eacuteducatif dans ce domaine les ressources sont des supports peacutedagogiques denatures dieacuterentes 43 et le but est de creacuteer des seacutequences permettant agrave des utilisateurs dat-teindre des connaissances speacutecieacutees Il existe des bases de donneacutees publiques provenantduniversiteacutes ouvertes comme par exemple lUniversiteacute Ouverte des Humaniteacutes 44 maisces derniegraveres nont pas de prols utilisateurs assez fournis pour pouvoir les utiliser icinotamment ducirce agrave une connexion avec une session unique et anonyme sans prol Commeil est preacutefeacuterable davoir plusieurs dizaines (voire centaines) dentreacutees preacute-existantes pourmodeacuteliser le graphe et les prols utilisateurs il est neacutecessaire dutiliser les donneacutees dunsite permettant la connexion de lutilisateur et lenregistrement de ses habitudes pendantune certaine dureacutee

42 httpwwwcrossculteu projet europeacuteen ayant pour but de modier la maniegravere dont les citoyens europeacuteensvoient et sapproprient lHistoire en creacuteant de nouvelles interconnexions entre lheacuteritage culturel des lieux deculture (museacutees villes etc) et le point de vue des citoyens eux-mecircmes43 Les supports peacutedagogiques peuvent inclure des cours eacutecrits oraux des videacuteos des exercices des tests etc44 httpwwwuohfr

85

Chapitre 4 Expeacuterimentations et reacutesultats

Domaine museacuteal ce domaine est unique car il est le seul des trois agrave neacutecessiter dereacutecolter des donneacutees de maniegravere physique et non sur ordinateur Comme nous lavons vudans leacutetat de lart des eacutetudes existent dans ce domaine et ont reacutecolteacute les positions desutilisateurs avec plus ou moins de preacutecision mais il nexiste agrave notre connaissance pas debase de donneacutees publique permettant de savoir ce que le visiteur regarde preacutecisemment 45Or cette information est essentielle agrave notre modegravele car la position seule ne permet pas dedeacuteterminer ce que fait preacuteciseacutement lutilisateur (par exemple il peut sassoir en face dunedivideuvre mais regarder derriegravere lui ou encore discuter avec quelquun sans precircter attentionagrave ldivideuvre devant lui etc) Autrement dit sans savoir ce que regarde lutilisateur il nestpas possible de savoir les ressources quil a consulteacute Eacutetant donneacute le sujet du stage eectueacuteavant cette thegravese cest sur ce problegraveme preacutecis que nous nous sommes dabord concentreacutesCependant devant le coucirct en temps de la mise en place dune telle expeacuterimentation nousavons chercheacute des alternatives plus reacutealisables Il est agrave noter quil existe aussi la possi-biliteacute dun museacutee virtuel ougrave les visiteurs utilisent un ordinateur et un casque de reacutealiteacutevirtuelle pour se deacuteplacer ddivideuvre en divideuvre dans un espace recreacuteeacute pour simuler un museacuteeLa creacuteation de lensemble des composants permettant cette expeacuterimentation ainsi que lerecrutement des visiteurs virtuels est cependant complexe et tregraves coucircteux en temps nechangeant pas le problegraveme principal de la reacutecolte de donneacutees dans notre cas

Domaine du divertissement multimeacutedia depuis le tout deacutebut des systegravemes de re-commandations le domaine multimeacutedia (musique lms etc) occupe une place majeuredans leacutetat de lart On peut citer par exemple la base de donneacutees publique MovieLensqui depuis 1998 a eacuteteacute utiliseacutee dans des milliers deacutetudes sur la recommandation de lms[Harper and Konstan 2015] La raison de cette omnipreacutesence est la grande quantiteacute desites web permettant souvent de maniegravere gratuite de regarder des videacuteos deacutecouter dela musique etc Les donneacutees dutilisation de ce genre de sites sont aussi relativementsimples agrave reacutecupeacuterer et agrave exploiter Leacutecoute de musique en ligne est speacuteciquement inteacute-ressante dans le cadre de cette thegravese car elle est propice agrave la consommation de multiplesressources agrave la suite dans une mecircme session orant ainsi la possibiliteacute de travailler avecdes seacutequences De plus il existe plusieurs sites de diusion de musique en ligne orantla possibiliteacute dacceacuteder agrave leur API et agrave certaines de leurs donneacutees comme Deezer 46 ouencore Spotify 47

Le choix sest nalement porteacute sur le domaine de leacutecoute de musique en ligne dune part pourla possibiliteacute dexploiter et de recommander des seacutequences de musiques et dautre part pour lapossibiliteacute dobtenir une base de donneacutees de la part de nos partenaires dans lindustrie musicaleNotre modegravele AntRS ayant la capaciteacute de sadapter agrave de nombreux domaines applicatifs nousavons pu nous diriger vers une base de donneacutees existante an de commencer les expeacuterimentationsAmaury LHuillier ancien doctorant de leacutequipe KIWI a reacutecupeacutereacute et exploiteacute durant sa thegraveseune base de donneacutees musicale provenant de Deezer [lHuillier 2018] Dans la section suivantenous allons deacutecrire les caracteacuteristiques de cette base de donneacutees

45 Bien que des solutions soient en cours deacutetudes[Mokatren et al 2018]46 httpswwwdeezercom47 httpswwwspotifycom

86

43 Expeacuterimentations sur le modegravele AntRS

Description de la base de donneacutees

La base de donneacutees que nous avons utiliseacute se base sur le comportement dutilisateurs deDeezer pendant un mois entre le 5 deacutecembre 2016 et le 5 janvier 2017 Durant ce mois nousavons pu identier

3561 utilisateurs uniques 1871919 eacutecoutes enregistreacutees 178910 musiques uniques eacutecouteacutees

En plus de ces donneacutees nous avons calculeacute le nombre de sessions uniques durant ce mois Unesession est deacutetermineacutee par un utilisateur se connectant sur le site eacutecoutant un certain nombre demusiques puis se deacuteconnectant Une session se poursuit tant que lutilisateur eacutecoute des musiquessans pause plus longues que 15 minutes Nous avons ainsi pu identier 91468 sessions uniquescomposeacutees en moyenne de 183 morceaux de musique Ces sessions seront la base de travail nouspermettant de construire le graphe de notre modegravele AntRS et de proposer des recommandationsLa Figure 410 preacutesente en scheacutema la deacutetection de sessions dans la base de donneacutees

Figure 410 Exemple de deacutetection de sessions dans la base de donneacutees Lheure agrave laquelleest lanceacutee chaque musique (ici en bas dans le scheacutema) ainsi que sa dureacutee sont enregistreacutees Silutilisateur ne relance pas de musique pendant 15 minutes apregraves la n de sa derniegravere eacutecoute alorsla session en cours est termineacutee et une nouvelle session est commenceacutee agrave la prochaine musiquelanceacutee

Deezer possegravede des meacutetadonneacutees sur chaque musique quil est possible de reacutecupeacuterer et decoupler agrave dautres API 48 (comme par exemple lAPI de Spotify 49) an de les compleacuteter si neacute-cessaire Sans preacutesenter la base de donneacutees dans lensemble de ses deacutetails voici ci-dessous les ca-racteacuteristiques potentiellement exploitables enregistreacutees pour chaque musique que nous pouvonsregrouper en trois cateacutegories Tout dabord nous disposons dinformations textuelles classiques

id identiant unique de la musique title titre de la musique album nom de lalbum auquel appartient la musique artist nom de lartiste (ou du groupe) qui a creacuteeacute la musique artistGenre genre musical de lartiste

Ensuite les API de descriptions de meacutetadonneacutees musicales disposent dun ensemble de va-leurs numeacuteriques correspondant aux caracteacuteristiques de chaque musique

48 API Application Programming Interface

49 httpsdeveloperspotifycomdocumentationweb-api

87

Chapitre 4 Expeacuterimentations et reacutesultats

duration dureacutee de la musique en secondes acousticness isin [0 1] indique agrave quel point la musique est acoustique cest-agrave-dire si

la musique est plutocirct de type eacutelectronique ou plutocirct classique (ie composeacutee avec desinstruments de musique agrave corde ou agrave vents par exemple)

danceability isin [0 1] indique agrave quel point la musique est adapteacutee agrave la danse energy isin [0 1] indique agrave quel point la musique est eacutenergique instrumentalness isin [0 1] indique agrave quel point la musique possegravede ou non des parties

vocales liveness isin [0 1] indique si la musique a eacuteteacute enregistreacutee avec ou sans la preacutesence dun

public loudness isin [0 1] mesure la preacutesence et la puissance des basses dans la musique speechiness isin [0 1] mesure limportance des paroles dans la musique sil y en a tempo rythme de la musique valence indique si leacutemotion geacuteneacuterale de la musique est plutocirct heureuse ou triste

Enn Deezer eacutetant un service de musique en ligne il dispose des donneacutees de freacutequentationsdes musiques les unes par rapport aux autres Il est donc possible de connaicirctre pour chaquemusique et artiste sa populariteacute

trackRankDeezer repreacutesente la populariteacute de la musique sur le site Deezer artistRankDeezer repreacutesente la populariteacute de lartiste sur le site Deezer

La base de donneacutees possegravede aussi une table concernant les utilisateurs Ces derniers sontbien sucircr anonymiseacutes avec un identiant geacuteneacutereacute automatiquement De plus pour chaque chansonDeezer peut connaicirctre quelles actions lutilisateur a eectueacute durant son eacutecoute (sil en a eectueacute)

idUser identiant unique de lutilisateur idTrack identiant unique de la musique eacutecouteacutee timestamp date preacutecise agrave laquelle lutilisateur a lanceacute la musique skip indique si lutilisateur est passeacute agrave la musique suivante durant son eacutecoute ban indique si lutilisateur a banni la musique eacutecouteacutee de ses futures recommandations love indique si lutilisateur a aimeacute la musique durant son eacutecoute

Ces trois derniegraveres informations sont importantes car elles repreacutesentent lavis de lutilisateursur la musique quil eacutecoute On peut par exemple deacuteduire dun utilisateur qui passe la musiqueen cours (skip) quil ne lappreacutecie pas ou alors quil laime mais que ce nest pas le bon momentpour leacutecouter Un utilisateur supprimant une musique de ses futures eacutecoutes (ban) indique quilne souhaite plus eacutecouter cette musique et ce quelles que soient les circonstances Le Tableau 41preacutesente la freacutequence agrave laquelle les utilisateurs se sont servis de ces fonctionnaliteacutes dans notrebase de donneacutees

Discussion sur la base de donneacutees

Dans cette section nous avons justieacute le choix dune base de donneacutees musicale et deacutecritson contenu Mecircme si initialement nous nous sommes plutocirct dirigeacutes vers lespace museacuteal etle-eacuteducation devant le temps et la complexiteacute de la reacutecupeacuteration de donneacutees dans ces deuxdomaines nous avons nalement proceacutedeacute au choix plus pragmatique du domaine musical dont

88

43 Expeacuterimentations sur le modegravele AntRS

Nombre doccurrences Pourcentage

skip 603773 3225ban 3417 018love 14174 076

Total 621364 3319

Table 41 Tableau repreacutesentant le nombre de fois ougrave un utilisateur a cliqueacute sur les boutonspour passer bannir ou aimer une musique durant son eacutecoute On remarque quau total dansnotre base de donneacutees pregraves dun tiers des utilisateurs ont passeacute la musique quils eacutecoutaient

une base de donneacutees eacutetait deacutejagrave disponible et precircte agrave lemploi Le travail preacuteliminaire sur les deuxdomaines applicatifs non seacutelectionneacutes na cependant pas eacuteteacute vain car des projets en parallegravelesur la creacuteation dune base de donneacutees de visiteurs se deacuteplaccedilant dans le museacutee des Beaux-arts deNancy sont en cours de reacutealisation [Osche et al 2019b][Castagnos et al 2019]

Un autre objectif derriegravere la prise en compte de plusieurs domaines sur lesquels appliquernotre modegravele est la geacuteneacutericiteacute de notre approche Ces trois domaines possegravedent de nombreusesdieacuterences les uns par rapports aux autres Le domaine des museacutees est un environnement physiqueougrave les distances entre les divideuvres dart et la foule sont des notions importantes agrave prendre en compteet unique agrave ce domaine Le domaine de le-eacuteducation quant agrave lui neacutecessite de prendre en comptelobjectif peacutedagogique de lapprenant son niveau ou encore sa vitesse dapprentissage plutocirctque les seules preacutefeacuterences quil est dusage dexploiter dans les systegravemes de recommandationNotre modegravele AntRS a eacuteteacute conccedilu dans le but de pouvoir sadapter agrave ces dieacuterentes speacuteciciteacutesAinsi le fonctionnement du cdivideur du modegravele reste le mecircme quel que soit le domaine et seulsles objectifs des colonies ainsi que le type des colonies neacutecessite decirctre adapteacute en fonctiondes objectifs importants du domaine et des caracteacuteristiques de ses ressources Pour illustrer cedernier point tregraves concregravetement les expeacuterimentations qui suivent nincluent pas la colonie deprogressiviteacute Nous avons reacutealiseacute de nombreux tests avec cette colonie avec le corpus de donneacuteesmais les reacutesultats obtenus nont jamais eacuteteacute concluants Cela sexplique par le fait que les seacutequencesdeacutecoutes utilisateurs que nous avons recueilli ne posseacutedaient elles-mecircmes aucun motif deacutetectablede progressiviteacute selon les critegraveres deacutenis dans notre modegravele Nous avons donc deacutecideacute dutiliser lamodulariteacute quore notre modegravele en enlevant cette colonie

432 AntRS mono-objectif expeacuterimentations sur chaque colonie isoleacutee

Apregraves avoir deacutetailleacute la base de donneacutees nous allons maintenant aborder la premiegravere expeacuteri-mentation que nous avons reacutealiseacute avec celle-ci Comme nous lavons fait au deacutebut de ce chapitreavec le modegravele ACS classique nous avons jugeacute important de reacutealiser quelques expeacuterimentationsde tests an dappreacutecier le fonctionnement en pratique de notre modegravele qui jusquagrave maintenantdans ce manuscrit na eacuteteacute preacutesenteacute que de maniegravere theacuteorique Pour rappel notre modegravele simuleen parallegravele plusieurs colonies de fourmis ayant chacune un objectif unique Ensuite un algo-rithme se charge de fusionner les dieacuterents reacutesultats de lensemble des colonies pour ne proposeragrave lutilisateur quune seule seacutequence de ressources Avant de tester lensemble de notre modegravelenous avons voulu tester les colonies seacutepareacutement an dobserver si les reacutesultats quelles produisentsont bien adapteacutes agrave leurs objectifs respectifs Voici les 4 colonies que nous avons preacutesenteacutes dansle chapitre 3 et que nous allons mesurer ici

1 Similariteacute

89

Chapitre 4 Expeacuterimentations et reacutesultats

2 Diversiteacute

3 Nouveauteacute

4 Preacutefeacuterences

An de mesurer les performances de ces 4 colonies nous allons les isoler et les lancer sur ungraphe identique en tous points La modulariteacute dAntRS nous permettant de changer le nombrede colonies utiliseacutees au vol agrave chaque exeacutecution est ici mis agrave prot pour lancer notre modegraveleavec uniquement une colonie au lieu des 4 habituelles La deuxiegraveme phase de notre modegravele lafusion des seacutequences provenant des dieacuterentes colonies nest ici pas utiliseacutee eacutetant donneacute que nousnaurons que les reacutesultats dune seule colonie autrement dit nous naurons agrave la n quune seuleseacutequence unique par utilisateur et par expeacuterimentation (soit 4 seacutequences par utilisateur pourlensemble des 4 expeacuterimentations) Nous allons donc proceacuteder agrave 4 tests dieacuterents pour chaquecolonie avec des conditions de deacutepart strictement identiques Le but est ici de voir si les reacutesultatsobtenus correspondent bien agrave lobjectif de la colonie testeacutee Autrement dit pour un utilisateurdonneacute les agents de la colonie de similariteacute devraient favoriser les musiques similaires au goucirct delutilisateur en question De son cocircteacute la colonie de nouveauteacute devrait dans les mecircmes conditionsproduire des seacutequences de musiques moins familiegraveres pour lutilisateur

Avant de preacutesenter les reacutesultats de ces premiegraveres expeacuterimentations nous allons deacutecrire dequelle maniegravere nous les avons reacutealiseacutees Nous avons deacutejagrave deacutetailleacute la base de donneacutees avec laquellenous travaillons dans la section preacuteceacutedente mais nous navons pas encore expliqueacute commentnous avons utiliseacute ces donneacutees Comme nous lavons preacuteciseacute nous avons agrave notre disposition plusde 3500 utilisateurs et plus de 91400 sessions Parmi lensemble total des utilisateurs nous enavons seacutelectionneacute 500 au hasard an de travailler uniquement sur eux Cette reacuteduction du nombredutilisateurs nous a permis de reacutealiser beaucoup plus rapidement des expeacuterimentations tout engardant une diversiteacute importante Pour chacun de ces 500 utilisateurs nous avons reacutecupeacutereacute leurssessions deacutecoute et gardeacute toutes celles contenant 5 musiques ou plus Ces 500 utilisateurs ontensuite eacuteteacute diviseacutes aleacuteatoirement en 2 groupes de 400 et de 100 les 400 premiers utilisateursont servi pour lentraicircnement du modegravele (dans notre cas la creacuteation du graphe) et cest sur les100 utilisateurs restants que nous avons meneacute les tests Dans le cadre de cette expeacuterimentationpreacutecise les utilisateurs de la base dentraicircnement ont eacutecouteacute 10621 sessions uniques de plus de5 musiques et les utilisateurs de la base de test ont quant agrave eux eacutecouteacute 2569 sessions Pourchacune des sessions deacutecoute des utilisateurs de la base de test notre modegravele a produit uneseacutequence de recommandations en partant de la premiegravere musique eacutecouteacutee Autrement dit pourchaque session les agents de notre modegravele ont eacuteteacute lanceacutes sur le graphe en prenant comme pointde deacutepart la premiegravere musique que lutilisateur avait eacutecouteacute Par exemple pour la session dunutilisateur consistant en leacutecoute de lalbum entier Dark Side of the Moon des Pink Floyd conte-nant 9 musiques les agents eacutetaient placeacutes sur le ndivideud du graphe correspondant agrave la premiegraveremusique de lalbum Speak to me Breathe puis notre modegravele sexeacutecute et les agents trouventun chemin dans le graphe Les agents possegravedent 3 conditions de parcours de graphe une condi-tion de taille minimale de la seacutequence recommandeacutee et deux conditions darrecircts La conditionde taille minimale de la seacutequence recommandeacutee est xeacutee agrave la moitieacute de la longueur de la sessioninitiale de lutilisateur Dans lexemple de lalbum de Pink Floyd un agent sera donc forceacute deparcourir au moins 5 ndivideuds du graphe avant de pouvoir sarrecircter Les deux conditions darrecirctseacutetaient quant agrave elles imposeacutees dans notre modegravele an de limiter la taille maximale de la seacutequencerecommandeacutee des agents Premiegraverement la derniegravere musique de la session initiale eacutecouteacutee parlutilisateur neacutetait pas donneacutee en amont mais si jamais les agents arrivaient agrave cette musique ils

90

43 Expeacuterimentations sur le modegravele AntRS

arrecirctaient ici leur chemin Deuxiegravemement dans le cas ougrave les agents natteignaient pas la derniegraveremusique de la session initiale de lutilisateur ces derniers sarrecirctaient lorsquils avaient parcourudeux fois la taille de la session initiale Dans notre exemple avec lalbum de Pink Floyd les agentspourraient donc parcourir au maximum 18 ndivideuds du graphe et produire ainsi une seacutequence derecommandations de 18 musiques En prenant en compte le nombre de ndivideuds des graphes surlesquels nous avons travailleacute (entre plusieurs dizaines de milliers jusquagrave plusieurs centaines demilliers) cest cette deuxiegraveme condition darrecirct qui eacutetait tregraves largement atteinte Ces trois condi-tions son neacutecessaires et ont eacuteteacute mises en place an dobtenir des seacutequences de recommandationfaisant sens dans le contexte du domaine applicatif musical Sans ces 3 conditions il est pos-sible dobtenir des seacutequences ne faisant que deux musiques ou posseacutedant des centaines voire desmilliers de musiques Comme le reste des paramegravetres de notre modegravele nous avons fait en sortequil soit aiseacute de les changer au vol en fonction du domaine applicatif voire mecircme en fonctionde chaque utilisateur au sein dun mecircme domaine

Nous allons maintenant nous inteacuteresser agrave la creacuteation du graphe Nous avons deacutecrit la maniegraveredont nous creacuteons le graphe sur lequel les agents se deacuteplacent dans la Section 33 du chapitrepreacuteceacutedent Nous avons utiliseacute un sous-ensemble de 500 utilisateurs choisis aleacuteatoirement parmilensemble des utilisateurs de notre base de donneacutees Deezer pour reacutealiser cette expeacuterimentationApregraves cette seacutelection aleacuteatoire nous avons seacutepareacute ces 500 utilisateurs en 5 blocs de 100 utilisateursan de reacutealiser une validation croiseacutee agrave 5 blocs 4 blocs ont constitueacute la base dapprentissage tandisque le dernier bloc restant a constitueacute la base de test Ce processus a eacuteteacute reacutepeacuteteacute 5 fois pour reacutealiserlexpeacuterimentation avec toutes les combinaisons possibles Le choix speacutecique dutiliser lensembledes connaissances disponibles de 80 des utilisateurs et dessayer de preacutevoir les preacutefeacuterences desderniers 20 est deacutelibeacutereacutement voulu Il nous permet de simuler au mieux le fonctionnement dunservice de recommandations en cours dutilisation En eet un nouvel utilisateur arrivant surle site sera inconnu du systegraveme de recommandation La tacircche de preacutediction est plus ardue etsaidera initialement des preacutefeacuterences des autres utilisateurs deacutejagrave connus du modegravele Au fur et agravemesure que le nouvel utilisateur eacutecoute des musiques et apporte ses retours sur ces derniegraveresle modegravele peut inteacutegrer ses preacutefeacuterences speacuteciques et de ce fait ameacuteliorer les recommandationsquil lui propose Pour simuler cette eacutevolution des connaissances du modegravele nous avons inteacutegreacutechaque session de lutilisateur au graphe apregraves avoir proposer une recommandation pour celle-ciAutrement dit une fois que le modegravele a proposeacute une recommandation de seacutequence en se basantsur une session deacutecoute de lutilisateur le graphe est reconstruit en inteacutegrant les informationsde cette nouvelle session deacutecoute Ainsi agrave chaque nouvelle session deacutecoute pour laquelle notremodegravele propose une recommandation le graphe gagne en information et est plus agrave mecircme depreacutedire correctement les preacutefeacuterences de lutilisateur Cependant linconveacutenient majeur de cettemeacutethode est de devoir reconstruire le graphe apregraves chaque recommandation an dinteacutegrer lesnouvelles informations Apregraves cette premiegravere expeacuterimentation nous proposerons une meacutethodeplus classique de reacutepartition des connaissances apporteacutees par les utilisateurs

Le Tableau 42 preacutesente les reacutesultats de cette expeacuterience pour les 4 colonies choisies Ce for-mat de tableau de reacutesultats et les meacutetriques deacutevaluations qui le compose seront utiliseacutes pour lesprochaines expeacuterimentations nous allons donc les expliquer ici avant de discuter des reacutesultatsobtenus An de mesurer les performances de notre modegravele nous avons utiliseacute diverses mesuresnous permettant de capturer dieacuterents aspects que nous consideacuterons ecirctre importants dans unerecommandation de seacutequence Nous allons deacutecrire ces dieacuterentes mesures ci-dessous

Preacutecision Rappel et F-mesure les mesures classiques dans le domaine de la recherche

91

Chapitre 4 Expeacuterimentations et reacutesultats

Preacutecision Rappel F-mesure Similariteacute SIL Diversiteacute DR Nouveauteacute Preacutefeacuterences

Colonie de Similariteacute 0317 0126 0165 0952 0923 0048 0049 072 0447 Colonie de Diversiteacute 0211 0104 0127 0862 077 0138 019 0806 0393 Colonie de Nouveauteacute 0132 0112 0114 0895 0837 0105 0144 0909 079 Colonie de Preacutefeacuterences 0296 0159 0191 0946 091 0054 008 0695 0804

Table 42 Expeacuterimentations avec le modegravele AntRS mono-objectif pour les 4 objectifs desimilariteacute diversiteacute nouveauteacute preacutefeacuterencesLe code couleur fait reacutefeacuterence agrave la signicativiteacute statistique de la p-valeur avec p isin [0 1] 0 0001 001 005 01 1

dinformation [Baeza-Yates et al 1999] Elles permettent de comparer directement lesseacutequences de recommandation produites par notre modegravele avec les sessions deacutecoute ini-tiales des utilisateurs Dans un contexte dutilisation reacuteel ougrave un utilisateur se connecte etle systegraveme propose une recommandation il ne serait pas possible dutiliser ces mesuresCependant dans le cadre dune eacutevaluation hors-ligne elles apportent des informations ma-jeures sur la qualiteacute des recommandations car nous consideacuterons que les sessions deacutecouteque nous posseacutedons sont de bons modegraveles pour nos recommandations

Similariteacute et SIL (Similariteacute Intra-Liste) bien quelles soient sur-utiliseacutees les me-sures de similariteacute et notamment la similariteacute intra-liste sont de bons indicateurs de lacoheacuterence de nos seacutequences de recommandations La mesure de similariteacute intra-liste pro-vient des travaux de Ziegler amp al[Ziegler et al 2005]

Diversiteacute et DR (Diversiteacute Relative) comme nous lavons expliqueacute plus tocirct dans cemanuscrit la diversiteacute est une caracteacuteristique cruciale des systegravemes de recommandationsen plus de la similariteacute Il eacutetait donc important de mesurer agrave quel point les musiques re-commandeacutees ainsi que les seacutequences en elles-mecircmes eacutetaient diverses [McGinty and Smyth2003 Vargas and Castells 2011]

Nouveauteacute et Preacutefeacuterences pour mesurer ces deux derniegraveres caracteacuteristiques nousavons utiliseacute les deux mesures proposeacutees dans larticle de[Vargas and Castells 2011] quenous avons aussi reproduites preacuteceacutedemment dans les Eacutequations 35 et 36

Apregraves avoir expliqueacute en deacutetail lexpeacuterimentation et le processus deacutevaluation nous pouvonsmaintenant nous inteacuteresser aux reacutesultats agrave proprement parler Le Tableau 42 preacutesente les reacutesul-tats de notre premiegravere expeacuterimentation mono-objectif avec 500 utilisateurs pour chacune des 4colonies isoleacutees

An de sassurer que les reacutesultats obtenus et preacutesenteacutes ci-dessus sont signicatifs nous avonsreacutealiseacute pour chacune des cases du tableau un test de signicativiteacute statistique An de savoirsi nos donneacutees suivaient la loi normale nous avons reacutealiseacute un test de Shapiro-Wilk et ce der-nier sest reacuteveacuteleacute neacutegatif Nous avons ainsi ducirc utiliser le test non parameacutetrique de Wilcoxon quinous a permis de comparer les moyennes des deux eacutechantillons connexes (mecircme utilisateurs maisdieacuterentes colonies) Les reacutesultats pour cette expeacuterimentation se sont tous reacuteveacuteleacutes ecirctre tregraves si-gnicatifs avec un p maximal infeacuterieur agrave p lt 0 001 Nous avons preacutesenteacutes la signicativiteacute dechaque case de reacutesultat avec un systegraveme de symboles coloreacutees ougrave les trois premiers symboles (0 0001 001 ) sont signicatifs Ces tests de signicativiteacute ont eacuteteacute systeacutematiquementeectueacutes agrave chaque expeacuterimentation et par conseacutequent tous les reacutesultats que nous preacutesenterons

92

43 Expeacuterimentations sur le modegravele AntRS

dans la suite de cette section seront accompagneacutes de leur signicativiteacute

Nous pouvons maintenant revenir sur les reacutesultats preacutesenteacutes dans le Tableau 42 Commeil eacutetait preacutevu on peut observer que chaque colonie a produit des recommandations orienteacuteesvers son objectif speacutecique Ainsi la colonie de similariteacute a produit des seacutequences de musiquesayant obtenu les plus hauts scores de preacutecision similariteacute et similariteacute intra-liste la colonie dediversiteacute a produit les seacutequences avec le plus haut score de diversiteacute et de diversiteacute relative tandis que les colonies de nouveauteacute et de preacutefeacuterences ont respectivement produit des seacutequencesavec le plus haut score de nouveauteacute et de preacutefeacuterences On peut cependant remarquer que pourcertaines mesures (la preacutecision la similariteacute ou encore la diversiteacute par exemple) les eacutecarts sontrelativement faibles entre les dieacuterentes colonies Nous pouvons reacutepondre agrave cette constatation endeux points Tout dabord et comme nous lavons preacuteciseacute plus haut toutes les cases ougrave 3 eacutetoilesvertes ont eacuteteacute apposeacutees repreacutesentent des reacutesultats tregraves signicatifs dun point de vue statistiqueEnsuite lobjectif principal de cette expeacuterimentation est de prouver que notre modegravele est biencapable de produire des recommandations diverses et complegravetes suivant plusieurs dimensionsLa deuxiegraveme partie de notre modegravele ougrave les reacutesultats de chaque colonie seront fusionneacutes devraproduire des seacutequences eacutequilibrant au mieux chacune des dimensions Les premiegraveres seacutequencesproduites par les colonies mono-objectifs prouvent que cela est possible mais quil est neacutecessairedavoir cette deuxiegraveme eacutetape an de mieux eacutequilibrer les seacutequences nales qui seront proposeacuteesagrave lutilisateur

433 AntRS multi-objectifs expeacuterimentations sur lensemble des colonies

simultaneacutement et sur les tactiques de fusion

Objectifs de lexpeacuterimentation

Apregraves avoir montreacute que toutes les colonies eacutetaient capables de produire des seacutequences demusiques speacutecialiseacutees dans une dimension speacutecique nous pouvons maintenant reacutealiser des ex-peacuterimentations sur notre modegravele AntRS dans son ensemble cest-agrave-dire avec les 4 colonies enparallegravele suivi de leacutetape de fusion pour ne produire quune seacutequence unique posseacutedant toutes lesqualiteacutes de chaque dimension agrave lutilisateur nal Autrement dit avec la premiegravere expeacuterimenta-tion nous avons obtenu 4 seacutequences excellant chacune dans une dimension speacutecique (similariteacutediversiteacute nouveauteacute et preacutefeacuterences) et doreacutenavant lobjectif est dobtenir une seule seacutequencereacuteunissant ces 4 dimensions

Nous nallons pas reacuteexpliquer en deacutetail ici la construction du graphe ni le fonctionnement descolonies eacutetant donneacute que nous lavons deacutejagrave fait preacuteceacutedemment mais les dieacuterences entre cetteexpeacuterimentation et les preacuteceacutedentes seront cependant souligneacutees Contrairement agrave lexpeacuterimenta-tion preacuteceacutedente les 4 colonies ont eacuteteacute exeacutecuteacutees en parallegravele en exploitant les threads de JavaLa deuxiegraveme et principale dieacuterence se trouve dans lexploitation des seacutequences geacuteneacutereacutees par lescolonies Au lieu de les preacutesenter directement comme nous lavons fait dans lexpeacuterimentationmono-objectif ces seacutequences ont eacuteteacute fusionneacutees avec la deuxiegraveme partie du modegravele preacutesenteacutee dansle chapitre preacuteceacutedent dans la Section 35 Le but est ici dobtenir une seule seacutequence combinantau mieux tous les points forts des 4 colonies Les meacutetavariables utiliseacutees sont les mecircmes que pourlexpeacuterience preacuteceacutedente

93

Chapitre 4 Expeacuterimentations et reacutesultats

Comparaison de performances intra-modegravele

Maintenant que nous avons deacutecrit lobjectif de cette expeacuterimentation nous allons deacutecrire lamaniegravere dont nous avons mesureacute et compareacute les reacutesultats obtenus Tout dabord nous avons testeacute3 versions de notre modegravele les voici deacutecrites ci-dessous

AntRS avec les 4 colonies en parallegravele et le fusion de seacutequences Comme nous lavonsexpliqueacute dans le chapitre preacuteceacutedent Section 35 nous avons proposeacute deux tactiques defusion pour les seacutequences trouveacutees par les dieacuterentes colonies lors de la premiegravere eacutetape dumodegravele La fusion de seacutequences est la premiegravere de ces deux tactiques Pour rappel cettetactique consiste agrave geacuteneacuterer une liste de toutes les ressources de chacune des 4 meilleuresseacutequences trouveacutees par les colonies lors de la premiegravere eacutetape du modegravele puis de les reacutear-ranger an de creacuteer la seacutequence nale

AntRS avec les 4 colonies en parallegravele et la colonie de fusion Le deuxiegraveme modegraveletesteacute est identique au premier sauf en ce qui concerne la tactique de fusion Nous avonsutiliseacute ici la deuxiegraveme tactique de fusion preacutesenteacutee dans la Section 35 Pour rappel cettetactique consiste agrave construire un nouveau graphe constitueacute uniquement des ressources quicomposent les seacutequences des colonies de la premiegravere eacutetape cette derniegravere agissant donccomme une sorte de seacutelection pour reacutecupeacuterer les ressources les plus inteacuteressantes

Colonie de fusion uniquement La troisiegraveme et derniegravere version de cette expeacuterimen-tation sur le modegravele AntRS est dieacuterente des deux premiegraveres Au lieu deectuer seacutequen-tiellement la premiegravere eacutetape (les 4 colonies) puis la deuxiegraveme eacutetape avec les reacutesultats dela premiegravere (la fusion) nous avons voulu tester si le fait dexeacutecuter la colonie de fusiondirectement avec lensemble des ressources de tous les utilisateurs pouvait produire desreacutesultats inteacuteressants En eet dans le modegravele AntRS classique cette colonie est exeacutecuteacuteeavec quelques dizaines de ressources tout au plus qui ont eacuteteacute seacutelectionneacutees par les autrescolonies de la premiegravere eacutetape mais rien nempecircche de lancer directement cette colonieavec le mecircme graphe quutilisent les premiegraveres colonies et qui contient quelques dizainesde milliers de sommets Notre hypothegravese est que la seacutequence nale obtenue par ce biaisobtiendra de moins bons reacutesultats que le processus complet de notre modegravele AntRS avecnotamment la preacute-seacutelection de ressources potentiellement inteacuteressantes par les premiegraverescolonies speacutecialiseacutees

Enn les mecircmes meacutetriques ont eacuteteacute utiliseacutees pour mesurer les performances de chaque ver-sion testeacutee du modegravele que pour lexpeacuterimentation mono-objectif preacuteceacutedente an de garder laconsistance des reacutesultats entre toutes les expeacuterimentations meneacutees

Comparaison de performances inter-modegraveles

En plus de mesurer les performances des dieacuterentes versions de notre modegravele nous avonsvoulu comparer nos reacutesultats obtenus avec dautres systegravemes de recommandation deacutejagrave existantsLe but est ici de conrmer que notre modegravele produit des recommandations compeacutetitives parrapport agrave dautres algorithmes souvent utiliseacutes dans leacutetat de lart Pour ce faire nous avonsutiliseacute deux types dalgorithmes (1) trois algorithmes classiques mono-objectif capables de pro-duire des listes de recommandations et (2) un algorithme speacuteciquement multi-objectifs an dedavoir un point de comparaison provenant dun modegravele de la mecircme classe que le nocirctre Nous

94

43 Expeacuterimentations sur le modegravele AntRS

avons choisi ces 2 familles dalgorithmes an de comparer au mieux notre modegravele Les algo-rithmes mono-objectif permettent deacutetablir une base de comparaison an de deacuteterminer si notremodegravele est compeacutetitif face agrave des systegravemes noptimisant quun seul de nos objectifs De plus cesalgorithmes sont classiques dans le domaine de la recommandation et sont tregraves souvent utiliseacutescomme base de comparaison Lalgorithme multi-objectifs de comparaison permet quant agrave lui demesurer nos performances sur lensemble des objectifs que nous optimisons Nous allons deacutecriresuccinctement le principe de ces algorithmes sans entrer dans les deacutetails eacutetant donneacute que nousavons deacutejagrave deacutecrit leur fonctionnement geacuteneacuteral preacuteceacutedemment dans leacutetat de lart

Algorithmes classiques mono-objectifs

1 UserKNN [Breese et al 2013] algorithme classique de ltrage collaboratif ougrave les k plusproches voisins de lutilisateur actif baseacutes sur la similariteacute des preacutefeacuterences sont seacutelectionneacutesan de participer au processus de recommandation

2 TrustMF [Yang et al 2017] dans cette meacutethode plus reacutecente de ltrage collaboratifles auteurs proposent des ameacuteliorations du modegravele classique de factorisation de matricesan dadresser les problegravemes de deacutemarrage agrave froid et de manque de donneacutees Mecircme silsutilisent la meacutethode classique de la factorisation de matrice ils se deacutemarquent en utilisantla conance quont les utilisateurs les uns envers les autres an de reeacuteter leur inuencereacuteciproque sur leurs opinions

3 SVD++ [Koren 2008] dans cet article les auteurs proposent des ameacuteliorations auxtechniques des facteurs latents et des plus proches voisins qui sont les deux approches dultrage collaboratif obtenant les meilleurs reacutesultats Les auteurs combinent ces deux ap-proches ensemble et utilisent agrave la fois les retours explicites et implicites an dobtenir unepreacutecision plus importante Ce modegravele a eacuteteacute creacutee dans le cadre du Netix Prize de 2008une compeacutetition organiseacutee par Netix ougrave le but eacutetait de creacuteer un algorithme de ltragecollaboratif an de preacutedire au mieux les preacutefeacuterences des utilisateurs [Bennett et al 2007]

Ces trois algorithmes ont eacuteteacute seacutelectionneacutes car ils repreacutesentent des techniques connues et bienutiliseacutees du domaine des systegravemes de recommandation Ils ont prouveacute leur ecaciteacute de par lesnombreuses eacutetudes de leacutetat de lart les utilisant comme nous lavons montreacute dans le chapitre 2de ce manuscrit De plus ces algorithmes sont mis agrave disposition dans la librairie Java Librec 50

[Guo et al 2015] Cette librairie propose plus de 70 algorithmes de systegravemes de recommandationen open source et a deux missions principales la preacutediction de preacutefeacuterences (via des notes) et leclassement de ressources Lutilisation de Librec nous a permis de travailler directement sur desalgorithmes agrave jour et sans erreur

Algorithme multi-objectifs

4 PEH [Ribeiro et al 2014] Nous avons souhaiteacute ajouter agrave cette liste un quatriegraveme algo-rithme qui contrairement aux trois premiers est multi-objectifs Cet algorithme nommeacutePEH pour Pareto-Ecient Hybridization a eacuteteacute preacutesenteacute dans la Section 252 de leacutetatde lart de ce manuscrit et nous allons ici discuter de son impleacutementation PEH est unmodegravele ougrave plusieurs algorithmes de recommandation sont exeacutecuteacutes en mecircme temps Lebut est dobtenir une valeur de pertinence pour chaque paire ressourcetimes utilisateur in-diquant agrave quel point il est pertinent de recommander la ressource agrave lutilisateur Chaquealgorithme produit un score et an de nobtenir quune seule valeur unique par paire

50 Librec la librarie Java pour les systegravemes de recommandation

95

Chapitre 4 Expeacuterimentations et reacutesultats

Table 43 Expeacuterimentations avec 3 versions du modegravele AntRS et 4 algorithmes de compa-raison 3 algorithmes mono-objectifs classiques (UserKNN TrustMF SVD++) et 1 algorithmemulti-objectifs (Pareto-Ecient Hybridization)

Preacutecision Rappel F-mesure Similariteacute SIL Diversiteacute DR Nouveauteacute Preacutefeacuterences Couverture

AntRS (4 colonies+ fusion de seacute-quences)

0344 0131 01838 0947 0908 0053 0069 0741 061 9692

AntRS (4 colonies+ colonie de fu-sion)

0288 0151 01836 0945 0905 0055 0082 0702 0612 9692

AntRS (colo-nie de fusionuniquement)

0197 0118 0141 0953 093 0047 0068 0324 0389 9692

UserKNN 0224 0138 0162 095 0905 005 0081 068 0541 6139TrustMF 0195 0117 014 095 0894 0058 009 0697 0458 6817SVD++ 0195 012 014 0941 0892 006 0093 070 0455 6817PEH 0193 0118 014 0941 0892 0059 0096 0697 0452 9752

Signicance codes (compared to AntRS with 4 colonies + lists merging) 0 0001 001 005 01 1

le modegravele PEH associe chacun de ces scores dans une combinaison lineacuteaire selon une hy-bridation speacutecique (ie des poids dieacuterents attribueacutes agrave chaque algorithme mitigeant ouaugmentant ainsi leur importance sur la valeur de pertinence nale) Le reacutesultat de cettecombinaison lineacuteaire est la valeur de pertinence de la recommandation de la ressource agravelutilisateur Plusieurs hybridations sont ainsi testeacutees et repreacutesenteacutees dans un espace en3 dimensions ougrave chaque point correspond aux niveaux de preacutecision de diversiteacute et denouveauteacute atteint par une hybridation Comme ces 3 dimensions sont aussi importantesles unes que les autres les auteurs utilisent le concept dOptimum de Pareto an de seacute-lectionner les meilleurs hybridations cest-agrave-dire les hybridations les plus proches ou surla frontiegravere de Pareto Dans leur article les auteurs utilisent dieacuterents algorithmes clas-sique de recommandation Ayant agrave notre disposition Librec ainsi que les 3 algorithmespreacutesenteacutes ci-dessus repreacutesentant plusieurs techniques de recommandation agrave la fois dieacute-rentes les unes des autres et tregraves utiliseacutees dans la litteacuterature nous les avons inclus dansle processus dhybridation Le reste du modegravele a eacuteteacute impleacutementeacute agrave partir de larticle desauteurs Ce modegravele est tregraves inteacuteressant pour notre comparaison de performance car il estmulti-objectifs comme le nocirctre mais utilise une technique tout agrave fait dieacuterente de An-tRS non baseacutee sur des modegraveles multi-agents et utilisant le concept dOptimum de Pareto

Pour cette expeacuterimentation nous avons donc un total de 4 algorithmes dieacuterents qui vontecirctre exeacutecuteacutes sur exactement la mecircme base de donneacutees et le mecircme nombre dutilisateurs quepour les trois versions de notre modegravele Les reacutesultats de cette expeacuterimentation sont preacutesenteacutesdans le Tableau 43

Reacutesultats

Comme pour lexpeacuterimentation mono-objectif nous avons mesureacute la signicativiteacute statistiqueavec le test des rangs signeacutes de Wilcoxon an de sassurer que les donneacutees obtenues pouvaientecirctre interpreacuteteacutee De plus les valeurs en gras pour chaque colonne montrent les meilleurs reacutesultatsobtenus

Les reacutesultats de cette expeacuterimentation nous reacutevegravelent plusieurs informations importantes Toutdabord nous allons nous inteacuteresser aux performances de notre modegravele AntRS Comme expliqueacute

96

43 Expeacuterimentations sur le modegravele AntRS

ci-dessus nous avons testeacute deux tactiques de fusion pour combiner les reacutesultats de nos quatreobjectifs Nous avons eacutegalement exeacutecuteacute directement la colonie de fusion sur le graphe completet sans la premiegravere eacutetape de notre modegravele

Les deux premiegraveres lignes du Tableau 43 preacutesentent les reacutesultats de notre modegravele AntRScomplet avec ses deux variations la fusion de seacutequences et la colonie de fusion Nous pouvonsvoir que dune maniegravere geacuteneacuterale notre modegravele obtient de tregraves bonnes performances par rapportaux 4 algorithmes de comparaison Les deux variations de notre modegravele obtiennent la meilleurepreacutecision (jusquagrave +7823) de rappel (jusquagrave +2905) et F-mesure (jusquagrave +3128) de tousles modegraveles testeacutes dans cette expeacuterimentation ce qui signie que notre modegravele est le meilleurpour modeacuteliser les preacutefeacuterences agrave partir des sessions initiales eacutecouteacutees par les utilisateurs AntRSa eacutegalement surpasseacute les autres modegraveles pour les preacutefeacuterences et les meacutetriques de nouveauteacute touten parvenant agrave maintenir un niveau correct de similitude et de diversiteacute Il est utile de rappelerici que nous avons deacutelibeacutereacutement choisi des objectifs non compatibles entre eux (Similariteacute vs Di-versiteacute Nouveauteacute vs Preacutefeacuterences) ce qui rend le processus de recommandations plus complexepour les algorithmes multi-objectifs (AntRS et PEH) par rapport aux algorithmes mono-objectifMalgreacute une diversiteacute un peu plus faible par rapport aux algorithmes de comparaison AntRS oreun meilleur compromis entre tous les objectifs que PEH et dans un temps dexeacutecution beaucoupplus court Enn nous pouvons remarquer que les deux modegraveles multi-objectifs AntRS et PEHont une bien meilleure couverture par rapport aux autres algorithmes

Les reacutesultats montrent que notre modegravele AntRS a obtenu de meilleurs reacutesultats que lesautres algorithmes de comparaison Cependant un autre objectif de cette expeacuterimentation eacutetaitde comparer les deux versions de la deuxiegraveme phase de notre modegravele la fusion de seacutequences et lacolonie de fusion Ces deux tactiques permettant dobtenir une seacutequence de recommandation -nale multi-objectifs agrave partir de plusieurs seacutequences mono-objectif repreacutesentent deux philosophiesdieacuterentes de construction de seacutequences et il est inteacuteressant de pouvoir observer leurs dieacuterencesde performance Dapregraves les reacutesultats obtenus ces deux meacutethodes sont relativement proches lunede lautre avec lexception majeure de la preacutecision qui est plus eacuteleveacutee pour la fusion de seacutequences(0 344) que pour la colonie de fusion (0 288) On peut noter aussi une leacutegegravere dieacuterence au ni-veau de la diversiteacute relative (respectivement 0 069 contre 0 082) et de la nouveauteacute (0 741 contre0 702) Limportance de la preacutecision dans la litteacuterature et la dieacuterence entre les deux tactiquesconcernant cette meacutetrique nous permettent de dire que la fusion de seacutequence est la meilleure desdeux tactiques pour cette expeacuterimentation

Nous allons maintenant nous inteacuteresser agrave la troisiegraveme ligne du tableau de reacutesultats repreacute-sentant lexeacutecution de la 2egraveme partie de notre modegravele seule Pour rappel lhypothegravese de cettetroisiegraveme version de notre modegravele est de veacuterier si la premiegravere eacutetape de notre modegravele permet biendameacuteliorer la qualiteacute des reacutesultats en preacute-seacutelectionnant les ressources correspondant le mieux auxquater objectifs agrave maximiser On peut observer en eet avec les reacutesultats que lexeacutecution directede la colonie de fusion sans la premiegravere eacutetape du modegravele deacutegrade bien la qualiteacute des solutionsnales trouveacutees Nous observons une nette diminution de la preacutecision du rappel de la F-mesureainsi que de la diversiteacute de la nouveauteacute et de preacutefeacuterences Ces reacutesultats nous permettent doncde conrmer que la premiegravere eacutetape de notre modegravele ougrave les 4 colonies travaillent simultaneacutementagrave obtenir des seacutequences speacutecialiseacutees dans leur objectif ameacuteliore bien la qualiteacute nale des recom-mandations dune maniegravere signicative Autrement dit les deux tactiques de fusion que nousavons deacuteveloppeacutees (fusion de seacutequences et colonie de fusion) permettent de trouver un compro-mis entre tous les objectifs de maniegravere plus ecace quand elles se basent sur les reacutesultats de la

97

Chapitre 4 Expeacuterimentations et reacutesultats

premiegravere eacutetape de notre modegravele

Expeacuterimentation alternative techniques de validation croiseacutee et de creacuteation degraphe alternative

Dans lexpeacuterimentation preacuteceacutedente nous avons deacutecideacute de seacuteparer les 500 utilisateurs en 5blocs de 100 ougrave agrave tour de rocircle 400 utilisateurs eacutetaient utiliseacutes pour la construction du grapheet 100 utilisateurs correspondaient agrave la base de test Ainsi le modegravele avait pour tacircche de pro-duire des seacutequences de recommandations baseacutees sur les sessions deacutecoute de ces 100 utilisateursUne fois que le modegravele avait produit sa seacutequence recommandeacutee la session deacutecoute initiale surlaquelle eacutetait baseacutee la recommandation eacutetait deacutevoileacutee au modegravele et le graphe eacutetait reconstruitpour en tenir compte Le but de ce fonctionnement eacutetait de simuler un fonctionnement reacuteel dunservice deacutecoute de musique Cependant un certain nombre deacutetudes du domaine de la recom-mandation de la litteacuterature scientique utilisent une meacutethode dieacuterente lors de la seacuteparationdes informations des utilisateurs pour reacutealiser une validation croiseacutee agrave 5 blocs Cette meacutethodeconsiste agrave peupler les 5 blocs non plus agrave partir dutilisateurs mais agrave partir de sessions deacutecoutedans chaque utilisateur Autrement dit au lieu davoir une base dapprentissage contenant 80des utilisateurs et une base de test contenant les derniers 20 dutilisateurs la base dapprentis-sage consiste en 80 des sessions deacutecoute de chaque utilisateur et la base de test correspond aux20 des sessions restantes Le but du modegravele est ici de recommander pour chaque utilisateurdes seacutequences correspondant agrave la base de test Par rapport agrave la premiegravere meacutethode le graphepossegravede donc en permanence 80 des sessions de tous les utilisateurs Cependant le graphe necontient pas les connaissances provenant de prols complets dutilisateurs Ces deux meacutethodessont toutes les deux valides mais proposent deux approches dieacuterentes concernant lexploitationdes donneacutees des utilisateurs et il est inteacuteressant de les comparer

Par ailleurs et comme nous lavons expliqueacute dans le chapitre 3 deacutecrivant notre modegravele AntRSla construction du graphe exploite les transitions trouveacutees dans les sessions deacutecoute des utilisa-teurs pour creacuteer un reacuteseau de ndivideuds et darecirctes repreacutesentant lensemble des donneacutees de la basedapprentissage Aucune emphase nest porteacutee speacuteciquement sur lutilisateur actif pour lequelle systegraveme est en train de construire des recommandations Cependant nous avons proposeacute dansle chapitre 3 une autre meacutethode de construction du graphe portant une emphase particuliegravere surlutilisateur actif Agrave chaque nouvel utilisateur traiteacute nous calculons ses k plus proches voisinsparmi les 499 utilisateurs restants Pour faire cela nous avons calculeacute la similariteacute cosine agrave partirdes preacutefeacuterences existantes de ces utilisateurs Autrement dit pour chaque utilisateur actif nousavons compareacute ses 80 des sessions deacutecoute de la base dapprentissage avec les 80 des sessionsdeacutecoute des 499 autres utilisateurs Les k utilisateurs les plus similaires sont ensuite utiliseacutespour construire le graphe avec la mecircme technique deacutecrite dans le chapitre 3 Lavantage est icide reacuteduire la taille du graphe dacceacuteleacuterer la dureacutee dexeacutecution et de potentiellement augmenterla qualiteacute des recommandations nales notamment en terme de similariteacute puisque cest le critegraverede seacutelection ici Cette variante de construction du graphe agrave partir des n plus proches voisins nestpossible quavec la technique de validation croiseacutee deacutecrite dans le paragraphe preacuteceacutedent puisquilest neacutecessaire davoir accegraves aux sessions deacutecoute des utilisateurs actifs ce qui nest pas le casavec la premiegravere expeacuterimentation de cette section

Dans la suite de la section nous allons reacutealiser la mecircme expeacuterimentation que preacuteceacutedem-ment avec ces deux modications (le changement du processus de validation croiseacutee et le grapheconstruit agrave partir de n plus proches utilisateurs en termes de similariteacute) puis nous allons preacute-

98

43 Expeacuterimentations sur le modegravele AntRS

Table 44 Expeacuterimentation AntRS multi-objectifs avec les modications de validation croiseacuteeet de creacuteation de graphe

Preacutecision Rappel F-mesure Similariteacute SIL Diversiteacute DR Nouveauteacute Preacutefeacuterences Couverture

AntRS grapheclassique (fusionde seacutequences)

0379 0147 0205 0942 0902 0058 0073 0748 0631 7168

AntRS grapheclassique (coloniede fusion)

0339 0176 0215 0943 09 0057 0085 072 0718 7168

AntRS graphe kvoisins (fusion deseacutequences)

0369 0149 0203 0941 0901 0059 0075 0737 0633 7168

AntRS graphe kvoisins (colonie defusion)

0329 0167 0206 0944 0905 0056 0081 0707 068 7168

senter les reacutesultats obtenus

Le Tableau 44 preacutesente les reacutesultats de cette deuxiegraveme expeacuterimentation Nous avons testeacute4 versions de notre modegravele Pour chacune de ces 4 versions la nouvelle technique de validationcroiseacutee a eacuteteacute utiliseacutee Comme pour lexpeacuterimentation suivante nous avons eacutegalement testeacute lesdeux tactiques de fusion de notre modegravele Quant aux modications portant sur la creacuteation dugraphe nous avons exeacutecuteacute notre modegravele selon 2 modaliteacutes avec la mecircme construction de grapheque lexpeacuterimentation preacuteceacutedente (graphe classique) et avec la prise en compte des k voisinsles plus similaires (graphe k voisins) On remarque deacutejagrave que les reacutesultats sont dune maniegraveregeacuteneacuterale relativement similaires agrave la premiegravere expeacuterimentation Les valeurs de preacutecision obte-nues sont plus eacuteleveacutees que pour lexpeacuterimentation preacuteceacutedente suggeacuterant que le modegravele produitdes recommandations plus proches des sessions deacutecoute des utilisateurs Cette augmentation depreacutecision est la conseacutequence logique du fait que 80 des sessions deacutecoute initiales sont connuesdu modegravele Ces reacutesultats sont cependant agrave nuancer avec la couverture qui est signicativementplus basse dans cette version de notre modegravele (7168 par rapport agrave 9692)

La tactique de fusion de seacutequence obtient une nouvelle fois la meilleure preacutecision par rapportagrave la tactique de colonie de fusion Cependant nous nobservons pas de nette dieacuterence entreles deux meacutethodes de construction du graphe Cette expeacuterimentation ne nous permet donc pasde valider lhypothegravese selon laquelle un graphe moins grand et construit agrave partir dutilisateurssimilaires agrave lutilisateur actif pourrait ameacuteliorer les recommandations nales Cependant lautreobjectif de cette expeacuterimentation qui eacutetait de deacutemontrer que notre modegravele obtient eacutegalementdes reacutesultats satisfaisants avec une meacutethode plus classique de validation croiseacutee est valideacutee Latechnique classique de creacuteation du graphe sans connaicirctre par avance 80 des seacutequences deacutecoutesdes utilisateurs reste cependant plus proche dun fonctionnement en conditions reacuteelles de notremodegravele

434 Optimisation des meacutetavariables de AntRS

Inuence du nombre dagents et diteacuterations sur la preacutecision des recommandations

Comme tous les systegravemes multi-agents AntRS est deacutependant du nombre dagents utiliseacutes etdes iteacuterations eectueacutees Un nombre trop faible dagents ou diteacuterations peut empecirccher leacutemer-gence dun comportement intelligent en raison dun manque dinteraction entre les agents Dansle mecircme temps il est eacutegalement crucial de ne pas augmenter aveugleacutement ces paramegravetres car ils

99

Chapitre 4 Expeacuterimentations et reacutesultats

aectent lineacuteairement le temps dexeacutecution de lalgorithme Nous avons ainsi reacutealiseacute des expeacuteri-mentations sur notre modegravele AntRS an de deacuteterminer un bon compromis entre performance ettemps dexeacutecution Dans la gure 411 la preacutecision moyenne des recommandations obtenues estpreacutesenteacutee en fonction du nombre dagents et diteacuterations par increacutementation de 50 allant de 50 agrave300 On observe comme attendu une leacutegegravere augmentation de la preacutecision suivant laccroissementdes agents et des iteacuterations sans toutefois que celle-ci ne soit majeure On remarque visuellementque la preacutecision obtenue atteint rapidement un plateau agrave partir de 100 agents et iteacuterations Cetteobservation a eacuteteacute conrmeacutee par un test de signicativiteacute statistique avec le test de WilcoxonDans un contexte de fonctionnement en ligne ougrave les utilisateurs sattendent agrave des recommanda-tions quasi immeacutediates laugmentation importante du temps dexeacutecution lieacutee agrave un nombre eacuteleveacutedagents et diteacuterations pour un gain minime de preacutecision nest pas recommandable Ce sontaussi ces valeurs de 100 agents et iteacuterations qui ont eacuteteacute utiliseacutees dans les expeacuterimentations de cechapitre

Figure 411 Inuence du nombre dagents et diteacuterations sur la preacutecision moyenne obtenuepar notre modegravele

Principe de fonctionnement et application dun algorithme geacuteneacutetique

Les meacutetavariables des algorithmes multi-agents ont une place importante dans la qualiteacute desreacutesultats obtenus Pour rappel et en plus du nombre diteacuterations et dagents dont nous avonsdeacutejagrave discuteacute dans la section preacuteceacutedente on peut lister

τ0 isin [0 1] quantiteacute de pheacuteromones deacuteposeacutee sur les arecirctes agrave linitialisation du modegravele q0 isin [0 1] gegravere la part dexploration et dexploitation des agents α isin [0 1] importance des pheacuteromones dans la prise de deacutecision des agents

100

43 Expeacuterimentations sur le modegravele AntRS

β isin [0 1] importance de lheuristique dans la prise de deacutecision des agents ρ isin [0 1] taux deacutevaporation des pheacuteromones

Les valeurs de ces 5 meacutetavariables ont eacuteteacute xeacutees agrave laide des expeacuterimentations preacuteliminairespreacutesenteacutees au deacutebut de ce chapitre dans la Section 422 Les valeurs de ces meacutetavariables ontpermis dobtenir des reacutesultats convaincants agrave la fois sur le modegravele ACS classique de Dorigo et surnotre modegravele ACS Cependant et an de maximiser le potentiel de notre modegravele AntRS nousavons voulu tester une optimisation automatique de ces meacutetavariables agrave laide dun algorithmegeacuteneacutetique Ces derniers font partie de la famille des algorithmes eacutevolutionnaires sinspirant de latheacuteorie de leacutevolution Le principe de ces algorithmes est de creacuteer des individus posseacutedant desgegravenes cest-agrave-dire des valeurs agrave des caracteacuteristiques preacute-deacutetermineacutees puis de tester ces individussur le problegraveme agrave optimiser Agrave la n dune iteacuteration les meilleurs individus transmettent unepartie de leurs gegravenes agrave leurs descendants Ainsi de geacuteneacuteration en geacuteneacuteration les gegravenes seacutelection-neacutes provenant des meilleurs individus permettent daugmenter la qualiteacute des reacutesultats Appliqueacuteagrave notre modegravele un gegravene correspond agrave des valeurs pour les 5 meacutetavariables agrave optimiser Cesvaleurs sont ensuite appliqueacutees agrave notre modegravele et testeacutees durant une exeacutecution complegravete dansles mecircmes conditions que les autres expeacuterimentations de ce chapitre Les reacutesultats sont ensuiteeacutevalueacutes selon les 4 meacutetriques correspondant agrave nos objectifs similariteacute diversiteacute nouveauteacute etpreacutefeacuterences Lutilisation dun algorithme geacuteneacutetique sur notre modegravele a cependant poseacute un pro-blegraveme majeur de temps dexeacutecution En eet chaque individu de chaque geacuteneacuteration a ducirc ecirctretesteacute sur une exeacutecution complegravete de notre modegravele Pour rappel une exeacutecution de notre modegravelecorrespond agrave 100 iteacuterations ougrave dans chacune dentre elles 100 agents se deacuteplacent pour trouverune seacutequence sur un graphe de plusieurs dizaines de milliers de ndivideuds et de plusieurs centainesde milliers darecirctes en moyenne Mecircme si la complexiteacute algorithmique est faible ducirce agrave la naturemecircme des modegraveles multi-agents la quantiteacute dopeacuterations agrave reacutesoudre est conseacutequente En plus delutilisation de serveurs de calculs deacutedieacutes une optimisation importante du code de AntRS a eacuteteacuteneacutecessaire pour pouvoir eectuer loptimisation des meacutetavariables avec un algorithme geacuteneacutetiquedans des temps raisonnables

Choix de lalgorithme geacuteneacutetique doptimisation

De nombreuses familles dalgorithmes geacuteneacutetiques ont eacuteteacute deacuteveloppeacutees depuis leur creacuteation agravelinstar des problegravemes algorithmiques complexes neacutecessitant des techniques doptimisation et dereacutesolution avanceacutees Il est donc neacutecessaire de correctement deacutenir le problegraveme agrave optimiser an dechoisir lalgorithme geacuteneacutetique le plus adapteacute agrave la tacircche AntRS est un modegravele multi-objectifs etles paramegravetres agrave optimiser sont les 4 objectifs de similariteacute diversiteacute nouveauteacute et preacutefeacuterencesIl est ainsi neacutecessaire dutiliser une technique parmi la famille des algorithmes eacutevolutionnairesmulti-objectifs (MOEA 51) Nous avons choisi lalgorithme NSGA-II 52 pour sa rapiditeacute et sonecaciteacute pour trouver de meilleurs solutions non-domineacutees agrave des problegravemes multi-objectifs clas-siques de la litteacuterature par rapport agrave dautres MOEA [Deb et al 2002]

Pour les mecircmes raisons que pour limpleacutementation des algorithmes de comparaison utiliseacutesdans cette section nous avons utiliseacute une librairie Java nommeacutee jMetal 53 [Durillo and Nebro2011] Cette librairie est speacutecialiseacutee dans limpleacutementation et la mise agrave disposition dune vingtaine

51 MOEA Multi-objective evolutionary algorithms

52 NSGA-II Non-dominated Sorting Genetic Algorithm 2

53 jMetal Metaheuristic Algorithms in Java

101

Chapitre 4 Expeacuterimentations et reacutesultats

Table 45 Expeacuterimentations preacutesentant AntRS avec les meacutetavariables empiriques et avec lesmeacutetavariables optimiseacutees via NSGA-II)

Preacutecision Rappel F-mesure Similariteacute SIL Diversiteacute DR Nouveauteacute Preacutefeacuterences Couverture

AntRS meacutetava-riables empiriques(fusion de seacute-quences)

0344 0131 01838 0947 0908 0053 0069 0741 061 9692

AntRS meacutetava-riables empiriques(colonie de fusion)

0288 0151 01836 0945 0905 0055 0082 0702 0612 9692

AntRS meacutetava-riables NSGA-II(fusion de seacute-quences)

0382 0153 0221 0953 091 0047 007 0762 0744 9692

AntRS meacutetava-riables NSGA-II(colonie de fusion)

0312 0174 0226 0946 0906 0054 0082 0703 0802 9692

Code de signicativiteacute statistique 0 0001 001 005 01 1

de MOEA permettant de les adapter agrave tous types de problegravemes multi-objectifs

Reacutesultats

La version du modegravele AntRS utiliseacutee est la mecircme que preacutesenteacutee dans le Chapitre 3 et danslexpeacuterimentation 433 Lalgorithme doptimisation NSGA-II a quant agrave lui eacuteteacute lanceacute sur unserveur de calculs deacutedieacute de leacutequipe KIWI et arrecircteacute agrave partir du moment ougrave 10 geacuteneacuterations de suitenameacutelioraient plus les reacutesultats obtenus Les valeurs obtenues pour les 5 meacutetavariables ont ensuiteeacuteteacute utiliseacutees dans une exeacutecution complegravete de AntRS an de mesurer limpact de loptimisationLalgorithme de comparaison PEH [Ribeiro et al 2014] inclut deacutejagrave dans son fonctionnement unMOEA nommeacute SPEA2 54 [Zitzler et al 2001] dont lobjectif est le mecircme que NSGA-II optimiserles recommandations en termes de similariteacute diversiteacute et nouveauteacute Nous ninclurons donc pasPEH dans les reacutesultats de cette derniegravere expeacuterimentation Outre les meacutetavariables lexeacutecution denotre modegravele sest deacuterouleacutee sous les mecircmes conditions que pour les expeacuterimentations preacuteceacutedentes

Le Tableau 45 preacutesente les reacutesultats obtenus Les deux premiegraveres lignes du tableau sont re-prises de lexpeacuterimentation principale AntRS multi-objectifs Section 433 pour plus de clarteacutePour rappel cette expeacuterimentation avait utiliseacute les meacutetavariables empiriques Les deux derniegravereslignes du tableau correspondent agrave AntRS avec les meacutetavariables optimiseacutees via le NSGA-II Lasignicativiteacute statistique de la dieacuterence des reacutesultats obtenus a eacuteteacute mesureacutee entre chaque paireayant la mecircme tactique de fusion (ie AntRS meacutetavariables empiriques (fusion de seacutequences)vs AntRS meacutetavariables NSGA-II (fusion de seacutequences) et AntRS meacutetavariables empiriques(colonie de fusion) vs AntRS meacutetavariables NSGA-II (colonie de fusion)) Les valeurs en grasindiquent les dieacuterences les plus notables entre les mecircmes versions de AntRS sans et avec opti-misation

Ces reacutesultats mettent principalement en exergue un net gain en preacutecision et rappel obtenuavec loptimisation des meacutetavariables Les valeurs obtenues pour ces meacutetriques sont similaires agravelexpeacuterimentation 44 ougrave le modegravele avait connaissance de 80 des seacutequences deacutecoutes des utili-sateurs On note eacutegalement des ameacuteliorations pour les meacutetriques de nouveauteacute et de preacutefeacuterencesmontrant que les seacutequences recommandeacutees eacutetaient agrave la fois plus proches des preacutefeacuterences de luti-

54 SPEA2 Strenght Pareto Evolutionary Algorithm 2

102

44 Conclusion

lisateur tout en introduisant parfois des musiques quil ne connaissait pas

Cependant il est important de nuancer ces reacutesultats Les gains obtenus mecircme sils sontstatistiquement signicatifs restent relativement peu eacuteleveacutes par rapport au temps neacutecessaire de-mandeacute par lalgorithme doptimisation De plus certaines meacutetriques comme la similariteacute ou ladiversiteacute nont que peu eacuteteacute aecteacutees par loptimisation En conclusion cette expeacuterimentation nousa montreacute quil eacutetait possible doptimiser les meacutetavariables de notre modegravele an dameacuteliorer cer-tains aspects des seacutequences recommandeacutees comme la preacutecision la nouveauteacute ou les preacutefeacuterencesToutefois le temps dexeacutecution dun tel processus doptimisation peut ecirctre prohibitif dans uncontexte dutilisation en ligne et en temps reacuteel

44 Conclusion

Dans ce Chapitre nous avons mis en pratique le modegravele multi-agents et multi-objectifs An-tRS Nous avons utiliseacute une base de donneacutees musicale provenant du site Deezer repreacutesentantun mois complet deacutecoutes en ligne Nous avons ensuite reacutealiseacute plusieurs expeacuterimentations por-tant chacune sur un aspect theacuteorique de AntRS La premiegravere expeacuterimentation preacutesenteacutee dans laSection 432 nous a permis de veacuterier que les colonies de notre modegravele permettent bien dobte-nir des recommandations de seacutequences speacutecialiseacutees dans les facteurs humains identieacutes dans leschapitres preacuteceacutedents Dans le cadre de ce travail nous avons testeacute de maniegravere isoleacutee 4 coloniescorrespondant agrave 4 facteurs humains speacuteciques la similariteacute la diversiteacute la nouveauteacute et lespreacutefeacuterences Les reacutesultats obtenus ont permis de prouver quil eacutetait possible de lier des facteurshumains agrave la recherche de chemins dans un graphe par des agents teacuteleacuteonomiques

La deuxiegraveme expeacuterimentation preacutesenteacutee dans la Section 433 sest appuyeacutee sur ces conclu-sions pour tester le modegravele AntRS dans son entiegravereteacute Le but de cette expeacuterimentation eacutetaittriple

1 Prouver que notre modegravele est capable de produire une seacutequence unique posseacutedant desaspects de chacun des 4 facteurs humains en utilisant les reacutesultats des colonies speacutecialiseacutees

2 Tester les performances des deux tactiques de notre modegravele (fusion de seacutequences et coloniede fusion) permettant de fusionner les seacutequences des colonies speacutecialiseacutees

3 Comparer les performances de AntRS avec dautres systegravemes de recommandations mono-objectif et multi-objectifs de la litteacuterature du domaine

Avec cette expeacuterimentation nous avons montreacute que AntRS eacutetait bien capable de syntheacutetiserdans une mecircme seacutequence les dieacuterents aspects humains consideacutereacutes De plus les seacutequences derecommandations produites par AntRS ont obtenu de meilleurs reacutesultats par rapport aux algo-rithmes de comparaison de leacutetat de lart La premiegravere tactique de fusion de seacutequences sest reacuteveacuteleacuteeecirctre plus ecace que la colonie de fusion pour obtenir un compromis entre les dieacuterents objectifs

Lexpeacuterimentation suivante preacutesenteacutee dans la Section 433 avait pour but de tester des va-riantes dans le fonctionnement de AntRS Au cours de cette thegravese nous avons reacutealiseacute et testeacutede multiples modications et variantes de notre modegravele de maniegravere empirique tant le fonction-nement du modegravele initial ACS de Dorigo est modulable Pour mettre en exergue un exemplede cette modulariteacute nous avons testeacute les performances de notre modegravele en modiant la basedapprentissage et la maniegravere dont le graphe eacutetait creacuteeacute Les reacutesultats obtenus ont mis en eacutevidence

103

Chapitre 4 Expeacuterimentations et reacutesultats

le potentiel deacutevolution et dadaptabiliteacute de AntRS agrave des travaux futurs

Enn nous nous sommes inteacuteresseacutes dans la Section 434 agrave loptimisation automatique desmeacutetavariables de notre modegravele Comme nous lavons illustreacute au deacutebut de ce chapitre avec les ex-peacuterimentations preacuteliminaires sur le modegravele ACS les meacutetavariables jouent un rocircle essentiel dans laqualiteacute des reacutesultats Ces derniegraveres gouvernent le comportement des agents comme par exempleleurs tendances agrave explorer lenvironnement ou au contraire agrave exploiter des chemins deacutejagrave connusAn de maximiser le potentiel de notre modegravele dans ce cadre applicatif nous avons utiliseacute lal-gorithme geacuteneacutetique doptimisation de problegravemes multi-objectifs NSGA-II sur 5 meacutetavariables deAntRS Le reacutesultat de cette optimisation a permis dameacuteliorer de maniegravere statistiquement signi-cative les performances de notre modegravele en termes de preacutecision rappel nouveauteacute et preacutefeacuterencesCependant la longueur du processus doptimisation limite pour le moment son application dansle contexte dune utilisation en temps reacuteel du modegravele

Le choix de la base de donneacutees musicale provenant de Deezer a permis de reacutealiser de nom-breuses expeacuterimentations et de tester dieacuterentes facettes de notre modegravele Cependant nousavons aussi rencontreacute beaucoup de problegravemes quant agrave la notion de progressiviteacute avec cette basede donneacutees et les reacutesultats obtenus nont pas eacuteteacute concluants concernant cette meacutetrique Nousdiscuterons de ce point et dautres perspectives dameacuteliorations dans la conclusion geacuteneacuterale decette thegravese

104

Chapitre 5

Conclusion et perspectives

51 Conclusion

Le domaine de la recommandation est en plein essor depuis maintenant une vingtaine dan-neacutees Durant cette peacuteriode la recommandation na cesseacute deacutevoluer an de sadapter agrave lexplosiondu nombre dutilisateurs et de la quantiteacute de donneacutees disponibles Nous pouvons distinguer troisaspects des recommandations modernes qui ont servi de l directeur dans cette thegravese Premiegrave-rement il y a encore 10 ans seulement la majoriteacute de la recherche avait pour but de maximiserla meacutetrique de preacutecision des reacutesultats des algorithmes il est aujourdhui admis quune bonnerecommandation neacutecessite aussi de satisfaire dautres meacutetriques comme la diversiteacute ou la nou-veauteacute Mecircme si la preacutecision reste centrale il est important de consideacuterer ces autres meacutetriquescar elles permettent de reacutepondre agrave une plus grande diversiteacute de situation chez les utilisateurs de-mandant des recommandations Deuxiegravemement la quantiteacute de donneacutees disponibles sur Interneta exploseacute tandis que lutilisation des systegravemes de recommandation sest tregraves largement deacutemocra-tiseacutee La diversiteacute des domaines applicatifs utilisant des systegravemes de recommandations est telleque lhyper-speacutecialisation dun systegraveme pour un seule domaine fait moins de sens quauparavantLes systegravemes de recommandations capables de sadapter rapidement agrave de multiples domainesapplicatifs sont donc aujourdhui particuliegraverement inteacuteressants Troisiegravemement la croissance etla complexication des donneacutees deacutecrivant les ressources et les utilisateurs permettent de propo-ser agrave ces derniers des recommandations plus complexes quauparavant Comme nous lavons ditdautres aspects que la preacutecision sont deacutejagrave exploiteacutes mais il est aussi possible de complexier lesrecommandations en les proposant par seacutequences et non plus par ressource unique En eet lanorme eacutetait avant de ne proposer agrave lutilisateur quune seule recommandation ou au mieux uneliste de recommandations au mecircme niveau les unes que les autres Or de nombreux domainescomme le-eacuteducation la musique ou encore le tourisme peuvent beacuteneacutecier de systegravemes capablesde recommander une seacutequence de ressources dans un ordre preacutecis Lutilisateur dun tel systegravemedispose donc dune seacutequence de ressources permettant datteindre potentiellement des objectifsqui ne seraient pas atteignables avec des recommandations simples ou en liste Ces trois pointseacutevoqueacutes ci-dessus constituent le cdivideur du travail de cette thegravese et nous allons maintenant rappelerles apports de notre travail sur ces trois points

1 Modegravele multi-objectifs En se basant sur larchitecture des colonies de fourmis notremodegravele AntRS permet dinteacutegrer autant de meacutetriques que voulues dans le processus degeacuteneacuteration de recommandations Dans ce travail nous en avons consideacutereacute 4 la similariteacutela diversiteacute la nouveauteacute et les preacutefeacuterences passeacutees Ces 4 meacutetriques sont inteacutegreacutees en

105

Chapitre 5 Conclusion et perspectives

tant que colonies dans notre modegravele et participent toutes agrave la construction de la seacutequencede recommandations Leur importance dans le processus de recommandation peut ecirctremoduleacutee an de mieux correspondre agrave chaque prol dutilisateur

2 Geacuteneacutericiteacute inter-domaine Dans le point preacuteceacutedent nous avons discuteacute de linteacutegrationde dieacuterentes meacutetriques dans les recommandations Comme nous lavons preacutesenteacute dansleacutetat de lart un certain nombre de modegraveles prennent deacutesormais en compte dieacuterentesmeacutetriques Cependant un des points forts de notre modegravele est la modulariteacute avec laquellenous pouvons lexeacutecuter Il est en eet possible denlever ou de rajouter des colonies agrave lademande Autrement dit nous sommes capable de changer agrave la voleacutee les facteurs humainsagrave consideacuterer pour construire les recommandations nales Outre ce point il est relati-vement simple de passer dun domaine applicatif agrave un autre Nous avons construit notremodegravele de sorte quil soit le plus geacuteneacuterique possible eacutetant donneacute que lors de sa conceptionnous navions pas encore deacutecideacute quelle base de donneacutees utiliser Ainsi la seule modica-tion neacutecessaire lors dun changement de domaine est dadapter le calcul de la distance dentre chaque ressource lors de la construction du graphe Apregraves cette modication le restede lalgorithme est le mecircme

3 Seacutequences de recommandation Eacutetant donneacute que notre modegravele AntRS se base sur lemodegravele des colonies de fourmis de Marco Dorigo les reacutesultats que nous obtenons se preacute-sentent sous le mecircme format que pour ce dernier Initialement dans les modegraveles proposeacutespar Dorigo les fourmis ont comme but de chercher un chemin parmi plusieurs possiblesdans un environnement repreacutesenteacute par un graphe et en empruntant des points de passagerepreacutesenteacutes par les ndivideuds du graphe Le reacutesultat obtenu est donc une suite de noeudavec un point de deacutepart un objectif de n et une seacuterie de points de passage dans unordre preacutecis entre les deux autrement dit une seacutequence Nous avons souhaiteacute garder ceprincipe de production naturelle de seacutequences et de ladapter agrave la recommandation Ainsien construisant avec attention le graphe an quil repreacutesente de la maniegravere la plus degravelepossible les liens preacutesents entre les ressources du domaine applicatif et en adaptant lecalcul de la distance d seacuteparant deux ndivideuds notre modegravele AntRS est capable de produiredes seacutequences avec des ressources varieacutees

Les deux premiers apports eacutenumeacutereacutes ci-dessus permettent de sadapter non seulement agrave denombreux prols utilisateurs gracircce aux dieacuterentes meacutetriques mais aussi agrave dieacuterents domainesapplicatifs gracircce agrave la simpliciteacute des changements agrave faire pour passer dun domaine agrave un autreLe troisiegraveme apport eacutenumeacutereacute permet quant agrave lui de proposer non plus des ressources uniques oudes listes de recommandations agrave lutilisateur nal mais bien des seacutequences posseacutedant un senscar baseacutees sur les habitudes de consommation des ressources des utilisateurs passeacutes

52 Perspectives

Dans ce travail nous avons reacutepondu aux probleacutematiques que nous avons deacutenies au deacutebutdu manuscrit mais nous pouvons cependant distinguer des pistes dameacuteliorations futures

Premiegraverement les seacutequences peuvent beacuteneacutecier dameacuteliorations notamment au niveau dela notion de progressiviteacute Pour le moment dans notre modegravele les seacutequences sont creacuteeacutees via

106

52 Perspectives

les agents fourmis parcourant le graphe agrave partir dun point de deacutepart jusquagrave un objectif Laprogressiviteacute des seacutequences est garantie par deux processus

1 La topologie du graphe qui prend en compte les seacutequences creacuteeacutees naturellement par lesutilisateurs lors de preacuteceacutedentes visites

2 La formule du calcul du meilleur chemin une fois les agents ayant termineacute de se deacuteplacersur le graphe

Nous avons exploreacute dautres pistes pour orir des seacutequences plus progressives aux utilisateursPar exemple en incluant une colonie deacutedieacutee uniquement agrave la progressiviteacute ou encore en modiantles calculs de distance totale de chemin Les tests que nous avons reacutealiseacutes nont cependant pasabouti agrave des reacutesultats concluants Nous attribuons ces reacutesultats au fait que le domaine de la mu-sique nest pas optimal pour utiliser ce genre de technique Quand bien mecircme il est courant pourles utilisateurs deacutecouter des musiques sous formes de playlists de reacutecentes eacutetudes ont montreacute quelordre dans lequel les musiques sont proposeacutees nest pas une caracteacuteristique prioritaire dans lasatisfaction de lutilisateur On peut par exemple citer les eacutetudes suivantes [Vall et al 2018 Vallet al 2019] ougrave les auteurs ont chercheacute agrave mesurer limportance de lordre dans lequel eacutetaient preacute-senteacutees les musiques dune playlist Les auteurs nobtiennent pas de dieacuterences de reacutesultats entreplusieurs expeacuterimentations ougrave lordre des musiques eacutetait maintenu ou lorsquil eacutetait rompu Lesauteurs concluent que lordre des musiques nest pas une variable cruciale pour la geacuteneacuteration au-tomatique de playlists Dautres domaines sont ainsi potentiellement plus agrave mecircme decirctre le sujetdeacutetudes plus approfondies sur la progressiviteacute comme par exemple les recommandations de par-cours dans des museacutees ou les recommandations de seacuteries de cours et dexercices dans le-eacuteducation

Une autre perspective dameacutelioration deacutecoulant du paragraphe preacuteceacutedent est lapplication denotre modegravele agrave un ou plusieurs autres domaines applicatifs Nous avons deacutejagrave mentionneacute dans cemanuscrit que nous avions consideacutereacute les domaines museacuteal et de le-eacuteducation en plus du domainemusical Ces deux autres domaines proposent chacun des deacutes uniques et pourraient proter deseacutequences de recommandations reacutepondant aux besoins speacuteciques de leurs utilisateurs Il a mal-heureusement eacutetait trop complexe de reacutecupeacuterer ou de creacuteer une base de donneacutees exploitable surces deux domaines durant cette thegravese Une expeacuterimentation est toutefois meneacutee actuellement enpartenariat avec le Museacutee des Beaux Arts de Nancy an de construire une base de donneacutees deschemins emprunteacutes par les visiteurs du museacutee ce qui permettra alors dappliquer notre modegravelean de proposer des parcours personnaliseacutes dans le museacutee

Une derniegravere perspective dameacutelioration reacuteside dans leacutevaluation des seacutequences geacuteneacutereacutees parnotre modegravele Notre but eacutetait de consideacuterer plusieurs facteurs humains pour geacuteneacuterer et eacutevaluernos recommandations tout en uniant leacutevaluation avec une seule meacutetrique de satisfaction Sinous avons reacuteussi agrave inteacutegrer plusieurs facteurs dans notre modegravele nous avons cependant rencon-treacute des problegravemes quant agrave lunication des eacutevaluations Lobjectif eacutetait de proposer une mesurede progressiviteacute permettant de mesurer la qualiteacute de la seacutequence recommandeacutee mais comme nouslavons expliqueacute nous navons pas obtenu de reacutesultats concluants au regard de la progressiviteacutedans notre base de donneacutees Ainsi la mesure de progressiviteacute optimale on proposeacutee et deacutetailleacuteedans la Section 345 na pas pu ecirctre testeacutee dans de bonnes conditions Mecircme si les expeacuterimenta-tions meneacutees dans ce travail nont pas pu exploiter cette mesure de progressiviteacute optimale nouspensons quelle pourrait agrave termes donner une indication geacuteneacuterale de la qualiteacute dune seacutequence deressources dans dautres domaines comme le-eacuteducation ou le tourisme

107

Chapitre 5 Conclusion et perspectives

Dun point de vue plus geacuteneacuteral sur le fonctionnement de notre modegravele AntRS certaines ameacute-liorations sont possibles si lon considegravere le fonctionnement du systegraveme dans des conditions reacuteelleset non plus pour une expeacuterimentation hors-ligne comme nous lavons fait dans ce travail Dans lecadre dune utilisation en conditions reacuteelles quelques modications du fonctionnement de notrealgorithme pourraient ameacuteliorer la satisfaction de lutilisateur Prenons lexemple dun utilisateurse connectant sur un site de diusion de musique et commenccedilant la lecture dune musique enparticulier Notre systegraveme sera capable agrave partir de ce point de deacutepart et des preacutefeacuterences passeacuteesde lutilisateur de creacuteer une seacutequence de musiques Cependant si lutilisateur ne clique pas surla recommandation de playlist ou eacutecoute une deuxiegraveme chanson complegravetement dieacuterente desrecommandations du systegraveme il serait inteacuteressant de pouvoir consideacuterer et inteacutegrer ces informa-tions dans le modegravele an que ce dernier puisse sadapter et satisfaire au mieux lutilisateur Deplus on voit bien linteacuterecirct de ces adaptations en temps reacuteel dans les domaines museacuteal (re-calculdun nouvel itineacuteraire de visite si lutilisateur ne suit pas la recommandation agrave linstar dunGPS par exemple) et de le-eacuteducation (adapter le contenu peacutedagogique en fonction du chemin delapprenant ou de ses reacutesultats) Une derniegravere remarque geacuteneacuterale concernant notre modegravele peutecirctre faite sur le temps dexeacutecution Malgreacute les optimisations reacutealiseacutees dans la derniegravere sectiondu chapitre preacuteceacutedent le temps dexeacutecution eacutetait relativement eacuteleveacute lors des expeacuterimentationsCependant les expeacuterimentations concernaient 100 utilisateurs agrave la fois et eacutetaient lanceacutees majo-ritairement sur un ordinateur portable Ainsi la recommandation en temps reacuteel dune seacutequencede ressources agrave un seul utilisateur peut ecirctre faite en temps reacuteel en utilisant un serveur deacutedieacute

Le domaine de la recommandation seacutelargit et se complexie chaque anneacutee agrave linstar du mondedans lequel nous vivons Devant la myriade de contenus accessibles sur Internet les utilisateurspeuvent plus que jamais beacuteneacutecier de recommandations intelligentes personnaliseacutees pertinenteset reacutepondant agrave leurs besoins Dans le futur les systegravemes dassistance aux utilisateurs devrontecirctre agrave la fois geacuteneacuteriques adaptables agrave tout types de contextes et toujours plus ecaces Cestdans cette direction que sinscrit le travail de cette thegravese et le modegravele AntRS

108

Bibliographie

[Adomavicius and Tuzhilin 2005] Adomavicius G and Tuzhilin A (2005) Toward the nextgeneration of recommender systems A survey of the state-of-the-art and possible extensionsIEEE Transactions on Knowledge amp Data Engineering (6) 734749

[Adomavicius and Tuzhilin 2011] Adomavicius G and Tuzhilin A (2011) Context-aware re-commender systems In Recommender systems handbook pages 217253 Springer

[Aggarwal et al 2016] Aggarwal C C et al (2016) Recommender systems Springer

[Agrawal et al 1995] Agrawal R Srikant R et al (1995) Mining sequential patterns Inicde volume 95 pages 314

[Alaya et al 2007] Alaya I Solnon C and Ghedira K (2007) Ant colony optimization formulti-objective optimization problems In Tools with Articial Intelligence 2007 ICTAI 200719th IEEE International Conference on volume 1 pages 450457 IEEE

[Angus 2007] Angus D (2007) Crowding population-based ant colony optimisation for themulti-objective travelling salesman problem In 2007 IEEE Symposium on ComputationalIntelligence in Multi-Criteria Decision-Making pages 333340 IEEE

[Angus and Woodward 2009] Angus D and Woodward C (2009) Multiple objective ant co-lony optimisation Swarm intelligence 3(1) 6985

[Antenucci et al 2018] Antenucci S Boglio S Chioso E Dervishaj E Kang S ScarlattiT and Dacrema M F (2018) Artist-driven layering and users behaviour impact on re-commendations in a playlist continuation scenario In Proceedings of the ACM RecommenderSystems Challenge 2018 page 4 ACM

[Aucouturier and Pachet 2002] Aucouturier J-J and Pachet F (2002) Scaling up music play-list generation In Proceedings IEEE International Conference on Multimedia and Expo vo-lume 1 pages 105108 IEEE

[Ausubel 1963] Ausubel D P (1963) The psychology of meaningful verbal learning

[Baeza-Yates et al 1999] Baeza-Yates R Ribeiro-Neto B et al (1999) Modern informationretrieval volume 463 ACM press New York

[Belkin and Croft 1992] Belkin N J and Croft W B (1992) Information ltering and infor-mation retrieval two sides of the same coin In Communications of the ACM Citeseer

[Bell and McMullen 2004] Bell J E and McMullen P R (2004) Ant colony optimizationtechniques for the vehicle routing problem Advanced engineering informatics 18(1) 4148

[Benbasat and Wang 2005] Benbasat I and Wang W (2005) Trust in and adoption of onlinerecommendation agents Journal of the association for information systems 6(3) 4

[Bennett et al 2007] Bennett J Lanning S et al (2007) The netix prize In Proceedingsof KDD cup and workshop volume 2007 page 35 New York

109

Bibliographie

[Bonabeau et al 1999] Bonabeau E Marco D d R D F Dorigo M Theacuteraulaz G The-raulaz G et al (1999) Swarm intelligence from natural to articial systems Number 1Oxford university press

[Borragraves et al 2014] Borragraves J Moreno A and Valls A (2014) Intelligent tourism recommen-der systems A survey Expert Systems with Applications 41(16) 73707389

[Boyer et al 2015] Boyer A Casanova G Roussanaly A and Ducreau F (2015) Periclesor how to assess and to improve quality in higher education

[Breese et al 2013] Breese J S Heckerman D and Kadie C (2013) Empirical analysis ofpredictive algorithms for collaborative ltering arXiv preprint arXiv 13017363

[Brooks 1991] Brooks R A (1991) Intelligence without reason

[Castagnos 2008] Castagnos S (2008) Modeacutelisation de comportements et apprentissage sto-chastique non superviseacute de strateacutegies dinteractions sociales au sein de systegravemes temps reacuteel derecherche et daccegraves agrave linformation PhD thesis Universiteacute Nancy II

[Castagnos and Boyer 2006] Castagnos S and Boyer A (2006) A clientserver user-basedcollaborative ltering algorithm Model and implementation In 17th European Conferenceon Articial Intelligence (ECAI 2006) pages 617621

[Castagnos et al 2013] Castagnos S Brun A and Boyer A (2013) Utiliteacute et perception dela diversiteacute dans les systegravemes de recommandation

[Castagnos et al 2010] Castagnos S Jones N and Pu P (2010) Eye-tracking product re-commenders usage In Proceedings of the fourth ACM conference on Recommender systemspages 2936 ACM

[Castagnos et al 2019] Castagnos S Marchal F Bertrand A Colle M and Mahmoudi D(2019) Inferring art preferences from gaze exploration in a museum In Adjunct Publicationof the 27th Conference on User Modeling Adaptation and Personalization pages 425430

[Castells et al 2015] Castells P Hurley N J and Vargas S (2015) Novelty and diversity inrecommender systems In Recommender Systems Handbook pages 881918 Springer

[Chen and Li 2019] Chen H and Li J (2019) Adversarial tensor factorization for context-aware recommendation In Proceedings of the 13th ACM Conference on Recommender Systemspages 363367

[Cheverst et al 2000] Cheverst K Davies N Mitchell K Friday A and Efstratiou C(2000) Developing a context-aware electronic tourist guide some issues and experiencesIn Proceedings of the SIGCHI conference on Human Factors in Computing Systems pages1724 ACM

[Chou et al 2005] Chou S-C Hsieh W-T Gandon F L and Sadeh N M (2005) Semanticweb technologies for context-aware museum tour guide applications In Advanced InformationNetworking and Applications 2005 AINA 2005 19th International Conference on volume 2pages 709714 IEEE

[Davis 1989] Davis F D (1989) Perceived usefulness perceived ease of use and user acceptanceof information technology MIS quarterly pages 319340

[Deb et al 2002] Deb K Pratap A Agarwal S and Meyarivan T (2002) A fast and elitistmultiobjective genetic algorithm Nsga-ii IEEE transactions on evolutionary computation6(2) 182197

[Deneubourg et al 1990] Deneubourg J-L Aron S Goss S and Pasteels J M (1990) Theself-organizing exploratory pattern of the argentine ant Journal of insect behavior 3(2) 159168

110

[Doerner et al 2004] Doerner K Gutjahr W J Hartl R F Strauss C and Stummer C(2004) Pareto ant colony optimization A metaheuristic approach to multiobjective portfolioselection Annals of operations research 131(1) 7999

[Dorigo 2001] Dorigo M (2001) Ant algorithms solve dicult optimization problems InEuropean Conference on Articial Life pages 1122 Springer

[Dorigo and Birattari 2010] Dorigo M and Birattari M (2010) Ant colony optimizationSpringer

[Dorigo and Birattari 2011] Dorigo M and Birattari M (2011) Ant colony optimization InEncyclopedia of machine learning pages 3639 Springer

[Dorigo et al 2006] Dorigo M Birattari M and Stutzle T (2006) Ant colony optimizationIEEE computational intelligence magazine 1(4) 2839

[Dorigo and Gambardella 1997] Dorigo M and Gambardella L M (1997) Ant colonies forthe travelling salesman problem biosystems 43(2) 7381

[Dorigo et al 1996] Dorigo M Maniezzo V Colorni A et al (1996) Ant system optimiza-tion by a colony of cooperating agents IEEE Transactions on Systems man and cyberneticsPart B Cybernetics 26(1) 2941

[Dorigo and Stuumltzle 2019] Dorigo M and Stuumltzle T (2019) Ant colony optimization overviewand recent advances In Handbook of metaheuristics pages 311351 Springer

[Drachsler et al 2015] Drachsler H Verbert K Santos O C and Manouselis N (2015)Panorama of recommender systems to support learning In Recommender systems handbookpages 421451 Springer

[Durillo and Nebro 2011] Durillo J J and Nebro A J (2011) jmetal A java framework formulti-objective optimization Advances in Engineering Software 42(10) 760771

[Ekstrand et al 2014] Ekstrand M D Harper F M Willemsen M C and Konstan J A(2014) User perception of dierences in recommender algorithms In Proceedings of the 8thACM Conference on Recommender systems pages 161168 ACM

[Ferber 1995] Ferber J (1995) Les systegravemes multi-agents Vers une intelligence collectiveintereditions 1995 Connaissances et compeacutetences requises Cette thegravese s adresse agrave des eacutetu-diants ayant un prol Intelligence ArticielleBase de Donneacutees et elle neacutecessite davoir descompeacutetences theacuteoriques dans les domaines 1

[Ferber and Weiss 1999] Ferber J and Weiss G (1999) Multi-agent systems an introductionto distributed articial intelligence volume 1 Addison-Wesley Reading

[Frolov and Oseledets 2017] Frolov E and Oseledets I (2017) Tensor methods and recom-mender systems Wiley Interdisciplinary Reviews Data Mining and Knowledge Discovery7(3) e1201

[Gambardella et al 1999] Gambardella L M Taillard Eacute and Agazzi G (1999) Macs-vrptw A multiple ant colony system for vehicle routing problems with time windows

[Gan et al 2020] Gan L Nurbakova D Laporte L and Calabretto S (2020) Enhancingrecommendation diversity using determinantal point processes on knowledge graphs In Pro-ceedings of the 43rd International ACM SIGIR Conference on Research and Development inInformation Retrieval pages 20012004

[Gavalas et al 2014] Gavalas D Konstantopoulos C Mastakas K and Pantziou G (2014)Mobile recommender systems in tourism Journal of network and computer applications39 319333

111

Bibliographie

[Goodenough et al 2017] Goodenough A E Little N Carpenter W S and Hart A G(2017) Birds of a feather ock together Insights into starling murmuration behaviour revealedusing citizen science PloS one 12(6) e0179277

[Goss et al 1989] Goss S Aron S Deneubourg J-L and Pasteels J M (1989) Self-organized shortcuts in the argentine ant Naturwissenschaften 76(12) 579581

[Gras et al 2016] Gras B Brun A and Boyer A (2016) Identifying grey sheep users incollaborative ltering a distribution-based technique In Proceedings of the 2016 Conferenceon User Modeling Adaptation and Personalization pages 1726 ACM

[Grasseacute 1959] Grasseacute P-P (1959) La reconstruction du nid et les coordinations interindi-viduelles chez bellicositermes natalensis etcubitermes sp la theacuteorie de la stigmergie Essaidinterpreacutetation du comportement des termites constructeurs Insectes sociaux 6(1) 4180

[Guo et al 2015] Guo G Zhang J Sun Z and Yorke-Smith N (2015) Librec A javalibrary for recommender systems In UMAP Workshops

[Han et al 2007] Han J Cheng H Xin D and Yan X (2007) Frequent pattern mining current status and future directions Data mining and knowledge discovery 15(1) 5586

[Harper and Konstan 2015] Harper F M and Konstan J A (2015) The movielens datasets History and context Acm transactions on interactive intelligent systems (tiis) 5(4) 119

[Herlocker et al 2004] Herlocker J L Konstan J A Terveen L G and Riedl J T (2004)Evaluating collaborative ltering recommender systems ACM Transactions on InformationSystems (TOIS) 22(1) 553

[Houmllldobler et al 1990] Houmllldobler B Wilson E O et al (1990) The ants Harvard UniversityPress

[Honey et al 1992] Honey P Mumford A et al (1992) The manual of learning styles

[Hu et al 2008] Hu Y Koren Y and Volinsky C (2008) Collaborative ltering for implicitfeedback datasets In 2008 Eighth IEEE International Conference on Data Mining pages263272 Ieee

[Iaquinta et al 2008] Iaquinta L De Gemmis M Lops P Semeraro G Filannino M andMolino P (2008) Introducing serendipity in a content-based recommender system In 2008Eighth International Conference on Hybrid Intelligent Systems pages 168173 IEEE

[Iredi et al 2001] Iredi S Merkle D and Middendorf M (2001) Bi-criterion optimizationwith multi colony ant algorithms In Evolutionary Multi-Criterion Optimization pages 359372 Springer

[Jameson et al 2015] Jameson A Willemsen M C Felfernig A de Gemmis M Lops PSemeraro G and Chen L (2015) Human decision making and recommender systems InRecommender Systems Handbook pages 611648 Springer

[Jannach et al 2016] Jannach D Kamehkhosh I and Bonnin G (2016) Biases in auto-mated music playlist generation A comparison of next-track recommending techniques InProceedings of the 2016 Conference on User Modeling Adaptation and Personalization pages281285 ACM

[Jawaheer et al 2010] Jawaheer G Szomszor M and Kostkova P (2010) Comparison ofimplicit and explicit feedback from an online music recommendation service In proceedingsof the 1st international workshop on information heterogeneity and fusion in recommendersystems pages 4751 ACM

112

[Jones 2010] Jones N (2010) User Perceived Qualities and Acceptance of Recommender Sys-tems The Role of Diversity PhD thesis EPFL

[Kaminskas and Bridge 2016] Kaminskas M and Bridge D (2016) Diversity serendipity no-velty and coverage A survey and empirical analysis of beyond-accuracy objectives in recom-mender systems ACM Trans Interact Intell Syst 7(1) 2 12 42

[Kardan et al 2014] Kardan A A Ebrahim M A and Imani M B (2014) A new perso-nalized learning path generation method Aco-map Indian Journal of Scientic Research5(1) 17

[King and Sumpter 2012] King A J and Sumpter D J (2012) Murmurations Current Bio-logy 22(4) R112R114

[Kolb and Fry 1974] Kolb D A and Fry R E (1974) Toward an applied theory of experientiallearning MIT Alfred P Sloan School of Management

[Konstan et al 1998] Konstan J A Riedl J Borchers A and Herlocker J L (1998) Re-commender systems A grouplens perspective In Recommender Systems Papers from the1998 Workshop (AAAI Technical Report WS-98-08) pages 6064 AAAI Press

[Koren 2008] Koren Y (2008) Factorization meets the neighborhood a multifaceted collabo-rative ltering model In Proceedings of the 14th ACM SIGKDD international conference onKnowledge discovery and data mining pages 426434 ACM

[Koren et al 2009] Koren Y Bell R and Volinsky C (2009) Matrix factorization techniquesfor recommender systems Computer (8) 3037

[Kuhlthau 1991] Kuhlthau C C (1991) Inside the search process Information seeking fromthe users perspective Journal of the American society for information science 42(5) 361371

[Kurilovas et al 2015] Kurilovas E Zilinskiene I and Dagiene V (2015) Recommending sui-table learning paths according to learners preferences Experimental research results Com-puters in Human Behavior 51 945951

[lHuillier 2018] lHuillier A (2018) Modeacuteliser la diversiteacute au cours du temps pour comprendrele contexte de lutilisateur dans les systegravemes de recommandation PhD thesis

[LHuillier et al 2014] LHuillier A Castagnos S and Boyer A (2014) Understanding usagesby modeling diversity over time In 22nd Conference on User Modeling Adaptation andPersonalization volume 1181

[Logan 2002] Logan B (2002) Content-based playlist generation Exploratory experimentsIn ISMIR

[Lops et al 2011] Lops P De Gemmis M and Semeraro G (2011) Content-based recom-mender systems State of the art and trends In Recommender systems handbook pages73105 Springer

[Mahmood and Ricci 2009] Mahmood T and Ricci F (2009) Improving recommender sys-tems with adaptive conversational strategies In Proceedings of the 20th ACM conference onHypertext and hypermedia pages 7382 ACM

[March 1991] March J G (1991) Exploration and exploitation in organizational learningOrganization science 2(1) 7187

[McGinty and Smyth 2003] McGinty L and Smyth B (2003) On the role of diversity inconversational recommender systems In Proceedings of the 5th International Conference onCase-based Reasoning Research and Development ICCBR03 pages 276290

113

Bibliographie

[McNee et al 2006] McNee S M Riedl J and Konstan J A (2006) Being accurate is notenough how accuracy metrics have hurt recommender systems In CHI06 extended abstractson Human factors in computing systems pages 10971101 ACM

[Merkle et al 2002] Merkle D Middendorf M and Schmeck H (2002) Ant colony optimi-zation for resource-constrained project scheduling IEEE transactions on evolutionary compu-tation 6(4) 333346

[Mokatren et al 2018] Mokatren M Kuik T and Shimshoni I (2018) Exploring the po-tential of a mobile eye tracker as an intuitive indoor pointing device A case study in culturalheritage Future Generation Computer Systems 81 528541

[Nurbakova et al 2018] Nurbakova D Laporte L Calabretto S and Gensel J (2018) Re-commandation de seacutequences dactiviteacutes lors deacutevegravenements distribueacutes

[Oard et al 1998] Oard D W Kim J et al (1998) Implicit feedback for recommendersystems In Proceedings of the AAAI workshop on recommender systems pages 8183

[Osche et al 2019a] Osche P-E Castagnos S and Boyer A (2019a) Antrs Recommendinglists through a multi-objective ant colony system In European Conference on InformationRetrieval pages 229243 Springer

[Osche et al 2019b] Osche P-E Castagnos S and Boyer A (2019b) From music to museum Applications of multi-objective ant colony systems to real world problems In Adaptive andLearning Agents Workshop at AAMAS (ALA 2019)

[Osche et al 2016] Osche P-E Castagnos S Napoli A and Naudet Y (2016) Walk theline toward an ecient user model for recommendations in museums In Semantic and SocialMedia Adaptation and Personalization (SMAP) 2016 11th International Workshop IEEE

[Oster 1981] Oster G (1981) E 0 wilson 1978 caste and ecology in the social insects Mo-nographs in Population Biology 12 1352

[Qiu et al 2015] Qiu J Lin Z and Li Y (2015) Predicting customer purchase behavior inthe e-commerce context Electronic commerce research 15(4) 427452

[Quadrana et al 2018] Quadrana M Cremonesi P and Jannach D (2018) Sequence-awarerecommender systems ACM Computing Surveys (CSUR) 51(4) 136

[Resnick et al 1994] Resnick P Iacovou N Suchak M Bergstrom P and Riedl J (1994)Grouplens an open architecture for collaborative ltering of netnews In Proceedings of the1994 ACM conference on Computer supported cooperative work pages 175186 ACM

[Reynolds 1987] Reynolds C W (1987) Flocks herds and schools A distributed behavioralmodel volume 21 ACM

[Ribeiro et al 2014] Ribeiro M T Ziviani N Moura E S D Hata I Lacerda A andVeloso A (2014) Multiobjective pareto-ecient approaches for recommender systems ACMTrans Intell Syst Technol 5(4) 53 153 20

[Ricci et al 2015] Ricci F Rokach L and Shapira B (2015) Recommender Systems Hand-book Springer US

[RISK 2002] RISK U (2002) Draft standard for learning object metadata IEEE standard1484(1)

[Rubtsov et al 2018] Rubtsov V Kamenshchikov M Valyaev I Leksin V and IgnatovD I (2018) A hybrid two-stage recommender system for automatic playlist continuation InProceedings of the ACM Recommender Systems Challenge 2018 page 16 ACM

114

[Russell and Norvig 2016] Russell S J and Norvig P (2016) Articial intelligence a modernapproach Malaysia Pearson Education Limited

[Salton 1989] Salton G (1989) Automatic text processing The transformation analysis andretrieval of Reading Addison-Wesley 169

[Salton and McGill 1986] Salton G and McGill M J (1986) Introduction to modern infor-mation retrieval

[Sammut and Webb 2010] Sammut C and Webb G I editors (2010) Mean Absolute Errorpages 652652 Springer US Boston MA

[Schlunz 2011] Schlunz E B (2011) Decision support for generator maintenance scheduling inthe energy sector PhD thesis Stellenbosch Stellenbosch University

[Schnabel et al 2018] Schnabel T Bennett P N Dumais S T and Joachims T (2018)Short-term satisfaction and long-term coverage Understanding how users tolerate algorithmicexploration In Proceedings of the Eleventh ACM International Conference on Web Search andData Mining pages 513521

[Semet et al 2003] Semet Y Lutton E and Collet P (2003) Ant colony optimisation fore-learning Observing the emergence of pedagogic suggestions In Swarm Intelligence Sympo-sium 2003 SIS03 Proceedings of the 2003 IEEE pages 4652 IEEE

[Shani and Gunawardana 2011] Shani G and Gunawardana A (2011) Evaluating recommen-dation systems In Recommender systems handbook pages 257297 Springer

[Shardanand and Maes 1995] Shardanand U and Maes P (1995) Social information ltering Algorithms for automating word of mouth In Chi volume 95 pages 210217 Citeseer

[Silva et al 2009] Silva A R D Lages W S and Chaimowicz L (2009) Boids that see Using self-occlusion for simulating large groups on gpus Computers in Entertainment (CIE)7(4) 51

[Simon 1997] Simon H A (1997) Models of bounded rationality Empirically grounded econo-mic reason volume 3 MIT press

[Smyth and McClave 2001] Smyth B and McClave P (2001) Similarity vs diversity InInternational Conference on Case-Based Reasoning pages 347361 Springer

[Stuumltzle and Hoos 2000] Stuumltzle T and Hoos H H (2000) Maxmin ant system Futuregeneration computer systems 16(8) 889914

[Su and Khoshgoftaar 2009] Su X and Khoshgoftaar T M (2009) A survey of collaborativeltering techniques Advances in articial intelligence 2009 4

[Tesoriero et al 2008] Tesoriero R Gallud J A Lozano M and Penichet V M R (2008) Alocation-aware system using rd and mobile devices for art museums In Fourth InternationalConference on Autonomic and Autonomous Systems (ICAS08) pages 7681 IEEE

[Tesoriero et al 2014] Tesoriero R Gallud J A Lozano M and Penichet V M R (2014)Enhancing visitors experience in art museums using mobile technologies Information SystemsFrontiers 16(2) 303327

[Tintarev et al 2017] Tintarev N Lo C and Liem C (2017) Sequences of diverse songrecommendations An exploratory study in a commercial system In Proceedings of the 25thConference on User Modeling Adaptation and Personalization pages 391392 ACM

[Twardowski 2016] Twardowski B (2016) Modelling contextual information in session-awarerecommender systems with neural networks In Proceedings of the 10th ACM Conference onRecommender Systems pages 273276 ACM

115

Bibliographie

[Vall et al 2018] Vall A Quadrana M Schedl M and Widmer G (2018) The impor-tance of song context and song order in automated music playlist generation arXiv preprintarXiv 180704690

[Vall et al 2019] Vall A Quadrana M Schedl M and Widmer G (2019) Order contextand popularity bias in next-song recommendations International Journal of Multimedia In-formation Retrieval 8(2) 101113

[Van den Berg et al 2005] Van den Berg B Van Es R Tattersall C Janssen J ManderveldJ Brouns F Kurvers H and Koper R (2005) Swarm-based sequencing recommendationsin e-learning In Intelligent Systems Design and Applications 2005 ISDA05 Proceedings 5thInternational Conference on pages 488493 IEEE

[Vargas and Castells 2011] Vargas S and Castells P (2011) Rank and relevance in noveltyand diversity metrics for recommender systems In Proceedings of the fth ACM conferenceon Recommender systems pages 109116 ACM

[Veacuteron and Levasseur 1989] Veacuteron E and Levasseur M (1989) Ethnographie de lexposition lespace le corps et le sens Centre Georges Pompidou Bibliothegraveque publique dinformation

[Volkovs et al 2018] Volkovs M Rai H Cheng Z Wu G Lu Y and Sanner S (2018)Two-stage model for automatic playlist continuation at scale In Proceedings of the ACMRecommender Systems Challenge 2018 page 9 ACM

[Wang et al 2012] Wang X Rosenblum D and Wang Y (2012) Context-aware mobile musicrecommendation for daily activities In Proceedings of the 20th ACM international conferenceon Multimedia pages 99108 ACM

[Weiss 2013] Weiss G (2013) Multiagent systems MIT press

[Yang et al 2017] Yang B Lei Y Liu J and Li W (2017) Social collaborative ltering bytrust IEEE transactions on pattern analysis and machine intelligence 39(8) 16331647

[Yang et al 2018] Yang H Jeong Y Choi M and Lee J (2018) Mmcf Multimodal colla-borative ltering for automatic playlist continuation In Proceedings of the ACM RecommenderSystems Challenge 2018 page 11 ACM

[Yang and Wu 2009] Yang Y J and Wu C (2009) An attribute-based ant colony system foradaptive learning object recommendation Expert Systems with Applications 36(2) 30343047

[Yoshimura et al 2014] Yoshimura Y Sobolevsky S Ratti C Girardin F Carrascal J PBlat J and Sinatra R (2014) An analysis of visitors behavior in the louvre museum a studyusing bluetooth data Environment and Planning B Planning and Design 41(6) 11131131

[Yu and Riedl 2012] Yu H and Riedl M O (2012) A sequential recommendation approachfor interactive personalized story generation In Proceedings of the 11th International Confe-rence on Autonomous Agents and Multiagent Systems-Volume 1 pages 7178 InternationalFoundation for Autonomous Agents and Multiagent Systems

[Zhang 2013] Zhang L (2013) The denition of novelty in recommendation system Journalof Engineering Science amp Technology Review 6(3)

[Zhao et al 2014] Zhao G Lee M L and Wynne H (2014) Utilizing purchase intervals inlatent clusters for product recommendation In Proceedings of the 8th Workshop on SocialNetwork Mining and Analysis page 4 ACM

[Ziegler et al 2005] Ziegler C-N McNee S M Konstan J A and Lausen G (2005) Im-proving recommendation lists through topic diversication In Proceedings of the 14th inter-national conference on World Wide Web pages 2232 ACM

116

[Zitzler et al 2001] Zitzler E Laumanns M and Thiele L (2001) Spea2 Improving thestrength pareto evolutionary algorithm TIK-report 103

117

Bibliographie

118

Reacutesumeacute

Les systegravemes de recommandations repreacutesentent un thegraveme de recherche fondamental agrave linter-section entre plusieurs grandes disciplines telles que lapprentissage automatique linteractionhomme-machine et les sciences cognitives Ils constituent en outre un cadre applicatif ambitieuxpour la communauteacute des chercheurs en Intelligence Articielle de par leur tregraves grande complexiteacuteet les nombreuses contraintes quils geacutenegraverent

Lobjectif de ces systegravemes est dameacuteliorer les interactions entre le grand public et les sys-tegravemes de recherche et daccegraves agrave linformation Il est en eet devenu dicile dans un contexte demasse de donneacutees heacuteteacuterogegravenes didentier les ressources les plus pertinentes Il sagit dassisterles utilisateurs dans leurs explorations (que cela soit dans un environnement virtuel ou physique)mais eacutegalement de proposer des ressources susceptibles de les inteacuteresser mais quils nauraientpas consulteacutees spontaneacutement

Les systegravemes actuels ont largement prouveacute leur valeur ajouteacutee et reposent sur des techniquesdapprentissage varieacutees (numeacuterique ou symbolique superviseacute ou non etc) [Castagnos 2008]Neacuteanmoins ils sourent encore de limitations lorsquil sagit de faire des recommandations deseacutequences (recommandations ditems dans un ordre preacutecis pouvant deacutependre des preacute-requis dela progressiviteacute requise du contexte des contraintes de temps etc) Certains modegraveles tels quele modegravele DANCE [Castagnos 2015] integravegrent cette dimension temporelle en suivant en tempsreacuteel leacutevolution en diversiteacute des ressources consulteacutees par les utilisateurs pour mieux comprendrele contexte dexploration Dans [Bonnin 2010] lauteur propose eacutegalement un modegravele temporelcapable de deacutetecter des motifs de consultations freacutequents dans un historique de consultationsan de fournir des recommandations de ressources a priori lieacutees agrave un mecircme contexte Neacuteanmoinssi la modeacutelisation temporelle et spatiale a eacuteteacute rendue possible [Zheng 2015] les modegraveles de leacutetatde lart sinteacuteressant agrave lordre dans lequel les recommandations doivent ecirctre faites ou agrave la qualiteacuteglobale dune seacutequence de recommandations sont encore trop rares

Dans le cadre de cette thegravese nous nous attacherons agrave deacutenir un nouveau formalisme etun cadre meacutethodologique permettant (1) la deacutenition de facteurs humains menant agrave la prisede deacutecision et agrave la satisfaction des utilisateurs (2) la construction dun modegravele geacuteneacuterique etmulti-critegraveres (contraintes physiques ou temporelles diversiteacute progressiviteacute etc) inteacutegrant cesfacteurs humains dans le but de recommander des ressources pertinentes sinscrivant dans uneseacutequence coheacuterente (3) une eacutevaluation holistique de la satisfaction utilisateur vis-agrave-vis de sonparcours de recommandations Leacutevaluation des recommandations tous domaines confondus sefait pour lheure recommandation par recommandation chaque meacutetrique deacutevaluation prise in-deacutependamment (preacutecision diversiteacute nouveauteacute couverture ) Il sagira de proposer un cadreplus complet mesurant leacutevolutiviteacute et la compleacutetude du parcours

Un tel modegravele de recommandations multi-critegraveres preacutesente de nombreux cadres applicatifs Agravetitre dexemple il peut ecirctre utiliseacute dans le cadre de leacutecoute de musique en ligne avec la recom-mandation de playlists adaptatives (recommandation de seacutequences de musique pour faire eacutevoluerlambiance dans un lieu tel quun bar pour susciter une certaine progressiviteacute de leacutemotion res-

119

sentie par le public ou pour sadapter aux attentes compleacutementairessimilairesdieacuterentes dungroupe) Il peut eacutegalement ecirctre utile pour adapter le parcours de recommandation aux progregraves delapprenant et au sceacutenario peacutedagogique de lenseignant dans un contexte de-eacuteducation Citonsaussi le domaine touristique ougrave ce modegravele pourrait inteacutegrer les contraintes spatiales et tempo-relles dun environnement physique (villes museacutees etc)

Mots-cleacutes Systegravemes de recommandation Systegravemes multi-agents Modeacutelisation utilisateur

120

Abstract

Recommender systems are a fundamental research topic at the intersection of several majordisciplines such as machine learning human-computer interaction and cognitive sciences Theyalso constitute an ambitious application framework for the community of researchers in ArticialIntelligence by their great complexity and the numerous constraints they generate

The purpose of these systems is to improve the interaction between the general audience andthe systems of search and access to information It has become dicult to identify the mostrelevant items in the context of big data The goal is thus to assist users in their explorations(whether in a virtual or physical environment) but also to propose items that may interest thembut that they would not consult spontaneously

Current systems have largely proven their added value and are based on various machinelearning techniques (numerical or symbolic supervised or not etc) [Castagnos 2008] Neverthe-less they still suer from limitations when making recommendations of sequences (recommendingitems in a specic order may depend on requirements progressiveness context time constraintsetc) Some models such as the DANCE model [Castagnos 2015] integrate this temporal di-mension by following in real time the evolution in diversity of resources consulted by users tobetter understand the exploration context In [Bonnin 2010] the author also proposes a temporalmodel capable of detecting frequent consultation patterns in a history of consultations in orderto provide a priori resource recommendations related to the same context Nevertheless whiletemporal and spatial modeling have been made possible [Zheng 2015] state-of-the-art modelsthat focus on sequence recommendations or on the overall quality of the sequence are still too rare

In the framework of this thesis we will focus on dening a new formalism and a method-ological framework allowing (1) the denition of human factors leading to decision making anduser satisfaction (2) the construction of a generic and multi-criteria model (physical or tem-poral constraints diversity progressiveness etc) integrating these human factors in order torecommend relevant resources in a coherent sequence (3) a holistic evaluation of user satisfac-tion with its recommendation path The evaluation of recommendations all domains includedis currently done recommendation by recommendation with each evaluation metric taken inde-pendently (accuracy diversity novelty coverage ) Thus we expect a more comprehensiveevaluation framework measuring the progressiveness and the completeness of the path

Such a multi-criteria recommendation model has many application frameworks As an exam-ple it can be used in the context of online music listening with the recommendation of adaptiveplaylists (recommendation of music sequences to change the atmosphere in a place such as a barto raise or lower the emotion felt by the audience progressively or to adapt to the complemen-tarysimilardierent expectations of a group) It can also be useful to adapt the recommendationpath to the learners progress and the teachers pedagogical scenario in an e-education contextLet us also mention the tourism eld where this model could integrate the spatial and temporalconstraints of a physical environment (cities museums etc)

Keywords Recommender systems Multi-agent systems User modeling

121

122

123

  • Introduction
    • Introduction
    • Preacuteambule
    • Contributions
      • SP1 les facteurs agrave prendre en compte pour satisfaire les utilisateurs
      • SP2 la conception de seacutequences de recommandations en accord avec les facteurs seacutelectionneacutes
      • SP3 et SP4 la creacuteation dun modegravele geacuteneacuterique prenant en compte plusieurs meacutetriques et produisant des seacutequences
        • Plan de la thegravese
          • Eacutetat de lart
            • Les systegravemes de recommandation
              • Le filtrage par contenu
              • Le filtrage collaboratif
              • Les actions des utilisateurs
              • Discussion et limites des systegravemes classiques
                • Les facteurs humains agrave prendre en compte dans la recommandation
                  • La similariteacute
                  • La diversiteacute
                  • La nouveauteacute
                  • Discussion
                    • La recommandation en seacutequence
                      • Deacutefinition et geacuteneacuteraliteacutes sur les seacutequences
                      • Domaines dapplication des modegraveles seacutequentiels
                      • Discussion
                        • Les systegravemes multi-agents
                          • Deacutefinition
                          • Preacutesentation de deux systegravemes multi-agents reacuteactifs
                          • Ant Colony System
                          • Discussion sur le modegravele ACS
                            • Utilisation et eacutevolution reacutecentes des algorithmes de colonies de fourmis
                              • Les algorithmes de colonies de fourmis dans les systegravemes de recommandation
                              • Les algorithmes de colonies de fourmis multi-objectifs
                              • Discussion sur lutilisation de loptimum de Pareto
                                • Discussion geacuteneacuterale
                                  • Notre modegravele de recommandation multi-objectifs AntRS
                                    • Introduction
                                    • Fonctionnement geacuteneacuteral du modegravele
                                    • Graphe
                                    • Objectifs
                                      • Similariteacute
                                      • Diversiteacute
                                      • Nouveauteacute
                                      • Preacutefeacuterences
                                      • Progressiviteacute
                                        • Tactiques de fusion
                                          • Colonie de fusion
                                          • Fusion de seacutequences
                                          • Conclusion
                                              • Expeacuterimentations et reacutesultats
                                                • Introduction
                                                • Expeacuterimentations preacuteliminaires portant sur le modegravele ACS initial
                                                  • Preacutesentation et inteacuterecircts de ces premiegraveres expeacuterimentations
                                                  • Expeacuterimentations preacuteliminaires sur le modegraveles ACS
                                                  • Conclusion
                                                    • Expeacuterimentations sur le modegravele AntRS
                                                      • Base de donneacutees utiliseacutee
                                                      • AntRS mono-objectif expeacuterimentations sur chaque colonie isoleacutee
                                                      • AntRS multi-objectifs expeacuterimentations sur lensemble des colonies simultaneacutement et sur les tactiques de fusion
                                                      • Optimisation des meacutetavariables de AntRS
                                                        • Conclusion
                                                          • Conclusion et perspectives
                                                            • Conclusion
                                                            • Perspectives
                                                              • Bibliographie
Page 5: Recommanding sequences in a multidimensional space

Remerciements

Ce manuscrit de thegravese est le fruit dun long travail de recherche qui a eacuteteacute riche en enseigne-ments Durant ces anneacutees jai beaucoup appris tant du point de vue professionnel que personnelplus que je naurais imagineacute avant de commencer cette thegravese Pour tout cela je souhaite remer-cier les personnes qui mont entoureacute durant cette peacuteriode

Je tiens tout dabord agrave particuliegraverement remercier ma directrice Anne Boyer et mon co-directeur Sylvain Castagnos avec qui jai eu la chance de pouvoir travailler durant toute cettethegravese Anne ma apporteacute son expeacuterience et son recul dans le domaine de la recherche et Sylvainma guideacute et soutenu dans chacune des eacutetapes de ce travail Jai beaucoup appreacutecieacute travailleravec vous et je vous remercie encore une fois ici pour vos conseils aviseacutes votre patience votrebonne humeur et pour tout ce que jai pu apprendre agrave vos cocircteacutes

Je remercie Sylvie Calabretto et Laurent Vercouter qui ont rapporteacute ma thegravese et qui ontaccepteacute de faire partie du jury de thegravese Leurs remarques pertinentes mont donneacute un recul etune conance nouvelle en mon travail Je remercie Laurent Vigneron qui a apporteacute un regardexteacuterieur et bienveillant sur mon travail pendant ces anneacutees de thegravese et qui a eacutegalement accepteacutede faire partie du jury comme examinateur

Je remercie aussi leacutequipe KIWI dans son ensemble De nombreuses ideacutees de ce travail sont lefruit de discussions avec les membres de leacutequipe dont certains sont devenus pour moi des amisproches

Je remercie enn ma famille et mes amis leur soutien ma donneacute la motivation de terminerce travail dans cette peacuteriode dicile de pandeacutemie et disolation sociale Tout particuliegraverementje remercie Rose et Ragnar pour leur douce preacutesence quotidienne

i

ii

Sommaire

Chapitre 1

Introduction 1

11 Introduction 1

12 Preacuteambule 4

13 Contributions 8

131 SP1 les facteurs agrave prendre en compte pour satisfaire les utilisateurs 9

132 SP2 la conception de seacutequences de recommandations en accord avec les

facteurs seacutelectionneacutes 9

133 SP3 et SP4 la creacuteation dun modegravele geacuteneacuterique prenant en compte plusieurs

meacutetriques et produisant des seacutequences 9

14 Plan de la thegravese 10

Chapitre 2

Eacutetat de lart 11

21 Les systegravemes de recommandation 12

211 Le ltrage par contenu 12

212 Le ltrage collaboratif 13

213 Les actions des utilisateurs 13

214 Discussion et limites des systegravemes classiques 14

22 Les facteurs humains agrave prendre en compte dans la recommandation 15

221 La similariteacute 17

222 La diversiteacute 19

223 La nouveauteacute 20

224 Discussion 21

23 La recommandation en seacutequence 22

231 Deacutenition et geacuteneacuteraliteacutes sur les seacutequences 22

232 Domaines dapplication des modegraveles seacutequentiels 26

233 Discussion 30

iii

Sommaire

24 Les systegravemes multi-agents 31

241 Deacutenition 31

242 Preacutesentation de deux systegravemes multi-agents reacuteactifs 33

243 Ant Colony System 38

244 Discussion sur le modegravele ACS 40

25 Utilisation et eacutevolution reacutecentes des algorithmes de colonies de fourmis 43

251 Les algorithmes de colonies de fourmis dans les systegravemes de recommandation 43

252 Les algorithmes de colonies de fourmis multi-objectifs 47

253 Discussion sur lutilisation de loptimum de Pareto 50

26 Discussion geacuteneacuterale 50

Chapitre 3

Notre modegravele de recommandation multi-objectifs AntRS 53

31 Introduction 54

32 Fonctionnement geacuteneacuteral du modegravele 54

33 Graphe 55

34 Objectifs 60

341 Similariteacute 63

342 Diversiteacute 64

343 Nouveauteacute 64

344 Preacutefeacuterences 66

345 Progressiviteacute 67

35 Tactiques de fusion 70

351 Colonie de fusion 71

352 Fusion de seacutequences 72

353 Conclusion 72

Chapitre 4

Expeacuterimentations et reacutesultats 73

41 Introduction 74

42 Expeacuterimentations preacuteliminaires portant sur le modegravele ACS initial 74

421 Preacutesentation et inteacuterecircts de ces premiegraveres expeacuterimentations 74

422 Expeacuterimentations preacuteliminaires sur le modegraveles ACS 78

423 Conclusion 84

43 Expeacuterimentations sur le modegravele AntRS 84

431 Base de donneacutees utiliseacutee 84

432 AntRS mono-objectif expeacuterimentations sur chaque colonie isoleacutee 89

iv

433 AntRS multi-objectifs expeacuterimentations sur lensemble des colonies si-

multaneacutement et sur les tactiques de fusion 93

434 Optimisation des meacutetavariables de AntRS 99

44 Conclusion 103

Chapitre 5

Conclusion et perspectives 105

51 Conclusion 105

52 Perspectives 106

Bibliographie 109

v

Sommaire

vi

Table des gures

21 Preacutesentation scheacutematiseacutee du calcul de la preacutecision et du rappel en fonction desressources trouveacutees par rapport agrave lensemble des ressources disponibles (creacuteditimage Datamok UserWalber) 15

22 Vue densemble du fonctionnement dun systegraveme de recommandation sensible auxseacutequences (source [Quadrana et al 2018]) 25

23 Scheacutema repreacutesentant linteraction entre un agent et lenvironnement dans lequel ileacutevolue [Russell and Norvig 2016] 32

24 Simulation de boids ougrave lon peut voir les agents se deacuteplaccedilant dans la mecircme di-rection agrave une certaine distance les uns des autres dans un environnement simuleacute[Reynolds 1987] 35

25 Illustration dun chemin creacuteeacute par des fourmis appartenant agrave lespegravece des fourmisleacutegionnaires (creacutedit photo Mehmet Karatay) 36

26 Exemple de descente de gradient ougrave lon peut voir lexploration au deacutebut avec undeacuteplacement rapide puis lexploitation ensuite vers la solution trouveacutee ( creacuteditimage Joris Gillis 41

27 Illustration de lexpeacuterience des ponts binaires par Jean-Louis Deneubourg (a)Apregraves un certain temps les fourmis choisissent majoritairement une des deuxvoies possibles (b) [Deneubourg et al 1990] 41

28 Scheacutema du dispositif expeacuterimental utiliseacute pour veacuterier si les fourmis sont biencapables demprunter rapidement la voie la plus courte lorsque leur sont preacutesenteacutesdes choix qualitativement dieacuterents [Goss et al 1989] 42

29 Front de Pareto dun problegraveme de minimisation de deux variables f1 et f2 Toutesles solutions sur cette frontiegravere sont optimales (source Wikipedia) 48

31 Graphe repreacutesentant leacutevolution exponentielle du nombre darecirctes selon le nombrede sommets existants dans un graphe complet 57

32 Graphe repreacutesentant leacutevolution lineacuteaire du nombre darecirctes selon le nombre desommets voulus dans un graphe creacuteeacute avec dieacuterentes valeurs de d 60

41 Diagramme de ux repreacutesentant le deacuteroulement de lalgorithme ACS proposeacute par[Schlunz 2011] 76

42 Deux exemples de congurations expeacuterimentales dieacuterentes permettant chacune detester la capaciteacute des fourmis agrave trouver le plus court chemin dans un evironnement[Goss et al 1989] 77

43 Illustration de lexpeacuterience des ponts binaires par Jean-Louis Deneubourg (a)Apregraves un certain temps les fourmis choisissent majoritairement une des deuxvoies possibles (b) [Deneubourg et al 1990] 78

vii

Table des gures

44 Repreacutesentation graphique de lExpeacuterimentation 11 meneacutee sur le modegravele ACS gracircceagrave la bibliothegraveque Java GraphStream Le ndivideud repreacutesenteacute par un carreacute rouge cor-respond au deacutepart le ndivideud repreacutesenteacute par un carreacute bleu repreacutesente larriveacutee lesndivideuds ronds noirs repreacutesentent des points de passage possible les nombres noirsaccoleacutes aux arecirctes repreacutesentent la distance pour parcourir larecircte les nombresviolets repreacutesentent le taux de pheacuteromones deacuteposeacutees sur larecircte 79

45 Reacutesultats obtenus apregraves 30 iteacuterations sur lExpeacuterimentation 11 Agrave gauche laconguration nale du graphe agrave droite le pourcentage dagents fourmis ayantemprunteacutes les deux chemins 80

46 Reacutesultats obtenus apregraves 30 iteacuterations sur lExpeacuterimentation 12 Comme les agentsse basent principalement sur lheuristique qui est partout eacutegale ils oscillent entreles deux chemins sans en privileacutegier un 81

47 Reacutesultats obtenus apregraves 30 iteacuterations sur lExpeacuterimentation 13 Les agents ex-ploitent ici les arecirctes ayant le plus de pheacuteromones Tregraves rapidement tous les agentsutilisent le mecircme chemin 82

48 Conguration nale du graphe pour lExpeacuterimentation 2 apregraves 30 iteacuterations Lesagents ont en majoriteacute bien seacutelectionneacute le chemin le plus court lt 0 1 3 4 9 gt 82

49 Exemple de graphe de lExpeacuterimentation 3 agrave la n des 50 iteacuterations Ces graphessont geacuteneacutereacutes aleacuteatoirement 83

410 Exemple de deacutetection de sessions dans la base de donneacutees Lheure agrave laquelleest lanceacutee chaque musique (ici en bas dans le scheacutema) ainsi que sa dureacutee sontenregistreacutees Si lutilisateur ne relance pas de musique pendant 15 minutes apregravesla n de sa derniegravere eacutecoute alors la session en cours est termineacutee et une nouvellesession est commenceacutee agrave la prochaine musique lanceacutee 87

411 Inuence du nombre dagents et diteacuterations sur la preacutecision moyenne obtenue parnotre modegravele 100

viii

Chapitre 1

Introduction

11 Introduction

Les systegravemes de recommandation existent depuis maintenant plus de deux deacutecennies[Resnick et al 1994] et ont pris leur essor avec la deacutemocratisation dInternet et de laccegraves agravelinformation Le but dun systegraveme de recommandation est comme son nom lindique de recom-mander des ressources agrave lutilisateur pour laiguiller parmi la masse dinformations disponibles Leterme de ressource peut faire reacutefeacuterence agrave un produit une information un lm une musique etcCes ressources doivent correspondre agrave ce quattend lutilisateur pour reacutepondre agrave ses attentesLagrave ougrave dautres meacutethodes daide agrave lutilisateur comme les moteurs de recherche proposerontune liste de sites Internet relatifs agrave une question geacuteneacuterale (ex la requecircte lms super-heacuterosreacutesultera en une liste des lms de super-heacuteros les plus connus etou reacutecents) un systegraveme derecommandation proposera quant agrave lui une reacuteponse plus speacutecique agrave un besoin plus preacutecis (ex un systegraveme recommandera agrave un utilisateur de voir le dernier lm de super-heacuteros du studio Marvelcar ce dernier a appreacutecieacute tous les lms reacutealiseacutes par ce studio speacutecique ces derniegraveres anneacutees) Uneautre speacuteciciteacute majeure des systegravemes de recommandation reacuteside dans le fait que ces derniersreacutepondent agrave un besoin de lutilisateur qui naura pas forceacutement eacuteteacute exprimeacute en amont par cedernier Contrairement aux moteurs de recherche qui se contentent de reacutepondre agrave une requecircte delutilisateur les systegravemes de recommandation proposent quant agrave eux des informations de maniegraverepro-active au moment le plus opportun Un des deacutes majeurs des systegravemes de recommandationen plus de proposer des recommandations au bon moment est de reacuteussir agrave modeacuteliser ce quelutilisateur souhaite reacuteellement alors que les seules donneacutees disponibles proviennent des traceslaisseacutees par les utilisateurs lors des preacuteceacutedentes interactions avec le systegraveme (consultation depages achat de produits visionnage de lms etc) Les systegravemes de recommandation apportentune reacuteelle plus-value par rapport agrave dautres meacutethodes (comme les moteurs de recherche) carlaide proposeacutee se veut tregraves personnaliseacutee selon les preacutefeacuterences de chaque utilisateur Cet objectifde personnalisation entraicircne cependant une complexication du problegraveme car il est neacutecessaire dedeacutenir et de prendre en compte les facteurs humains sous-jacents agrave la satisfaction de lutilisateurlors de la recherche dinformation Nous allons maintenant nous inteacuteresser plus particuliegraverementaux dieacuterentes techniques employeacutees par les systegravemes de recommandation

Les systegravemes de recommandation existent depuis plus de deux deacutecennies et mecircme si les tech-niques ont eacutevolueacute le principe fondamental reste le mecircme identier les besoins et les preacutefeacuterencesdun utilisateur pour lui proposer des ressources adapteacutees Pour ce faire la premiegravere eacutetape estde reacutecolter des informations agrave propos de lutilisateur dans le but didentier ses preacutefeacuterences

1

Chapitre 1 Introduction

Les informations reacutecolteacutees sont deacutependantes du domaine dans lequel est deacuteployeacute le systegraveme derecommandation Sur un site de-commerce le systegraveme pourra par exemple utiliser les produitsconsulteacutes par lutilisateur ainsi que les eacuteventuelles notes sur les produits quil a acheteacute Un sitedeacutecoute de musique exploitera quant agrave lui les titres eacutecouteacutes par lutilisateur ainsi que son com-portement durant leacutecoute (est-ce quil a eacutecouteacute le titre jusquau bout etc)

Durant ces deux deacutecennies dexistence les systegravemes de recommandation ont changeacute pouraccompagner leacutevolution des usages dInternet Les premiegraveres geacuteneacuterations de systegravemes eacutetaientnaturellement adapteacutees aux ressources peu nombreuses et complexes typiques du deacutebut de legraveredInternet Cest agrave cette eacutepoque que les deux grandes cateacutegories de systegravemes de recommandationse sont dieacuterencieacutees agrave savoir le ltrage collaboratif [Resnick et al 1994] et le ltrage par contenu[Belkin and Croft 1992] Dans le ltrage collaboratif les preacutefeacuterences des utilisateurs du systegravemesont utiliseacutees (eg pour un site de recommandation de lms les notes donneacutees par les utilisa-teurs du site sur les lms quils ont vu) Ainsi le systegraveme proposera agrave lutilisateur souhaitant desrecommandations les ressources appreacutecieacutees des autres utilisateurs qui lui sont similaires suivantlhypothegravese selon laquelle les preacutefeacuterences dun ensemble dutilisateurs similaires sont coheacuterentesentre elles Dans le ltrage par contenu les caracteacuteristiques des ressources sont utiliseacutees (egpour un site de recommandation de lms genre acteurs anneacutee de sortie ) Ainsi le systegravemeproposera agrave lutilisateur les ressources similaires agrave celles quil a appreacutecieacutees preacuteceacutedemment Pen-dant longtemps ces deux techniques ont eacuteteacute eacutevalueacutees sur la mesure de preacutecision Pour calculercette mesure les preacutedictions du systegraveme de recommandation sont directement confronteacutees auxdonneacutees reacuteelles recueillies avec de vrais utilisateurs Par exemple un systegraveme calcule quun uti-lisateur pourrait donner agrave un lm une note de 4 sur 5 indiquant quil pourrait eectivementappreacutecier ce lm et quil serait inteacuteressant de lui recommander Cette note calculeacutee de 45 estensuite compareacutee avec la note reacuteelle que cet utilisateur a donneacute agrave ce lm speacutecique note quiavait auparavant eacuteteacute cacheacutee au systegraveme de recommandation pendant les calculs Plus la note preacute-dite et la note reacuteelle sont proches et plus le systegraveme va ecirctre jugeacute preacutecis [Konstan et al 1998]Cette preacutecision peut se mesurer via dieacuterentes meacutetriques comme par exemple lerreur moyenneabsolue qui calcule la deacuteviation entre ce qua preacutedit le systegraveme et les preacutefeacuterences reacuteelles de luti-lisateur [Sammut and Webb 2010] Cette meacutethode bien quintuitive a tendance agrave enfermer lesutilisateurs dans leurs preacutefeacuterences deacutejagrave eacutetablies puisque cest preacuteciseacutement de cette maniegravere queles performances du systegraveme sont jugeacutees Ainsi dans le cas du ltrage par contenu si lutilisateuravait appreacutecieacute par le passeacute un type de ressources particulier le systegraveme tendait agrave lui recomman-der plus de ressources de ce type

Un autre problegraveme provenant de leacutevolution des usages peut ecirctre souleveacute ici Agrave lorigineles systegravemes de recommandation se concentraient dans quelques domaines particuliers commepar exemple les lms ou les produits de sites commerciaux Les recommandations eacutetaient alorspreacutesenteacutees agrave lutilisateur sous forme de ressources uniques ou de liste de ressources similairesCette maniegravere de preacutesenter les recommandations est encore tregraves courante aujourdhui alors queles usages ont eacutevolueacute et que les systegravemes de recommandation sont preacutesents dans un nombre deplus en plus grand de domaines ougrave recevoir une liste de ressources nest pas forceacutement adapteacutePour conclure sur cette partie il est clair que les systegravemes de recommandation ont eacutevolueacute depuisleur creacuteation Cependant des problegravemes demeurent quant agrave leacutevaluation de leurs performances etla satisfaction de lutilisateur nal ainsi que pour la preacutesentation des reacutesultats agrave lutilisateur nal

Prenons maintenant deux exemples qui vont servir agrave illustrer ce propos dans le chapitre Lepremier exemple se concentre sur le problegraveme de leacutevaluation par la preacutecision dans le domaine de

2

11 Introduction

le-commerce Consideacuterons un utilisateur qui consulte depuis quelques temps des appareils photo-graphiques sur un site de vente en ligne Le systegraveme de recommandation deacutetecte ce comportementet calcule les produits les plus similaires disponibles sur le site agrave savoir dautres appareils pho-tographiques Apregraves secirctre deacutecideacute lutilisateur achegravete son appareil et satisfait le reccediloit chez luiquelques jours plus tard Lors de ses prochaines connexions au site de vente en ligne le sys-tegraveme de recommandation proposera encore agrave lutilisateur des appareils photographiques car cesont eectivement toujours ces produits qui correspondent le plus agrave ses preacutefeacuterences mecircme silutilisateur nen a maintenant plus besoin Ce premier exemple montre le problegraveme relatif agrave lasur-utilisation de la preacutecision comme mesure de la performance Si les premiegraveres recommanda-tions baseacutees sur la preacutecision pouvaient ecirctre utiles pour lutilisateur on voit bien quune fois lachateectueacute cette mesure nest plus adapteacutee Des recommandations sur des nouveaux produits pour-raient par exemple ici se reacuteveacuteler inteacuteressantes pour lutilisateur Une autre ameacutelioration possiblepourrait ecirctre la prise en compte de la temporaliteacute Des recommandations dappareils photogra-phiques pourraient ecirctre utiles agrave lutilisateur mais peut-ecirctre dans plusieurs mois ou anneacutees et nonpas directement apregraves son achatOn voit bien ici que le systegraveme de recommandation ne peut passe contenter de la seule mesure de preacutecision et pourrait beacuteneacutecier de lutilisation dautres mesures

Prenons maintenant un deuxiegraveme exemple dans le domaine de le-education pour illustrer lesproblegravemes que peut apporter la preacutesentation des recommandations sous forme de liste agrave lutili-sateur nal Un utilisateur sest inscrit reacutecemment sur un site proposant des cours en ligne caril souhaite apprendre la programmation en Java Il consulte ainsi un cours sur les bases de laprogrammation en Java et le termine avec succegraves Le systegraveme de recommandation du site calculeun certain nombre de ressources eacuteducatives similaires au cours quil vient de suivre et les pro-pose sous forme de liste Lutilisateur se voit donc proposer en tecircte de liste dautres cours pourdeacutebutants en Java ainsi que quelques cours pour deacutebutants dans dautres langages de program-mation dans le reste de la liste Lutilisateur aurait davantage proteacute dune recommandation deplusieurs ressources eacuteducatives sadaptant agrave son niveau et proposant une augmentation de ladiculteacute pour quil poursuive son apprentissage illustrant linteacuterecirct de ne pas uniquement pro-poser des recommandations sous forme de liste On remarque une nouvelle fois que la prise encompte dautres mesures auraient ameacutelioreacute la qualiteacute des recommandations temporaliteacute priseen compte du niveau de lutilisateur diversiteacute des cours proposeacutes etc

Ces deux exemples mettent en exergue la complexiteacute du domaine de la recommandation tantles besoins des utilisateurs peuvent ecirctre varieacutes et complexes agrave satisfaire La satisfaction de lutili-sateur nal est lobjectif central de tout systegraveme de recommandation tout en eacutetant un problegravemeouvert et complexe En eet la satisfaction dun utilisateur nest pas binaire mais continue (unutilisateur nest pas soit satisfait soit non satisfait mais sera plutocirct satisfait de la recommanda-tion agrave un certain degreacute) Nous proposons donc ici daborder ce problegraveme sous un autre angle comment ameacuteliorer la qualiteacute des recommandations fournies agrave lutilisateur dans le but dobtenirde lutilisateur nal une plus haute satisfaction Les deux exemples ci-dessus illustrent leetpotentiellement neacutefaste de proposer des recommandations innaproprieacutees cest-agrave-dire qui ne sa-tisfont pas les besoins de lutilisateur au moment ougrave celui-ci les reccediloit En eet un utilisateur agravequi lon propose de maniegravere reacutecurrente des recommandations innaproprieacutees sera de plus en plusmeacuteant quant agrave la capaciteacute du systegraveme de produire des recommandations adapteacutees agrave ses besoinsau moment t De la mecircme maniegravere un mauvais systegraveme de recommandation ne sera pas utileagrave lutilisateur pour satisfaire ses besoins Il a eacuteteacute prouveacute que ces deux notions de conance etdutiliteacute diminuent chez lutilisateur face agrave un systegraveme de recommandation ne les satisfaisant pas[Benbasat and Wang 2005] Agrave terme ce genre de recommandations peut amener lutilisateur agrave

3

Chapitre 1 Introduction

ne plus utiliser le systegraveme sil ne perccediloit pas la valeur ajouteacutee de celui-ci Les exemples preacuteceacute-dents donnent aussi quelques pistes sur la maniegravere dameacuteliorer la qualiteacute des recommandationsEn eet on peut remarquer que mecircme si les propositions eacutetaient satisfaisantes du point de vueinterne du systegraveme elles ne leacutetaient pas du point de vue externe de lutilisateur Cette contra-diction peut sexpliquer par le fait que le systegraveme ne prend simplement pas assez en compte lesfacteurs deacuteterminant les besoins de lutilisateur Un systegraveme reacuteussissant agrave mieux modeacuteliser unutilisateur et prenant en compte les facteurs les plus importants pour ce dernier dans le processusde recommandation permettrait de mieux satisfaire ses besoins La probleacutematique scientiqueprincipale de cette thegravese peut donc se formuler ainsi

SP0 Comment ameacuteliorer la qualiteacute des recommandations faites aux utili-sateurs

Sinteacuteresser agrave la qualiteacute des recommandations implique de sinteacuteresser agrave leacutevaluation de cesderniegraveres Dans la prochaine section nous deacutetaillerons les deacutes et enjeux de cette probleacutematiqueet son lien avec leacutevaluation puis nous deacutenirons plusieurs sous-probleacutematiques permettant dyapporter des reacuteponses

12 Preacuteambule

Lameacutelioration de la qualiteacute des recommandations des utilisateurs est un vaste sujet auquelil est possible de reacutepondre de multiples faccedilons Il est dabord neacutecessaire de se demander ce quesignie ameacuteliorer la qualiteacute dans cette question Nous avons vu jusquagrave maintenant quun sys-tegraveme de recommandation mesure classiquement la qualiteacute de ses reacutesultats selon une meacutetrique lapreacutecision Cependant la satisfaction de lutilisateur nest pas forceacutement en accord avec cette me-sure comme cela a eacuteteacute illustreacute dans lexemple des appareils photographiques ougrave malgreacute un scorede preacutecision potentiellement tregraves haut lutilisateur peut ne pas ecirctre satisfait des propositionsdu systegraveme La satisfaction de lutilisateur nal peut ecirctre eacutevalueacutee de deux maniegraveres dieacuterentesPremiegraverement elle peut ecirctre mesureacutee directement via un systegraveme deacutevaluation des recommanda-tions ougrave lon demande par exemple agrave lutilisateur de noter la recommandation qui vient de luiecirctre proposeacutee Deuxiegravemement elle peut ecirctre mesureacutee indirectement en observant le comporte-ment de lutilisateur apregraves lui avoir fourni la recommandation [Shani and Gunawardana 2011]Si ce dernier consulte ou consomme la ressource recommandeacutee plutocirct quune autre il est raison-nable de faire lhypothegravese quil est satisfait par cette recommandation cest ce quon appellele taux dacception des recommandations dun systegraveme par rapport agrave un utilisateur Ces deuxmeacutethodes deacutevaluation permettent davoir une ideacutee de la correacutelation entre les meacutetriques internesdu systegraveme et la satisfaction reacuteelle de lutilisateur Il est plus simple de se baser sur des me-sures internes pour eacutevaluer un systegraveme comme la preacutecision plutocirct que sur des mesures externescomme par exemple la satisfaction reacuteelle de lutilisateur eacutetant donneacute que celle-ci demande demettre le systegraveme en ligne et de leacutevaluer apregraves un certain temps dutilisation Leacutevaluation surles seules performances du systegraveme est appeleacutee eacutevaluation hors ligne tandis que leacutevaluation enconditions reacuteelles est appeleacutee eacutevaluation en ligne [Shani and Gunawardana 2011] Leacutevaluationhors ligne mecircme si potentiellement moins apte agrave juger de la satisfaction de lutilisateur oretout de mecircme de nombreux avantages Elle permet premiegraverement de reacutealiser des expeacuteriencesrapidement et agrave bas coucircts eacutetant donneacute quil ny a pas besoin dattendre que les utilisateurs seservent du systegraveme Elle permet ensuite dutiliser des bases de donneacutees deacutejagrave creacuteeacutees permettantaux chercheurs de se concentrer uniquement sur la conception du systegraveme de recommandation(comme par exemple la tregraves connue base de donneacutees MovieLens qui rassemble un grand nombre

4

12 Preacuteambule

deacutevaluations de lms par des utilisateurs sous la forme de notes [Resnick et al 1994]) Ennelle permet de comparer les performances de dieacuterentes techniques de maniegravere objective en lesappliquant agrave un mecircme jeu de donneacutees Autrement dit leacutevaluation en ligne permet dobtenirdes reacutesultats provenant directement dutilisateurs dans un contexte reacuteel mais est tregraves couteuseen temps et en ressource Leacutevaluation hors ligne est quant agrave elle peu couteuse en temps et enressources et permet de reacutealiser autant dexpeacuterimentations que neacutecessaire Dans le contexte decette thegravese ougrave la question de la qualiteacute des recommandations est centrale ces deux meacutethodesdeacutevaluations possegravedent chacune des avantages et des inconveacutenients et seront discuteacutees dans lechapitre deacutedieacutee aux expeacuterimentations du manuscrit

Lameacutelioration de la qualiteacute des recommandations est un point crucial de nos jours tant lessystegravemes de recommandation sont omnipreacutesents dans notre monde Presque tous les grands sitescommerciaux sont deacutesormais doteacutes dun systegraveme de ce genre dans le but de garder lutilisateurplus longtemps sur leur site (Youtube 1 Deezer 2 Netix 3) de le satisfaire pour quil revienne agraveson prochain achat voire mecircme de susciter chez lui de nouvelles envies gracircce agrave la caracteacuteristiquede ces systegravemes decirctre force de proposition (Amazon 4) Les entreprises commerciales ne sontpas les seules agrave exploiter le potentiel des systegravemes de recommandations Les eacutecoles et universiteacutescommencent elles aussi agrave se doter de systegravemes de recommandation permettant aux eacutetudiants desauto-former en utilisant les vastes ressources eacuteducatives mises agrave disposition par celles-ci [Drachs-ler et al 2015] [Boyer et al 2015] De la mecircme maniegravere le domaine de lheacuteritage culturel etdu tourisme seacutequipe petit agrave petit dapplications smartphone permettant aux touristes perdusdevant les possibiliteacutes oertes par certains lieux de culture une aide automatiseacutee et personnaliseacutee[Borragraves et al 2014]

Devant lexplosion de la populariteacute des systegravemes de recommandation devant la complexiteacutegrandissante des ressources agrave recommander et devant laugmentation du nombre dutilisateurs deces systegravemes un constat a eacuteteacute fait proposer constamment des ressources similaires par rapportaux preacutefeacuterences de lutilisateur nest plus susant [McNee et al 2006] De nouvelles eacutetudes etexpeacuterimentations ont montreacute que proposer des recommandations selon dautres modaliteacutes que lapreacutecision pouvait ecirctre beacuteneacuteque Citons ici la mesure de diversiteacute qui a eacuteteacute deacutenie par [Smythand McClave 2001] comme eacutetant linverse de la similariteacute entre deux ressources Ainsi plus deuxressources sont similaires entre elles et moins elles seront diverses et vice versa Proposer desrecommandations plus diversieacutees permet deacuteviter aux utilisateurs de recevoir toujours les mecircmesrecommandations similaires agrave leurs preacutefeacuterences ou encore daugmenter le nombre des ressourcespouvant ecirctre recommandeacutees agrave un utilisateur (cette proportion entre ressources existantes et res-sources pouvant ecirctre recommandeacutees est appeleacutee la couverture dun systegraveme) Citons aussi lamesure de nouveauteacute qui fait quant agrave elle reacutefeacuterence agrave une ressource qui na jamais eacuteteacute vue parlutilisateur [Castells et al 2015] La nouveauteacute permet de remplir un des buts principaux dunsystegraveme de recommandation agrave savoir faire deacutecouvrir agrave lutilisateur des ressources quil nauraitpeut-ecirctre pas trouveacutees sans le systegraveme Il est cependant important de preacuteciser que lapport deces mesures dans les systegravemes de recommandation est aussi discuteacute Par exemple [Ekstrandet al 2014] ont montreacute que si la diversiteacute eacutetait correacuteleacutee positivement avec la satisfaction desutilisateurs ce neacutetait pas le cas de la nouveauteacute Les auteurs expliquent que cette correacutelationneacutegative pourrait ecirctre due au fait quun systegraveme proposant beaucoup de ressources nouvelles sans

1 https wwwyoutubecom2 https wwwdeezercom3 https wwwnetixcom4 https wwwamazoncom

5

Chapitre 1 Introduction

lien avec les preacutefeacuterences de lutilisateur serait mal vu par ce dernier Les auteurs suggegraverent ainside ne pas inteacutegrer de ressources issues de la meacutetrique de nouveauteacute aux nouveaux utilisateurspour leur laisser le temps davoir conance dans le systegraveme avant eacuteventuellement dinteacutegrer dela nouveauteacute dans les recommandations agrave mesure que lutilisateur shabitue au systegraveme

Il apparaicirct donc important dinclure plusieurs critegraveres dans le calcul les recommandationstout en eacutequilibrant ces dieacuterentes recommandations selon lutilisateur Cependant cet eacutequilibreest loin decirctre eacutevident agrave trouver alors que les informations disponibles sur les ressources et les uti-lisateurs sont souvent limiteacutees et que certaines de ces meacutetriques semblent opposeacutees les unes auxautres comme par exemple la similariteacute et la diversiteacute De plus cet eacutequilibre est non seulementameneacute agrave changer selon chaque utilisateur mais il peut aussi varier selon les attentes dun mecircmeutilisateur Ce dernier souhaitera par exemple deacutecouvrir les ressources les plus populaires dansun premier temps apregraves secirctre inscrit sur un site Apregraves avoir consulteacute ces ressources ce mecircmeutilisateur souhaitera peut-ecirctre deacutecouvrir des ressources moins populaires ou plus reacutecentes Il estdonc important de pouvoir modier limportance de chacun de ces facteurs agrave tout moment lorsde la recommandation

Reprenons maintenant le premier exemple de lintroduction sur les appareils photographiquesen proposant cette fois-ci une solution gracircce aux dieacuterentes meacutetriques expliciteacutees ci-dessus Unutilisateur arrive sur un site de vente en ligne et commence agrave consulter du mateacuteriel photogra-phique Le systegraveme neacutetant pas encore certain du but de lutilisateur ses recommandations sontrelativement diverses Apregraves un certain temps lutilisateur qui a aneacute ses recherches sur desappareils photographiques se voit proposer dautres types dappareils similaires agrave celui quil esten train de consulter dans le but de lui faire deacutecouvrir des alternatives possibles Le systegravemedeacutetecte nalement que lutilisateur est sur le point de se deacutecider Il propose alors une liste derecommandations plus diverses permettant agrave lutilisateur deectuer un dernier tour dhorizongeacuteneacuteral avant lachat et de conrmer son choix [Castagnos et al 2010] Apregraves secirctre deacutecideacute aveclaide du systegraveme lutilisateur achegravete son appareil Lors de ses prochaines connexions sur le sitede vente en ligne le systegraveme de recommandation ne proposera peu ou plus dappareils photo-graphiques Agrave la place lutilisateur se verra recommander du mateacuteriel photographique dont ilpourrait maintenant avoir lutiliteacute comme un eacutetui de protection ou encore dieacuterents objectifsLe systegraveme lui recommandera aussi de nouveaux produits quil na encore jamais consulteacute dansle but de lui faire deacutecouvrir la grande varieacuteteacute des produits vendus par le site comme par exempledu mateacuteriel informatique On peut voir ici linteacuterecirct dinteacutegrer de nouveaux facteurs comme ladiversiteacute dans la recommandation La variation du niveau de diversiteacute au cours du temps et enfonction du contexte permet dans cet exemple dameacuteliorer la qualiteacute de la recommandationnale en sadaptant plus nement aux besoins de lutilisateur et en laidant agrave des moments cleacutescomme juste avant ou apregraves son achat Lajout dun facteur comme la diversiteacute permet de plusdeacuteviter la scleacuterose des recommandations passeacute un certain temps cest-agrave-dire la recommandationdes mecircmes ressources en boucle agrave un utilisateur Ce pheacutenomegravene se produit ineacutevitablement dansun systegraveme baseacute uniquement sur la preacutecision ougrave les ressources recommandeacutees nissent toutes parecirctre deacutejagrave connues de lutilisateur ou trop similaires agrave ses goucircts Ce problegraveme peut en fait ecirctreconsideacutereacute comme du sur-apprentissage dans le sens ougrave le systegraveme est tellement speacutecialiseacute sur lespreacutefeacuterences de lutilisateur que quelques ressources obtiennent un tregraves haut score de preacutecisionet sont recommandeacutees en permanence Lintroduction de nouveaux facteurs permettant dautresmaniegraveres de calculer des recommandations ainsi que des variations dimportance entre ces fac-teurs au cours du temps peuvent reacuteduire ce problegraveme

6

12 Preacuteambule

De cet exemple la premiegravere probleacutematique scientique permettant de reacutepondre agrave la questiongeacuteneacuterale poseacutee agrave la n de lintroduction peut ecirctre deacutenie comme suit

SP1 Quels sont les facteurs agrave prendre en compte pour satisfaire les uti-lisateurs et comment adapter leur importance au cas par cas pour chaqueutilisateur

Comme nous lavons eacutevoqueacute preacuteceacutedemment les systegravemes de recommandation se sont gran-dement deacutemocratiseacutes et existent deacutesormais dans la plupart des domaines ougrave se trouvent denombreuses ressources mises agrave disposition de nombreux utilisateurs et ce quelque soit le typede ces ressources Classiquement un systegraveme de recommandation va calculer par divers moyensles ressources que lutilisateur pourraient le plus appreacutecier Le reacutesultat de cette opeacuteration est biensouvent une valeur reacuteelle dutiliteacute ou dinteacuterecirct comprise dans lintervalle [0 1] associeacutee agrave chaqueressource ougrave 1 correspond agrave la preacutediction selon laquelle lutilisateur devrait tregraves fortement appreacute-cier la ressource en question et inversement Ainsi les n ressources ayant les plus hautes valeurssont recommandeacutees agrave lutilisateur Certains domaines comme le-commerce se satisfont tregraves biende recommandations proposeacutees de cette maniegravere sous forme de listes Cependant dautres do-maines comme le-eacuteducation ou le tourisme beacuteneacutecieraient de recommandations proposeacutees auxutilisateurs sous la forme dune seacutequence Nous deacutenissons ici une seacutequence comme une suiteordonneacutee de ressources posseacutedant un deacutebut une n un but et eacuteventuellement une ou plusieurscontrainte(s) agrave respecter lors de sa creacuteation Cette deacutenition implique entre autres de deacutenir ceque signie la notion dordre dans la seacutequence Un ordre correspond agrave un agencement particulierde ressources permettant datteindre le but rechercheacute de maniegravere optimiseacutee Reprenons main-tenant le deuxiegraveme exemple de lintroduction sur le site de-eacuteducation en ajoutant cette fois-cila notion de seacutequence an dillustrer son inteacuterecirct Un utilisateur sest inscrit reacutecemment sur unsite proposant des cours en ligne car il souhaite apprendre la programmation en Java Cepen-dant et avant de commencer le site lui propose de fournir quelques informations sur son objectifeacuteducatif Ainsi lutilisateur explicite lobjectif quil souhaite atteindre (apprendre les bases deJava) ainsi que le temps dont il dispose (exprimeacute par exemple ici sous la forme dun nombre nde ressources eacuteducatives voulues pour atteindre lobjectif) Avec ces informations le systegraveme derecommandation du site va calculer parmi toutes les ressources eacuteducatives disponibles lesquellescorrespondent aux besoins de lutilisateur Le niveau de diculteacute de ces ressources seacutelectionneacuteesest ensuite calculeacute par le systegraveme gracircce agrave leurs caracteacuteristiques Enn le systegraveme construit uneseacutequence de taille n ougrave la place de chaque ressource eacuteducative deacutepend de son niveau de diculteacutede maniegravere agrave ce que lutilisateur deacutebute avec la ressource la moins complexe puis progresse avecdes ressources abordant des notions de plus en plus avanceacutees La seacutequence creacuteeacutee va donc luipermettre datteindre son objectif gracircce agrave des cours agrave la diculteacute croissante tout en respectantla contrainte de temps imposeacutee

Avec cet exemple nous pouvons maintenant expliciter les deuxiegraveme et troisiegraveme probleacutema-tiques scientiques

SP2 Connaissant les facteurs humains agrave prendre en compte (SP1) com-ment passer dune recommandation unitaire agrave une seacutequence de recomman-dations

7

Chapitre 1 Introduction

SP3 Connaissant les facteurs humains agrave prendre en compte (SP1) com-ment les combiner dans un mecircme modegravele permettant de faire varier leurimportance les uns par rapport aux autres agrave tout moment

Le domaine de la recommandation est en plein essor et mecircme si des problegravemes subsistentencore actuellement des solutions existent pour y reacutepondre comme lont illustreacute les exemples ci-dessus La compreacutehension des besoins des utilisateurs la prise en consideacuteration de la dimensiontemporelle et dobjectifs multiples et parfois antagonistes dans le processus de recommandationsont deacutesormais les objectifs principaux du domaine de la recommandation et cest au sein dece mouvement que cette thegravese sinscrit De plus les nouveaux domaines applicatifs souvrantagrave la recommandation (eg le-eacuteducation le tourisme ) sont agrave la fois une chance et un deacute une chance car il devient possible dassister lutilisateur dans un panel de plus en plus grand desituations un deacute dans le sens ougrave les modegraveles doivent ecirctre assez geacuteneacuteriques pour sadapter agravecette grande varieacuteteacute de situations possibles Une derniegravere probleacutematique scientique est toutefoisneacutecessaire dans le cadre de cette thegravese pour compleacuteter ce tour dhorizon Il est en eet neacutecessairede pouvoir quantier agrave quel point SP1 et SP2 ameacuteliorent la qualiteacute des recommandations Nousavons vu dans les exemples preacuteceacutedents que cette qualiteacute neacutetait pas une notion simple agrave mesurermais il est pourtant neacutecessaire de satteler agrave ce problegraveme pour quantier les performances dunmodegravele La 3egraveme et derniegravere probleacutematique de cette thegravese peut donc ecirctre exprimeacutee ainsi

SP4 Comment eacutevaluer les seacutequences produites en SP2 et SP3

Leacutevaluation des recommandations est au cdivideur des nouveaux deacutes eacutevoqueacutes preacuteceacutedemment Ledomaine de la recommandation est intimement lieacute agrave lecirctre humain et il est important de ne plusuniquement se concentrer sur une seule mesure comme la preacutecision Lecirctre humain est complexedans ses besoins et leacutevaluation des recommandations doit reeacuteter cette complexiteacute

13 Contributions

Dans cette thegravese une reacuteponse agrave eacuteteacute apporteacutee agrave chacune des probleacutematiques scientiques eacutenon-ceacutees ci-dessus Ces contributions scientique ont fait lobjet de trois publications

Workshop international SMAP 5 Walk the line Toward an ecient user model

for recommendations in museums [Osche et al 2016] Confeacuterence internationale ECIR 6 AntRS Recommending lists through a multi-

objective ant colony system [Osche et al 2019a] Workshop international ALA 7 organiseacute avec la confeacuterence internationale AAMAS 8

From Music to Museum Applications of Multi-Objective Ant Colony Sys-

tems to Real World Problems [Osche et al 2019b]

Dans la suite de cette section un aperccedilu plus en deacutetail des reacuteponses apporteacutees aux probleacute-matique scientique est donneacute

5 SMAP International Workshop on Semantic Media Adaptation and Personalization

6 ECIR European Conference on Information Retrieval http ecir2019org7 ALA Adaptive and Learning Agents

8 AAMAS International Conference on Autonomous Agents and Multiagent Systems

8

13 Contributions

131 SP1 les facteurs agrave prendre en compte pour satisfaire les utilisateurs

Pour reacutepondre agrave la premiegravere probleacutematique scientique SP1 nous avons seacutelectionneacute un en-semble de quatre critegraveres deacutevaluation repreacutesentant au mieux les besoins de lutilisateur Cescritegraveres ont eacuteteacute choisis car ils apparaissent dans la litteacuterature scientique comme eacutetant lieacutes agravela satisfaction nale de lutilisateur Ils repreacutesentent un panel inteacuteressant de facteurs humainsimportants pour les utilisateurs mais il est important de noter que ce choix nest pas exhaustifComme nous lavons mentionneacute le nombre de facteurs humains rentrant en compte dans la prisede deacutecision est potentiellement inni et varie en fonction de lutilisateur Nous avons donc choisices quatre critegraveres car ils sont les plus eacutetudieacutes dans la litteacuterature mais le but de cette thegravese estde pouvoir inteacutegrer de nouveaux critegraveres de faire varier leur importance si neacutecessaire et de lestraiter comme un problegraveme doptimisation multi-critegraveres Ces quatre critegraveres nous permettentde nous situer par rapport aux travaux existants de la litteacuterature tout en eacutetablissant un modegravelegeacuteneacuterique capable de sadapter agrave de multiples besoins Voici ces quatre critegraveres

1 La similariteacute garantissant agrave lutilisateur des recommandations similaires aux ressourcesquil appreacutecie deacutejagrave

2 La diversiteacute permettant dorir de la varieacuteteacute dans les recommandations

3 La nouveauteacute proposant agrave lutilisateur des ressources quil ne connaicirct et quil nauraitpeut-ecirctre jamais trouveacute lui-mecircme

4 Les preacutefeacuterences orant agrave lutilisateur la possibiliteacute de revoir les ressources quil a deacutejagraveaimeacute par le passeacute

132 SP2 la conception de seacutequences de recommandations en accord avec

les facteurs seacutelectionneacutes

La notion de seacutequence est centrale pour comprendre son inteacuterecirct dans le paysage actuel dessystegravemes de recommandation ainsi que pour ecirctre capable den geacuteneacuterer Dans ce travail nousavons proposeacute une meacutethode permettant de garantir des transitions optimales entre ressourcesau sein dune seacutequence Nous avons ensuite mis en pratique ces contributions dans un jeu dedonneacutees existant provenant de Deezer un site deacutecoute de musique en ligne Ce jeu de donneacuteescorrespond agrave un mois deacutecoutes de titres par plusieurs milliers dutilisateurs et possegravede desinformations sur les titres ainsi que sur les utilisateurs Gracircce agrave ce jeu de donneacutees nous avonspu extraire des seacutequences deacutecoutes et nous avons utiliseacute ces seacutequences reacuteelles comme eacutevaluationpour notre systegraveme Nous avons enn creacuteeacute un modegravele permettant de geacuteneacuterer des seacutequences de lataille voulue posseacutedant un point de deacutepart et darriveacutee deacutenis

133 SP3 et SP4 la creacuteation dun modegravele geacuteneacuterique prenant en compte

plusieurs meacutetriques et produisant des seacutequences

Apregraves avoir deacuteni les meacutetriques agrave utiliser la maniegravere de les calculer et apregraves avoir deacuteni lanotion de seacutequence et la maniegravere de les construire nous avons deacuteveloppeacute un modegravele reacuteunissantlensemble de ces caracteacuteristiques Pour cela nous nous sommes inspireacutes de solutions deacuteveloppeacuteespendant des millions danneacutees par la seacutelection naturelle pour reacutesoudre des problegravemes dexplora-tion et doptimisation de chemins dans la nature Il existe en eet tout un domaine de recherchedeacutedieacute agrave la modeacutelisation informatique de systegravemes vivants complexes et agrave lapplication de cesmodegraveles agrave des problegravemes complexes humains les Systegravemes Multi-Agents [Ferber and Weiss1999] Nous avons utiliseacute lun de ces systegravemes inspireacute des colonies de fourmis pour reacutepondre agrave

9

Chapitre 1 Introduction

notre probleacutematique [Dorigo et al 1996] [Dorigo et al 2006] Dans la nature il a eacuteteacute observeacute queles fourmis empruntaient la plupart du temps le plus court chemin possible entre leur fourmiliegravereet une source de nourriture Une fourmi prise seacutepareacutement na pas des capaciteacutes cognitives tregravesdeacuteveloppeacutees avec ses quelques centaines de milliers de neurones seulement Cependant linter-action entre toutes les fourmis de la fourmiliegravere produit ce quon appelle un eet deacutemergenceLinteraction danimaux simples (ou dagents si lon parle dun systegraveme informatique) provoqueleacutemergence dune intelligence collective capable de reacutesoudre des problegravemes dont la complexiteacute deacute-passe la somme des capaciteacutes des individus [Bonabeau et al 1999] Cest bien ce pheacutenomegravene quiest agrave ldivideuvre lors de loptimisation de la distance dun chemin par toutes les fourmis dune four-miliegravere Nous reviendrons plus en deacutetail sur lensemble des meacutecanismes permettant leacutemergencede cette intelligence collective dans ce manuscrit An de reacutepondre agrave notre probleacutematique nousavons deacuteveloppeacute un modegravele ougrave une multitude dagents tregraves simples (correspondant aux fourmis)sont deacuteployeacutes dans un graphe ougrave les sommets repreacutesentent les ressources dun domaine applicatifet ougrave les arecirctes repreacutesentent les liens entre ces ressources (correspondant agrave lenvironnement agraveparcourir pour les fourmis) An dinteacutegrer les quatre meacutetriques discuteacutees ci-dessus nous avonscreacuteeacute dieacuterentes colonies posseacutedant chacune leurs agents speacutecialiseacutes dans loptimisation dune desmeacutetriques De par le pheacutenomegravene dintelligence collective les agents produisent des seacutequencesoptimiseacutees dans le graphe pouvant ecirctre recommandeacutees agrave lutilisateur Cette approche apporteainsi des solutions aux problegravemes souleveacutes par les probleacutematiques scientiques sus-mentionneacutes

Nous sommes capables de prendre en compte les dieacuterentes meacutetriques expliciteacutees dans unseul et mecircme modegravele De plus nous produisons des solutions repreacutesentant un compromisentre des objectifs parfois divergents entre eux (similariteacute et diversiteacute)

Dans la nature les fourmis creacuteent un chemin entre leur fourmiliegravere et la source de nourri-ture Nous utilisons cette aptitude inheacuterente an de creacuteer des seacutequences entre une ressourcede deacutepart (la fourmiliegravere) et une ressource darriveacutee (la nourriture)

Ladaptation aux changements de lenvironnement est rapide (nouvel utilisateur nouvelleressource suppression dune ressource etc) De la mecircme maniegravere que dans la nature lesfourmis sont capables de retrouver un autre chemin optimiseacute si le premier venait agrave ecirctrebloqueacute par une branche venant de tomber par exemple

Notre modegravele est souple car il permet de modier le poids de chaque meacutetrique dans laseacutequence nale permettant de sadapter agrave chaque utilisateur

Il est possible dajouter ou denlever des colonies agrave la voleacutee dans le systegraveme permettantde sadapter rapidement agrave dieacuterents domaines applicatifs et agrave dieacuterents objectifs

14 Plan de la thegravese

La suite de ce manuscrit se preacutesente ainsi dans le chapitre 2 nous preacutesenterons les travaux dela litteacuterature portant sur les dieacuterents facteurs humains utiliseacutes dans les systegravemes de recomman-dation les approches existantes de recommandations en seacutequences et les systegravemes multi-agentsDans le chapitre 3 nous preacutesenterons notre modegravele et son fonctionnement en deacutetail Ensuitenous preacutesenterons les reacutesultats obtenus par ce modegravele dans le domaine applicatif de leacutecoute demusique en ligne dans le chapitre 4 Enn nous conclurons et discuterons des perspectives de cetravail dans le chapitre 5

10

Chapitre 2

Eacutetat de lart

Sommaire

21 Les systegravemes de recommandation 12

211 Le ltrage par contenu 12

212 Le ltrage collaboratif 13

213 Les actions des utilisateurs 13

214 Discussion et limites des systegravemes classiques 14

22 Les facteurs humains agrave prendre en compte dans la recommandation 15

221 La similariteacute 17

222 La diversiteacute 19

223 La nouveauteacute 20

224 Discussion 21

23 La recommandation en seacutequence 22

231 Deacutenition et geacuteneacuteraliteacutes sur les seacutequences 22

232 Domaines dapplication des modegraveles seacutequentiels 26

233 Discussion 30

24 Les systegravemes multi-agents 31

241 Deacutenition 31

242 Preacutesentation de deux systegravemes multi-agents reacuteactifs 33

243 Ant Colony System 38

244 Discussion sur le modegravele ACS 40

25 Utilisation et eacutevolution reacutecentes des algorithmes de colonies de four-

mis 43

251 Les algorithmes de colonies de fourmis dans les systegravemes de recomman-

dation 43

252 Les algorithmes de colonies de fourmis multi-objectifs 47

253 Discussion sur lutilisation de loptimum de Pareto 50

26 Discussion geacuteneacuterale 50

11

Chapitre 2 Eacutetat de lart

Dans cet eacutetat de lart nous allons tout dabord nous pencher sur le fonctionnement dessystegravemes de recommandation classiques ainsi que sur leurs limites Nous allons ensuite eacutetudierquelques reacuteponses agrave ces limites proposeacutees par la litteacuterature et discuter des ameacuteliorations possibles

21 Les systegravemes de recommandation

Les systegravemes de recommandation ont pour but principal de proposer aux utilisateurs desressources adapteacutees agrave leurs attentes Une ressource peut ecirctre un document une page web unemusique un lm un livre un objet un cours etc Pour eectuer une recommandation une hy-pothegravese simple a eacuteteacute exploiteacutee par les premiers systegravemes les preacutefeacuterences passeacutees dun utilisateurpeuvent ecirctre utiliseacutees pour preacutedire les preacutefeacuterences futures de ce mecircme utilisateur Cette hypothegravesesest deacuteclineacutee dans les deux approches principales des systegravemes de recommandation que sont leltrage par contenu [Belkin and Croft 1992 Lops et al 2011] et le ltrage collaboratif [Resnicket al 1994] La principale dieacuterence entre ces deux approches repose sur lexploitation de dieacute-rents types des donneacutees le ltrage par contenu utilise les informations descriptives caracteacuterisantles utilisateurs et les ressources du systegraveme tandis que le ltrage collaboratif exploite uniquementles interactions entre utilisateurs et ressources comme les consultations ou les votes [Aggarwalet al 2016] Ces deux familles ont par la suite donneacute naissance a de nombreuses techniquesque nous naborderons pas ici Toutes peuvent cependant ecirctre rapporteacutees agrave lune ou lautre deces familles ou agrave une combinaison des deux Dans la suite de cette section nous reviendronsrapidement sur ces deux familles qui ont marqueacute les deacutebuts des systegravemes de recommandationet qui regroupent agrave elles seules un grand nombre darticles de la litteacuterature du domaine Cetteintroduction aux systegravemes de recommandation servira aussi agrave preacutesenter quelques concepts-cleacuteslieacutes agrave ces systegravemes

211 Le ltrage par contenu

Le ltrage par contenu est une des deux approches majeures dans les systegravemes de recomman-dation [Belkin and Croft 1992 Lops et al 2011] Le but dun systegraveme de ltrage par contenu estde proposer des recommandations agrave lutilisateur uniquement en fonction des caracteacuteristiques desressources appreacutecieacutees Ce genre de systegraveme va donc enregistrer les actions de lutilisateur sur lesressources quil a consulteacutees dans le but de trouver dautres ressources quil pourrait appreacutecierCette meacutethode de fonctionnement implique deux principes

1 Le systegraveme doit pouvoir enregistrer les actions de lutilisateur dans le systegraveme 9 Le sys-tegraveme doit ensuite pouvoir interpreacuteter ces dieacuterentes actions an decirctre capable deacutevalueragrave quel point un utilisateur appreacutecie la ressource sur laquelle il a eectueacute des actions Nousdiscuterons de ces actions et des maniegraveres de les interpreacuteter plus en deacutetail dans la suitede cette section

2 Le systegraveme doit pouvoir comparer des ressources entre elles an de deacuteterminer lesquellespourraient ecirctre appreacutecieacutees par lutilisateur en fonction de son historique de consultationsPour reacutealiser cela il est neacutecessaire que les ressources soient deacutecrites par ce que lon appelledes meacuteta-donneacutees cest-agrave-dire des donneacutees deacutecrivant dautres donneacutees ou comme ici desdonneacutees deacutecrivant des ressources Il est dusage de deacutenir ou dutiliser des standards pour

9 Des exemples dactions possibles consulter une ressource donner une note agrave une ressource acheter uneressource bannir une ressource pour ne plus la voir placer une ressource dans ses favoris etc

12

21 Les systegravemes de recommandation

les meacuteta-donneacutees an de deacutecrire toutes les ressources de la mecircme maniegravere et eacuteventuelle-ment de pouvoir partager ou utiliser des bases de donneacutees utilisant les mecircmes standardsOn peut par exemple citer le Learning Object Metadata qui est un standard utiliseacute ene-eacuteducation pour deacutecrire des ressources eacuteducatives [RISK 2002] Des domaines commele web seacutemantique ou les systegravemes agrave base dontologie ont comme but de structurer cesdonneacutees descriptives lorsquelles ne le sont initialement pas

Le ltrage par contenu a lavantage de pouvoir fournir des recommandations agrave un utilisateurmecircme sil est le seul agrave utiliser le systegraveme tant que ce dernier possegravede des informations sur lesressources consulteacutees Cependant la qualiteacute des recommandations deacutependra directement de laqualiteacute de ces informations Si les actions de lutilisateur ou les descriptions de ressources sontinsusantes un systegraveme de ltrage par contenu ne sera pas capable de proposer de recommanda-tions de grande qualiteacute Une autre limite majeure de ce genre de systegraveme reacuteside dans le manquede nouveauteacute En eet apregraves un certain temps les recommandations proposeacutees par le systegravemeont un risque de scleacuterose provoqueacute par un manque de nouvelles informations dans le systegraveme

212 Le ltrage collaboratif

La deuxiegraveme approche majeure des systegravemes de recommandation est donc le ltrage colla-boratif [Resnick et al 1994] Cette technique utilise les preacutefeacuterences des autres utilisateurs dusystegraveme sur les ressources pour estimer les preacutefeacuterences de lutilisateur Lhypothegravese sous-jacentea cette meacutethode est quil est possible de preacutedire les preacutefeacuterences dun utilisateur en eacutetudiant ce quedautres utilisateurs similaires en termes de preacutefeacuterences ont aimeacute Si beaucoup de ces utilisateurssimilaires ont appreacutecieacute une ressource alors il est probable que lutilisateur appreacutecie aussi cetteressource Cette meacutethode repose ici aussi sur deux principes

1 Comme pour le ltrage par contenu il faut dabord pouvoir collecter les actions de nom-breux utilisateurs sur les ressources du systegraveme an den deacuteterminer leurs preacutefeacuterences

2 Le systegraveme doit ensuite deacuteterminer les utilisateurs les plus similaires agrave lutilisateur enterme de preacutefeacuterences avec pour but nal de lui recommander des ressources quil na pasencore consulteacute et qui sont appreacutecieacutees par ces utilisateurs similaires

Le ltrage collaboratif permet par rapport au ltrage par contenu de proposer des recom-mandations agrave lutilisateur sans forceacutement connaicirctre le contenu des ressources recommandeacutees Eneet le systegraveme ne manipule que des preacutefeacuterences geacuteneacuterales souvent repreacutesenteacutees numeacuteriquementpar une note associeacutee agrave une ressource et agrave un utilisateur En dautres termes le ltrage col-laboratif sinteacuteresse agrave lusage qui est fait des ressources et non aux ressources en elles-mecircmesUne fois ces preacutefeacuterences eacutetablies ce genre de systegraveme peut donc sadapter agrave des domaines ougraveles ressources sont dieacuterentes Cependant il est aussi neacutecessaire davoir agrave disposition un grandnombre dutilisateurs ainsi que leurs preacutefeacuterences an de pouvoir utiliser ce genre de systegravemecorrectement

213 Les actions des utilisateurs

Comme nous lavons deacutecrit plus haut peu importe le type de systegraveme de recommandationutiliseacute il est neacutecessaire de reacutecolter les actions des utilisateurs an dobtenir une eacutevaluation desressources quils ont consulteacutees Cette eacutevaluation prend la plupart du temps la forme dune noter entiegravere variant de 1 agrave 5 ou dune valeur continue r isin [0 1] ougrave dans les deux cas une preacutefeacuterence

13

Chapitre 2 Eacutetat de lart

marqueacutee correspond agrave une valeur haute et inversement Dune maniegravere geacuteneacuterale on nommeretours les informations reacutecupeacutereacutees par un systegraveme sur un utilisateur permettant daboutir agravecette note Dans les systegravemes de recommandation on peut distinguer deux types de retours le retour explicite et le retour implicite Le retour explicite est le plus simple des deux puisquilcorrespond agrave la situation ougrave lutilisateur fournit naturellement de lui-mecircme la note associeacutee agrave uneressource quil a consulteacutee Cette maniegravere de proceacuteder est courante dans le-commerce ou dansle divertissement ougrave les utilisateurs peuvent geacuteneacuteralement noter de 1 agrave 5 le produit quils ontacheteacute ou encore le lm quils ont vu Cette meacutethode permet dacceacuteder agrave leacutevaluation reacuteelle delutilisateur et agrave ses preacutefeacuterences orant de maniegravere directe des donneacutees de haute qualiteacute [Korenet al 2009] Agrave linverse le retour implicite repreacutesente les traces laisseacutees par lutilisateur lors desa preacutesence dans le systegraveme Ces traces ne sont pas directement des eacutevaluations ou des notes maisrepreacutesentent bien les dieacuterentes possibiliteacutes dactions quore un systegraveme agrave ses utilisateurs Cesactions diegraverent donc selon le domaine dapplication du systegraveme Pour un site web de-commerceles actions pourront ecirctre la consultation dune page la consultation dune che produit la misedun produit dans le panier ou encore lachat dun produit Pour un site web deacutecoute de musiqueles actions pourront ecirctre leacutecoute dune musique en entier larrecirct de leacutecoute dune musique avantla n la consultation de la page dun artiste etc On voit bien ici que les actions possiblessont deacutependantes du domaine mais aussi que toutes les actions nont pas la mecircme importanceni la mecircme signication On peut en eet supposer quun utilisateur appreacuteciera davantage unproduit sil lachegravete que sil consulte seulement sa page On retrouve cette distinction dans [Oardet al 1998] ougrave les auteurs deacutenissent trois cateacutegories permettant de grouper les actions de mecircmeimportance ensemble (1 consultation de la ressource 2 conservation de la ressource 3 partagede la ressource) On peut aussi citer [Castagnos 2008] qui dune maniegravere plus geacuteneacuterale proposeune meacutethode permettant de calculer linteacuterecirct preacutesumeacute dun utilisateur pour une ressource selonles types dactions eectueacutees par lutilisateur et leurs importances respectives An de conclurecette section il est important de preacuteciser que mecircme si le retour explicite semble plus deacutesirablepour les systegravemes de recommandation il a eacuteteacute montreacute que ces deux types de retours apportentdes informations dieacuterentes et quil peut justement ecirctre inteacuteressant de les prendre tous les deuxen compte [Jawaheer et al 2010]

214 Discussion et limites des systegravemes classiques

Dans les deux approches de recommandation preacutesenteacutees ci-dessus le problegraveme et la solutionsont fondamentalement les mecircmes Le problegraveme peut se formuler ainsi comment estimer linteacuterecirctr qua un utilisateur u sur une ressource i encore non consulteacutee en se basant sur les connaissancesincomplegravetes repreacutesenteacutees par le prol de lutilisateur u Le prol de lutilisateur est incompletcar les informations sur ses preacutefeacuterences proviennent uniquement des interactions que ce dernier aeu avec le systegraveme Autrement dit il nest pas possible de connaicirctre les facteurs ayant abouti auxactions de lutilisateur puisque ces derniegraveres sont le fruit des meacutecanismes de raisonnement internede lutilisateur Il nest par exemple pas possible de savoir reacuteellement pourquoi un utilisateur adonneacute la note de 5 sur 5 agrave un lm Est-ce parce quil considegravere que cest le meilleur lm quil a vude sa vie et quil aimerait deacutecouvrir plus de lms de ce genre Ou bien est-ce parce que cest unlm quil a vu dans un contexte particulier et que mecircme sil la beaucoup aimeacute il ne souhaiteraitpas revoir des lms similaires aujourdhui Il existe ainsi probablement une multitude de facteursjouant dans les actions que nous eectuons et il nest pas possible de tous les appreacutehender Devantce constat la solution adopteacutee par les deux approches est la mecircme se baser sur les preacutefeacuterencesconnues de lutilisateur pour extrapoler ses preacutefeacuterences futures potentielles Cependant et commenous lavons vu dans lexemple de lintroduction sur les appareils photo il est aiseacute de concevoir

14

22 Les facteurs humains agrave prendre en compte dans la recommandation

des situations ougrave les preacutefeacuterences et actions passeacutees dun utilisateur ne sont pas forceacutement lesmeilleurs indicateurs de ses besoins actuels ou futurs

22 Les facteurs humains agrave prendre en compte dans la recom-

mandation

Comme nous lavons vu dans la section preacuteceacutedente la performance des premiers systegravemes derecommandation a eacuteteacute mesureacutee avec les outils du domaine de la recherche dinformation Parmiceux-ci on peut citer la preacutecision et le rappel qui sont deux mesures permettant de jauger la per-tinence des ressources seacutelectionneacutees en les comparant avec lensemble des ressources disponiblesLa Figure 21 preacutesente bien la maniegravere dont ces deux mesures sont calculeacutees 10

Figure 21 Preacutesentation scheacutematiseacutee du calcul de la preacutecision et du rappel en fonction desressources trouveacutees par rapport agrave lensemble des ressources disponibles (creacutedit image Datamok UserWalber)

Plusieurs raisons peuvent expliquer pourquoi les systegravemes de recommandations ont initiale-ment emprunteacute des techniques venant de la recherche dinformation et en voici trois parmi lesplus eacutevidentes Premiegraverement les systegravemes de recommandation sont agrave la croiseacutee de plusieurs

10 httpsfrwikipediaorgwikiPreacutecision_et_rappel

15

Chapitre 2 Eacutetat de lart

disciplines parmi lesquelles entre autres la recherche dinformation [Adomavicius and Tuzhilin2005] Ce domaine a beaucoup utiliseacute et utilise toujours les mesures de preacutecision et de rappel[Salton 1989] il est donc naturel que les premiers systegravemes de recommandation aient utiliseacuteces mesures de performance Deuxiegravemement tregraves tocirct dans le domaine des systegravemes de recom-mandation des corpus de donneacutees ont eacuteteacute mis agrave disposition de tous tel que MovieLens 11 gracircceagrave GroupLens [Resnick et al 1994] Ces corpus de donneacutees ont beaucoup aideacute le domaine enpermettant agrave tous les chercheurs de mesurer la performance de leurs algorithmes en les com-parant avec les reacutesultats obtenus par dautres eacutetudes de la litteacuterature sur les mecircmes donneacuteesLa populariteacute toujours haute du corpus MovieLens depuis maintenant 25 ans illustre linteacuterecirctscientique de partager des donneacutees initiales Cependant lutilisation principale des meacutetriquesde preacutecision pour eacutevaluer la performance des premiers systegravemes de recommandation a meacutecani-quement pousseacute les autres auteurs voulant comparer leurs algorithmes agrave utiliser eux aussi cesmecircmes meacutetriques rareacuteant potentiellement le travail sur dautres meacutetriques Troisiegravemement lemesure de la performance des algorithmes en fonction de la preacutecision megravene forceacutement agrave la creacutea-tion dalgorithmes de plus en plus performants dans ce domaine Les chercheurs sont en eet plusenclins agrave deacutevelopper des algorithmes optimisant la mesure de preacutecision si la performance de lamajoriteacute des algorithmes existants est mesureacutee via cette meacutetrique Ce point mecircme sil est lieacute aupreacuteceacutedent nest pas agrave neacutegliger et explique en partie la concentration des premiers systegravemes surla meacutetrique de preacutecision La recherche dans le domaine de linformatique est compeacutetitive et lesrevues scientiques accepteront plus facilement de publier un article montrant quun algorithmeobtient de meilleures performances sur une meacutetrique bien connue plutocirct quune eacutetude reposantsur dautres meacutetriques moins communes

Apregraves ces explications donnant quelques raisons systeacutemiques de lutilisation de la preacutecisioncomme mesure deacutevaluation il est neacutecessaire de nuancer ce constat La preacutecision a beaucoup eacuteteacuteutiliseacutee car avant toute chose elle est au cdivideur des systegravemes de recommandation et doit doncecirctre consideacutereacutee par tous ces systegravemes Le but de lutilisation de la preacutecision est dobtenir desrecommandations proches de ce que lutilisateur a deacutejagrave consulteacute et donc appreacutecie deacutejagrave Il est im-portant de preacuteciser aussi ici que malgreacute les critiques faites dans le paragraphe preacuteceacutedent sur cettemesure il est indispensable de la conserver et de lutiliser lors du processus de recommandationUn utilisateur souhaite avant tout se voir proposer des ressources pertinentes et il convient pourun systegraveme dutiliser la preacutecision pour arriver agrave cet objectif Il est cependant neacutecessaire de ne pasuniquement consideacuterer la preacutecision pour produire de bonnes recommandations et nous allons levoir dans la suite de cette section

Nous venons de voir quelques-unes des raisons de lomnipreacutesence de leacutevaluation par la preacuteci-sion au deacutebut des systegravemes de recommandation Nous allons maintenant eacutetudier les conseacutequencesque la sur-utilisation de la preacutecision a pu avoir sur les utilisateurs en se basant agrave la fois sur lalitteacuterature et sur des constatations empiriques Pour comprendre les limites de cette meacutetrique ilest tout dabord neacutecessaire de sinteacuteresser agrave ce que repreacutesente une recommandation preacutecise pourlutilisateur nal Nous lavons vu preacuteceacutedemment plus un modegravele sapproche des preacutefeacuterences deacutejagraveconnues dun utilisateur et plus il obtiendra de bonnes performances dans les meacutetriques mesurantla preacutecision Dans la pratique cela se traduit par le systegraveme proposant agrave lutilisateur nal desressources souvent deacutejagrave connues de celui-ci ou a minima des ressources tregraves proches de ce quilaime deacutejagrave [McNee et al 2006] Un utilisateur dun site de recommandation de lms indiquantquil a aimeacute le premier lm Star Wars se verra probablement recommander une liste de tous les

11 httpsgrouplensorgdatasetsmovielens

16

22 Les facteurs humains agrave prendre en compte dans la recommandation

lms Star Wars suivants Intuitivement on voit bien que ces recommandations ne seront proba-blement pas satisfaisantes pour lutilisateur bien queacutetant les plus preacutecises possibles par rapportagrave ses preacutefeacuterences Ces lms sont anciens connus et il ny a donc que tregraves peu de chances pour quelutilisateur nen ait pas deacutejagrave connaissance On peut imaginer que lutilisateur aurait souhaiteacuteque le systegraveme lui propose des lms de science-ction ou de guerre spatiale reacutecents ou du moinsquil ne connaissait pas encore Plus que de ne pas ecirctre utiles ce genre de recommandations peutmecircme deacutegrader linteacuterecirct et la conance que lutilisateur porte au systegraveme En eet un utilisa-teur recevant beaucoup de recommandations inutiles ou deacutejagrave connues de la part dun systegravemenira par ne plus lui accorder de limportance Cet argument peut ecirctre rapprocheacute du TechnologyAcceptance Model de Fred Davis sur la maniegravere dont les utilisateurs appreacutehendent une technolo-gie [Davis 1989] et notamment sur la notion dutiliteacute perccedilue qui fait reacutefeacuterence agrave la tendancequont les personnes agrave utiliser une technologie si cela leur permet de reacutealiser plus ecacementleur tacircche en cours (comme par exemple trouver un bon lm ou deacutecouvrir une nouvelle musique)Pour conclure il semble eacutevident que de nouvelles maniegraveres de concevoir et deacutevaluer les systegravemesde recommandation sont neacutecessaires Dans la suite de cette section nous allons voir commentlinteacutegration de facteurs humains suppleacutementaires dans le processus de recommandation et lamise en place de nouvelles maniegraveres deacutevaluer la qualiteacute des recommandations nales doiventpermettre de palier les problegravemes eacutevoqueacutes preacuteceacutedemment

221 La similariteacute

Comme nous lavons vu dans la section preacuteceacutedente limportance de la similariteacute dans lessystegravemes de recommandation est eacutevidente tant ces derniers ont longtemps eu comme but principalde proposer des ressources proches autrement dit similaires de ce quappreacuteciait deacutejagrave lutilisateurNous avons vu que la preacutecision a beaucoup eacuteteacute utiliseacutee pour eacutevaluer ces systegravemes mais il eacutetaitaussi neacutecessaire de deacuteterminer agrave quel point des ressources etou des utilisateurs eacutetaient prochesles uns des autres En eet les approches les plus utiliseacutees comme le ltrage collaboratif ou leltrage par contenu neacutecessitent souvent de deacuteterminer un ensemble dutilisateurs ou un ensemblede ressources proches des goucircts de lutilisateur Pour ce faire ces systegravemes vont utiliser desmeacutetriques permettant de juger la similariteacute de deux variables entre elles On retrouve parmi cesmeacutetriques le coecient de correacutelation de Pearson qui calcule la correacutelation lineacuteaire r entre deuxvariables agrave laide de leur covariance Cette correacutelation peut ecirctre appliqueacutee agrave des prols utilisateurs[Shardanand and Maes 1995] posseacutedant des eacutevaluations communes sur des ressources LEacutequation21 deacutecrit son calcul pour deux prols utilisateurs ux et uy

ruxuy =

sumn1 (uxi minus ux)times (uyi minus uy)radicsumn

1 (uxi minus ux)2 timessumn

1 (uyi minus uy)2(21)

ougrave n est le nombre de co-consultations des deux prols utilisateurs ux et uy uxi est une noteindividuelle du prol de lutilisateur ux et ux est la moyenne des notes dans le prol ux Classi-quement les eacutevaluations des ressources co-consulteacutees sont consideacutereacutees pour calculer la correacutelationde Pearson dont la valeur r isin [minus1 1] ougrave une valeur proche de 1 signie une correacutelation posi-tive entre les utilisateurs (autrement dit une forte similariteacute entre les deux) minus1 une correacutelationneacutegative (autrement dit une forte dissimilariteacute entre les deux utilisateurs) et 0 une absence decorreacutelation lineacuteaire entre les deux prols 12

12 Une valeur de correacutelation de Pearson r = 0 signie uniquement une absence de correacutelation lineacuteaire entre lesdeux variables eacutetudieacutees Il est cependant possible quune correacutelation non lineacuteaire existe entre ces deux variables

17

Chapitre 2 Eacutetat de lart

On peut aussi citer la tregraves utiliseacutee similariteacute cosinus permettant de calculer langle formeacute pardeux vecteurs Cette ideacutee a dabord eacuteteacute proposeacutee dans le domaine de la recherche dinformationan de comparer deux documents repreacutesenteacutes sous forme de vecteurs doccurrences de mots[Salton and McGill 1986] Cette mesure a ensuite eacuteteacute adapteacutee pour le ltrage collaboratif enremplacant les documents par les utilisateurs les mots par les ressources et les occurrences parles votes [Breese et al 2013] 13 Le calcul de la similariteacute cosinus est preacutesenteacute dans lEacutequation22

Cosine_Similarity(u1 u2) =

sumu1u2radicsumu21radicsum

u22(22)

ougrave comme pour le coecient de correacutelation de Pearson on considegravere uniquement les eacuteva-luations des ressources co-consulteacutees par les deux utilisateurs dans le calcul Beaucoup dautresmesures de similariteacute existent dans le cadre de la comparaison de deux variables entre elles etchacune possegravede des avantages et des inconveacutenients Lensemble de ces mesures ont cependantpour point commun de mesurer la similariteacute entre deux ressources uniquement et on peut tou-tefois apporter quelques critiques agrave ce genre de mesures En eet [McNee et al 2006] critiquejustement le fait que les mesures classiques calculent geacuteneacuteralement la preacutecision de chaque res-source recommandeacutee une par une Cependant limmense majoriteacute des recommandations sontproposeacutees via des listes agrave lutilisateur et non via une seule ressource On peut le voir chez tousles grands sites utilisant un systegraveme de recommandation tels que Netix 14 Youtube 15 Ama-zon 16 Deezer etc Cette maniegravere de calculer la preacutecision ressource par ressource peut provoquerleacutemergence de listes de recommandations posseacutedant des ressources toutes similaires entre ellesLe site de recommandation de lms proposant agrave un utilisateur la liste de tous les lms Star Warssoure de ce problegraveme Toutes ces recommandations sont preacutecises et similaires par rapport auxpreacutefeacuterences de lutilisateur mais les meacutetriques classiques ne donnent aucune indication sur ledegreacute de similariteacute de ces recommandations entre elles dans la liste proposeacutee agrave lutilisateur Unemaniegravere de mitiger ce problegraveme est de calculer la similariteacute non plus ressource par ressourcemais pour la liste entiegravere La similariteacute intra-liste permet justement de calculer agrave quel point lesressources dune liste sont similaires entre elles [Ziegler et al 2005] La similariteacute de chaque pairede ressources est calculeacutee et la moyenne est ensuite calculeacutee pour obtenir agrave une valeur uniquemesurant agrave quel point la liste dans son ensemble possegravede des ressources similaires entre elles

ILS(u) =

sumijisinL

sumikisinLij 6=ik sim(ij ik)

2(23)

ougrave ILSu est la similariteacute intra-liste dun utilisateur u ij et ik sont deux ressources de laliste recommandeacutee L et sim(ij ik) est la similariteacute des deux items ij et ik similariteacute pouvantecirctre calculeacutee dieacuteremment selon la meacutethode utiliseacutee (similariteacute cosinus similariteacute de Jaccardetc) Cette maniegravere de proceacuteder est inteacuteressante car premiegraverement elle deacutenote avec les mesuresclassiques et permet de proposer une liste plus homogegravene plaisante pour lutilisateur et nonplus uniquement sur les performances pures des systegravemes Deuxiegravemement le fait de consideacutererla liste de recommandations comme un tout et non plus uniquement comme des ressourcesaligneacutees les unes agrave la suite des autres permet de se rapprocher de la notion de seacutequence dontnous allons parler dans la suite de cette section Enn larticle de [McNee et al 2006] dont

13 Il est agrave noter quune variante de la mesure de similariteacute cosine sappliquant aux ressources et non auxutilisateurs a aussi eacuteteacute deacuteveloppeacutee14 httpswwwnetixcom15 httpswwwyoutubecom16 httpswwwamazoncom

18

22 Les facteurs humains agrave prendre en compte dans la recommandation

est tireacutee cette reacuteexion marque un tournant dans le domaine des systegravemes de recommandationavec la critique de la sur-utilisation de la similariteacute et linteacutegration dautres facteurs humainsToutefois dans le contexte de cette thegravese ce constat doit ecirctre nuanceacute En eet la similariteacute a eacuteteacutela meacutetrique reine pendant plusieurs anneacutees dans le domaine de la recommandation pour mesurerla performance des modegraveles Cette omnipreacutesence a provoqueacute lessor dun nouveau pan de larecherche portant sur dautres facteurs humains et dautres meacutetriques deacutevaluation Neacuteanmoinsla similariteacute reste une meacutetrique centrale dans la mesure des performances dun algorithme etdans la qualiteacute perccedilue des recommandations des utilisateurs comme lont montreacute les multitudesdeacutetudes utilisant principalement cette meacutetrique Il est donc naturel que cette meacutetrique soitinteacutegreacute dans notre modegravele comme un objectif Notre approche se veut cependant multi-objectifset nous allons preacutesenter dans la suite de cette section les autres objectifs agrave consideacuterer

222 La diversiteacute

La diversiteacute est une des meacutetriques ayant attireacute le plus lattention de la communauteacute scien-tique des recommandations ces derniegraveres anneacutees La diversiteacute est au cdivideur du changement deparadigme du domaine et larticle de McNee amp al justement intituleacute Being accurate is not en-ough how accuracy metrics have hurt recommender systems 17 repreacutesente bien ce changement[McNee et al 2006] Dans cet article les auteurs expliquent que jusqualors la majoriteacute desrecherches seacutetaient eacutetroitement concentreacutees sur lameacutelioration de la preacutecision des systegravemes Ilssoutiennent cependant que cet eacutetat de fait a nui au domaine en nencourageant pas les recherchesallant dans dautres directions et a aussi nui aux utilisateurs car les recommandations les pluspreacutecises ne sont pas forceacutement les meilleures pour ces derniers Mecircme si ce constat a eacuteteacute fait il y aplus dune deacutecennie la preacutecision est toujours tregraves utiliseacutee dans le domaine des recommandationsPar conseacutequent il nest pas rare de trouver des eacutetudes tregraves reacutecentes se deacutemarquant encore enprocircnant lutilisation dautres mesures [Gan et al 2020]

La diversiteacute et la similariteacute sont deux mesures extrecircmement lieacutees et ont souvent eacuteteacute deacutecritesensemble La similariteacute intra-liste preacutesenteacutee dans la section preacuteceacutedente est un exemple de ce lienpuisque cette mesure permet de faire varier le taux de similariteacute ou inversement de diversiteacutedune liste de ressources Dans [Smyth and McClave 2001] les auteurs soutiennent lideacutee quelorsque plusieurs ressources sont proposeacutees il est important de mesurer agrave la fois la similariteacutede chacune de ces ressources par rapport agrave la cible (pouvant ecirctre par exemple un modegraveleutilisateur) mais aussi la diversiteacute de chacune de ces ressources entre elles Le deacute revient alorsagrave ameacuteliorer la diversiteacute des ressources entre elles sans compromettre leur similariteacute par rapport agravela cible Les auteurs deacutenissent ainsi la diversiteacute dun ensemble de ressources (i1 in) commela dissimilariteacute moyenne entre toutes les paires de ressources illustreacute dans lEacutequation 24 ougrave ladissimilariteacute est deacutenie comme eacutetant linverse de la similariteacute

Diversity(i1 in) =

sumi=1n

sumj=1n(1minus Similarity(ii ij))

n2 lowast (nminus 1)

(24)

Il existe plusieurs interpreacutetations et deacutenitions de la diversiteacute dans les systegravemes de recom-mandation mais nous nutiliserons ici que la plus reacutepandue vue ci-dessus la diversiteacute sappliqueagrave un ensemble de ressources et correspond agrave la mesure moyenne de la dissimilariteacute par rapportagrave chacune dentre elles Pour compleacutementer cette deacutenition qui permet dintroduire une valeurgeacuteneacuterale de diversiteacute pour une liste de ressources nous pouvons preacutesenter ici la notion de diversiteacute

17 Ecirctre preacutecis nest pas susant comment les mesures de preacutecision ont nui aux systegravemes de recommandation

19

Chapitre 2 Eacutetat de lart

relative RD 18 qui consiste agrave calculer lapport en diversiteacute de chaque ressource i agrave un ensemblede ressources C 19 [Smyth and McClave 2001] La RD permet dobserver les changements dansla diversiteacute de la liste au moment mecircme de sa construction agrave chaque fois que le systegraveme ajouteune nouvelle ressource agrave la liste deacutejagrave existante La maniegravere de la calculer est expliqueacutee danslEacutequation 25

RD(i C) =

0 si C = sum

i=1m(1minus Similarity(i cj))

m sinon

(25)

La diversiteacute est aujourdhui reconnue comme une mesure importante agrave prendre en comptedans les systegravemes de recommandation car permettant dameacuteliorer la satisfaction de lutilisateur[Jones 2010] Cependant il est important de savoir utiliser la diversiteacute agrave bon escient et au bonmoment Comme lexemple donneacute dans lintroduction agrave propos des appareils photos le montraitlinteacuterecirct de la diversiteacute dans la recommandation deacutepend de nombreux facteurs comme lutilisa-teur son ancienneteacute dans le systegraveme le contexte de sa visite le moment de la recommandationetc Certains travaux se sont ainsi concentreacutes sur la dimension temporelle de la diversiteacute et surlimpact que cette derniegravere avait selon le contexte de la recommandation On peut citer [Mc-Ginty and Smyth 2003] dont leurs travaux portent sur le rocircle de la diversiteacute dans les systegravemesde recommandation conversationnels 20 et sur linteacuterecirct dapporter de la diversiteacute dans ce genrede systegravemes Les auteurs ont ainsi montreacute que lajout de diversiteacute durant le processus de re-commandation eacutetait beacuteneacuteque pour lutilisateur Cependant ils ont aussi montreacute que mecircme silinteacuterecirct de la diversiteacute est indeacuteniable il nest pas forceacutement justieacute dintroduire de la diversiteacuteagrave chaque recommandation sous peine de nuire agrave lecaciteacute du systegraveme [Castagnos et al 2013]De la mecircme maniegravere on peut rappeler les travaux de [Castagnos et al 2010] prouvant quilest beacuteneacuteque pour lutilisateur de se voir proposer des recommandations diverses juste avant unachat sur un site de-commerce

223 La nouveauteacute

La nouveauteacute est un facteur humain qui sous la mecircme impulsion que la diversiteacute est ap-parue comme une reacuteponse possible au problegraveme de la sur-utilisation de la preacutecision Mecircme siles deux mesures de diversiteacute et de nouveauteacute sont lieacutees il convient de ne pas les confondreLa nouveauteacute dune ressource se deacutenit geacuteneacuteralement par rapport aux autres ressources deacutejagraveconsulteacutees par lutilisateur La notion de diversiteacute sapplique quant agrave elle agrave un ensemble deressources en deacuteterminant si elles sont diverses les unes par rapport aux autres [Castells et al2015] La nouveauteacute reacutepond de plus agrave un besoin bien speacutecique de lutilisateur En eet etcomme lexpliquent [Vargas and Castells 2011] dans la majoriteacute des sceacutenarios le but dune re-commandation est de faire deacutecouvrir agrave lutilisateur des ressources quil naurait pas deacutecouvertesautrement Les auteurs preacutecisent aussi que la nouveauteacute est une caracteacuteristique importante dansun systegraveme de recommandation car elle contribue agrave diminuer la preacutevisibiliteacute des recommanda-tions et donc agrave maintenir linteacuterecirct des utilisateurs pour le systegraveme En partant de ce principeles recommandations eacutevidentes ne sont pas forceacutement de grande utiliteacute mecircme si elles possegravedentun haut niveau de preacutecision avec les preacutefeacuterences de lutilisateur On peut illustrer ce point en

18 RD pour Relative Diversity19 C pour Class soit classeensemble de ressources20 Un systegraveme de recommandation conversationnel consiste en un systegraveme interactif qui va dialoguer avec

lutilisateur sous la forme deacutechange de propositions et de critiques de ces propositions par ce dernier [Mahmoodand Ricci 2009]

20

22 Les facteurs humains agrave prendre en compte dans la recommandation

citant le classique exemple du fan de musique rock qui apregraves avoir eacutecouteacute quelques musiquesde lalbum Dark Side of the Moon de Pink Floyd se voit recommander le reste des musiquesde lalbum En terme de preacutecision la recommandation est quasi parfaite mais lutiliteacute dunetelle recommandation peut laisser agrave deacutesirer On retrouve le mecircme constat chez [Zhang 2013] ougravelomnipreacutesence de la preacutecision et de ses mesures y est critiqueacutee Les auteurs proposent ainsi unedeacutenition de la nouveauteacute en deacutenissant les trois caracteacuteristiques quune ressource doit posseacutederpour ecirctre consideacutereacutee comme nouvelle pour un utilisateur

1 Inconnue la ressource doit ecirctre inconnue de lutilisateur

2 Satisfaisante la ressource doit ecirctre satisfaisante par rapport aux besoins de lutilisateur

3 Dissimilaire la ressource doit ecirctre dissimilaire aux autres ressources que lutilisateur ap-preacutecie

En utilisant les 3 caracteacuteristiques eacutenonceacutees ci-dessus les auteurs ont ensuite proposeacute deacutevaluerla nouveauteacute dune ressource i pour un utilisateur u comme preacutesenteacute dans lEacutequation 34

Novelty(i u) = p(i|unknown u) middot dis(i prefu) middot p(i|like u) (26)

ougrave p(i|unknown u) est la probabiliteacute que lutilisateur u ne connaisse pas la ressource idis(i prefu) est la dissimilariteacute entre i et lensemble des ressources consulteacutees par lutilisateur etp(i|like u) est la probabiliteacute que u appreacutecie i On retrouve ainsi dans cette maniegravere de mesurerla nouveauteacute les 3 caracteacuteristiques mises en avant par [Zhang 2013] pour que le score de nou-veauteacute dune ressource soit haut elle doit ecirctre pour lutilisateur agrave la fois inconnue satisfaisanteet dissimilaire avec ce quil a lhabitude de voir

De reacutecentes eacutetudes ont exploreacute plus avant le lien entre nouveauteacute et satisfaction de lutilisateurNous pouvons citer ici [Schnabel et al 2018] ougrave les auteurs ont testeacute limpact de nouvellesrecommandations par rapport agrave lexploitation des preacutefeacuterences deacutejagrave connues des utilisateurs Ilsen concluent quune petite dose de nouveauteacute permet dameacuteliorer la satisfaction de lutilisateurmais que trop de ressources nouvelles nuisent fortement agrave sa satisfaction

224 Discussion

Au travers de ces quelques exemples un changement de vision dans le domaine de la re-commandation a eacuteteacute illustreacute Dun domaine ougrave la majeure partie des eacutetudes eacutetait initialementconcentreacutee sur la maximisation dune seule meacutetrique la preacutecision [Ricci et al 2015] nous avonsvu que de plus en plus de travaux sinteacuteressaient agrave dautres maniegraveres de proposer des recomman-dations Ainsi on peut deacutesormais trouver pleacutethore deacutetudes tentant de trouver des compromisentre plusieurs des facteurs discuteacutes ci-dessus comme la preacutecision et la diversiteacute [Ziegler et al2005 LHuillier et al 2014] ou encore entre la preacutecision la seacuterendipiteacute 21 et la nouveauteacute [Ka-minskas and Bridge 2016] Ces nouvelles maniegraveres de proceacuteder ont pour but didentier lesfacteurs explicatifs de la satisfaction des utilisateurs an de les prendre en compte dans des mo-degraveles plus complexes et plus geacuteneacuteraux

Il est cependant important de noter que outre ceux citeacutes dans les sections preacuteceacutedentes denombreux autres facteurs humains ont eacuteteacute eacutetudieacutes dans la litteacuterature pour reacutepondre au problegraveme

21 La notion de seacuterendipiteacute fait reacutefeacuterence agrave lheureuse deacutecouverte soit le fait de deacutecouvrir par hasard quelquechose dinteacuteressant qui naurait potentiellement pas eacuteteacute deacutecouvert sans aide [Iaquinta et al 2008]

21

Chapitre 2 Eacutetat de lart

de la satisfaction utilisateur et de la sur-utilisation de la preacutecision On peut citer la seacuterendipiteacutela couverture le contexte la personnaliteacute de lutilisateur Nous avons fait le choix de nous ba-ser sur 4 facteurs couramment dans la litteacuterature an de tester la probleacutematique de cette thegravesesur la recommandation multi-objectifs La multitude de facteurs humains eacutetudieacutes ces derniegraveresanneacutees pour enrichir les recommandations soulignent agrave quel point il est important de nos joursde penser des modegraveles geacuteneacuteriques capables dinteacutegrer de nouveaux facteurs humains agrave la demande

Cette premiegravere grande section de leacutetat de lart a montreacute que le domaine de la recommanda-tion est passeacute dun problegraveme doptimisation mono-objectif agrave un problegraveme doptimisation multi-objectifs Un systegraveme de recommandation agrave lheure actuelle se doit de prendre en compte lesfacteurs humains tels que ceux preacutesenteacutes dans les sections preacuteceacutedentes an decirctre performant etcapable de satisfaire le plus grand nombre de type dutilisateurs dans le maximum de situationspossibles Cest dans ce contexte multi-objectif que cette thegravese se positionne Dans la deuxiegraveme etderniegravere grande section de cet eacutetat de lart nous allons preacutesenter et comparer dieacuterentes maniegraveresde proposer des recommandations agrave lutilisateur la recommandation unitaire la recommanda-tion en liste et la recommandation en seacutequences Nous allons notamment nous attarder sur leslistes et les seacutequences car elles sont les plus agrave mecircmes de fournir des recommandations complexesinteacutegrant de multiples objectifs

23 La recommandation en seacutequence

231 Deacutenition et geacuteneacuteraliteacutes sur les seacutequences

Pour comprendre linteacuterecirct des seacutequences il est neacutecessaire de sattarder sur les listes En eetdegraves les premiers systegravemes de recommandation les utilisateurs se sont la plupart du temps vuproposer soit des ressources uniques soit des listes de ressources On peut deacutenir une liste ainsi

Dans le domaine de la recommandation une liste est un ensemble de res-sources ordonneacutees selon un ou plusieurs critegraveres orant agrave lutilisateur lechoix de consulter ces ressources indeacutependamment les unes des autres

Preacutesenter une liste de recommandations a ainsi pour but de proposer les ressources ayantobtenu le score le plus haut selon un ou plusieurs critegraveres choisis par le systegraveme pour produiredes recommandations Comme nous lavons vu dans la section preacuteceacutedente un des critegraveres les plusutiliseacutes eacutetait originellement la preacutecision Lautre speacuteciciteacute dune liste est dorir agrave un utilisateurplusieurs ressources adapteacutees agrave ses preacutefeacuterences agrave un temps t Ainsi le but nest pas moins desatisfaire lobjectif agrave moyenlong terme de lutilisateur que de simplement lui proposer une listede ressources alternatives adapteacutees agrave son prochain choix Autrement dit le but dune liste derecommandations est de satisfaire les besoins dun utilisateur au temps t+ 1 (soit agrave sa prochaineaction) Le format des listes a donc souvent eacuteteacute utiliseacute car il permet agrave la fois de maximiser leschances de satisfaire lutilisateur tout en tirant parti des meacutecanismes internes de production derecommandations geacuteneacuterant la plupart du temps des listes de ressources de la plus preacutecise agrave lamoins preacutecise pour chaque utilisateur Ce mode de repreacutesentation de par sa capaciteacute agrave pro-poser des alternatives se rapproche deacutejagrave un peu plus du cadre de notre travail doptimisationmulti-critegraveres contrairement aux recommandations unitaires Il nest donc pas question ici deremettre en cause linteacuterecirct dutiliser des listes de ressources comme format de recommandationsces derniegraveres eacutetant adapteacutees agrave de nombreux domaines dapplication De tregraves populaires sites

22

23 La recommandation en seacutequence

de-commerce ou de divertissement utilisent dailleurs principalement des recommandations parlistes comme Netix Youtube ou encore Amazon Un client sur un site de-commerce pourrapar exemple ecirctre satisfait de se voir proposer par le systegraveme une liste darticles similaires agrave sesrecherches an de laider dans son choix Cependant certains domaines peuvent ne pas beacuteneacuteciervoire ecirctre desservis par ce format de recommandation On peut ici agrave nouveau rappeler lexempledirecteur de lintroduction agrave ce sujet ougrave un apprenant se voyait proposer une liste de ressourceseacuteducatives toutes similaires au cours quil avait deacutejagrave suivi sans tenir compte de sa progression nide ses objectifs De la mecircme maniegravere un visiteur dun museacutee ne sera pas forceacutement satisfait de sevoir proposer une liste de 10 divideuvres dart similaires agrave ce quil vient de voir mais potentiellementeacuteparpilleacutees dans tous le museacutee Dans ces deux exemples on devine bien que dautres maniegraveresde proposer les recommandations seraient beacuteneacuteques Cest ici que lon peut deacutenir la notion deseacutequence qui pourrait permettre de reacutepondre agrave des situations ougrave une liste de ressources nest passusante pour satisfaire lutilisateur et ougrave la composante temporelle entre en ligne de compte

Dans le domaine de la recommandation une seacutequence est une suite de res-sources permettant datteindre un ou plusieurs objectifs speacutecieacutes ou nonpar lutilisateur (eg une compeacutetence speacutecique la sortie dun museacutee unapprentissage des recommandations diverses pour un parcours eacuteclectiqueetc) Une seacutequence possegravede donc un deacutebut une n et une progression deacute-nie sous forme dun ordonnancement temporel Une seacutequence est reacutegiepar les objectifs agrave atteindre ces derniers eacutetant speacutecique au domaine et agravelutilisateur

Une seacutequence peut donc ecirctre vue comme une liste ameacutelioreacutee de ressources prenant uncompte un nombre plus grand de variables et une dimension temporelle dans le but de mieuxsatisfaire lutilisateur Nous allons ici deacutetailler la notion de progression qui est importante dansune seacutequence Le principe dune seacutequence reacuteside dans lexistence dau moins un objectif agrave at-teindre et cest ce qui la dieacuterencie dune liste Comme nous lavons vu une liste de ressourcesna pas fondamentalement dobjectif agrave atteindre si ce nest satisfaire lutilisateur agrave t + 1 en luiproposant des ressources adapteacutees De part la notion dobjectif agrave atteindre une seacutequence a pourbut de satisfaire les besoins de lutilisateur non plus agrave t + 1 mais agrave t + n Il nest donc plusquestion daider lutilisateur pour sa prochaine action mais bien daider lutilisateur agrave atteindreun objectif plus complexe qui neacutecessitera n actions ou paliers intermeacutediaires Avec ces deux deacute-nitions on se rend bien compte que les notions de liste et de seacutequence ne sont pas opposeacutees maiscompleacutementaires Certains domaines ne neacutecessitent pas forceacutement lutilisation de seacutequences carlutilisateur naura pas dobjectif agrave moyenlong terme agrave satisfaire (ex la recherche dun lmsur une plateforme de videacuteos agrave la demande) tandis que dans dautres domaines une liste serainsusante pour satisfaire lutilisateur (ex e-eacuteducation heacuteritage culturel playlist musicale)De la mecircme maniegravere il nest pas neacutecessaire de recommander des seacutequences agrave un utilisateur si cedernier na pas dobjectif agrave atteindre et souhaite simplement une aide pour sa prochaine actionet ce mecircme si le domaine dapplication est propice agrave lutilisation de seacutequences

Linteacuterecirct des seacutequences na pas eacutechappeacute aux chercheurs du domaine des systegravemes de recom-mandation qui les ont consideacutereacute comme eacutetant un moyen suppleacutementaire permettant de mieuxsatisfaire lutilisateur Cette prise de conscience sest dailleurs deacutemocratiseacutee au mecircme momentque la prise en compte des facteurs humains autre que la preacutecision dans larticle deacutejagrave citeacute preacute-ceacutedemment [McNee et al 2006] Ainsi on peut lire en 2004 dans le tregraves complet article sur

23

Chapitre 2 Eacutetat de lart

leacutevaluation des systegravemes de recommandation de [Herlocker et al 2004] une liste des tacircchesusuelles que doivent reacutealiser ces systegravemes Dans cette liste se trouve entre autres une reacuteexiondes auteurs sur la recommandation de seacutequences dans le cadre de lutilisation dun site deacutecoutede musiques en ligne

[] Cependant le deacute que repreacutesente le fait de passer dune recommandation dune seulemusique agrave une recommandation dune seacutequence de musiques satisfaisante dans son ensemblenous a intrigueacute Cette mecircme tacircche peut sappliquer agrave la recommandation darticles de recherchean dappreacutehender un domaine (lire cette introduction puis lire cette eacutetude ) Alors que ledomaine de la recherche dinformation a exploreacute le timing et les seacutequences dachat de produitsnous navons connaissance daucun systegraveme de recommandation ou de recherche sattelant direc-tement agrave la reacutesolution de cette tacircche (ie la recommandation en seacutequences)

Les auteurs expliquent donc clairement ici que la recommandation de seacutequences mecircme sielle navait pas encore eacuteteacute traiteacutee agrave leacutepoque eacutetait un point inteacuteressant agrave deacutevelopper et pouvaitsatisfaire des besoins speacuteciques comme la recommandation de musiques en ligne ou encore lac-quisition de nouvelles connaissances en ligne La premiegravere partie de leur reacuteexion qui na pas eacuteteacutetraduite ici sur les speacuteciciteacutes des recommandations musicales sera eacutetudieacutee plus en deacutetail dans lechapitre suivant Mecircme si les recommandations de ressources uniques ou de listes de ressourcessont resteacutees tregraves largement majoritaires dans le domaine quelques travaux se sont tout de mecircmeatteleacutes au problegraveme des seacutequences Il est tout dabord neacutecessaire de distinguer deux utilisationsde la notion de seacutequence dans la litteacuterature lutilisation de seacutequences deacutejagrave existantes en entreacuteedun systegraveme et la production de seacutequences en sortie dun systegraveme Dans la suite de cette sec-tion nous allons eacutetudier ces deux maniegraveres de proceacuteder ainsi que leurs avantages et inconveacutenients

Comme nous lavons vu dans la majoriteacute des cas les systegravemes de recommandation se basentsur la matrice deacutevaluations utilisateurs times ressources pour preacutedire les ressources encore nonconsulteacutees pouvant inteacuteresser lutilisateur Cependant mecircme si elle permet lapplication de nom-breuses et puissantes meacutethodes de preacutediction que nous ne deacutetaillerons pas ici 22 lutilisationdune matrice ne permet pas en leacutetat de tenir compte de lordre dans lequel les ressources onteacuteteacute consulteacutees ni de distinguer les variances agrave court ou moyen-terme des prols utilisateurs [Qua-drana et al 2018] De la mecircme maniegravere une cellule de cette matrice rui repreacutesente uniquementune eacutevaluation r dun utilisateur u sur une ressource i pouvant cacher une reacutealiteacute plus complexeougrave un utilisateur a consulteacute plusieurs fois cette ressource au cours du temps potentiellement dansdieacuterents contextes et avec une eacutevaluation dieacuterente agrave chaque fois Pour remeacutedier agrave ce problegravemedes approches agrave base de tenseurs ont eacuteteacute proposeacutees permettant dutiliser plusieurs matrices re-preacutesentant dieacuterents moments ou critegraveres dans le prol de lutilisateur [Frolov and Oseledets2017] Il est donc clair que les seacutequences de consultation contiennent des informations richespouvant ecirctre exploiteacutees dans un systegraveme de recommandation Lexploitation de lordre des res-sources dans des seacutequences nest cependant pas nouvelle et provient principalement du domainede la recherche dinformation [Agrawal et al 1995] Aujourdhui on retrouve lexploitation delordre des seacutequences dans de nombreux autres domaines comme la fouille de motifs seacutequentielsou encore la reconnaissance de la parole [Han et al 2007] Lexplosion des services proposeacutes parla deacutemocratisation dInternet et du numeacuterique en geacuteneacuteral ces derniegraveres anneacutees a ameneacute la recom-mandation agrave sadapter agrave de nombreux domaines ougrave lordre dans lequel les utilisateurs reacutealisent

22 On peut par exemple citer les techniques de factorisation de matrice qui dominent le domaine [Koren et al2009]

24

23 La recommandation en seacutequence

des actions a de limportance Ces systegravemes de recommandation portant une attention particu-liegravere aux seacutequences sont regroupeacutes sous le terme de systegravemes de recommandation sensiblesaux seacutequences (sequence-aware recommender system) [Quadrana et al 2018] Dans leur tourdhorizon du domaine les auteurs proposent une vue densemble de la maniegravere dont un systegravemede recommandation sensible aux seacutequences fonctionne agrave laide dun scheacutema en 3 parties preacutesenteacutepar la Figure 22

Figure 22 Vue densemble du fonctionnement dun systegraveme de recommandation sensible auxseacutequences (source [Quadrana et al 2018])

Dans la Figure 22 on peut donc bien distinguer 3 parties distinctes dans le fonctionnementinterne dun systegraveme de recommandation sensible aux seacutequences

1 Les entreacutees les entreacutees se caracteacuterisent par des donneacutees relatives aux actions eectueacuteespar les utilisateurs du systegraveme Ces actions doivent ecirctre classeacutees selon lordre dans lequelelles ont eacuteteacute eectueacutees par chaque utilisateur an de pouvoir exploiter toutes les infor-mations disponibles (si les actions ne sont pas reccedilues de maniegravere ordonneacutee ces derniegraveresdoivent au minimum ecirctre associeacutees agrave un timestamp agrave une date preacutecise pour pouvoir ecirctrereacute-ordonneacutees et traiteacutees dans le bon ordre par le systegraveme de recommandation)

2 Le processus de recommandation le processus de recommandation est geacuteneacuteralementdieacuterent des systegravemes de recommandation classiques utilisant des matrices 23 mais leprincipe geacuteneacuteral reste le mecircme utiliser lensemble des informations fournies par les entreacuteespour produire des recommandations adapteacutees agrave lutilisateur nal On retrouve dans cettepartie les tacircches purement lieacutees agrave la recommandation la prise en compte des facteurshumains du contexte eacuteventuellement des contraintes sil y en a etc Dans la Figure 22les auteurs distinguent 4 types de tacircches lieacutees aux systegravemes de recommandation sensiblesaux seacutequences Nous discuterons de ces 4 tacircches dans la suite de ce manuscrit lors de lapreacutesentation du modegravele et des expeacuterimentations meneacutees pour le tester

23 Mecircme si quelques modegraveles utilisant agrave la fois des seacutequences et des meacutethodes de factorisation de matrices onteacuteteacute proposeacutes ces derniegraveres anneacutees [Yu and Riedl 2012 Zhao et al 2014 Twardowski 2016 Chen and Li 2019]

25

Chapitre 2 Eacutetat de lart

3 Les sorties les auteurs distinguent ici deux types de sorties possibles Le premier typede sortie concerne dabord les listes ordonneacutees de ressources que nous avons deacutejagrave expli-citeacutees auparavant dans ce manuscrit Une liste aura pour but de proposer agrave lutilisateurun ensemble de ressources ordonneacutees de la meilleure agrave la moins bonne selon une ou plu-sieurs meacutetriques speacuteciques Une liste propose dans les faits un ensemble dalternatives dechoix possibles que le systegraveme met agrave disposition de lutilisateur an que ce dernier puissechoisir une (ou eacuteventuellement plusieurs) ressource(s) parmi toutes celles proposeacutees Cepremier type de sortie est donc identique aux systegravemes de recommandation classiques Ledeuxiegraveme type de sortie concerne les seacutequences de ressources Contrairement aux listesconsistant en un ensemble dalternatives les ressources dune seacutequence ont pour but decirctretoutes consulteacutees dans lordre donneacute par le systegraveme Lagrave ougrave pour les listes une recomman-dation consiste en une ressource pour les seacutequences une recommandation consiste en unesuite de ressources agrave consulter dans lordre proposeacute Ainsi une seacutequence peut ecirctre consi-deacutereacutee comme une unique recommandation de la mecircme maniegravere que dans une liste chaqueressource est une recommandation unique

232 Domaines dapplication des modegraveles seacutequentiels

Comme nous lavons expliqueacute auparavant il est eacutevident que certains domaines dapplicationssont adapteacutes aux systegravemes de recommandation sensibles aux seacutequences comme par exemple lamusique ou le tourisme [Nurbakova et al 2018] Inversement certains domaines semblent moinsbeacuteneacutecier de tels systegravemes Le domaine de le-commerce est un cas particulier dans le sens ougraveil a vu un grand nombre de ces systegravemes y ecirctre testeacutes quand bien mecircme il semble agrave premiegraverevue ecirctre moins adapteacutes aux seacutequences Deux raisons peuvent expliquer cet eacutetat de fait Premiegrave-rement il a statistiquement eacuteteacute prouveacute que la tregraves grande majoriteacute des clients consultant un sitede-commerce ne le font en reacutealiteacute que dans le but de trouver un seul produit speacutecique avantde quitter le site [Qiu et al 2015] Deuxiegravemement le domaine de le-commerce est geacuteneacuteralementtregraves repreacutesenteacute dans les systegravemes de recommandation [Quadrana et al 2018] potentiellement ducircaux forts inteacuterecircts nanciers et agrave lancienneteacute de lutilisation de ce domaine dapplication Dansla suite de cette section nous allons nous inteacuteresser agrave quelques exemples de systegravemes sensiblesaux seacutequences dans les domaines de la musique et du tourisme an dillustrer leacutetat du domaineainsi que les directions potentielles pour de futurs travaux

Dans le domaine musical

Le domaine de la musique est un deacuteboucheacute naturel des systegravemes de recommandation sinteacute-ressant aux seacutequences autant quand il sagit dexploiter les seacutequences creacuteeacutees par les utilisateursque lorsquil sagit den produire en sortie dun systegraveme Cet eacutetat de fait sexplique par la speacuteci-citeacute du domaine musical ougrave les utilisateurs eacutecoutent tregraves souvent plusieurs musiques les unes agravela suite des autres Ces utilisateurs produisent des seacutequences signicatives de par leurs eacutecoutes etpeuvent ecirctre demandeurs de seacutequences de musiques ou playlists adapteacutees agrave leurs preacutefeacuterences Ilnest donc pas eacutetonnant de trouver degraves le deacutebut des anneacutees 2000 dans la litteacuterature des travauxportant sur ce sujet Les travaux de leacutepoque souraient cependant dun certain nombre de pro-blegravemes comme un manque de personnalisation et dexpressiviteacute ou encore des diculteacutes pourgeacuterer le grand nombre de musiques des catalogues en ligne problegravemes qui ont par la suite eacuteteacutereacutesolus avec la production de nouveaux systegravemes et laugmentation de la puissance de calcul desmachines [Aucouturier and Pachet 2002] On peut cependant aussi trouver des eacutetudes dont le

26

23 La recommandation en seacutequence

but eacutetait dexploiter les caracteacuteristiques speacuteciques du domaine musical pour proposer des adap-tations des techniques classiques de recommandation utiliseacutees dans le-commerce [Logan 2002]Plus reacutecemment le domaine des recommandations musicales a beaucoup gagneacute en populariteacutecomme lillustre le ceacutelegravebre ACM RecSys Challenge dont leacutedition 2018 en partenariat avec Spo-tify 24 sest porteacutee sur la musique avec comme challenge de creacuteer un systegraveme capable de prolongerdes playlists deacutejagrave existantes 25 Au total plus de 100 eacutequipes ont participeacute agrave ce deacute et plus de15 articles ont eacuteteacute publieacutes Voici un court reacutesumeacute des 4 approches ayant eacuteteacute les plus performantes

[Volkovs et al 2018] ont proposeacute un modegravele en deux eacutetapes baseacute sur des meacutethodes deltrage collaboratif utilisant la factorisation de matrice (Weighted Regularized Matrix Fac-torization[Hu et al 2008]) et de renforcement de gradient (gradient boosting) La premiegravereeacutetape est optimiseacutee pour reacutecupeacuterer rapidement une liste de musiques candidates tandisque le deuxiegraveme stage reacuteordonne ces musiques en maximisant la preacutecision au deacutebut de laliste ainsi creacuteeacutee [Rubtsov et al 2018] ont proposeacute une approche relativement similaireavec un modegravele posseacutedant aussi deux eacutetapes la premiegravere utilisant des techniques de l-trage collaboratif pour seacutelectionner des candidats potentiels et la deuxiegraveme utilisant uneplaylist avec ces candidats agrave laide de techniques de renforcement de gradient

[Yang et al 2018] ont proposeacute un modegravele multimodal de ltrage collaboratif en deuxparties utilisant chacune des reacuteseaux de neurones (autoencoder pour la premiegravere partie etreacuteseau neuronal convolutif pour la deuxiegraveme partie) Le but des auteurs eacutetait de prendreen compte 3 des problegravemes les plus communs aux systegravemes de recommandation musicauxagrave savoir (1) le problegraveme du deacutemarrage agrave froid (2) les biais de populariteacute ougrave des musiquesse retrouvent soit dans la plupart des playlists soit dans tregraves peu dentre elles (3) et ennle contexte de la playlist originale (autrement dit le fait dutiliser les preacutefeacuterences agrave courtterme de lutilisateur dans la session deacutecoute en cours pour continuer du mieux possiblela playlist)

[Antenucci et al 2018] ont proposeacute une approche mecirclant agrave la fois des techniques de l-trage collaboratif et de ltrage par contenu Les preacutedictions de ces dieacuterentes techniquessont ensuite agreacutegeacutees ensemble dans le but de maximiser la qualiteacute de la recommandation

On peut remarquer que ces 4 approches ayant obtenu les 4 premiegraveres places de la compeacute-tition possegravedent des points communs et orent des perspectives inteacuteressantes sur la maniegraverede concevoir des systegravemes de recommandation performants dans ce domaine Premiegraverementon remarque que toutes ces approches sont relativement complexes et utilisent des meacutethodesvarieacutees pour la recommandation (ltrage collaboratif ltrage par contenu factorisation de ma-trice reacuteseaux neuronaux gradient boosting etc) prouvant que les systegravemes de recommandationperformants utilisent plus que jamais des techniques hybrides Deuxiegravemement chacune de ces 4approches propose un modegravele en deux parties La premiegravere partie est geacuteneacuteralement utiliseacutee pourseacutelectionner un certain nombre de candidats parmi les 22 millions de musiques disponibles quiavaient eacuteteacute mises agrave disposition et ce an de limiter lespace de recherche et donc le temps decalcul La deuxiegraveme partie consiste en la creacuteation de la playlist nale baseacutee sur les candidats deacutejagraveseacutelectionneacutes Cette partie peut potentiellement ecirctre plus complexe dun point de vue algorith-mique car lespace de recherche est beaucoup plus restreint quinitialement

Par ailleurs chacune de ces 4 approches a aussi tenteacute de prendre en compte un maximum

24 https wwwspotifycom25 http wwwrecsyschallengecom2018

27

Chapitre 2 Eacutetat de lart

dinformations an de satisfaire au mieux lutilisateur (caracteacuteristiques des musiques preacutecisiondiversiteacute contexte de la playlist initiale utilisation de la session deacutecoute en cours) validantainsi lapproche deacuteveloppeacutee depuis le deacutebut de ce manuscrit qui consiste agrave prendre en compte unmaximum dobjectifs associeacutes agrave des facteurs humains dans la recommandation Cette constata-tion se retrouve aussi chez [Jannach et al 2016] ougrave les auteurs expliquent que le but des systegravemesde recommandation dans le domaine de la musique est dacqueacuterir et dexploiter des informationssuppleacutementaires agrave propos des musiques an de comprendre le thegraveme sous-jacent des playlistscreacuteeacutees par les utilisateurs [] Le but ultime serait ainsi de concevoir de nouvelles approchesalgorithmiques qui seraient explicitement conccedilues pour creacuteer des playlists correspondant agrave une ouplusieurs caracteacuteristiques signicatives pour lutilisateur En dehors des facteurs humains deacutejagravedeacuteveloppeacutes au deacutebut de cette section (similariteacute diversiteacute nouveauteacute) les auteurs explicitentces caracteacuteristiques signicatives comme pouvant aussi ecirctre lhomogeacuteneacuteiteacute de la playlist dansson ensemble ou encore les transitions entre chacune des musiques dune playlist Le but seraitdonc ici de reacuteussir agrave creacuteer des playlists semblables agrave ce quun ecirctre humain pourrait faire tout entenant compte au maximum des besoins en similariteacute diversiteacute et nouveauteacute [Quadrana et al2018] deacuteveloppent aussi cette ideacutee en expliquant quun systegraveme de recommandation musical peutsoit proposer des musiques correspondant dune maniegravere geacuteneacuterale au thegraveme de la playlist soitproposer une playlist avec un ordre speacutecique permettant de garantir des transitions douces entrechaque musique comme par exemple une augmentation graduelle du tempo Les notions de pro-gression et de transitions douces dans une playlist correspondent agrave la deacutenition dune seacutequencedonneacutee plus haut dans le manuscrit et sont donc particuliegraverement inteacuteressantes dans le cadre decette thegravese Il est cependant agrave noter que dans le domaine des recommandations musicales undeacutebat est reacutecemment apparu sur limportance de lordre des musiques dans les recommandationsde playlist En eet une eacutetude exploratoire reacutecente a montreacute que si les utilisateurs jugent posi-tivement un systegraveme recommandant des musiques diverses et nouvelles ces derniers ne portaientque peu dinteacuterecirct agrave lordre dans lequel les musiques eacutetaient proposeacutees (voire dans certains casne percevaient mecircme pas dordre speacutecique dans les recommandations) [Tintarev et al 2017]Mecircme si cette eacutetude na porteacute que sur 20 participants les reacutesultats obtenus sont inteacuteressantset soulignent agrave quel point chaque domaine agrave des particulariteacutes propres dont il est neacutecessairede tenir compte pour la conception dun systegraveme de recommandation sensible aux seacutequencesPour renforcer encore cette derniegravere constatation nous allons nous inteacuteresser dans la prochainesous-section aux systegravemes de recommandation touristiques

Dans le domaine touristique

Le domaine du tourisme a lui aussi vu sa populariteacute croicirctre dans la litteacuterature gracircce agrave lexplo-sion des teacuteleacutephones portables et tablettes orant un nouveau support pour les recommandationsDe la mecircme maniegravere que pour le domaine de la musique le tourisme a vu ses premiegraveres appli-cations de recommandation apparaicirctre au deacutebut des anneacutees 2000 Dans [Cheverst et al 2000]par exemple les auteurs ont deacuteveloppeacute un guide mobile permettant daider les visiteurs de laville de Lancaster en leur fournissant des informations contextuelles (localisation date heure dela journeacutee ouvertures et fermetures dattractions heures de visites etc) ainsi quen proposantau visiteur plusieurs services comme avoir plus dinformations sur un monument ou geacuteneacuterer unparcours prenant en compte ces informations contextuelles Cette eacutetude a permis de proposer unstandard dans la recommandation touristique comme la prise en compte du contexte et eacutetaittregraves complegravete pour son eacutepoque mecircme si lon peut critiquer labsence dun modegravele utilisateurne permettant pas de prendre en compte les besoins speacuteciques de chaque visiteur Toujours audeacutebut des anneacutees 2000 nous pouvons aussi citer [Chou et al 2005] dont les auteurs ont modeacuteliseacute

28

23 La recommandation en seacutequence

agrave laide dun systegraveme de repreacutesentation de connaissances (OWL pour Web Ontology Language)les inteacuterecircts dun visiteur ainsi que les divideuvres dun museacutee dans un systegraveme de recommandationproposant des parcours Il est agrave noter que dans cette eacutetude les auteurs ont pu prouver que letemps passeacute par un visiteur devant un objet eacutetait positivement correacuteleacute avec son appreacuteciationpositive sur cet objet Le terme objet est utiliseacute ici car les auteurs ont reacutealiseacute cette expeacuteriencesur un site proposant des vecirctements et non dans le museacutee comme le reste de leur application

Plus reacutecemment les systegravemes de recommandation touristiques de ces derniegraveres anneacutees ontproteacute des nombreuses avanceacutees technologiques leur donnant plus de possibiliteacutes quant agrave la lo-calisation de lutilisateur et agrave laide personnaliseacutee dans des lieux autrefois complexes agrave atteindreEn eet la deacutemocratisation des smartphones recevant tous un signal GPS de bonne qualiteacute per-met deacutesormais agrave des applications de connaicirctre relativement preacuteciseacutement la position dun visiteurtant quil est dehors Dune maniegravere geacuteneacuterale les systegravemes utilisant des donneacutees geacuteographiquesdans le processus de recommandation sont regroupeacutes sous le terme systegravemes de recommandationsensibles agrave la position (Location-Aware Recommender Systems (LARS)) Pour les systegravemes derecommandation destineacutes agrave ecirctre utiliseacutes agrave linteacuterieur dun bacirctiment ougrave le signal GPS ne peutpas passer (comme un museacutee par exemple) il existe maintenant plusieurs solutions eacutetudieacutees etdeacuteveloppeacutees dans le domaine de recherche des systegravemes de localisation en interne comme parexemple le Wi-Fi [Tesoriero et al 2014] les puces RFID 26 [Tesoriero et al 2008] les senseursde proximiteacute Bluetooth [Yoshimura et al 2014] et mecircme le geacuteomagneacutetisme 27 Les moyens tech-niques permettant de localiser preacuteciseacutement un visiteur ou de lui fournir des recommandations agravedistance via une application ne seront pas deacutetailleacutes ici Cependant il est important de prendreen compte ces problegravemes lorsque lon passe dun domaine agrave un autre Mecircme si lobjectif est lemecircme agrave savoir recommander les meilleures seacutequences agrave un utilisateur dun systegraveme les moyenstechniques agrave mettre en divideuvre ainsi que les caracteacuteristiques agrave prendre en compte pour produire debonnes recommandations peuvent drastiquement changer Ainsi alors que certains systegravemes derecommandations musicaux commencent depuis quelques anneacutees agrave prendre en compte le contextede lutilisateur quand cela est possible [Wang et al 2012] les systegravemes deacuteployeacutes dans le domainedu tourisme doivent neacutecessairement tenir compte du contexte de lutilisateur au minimum pourpouvoir le guider activement [Adomavicius and Tuzhilin 2011 Gavalas et al 2014] De la mecircmemaniegravere les modegraveles utilisateurs requis dans les recommandations touristiques diegraverent de ceuxdes autres domaines Il est par exemple important de prendre en compte la maniegravere dont lesvisiteurs se deacuteplacent physiquement agrave la fois pour proposer des recommandations satisfaisantesdun point de vue individuel mais aussi pour avoir une vision globale de la foule et de ses ef-fets sur les individus Ainsi [Veacuteron and Levasseur 1989] ont reacutealiseacute une eacutetude ethnographiqueau centre Pompidou montrant que les visiteurs pouvaient ecirctre classeacutes en 4 cateacutegories selon leurmaniegravere de se deacuteplacer tandis que [Yoshimura et al 2014] ont observeacute pendant 3 semaines lecomportement de plus de 27000 visiteurs au museacutee du Louvre permettant de discerner 2 typesde visiteurs selon la dureacutee de leur visite ainsi que linuence de la foule sur les comportements

Ces deux eacutetudes toujours tregraves utiliseacutees aujourdhui reacutevegravelent que le domaine des recomman-dations touristiques possegravede des speacuteciciteacutes quil est important de prendre en compte an decorrectement modeacuteliser le comportement de lutilisateur et de lui fournir des recommandationspertinentes Dune maniegravere geacuteneacuterale et peut-ecirctre encore plus que dans dautres domaines la

26 Acronyme de Radio-Frequency IDentication deacutesignant lutilisation de radio-eacutetiquettes adheacutesives permet-tant de recevoir et de reacutepondre agrave des signaux agrave courte distance27 IndoorAtlas

29

Chapitre 2 Eacutetat de lart

recommandation de points dinteacuterecircts physiques neacutecessite une attention toute particuliegravere agrave uncertain nombre de caracteacuteristiques quant agrave la modeacutelisation de lutilisateur parmi lesquelles onpeut citer [Osche et al 2016]

Le style de visite repreacutesente le style de visite de lutilisateur en rapport avec les deuxeacutetudes citeacutees ci-dessus [Veacuteron and Levasseur 1989 Yoshimura et al 2014]

Le niveau de fatigue repreacutesente agrave quel point lutilisateur est mentalement etouphysiquement fatigueacute

Les preacutefeacuterences implicites repreacutesente les preacutefeacuterences sur les ressources deacuteduites ducomportement de lutilisateur

La toleacuterance agrave la distance repreacutesente agrave quel point lutilisateur souhaite se deacuteplacer La toleacuterance agrave la foule repreacutesente agrave quel point lutilisateur est deacuterangeacute par les autres

visiteurs autour de lui La toleacuterance agrave la preacutecision repreacutesente le souhait de lutilisateur concernant la balance

entre recommandations preacutecises et recommandations diverses La toleacuterance agrave lintrusion technologique repreacutesente agrave quelle freacutequence lutilisateur

souhaite recevoir des recommandations du systegraveme Le niveau de controcircle repreacutesente le niveau de choix que lutilisateur attend cest-agrave-

dire le nombre dalternatives proposeacutees

Outre ces points relatifs agrave la modeacutelisation de lutilisateur il est aussi important de prendreen compte lenvironnement dans lequel il se trouve comme par exemple la geacuteographie du lieu etses contraintes les distances physiques entre les points dinteacuterecircts les donneacutees meacuteteacuteorologiquesles horaires douvertures et de fermetures sil y en a etc

Mecircme si agrave premiegravere vue le domaine touristique semble dieacuterent du domaine musical denombreux points communs peuvent ecirctre trouveacutes comme par exemple la gestion de la distance(distance physique entre deux points dinteacuterecircts ou distance matheacutematiques entre deux ressourcesles preacutefeacuterences implicites les divers niveaux de toleacuterances etc) Dans la prochaine section nousallons discuter des points communs entre ces dieacuterents domaines et des caracteacuteristiques quunmodegravele se voulant geacuteneacuterique et multi-domaines se doit de posseacuteder

233 Discussion

Cette section a eu pour but de preacutesenter un certain nombre de travaux lieacutes de pregraves ou de loinagrave la notion de seacutequence Nous avons vu que dans le domaine des recommandations musicales lacreacuteation ou la continuation de playlists sont des objectifs de plus en plus consideacutereacutes par les cher-cheurs Ce domaine sy precircte en eet tregraves bien car la majoriteacute des utilisateurs eacutecoutent plusieursmusiques les unes agrave la suite des autres permettant dexploiter linformation contenue dans cesseacutequences deacutejagrave existantes et de tenter den creacuteer de nouvelles De la mecircme maniegravere le rapidetour dhorizon du domaine des recommandations touristiques a permis de mettre en exerguemecircme sil existe des dieacuterences notables avec le domaine musical dont il faut tenir compte unobjectif principal commun consideacuterer le maximum de donneacutees pertinentes disponibles (compor-tements preacuteceacutedents des utilisateurs informations sur les ressources caracteacuteristiques personnellesde chaque utilisateur etc) dans le but de produire des seacutequences adapteacutees agrave chaque utilisateurLes eacutetudes de ces domaines ont permis de faire ressortir 5 directions majeures dans la conceptiondun tel systegraveme de recommandation

1 Les approches les plus performantes actuellement semblent geacuteneacuteralement composeacutees de

30

24 Les systegravemes multi-agents

deux parties distinctes La premiegravere partie consiste en une preacute-seacutelection avec pour but dediminuer lespace de recherche en seacutelectionnant une liste de candidats potentiels tandisque dans la deuxiegraveme partie une seacutequence est produite en utilisant les meilleurs candidatspreacute-seacutelectionneacutes dans leacutetape 1

2 Ces approches ne se limitent plus uniquement agrave lutilisation de techniques provenantdes systegravemes de recommandation classiques mais mecirclent deacutesormais dieacuterentes techniquesprovenant de divers domaines de la recherche en informatique

3 Les seacutequences deacutejagrave creacuteeacutees en amont par les utilisateurs peuvent ecirctre utiliseacutees an dexploi-ter les informations quelles contiennent et produire en aval des seacutequences plus conformesagrave ce quun ecirctre humain ferait

4 Le mouvement geacuteneacuteral des eacutetudes produites ces derniegraveres anneacutees va dans le sens dune priseen compte conjointe et toujours plus importante de facteurs et caracteacuteristiques humains

5 Un systegraveme geacuteneacuterique permettant de produire des seacutequences personnaliseacutees quelque soit ledomaine reste possible mais ce dernier devra ecirctre susamment modulable pour sadapteraux dieacuterences bien reacuteelles entre tous les domaines concerneacutes

Dans la suite de cette section nous allons nous concentrer sur un domaine de linformatiquedont les meacutethodes saccordent avec lensemble des points eacutevoqueacutes ci-dessus les systegravemes multi-agents et plus particuliegraverement les algorithmes de colonies de fourmis Cest dans le cadre de ceparadigme que nous reacutepondrons aux probleacutematiques de cette thegravese

24 Les systegravemes multi-agents

241 Deacutenition

Les systegravemes multi-agents deacutesignent lensemble des systegravemes ougrave de nombreux agents co-opegraverent dans le but de reacutesoudre un problegraveme trop complexe pour un agent seul [Ferber andWeiss 1999 Weiss 2013] Un agent dans sa deacutenition la plus large repreacutesente toute entiteacute pou-vant percevoir son environnement agrave travers ses senseurs et pouvant agir dans cet environnementavec ses actuateurs [Russell and Norvig 2016] comme le preacutesente la Figure 23

Selon cette deacutenition limmense majoriteacute des ecirctres vivants robots machines et programmesinformatiques peuvent ecirctre consideacutereacutes comme des agents Nous allons aner petit agrave petit cettedeacutenition an de rentrer dans le cadre speacutecique des systegravemes multi-agents Un premier eacuteleacutementpouvant ecirctre ajouteacute est la notion de rationaliteacute Un agent rationnel est un agent dont le com-portement est le bon eacutetant donneacute un environnement speacutecique dans lequel il eacutevolue Avoir lebon comportement autrement dit eectuer une bonne seacutequence dactions implique de deacutenirun but preacutecis ainsi quune maniegravere deacutevaluer les seacutequences dactions que lagent eectue commepar exemple la maximisation dune fonction dutiliteacute An de reacutealiser des actions dans son en-vironnement un agent a besoin de pouvoir prendre des deacutecisions de lui-mecircme Il existe dans lalitteacuterature deux types dagents repreacutesentant deux conceptions dieacuterentes pour la reacutesolution dunproblegraveme [Ferber 1995]

Le premier type dagent est appeleacute agent cognitif et fait reacutefeacuterence agrave des agents pos-seacutedant une repreacutesentation symbolique du monde avec laquelle ils peuvent appliquer desraisonnements Ces agents possegravedent donc une repreacutesentation interne de leur environ-nement et sont capables dinteragir entre eux de maniegravere sophistiqueacutee Ce type dagent

31

Chapitre 2 Eacutetat de lart

Figure 23 Scheacutema repreacutesentant linteraction entre un agent et lenvironnement dans lequel ileacutevolue [Russell and Norvig 2016]

correspond plus geacuteneacuteralement agrave une approche cognitive qui a pour but de faire commu-niquer et coopeacuterer des systegravemes experts classiques [ougrave] chaque agent dispose dune base deconnaissance comprenant lensemble des informations et des savoir-faire neacutecessaires agrave lareacutealisation de sa tacircche et agrave la gestion des interactions avec les autres agents et avec sonenvironnement [Ferber and Weiss 1999]

Le deuxiegraveme type dagent nommeacute agent reacuteactif ne possegravede pas de repreacutesentation sym-bolique du monde et est donc limiteacute par ses propres perceptions Ces agents et leursinteractions sont geacuteneacuteralement moins complexes que les agents cognitifs Ce type dagentcorrespond plus geacuteneacuteralement agrave une approche reacuteactive qui quant agrave elle preacutetend quil nestpas neacutecessaire que les agents soient intelligents individuellement pour que le systegraveme aitun comportement global intelligent Des meacutecanismes de reacuteaction aux eacuteveacutenements ne pre-nant en compte ni une explicitation des buts ni des meacutecanismes de planication peuventalors reacutesoudre des problegravemes qualieacutes de complexes [Ferber and Weiss 1999]

En plus de ces deux types dagents dieacuterencieacutes par leur repreacutesentation du monde Ferberpropose un autre type de distinction sur les comportements ces derniers peuvent ecirctre teacuteleacuteono-miques cest-agrave-dire dirigeacutes vers des buts explicites ou bien reacuteexes cest-agrave-dire reacutegis par lesperceptions Ces 4 dieacuterents types dagents peuvent se combiner comme illustreacute dans le Tableau21

Nous allons plus particuliegraverement nous inteacuteresser ici aux agents reacuteactifs et agrave leurs dieacuterencesavec les agents cognitifs Malgreacute leur relative simpliciteacute les interactions entre agents reacuteactifsexistent bien Mais contrairement aux agents cognitifs elles seectuent au travers de lenvi-ronnement geacuteneacuteralement par des traces laisseacutees dans ce dernier comme des donneacutees visuellesolfactives auditives etc Lagrave ougrave les agents cognitifs raisonnent avant de prendre une deacutecisionles agents reacuteactifs ne font que reacuteagir agrave des stimuli externes Ils possegravedent bien des senseurs ande deacutetecter leur environnement et des actuateurs pour agir mais leur fonctionnement reste tregraves

32

24 Les systegravemes multi-agents

Agents cognitifs Agents reacuteactifsTeacuteleacuteonomiques Agents intentionnels Agents pulsionnels

Reacuteexes Agents modules Agents tropiques

Table 21 Description des dieacuterents types dagents selon leur relation au monde et selon leursconduites [Ferber 1995]

simple par rapport aux agents cognitifs La relative simpliciteacute de ces agents est inteacuteressante carelle sinscrit dans un changement de paradigme par rapport agrave la vision classique des lintelligencearticielle dans le domaine de linformatique En eet le domaine de lintelligence articielleexiste depuis pregraves de 60 ans maintenant et agrave lorigine les systegravemes intelligents creacuteeacutes dans cedomaine pour reacutesoudre des problegravemes lont eacuteteacute selon une approche dite top-down cest-agrave-direde haut en bas avec les notions de penseacutee et de raison au centre de ces systegravemes Ainsi cessystegravemes manipulaient les connaissances agrave laide de symboles et de regravegles et navaient aucune in-teraction ni avec leur environnement ni avec dautres systegravemes intelligents Cest ce quon appellecommuneacutement la Good Old Fashioned Articial Intelligence Depuis les anneacutees 1990 une autreapproche est apparue pour eacutetudier lintelligence et creacuteer des systegravemes intelligents lapprochebottom-up soit de bas en haut dont certains systegravemes tregraves populaires sinspirent de systegravemesbiologiques incarneacutes dans un environnement et pouvant communiquer entre eux Cest dans cemouvement que sinscrivent les systegravemes multi-agents et comme le dit Rodney A Brooks dansson article justement intituleacute Intelligence without Reason [Brooks 1991]

Les comportements intelligents peuvent ecirctre geacuteneacutereacutes sans laide de systegravemes de raisonne-ment explicites

Lintelligence est une proprieacuteteacute eacutemergente de certains systegravemes complexes apparaissantparfois sans quelle nait de raison speacutecique dapparaicirctre

Une premiegravere implication de la simpliciteacute des agents reacuteactifs est quil est neacutecessaire de faireinteragir un certain nombre de ces agents pour pouvoir solutionner des problegravemes Lagrave ougrave unagent cognitif peut potentiellement ecirctre tregraves complexe et capable de solutionner des problegravemesprincipalement par lui-mecircme (en deacuteleacuteguant ou coopeacuterant parfois avec dautres agents) un agentreacuteactif seul nen sera pas capable de par sa simpliciteacute Cependant cette simpliciteacute ore aussides avantages dans le sens ougrave il est aiseacute de comprendre de programmer ou de modier cesagents Apregraves cette partie theacuteorique nous allons voir dans la sous-section suivante deux modegravelesmulti-agents an dillustrer la maniegravere dont ils fonctionnent reacuteellement Ces deux systegravemes nouspermettrons par la suite de tirer quelques conclusions sur leur utiliteacute dans le cadre de cette thegravese

242 Preacutesentation de deux systegravemes multi-agents reacuteactifs

Nous avons pour le moment seulement deacutecrit le principe des modegraveles multi-agents et lesagents pouvant les composer Cependant ces systegravemes ne puisent pas leur origine uniquementdans linformatique Beaucoup de systegravemes multi-agents sinspirent agrave lorigine de comportementsdanimaux ou dinsectes observeacutes en milieu naturel par des eacutethologues En eet certaines espegravecesanimales semblent agir en groupe de maniegravere tregraves intelligente sans quil ny ait de meneur ou sansquun individu pris seacutepareacutement ne soit speacutecialement intelligent On parle alors dauto-organisationet deacutemergence de lintelligence quand une masse dindividus peu intelligents se coordonne ainsidans la nature Ce pheacutenomegravene a eacuteteacute eacutetudieacute par le biologiste franccedilais Pierre-Paul Grasseacute en 1959

33

Chapitre 2 Eacutetat de lart

et a eacuteteacute nommeacute stigmergie [Grasseacute 1959] La stigmergie est le meacutecanisme par lequel des agentsvont se synchroniser et travailler ensemble dans un but commun sans quaucun nait lideacutee agravelavance de laction agrave faire ou nait le plan nal de la construction agrave reacutealiser (une fourmiliegravereou un nid de termites par exemple) Pour deacutecrire le pheacutenomegravene de stigmergie agrave ldivideuvre chezcertains animaux Pierre-Paul Grasseacute explique ainsi Louvrier ne dirige pas son travail maisil est guideacute par lui Cette phrase signie quun agent na pas dintention et dideacutee de ce quildoit faire mais quil sait cependant exactement quoi faire au moment ougrave il est preacutesent devant letravail Cette capaciteacute sexplique par le fait que les individus sont geacuteneacutetiquement preacuteprogrammeacutespour eectuer certaines tacircches [Oster 1981] Cest de cette maniegravere que des espegraveces ne posseacutedantquune tregraves faible intelligence individuelle comme les fourmis ou les termites sont capables deproduire des constructions extrecircmement grandes et sophistiqueacutees On peut par exemple citer uneespegravece nommeacutee la fourmi coupe-feuille du Texas aussi appeleacutee fourmi champignonniste dontles individus vivent dans de grandes colonies de plusieurs millions dindividus et cultivent deschampignons dans des piegraveces souterraines doteacutees dune structure particuliegravere et dune aeacuterationspeacutecique destineacutee agrave favoriser la pousse du champignon [Houmllldobler et al 1990] La cleacute de lacapaciteacute de ces animaux agrave agir de la bonne maniegravere face agrave tel ou tel stimulus reacuteside dans lADNmecircme de lespegravece faccedilonneacute par des millions danneacutees deacutevolution Cest ainsi quune ouvriegraverevaquera agrave ses tacircches jusquagrave ce quun pan de mur de son nid seondre et que devant ce nouveaustimulus elle deacuteploie une nouvelle panoplie de comportements approprieacutes agrave la situation agrave laquelleelle fait soudainement face Ces exemples deacutemontrent que lintelligence est bien preacutesente dans cessystegravemes biologiques vivants et dans la suite de cette section nous allons donner deux exemplesde modeacutelisation de ces systegravemes biologiques en systegravemes multi-agents dans linformatique

Murmuration deacutetourneaux le modegravele des boids

Les eacutetourneaux repreacutesentent une famille dune quinzaine despegraveces doiseaux et vivent surles 5 continents Ces oiseaux se regroupent parfois dans la nature sous forme de nueacutees pouvantcontenir des dizaines de milliers dindividus La raison de ces murmurations nest pas encoreconnue avec certitude mais des theacuteories existent expliquant par exemple que ces regroupementspermettraient une plus grande chance de survie face aux preacutedateurs [King and Sumpter 2012]ou bien que le regroupement et la haute densiteacute dindividus leur permettraient de se reacutechauerdurant les peacuteriodes les plus froides de lanneacutee [Goodenough et al 2017] Ce pheacutenomegravene est beau-coup eacutetudieacute car tous les oiseaux semblent se deacuteplacer dans la mecircme direction et modient leurtrajectoire en mecircme temps sans quaucun oiseau ne se touche en vol ce qui est remarquable eacutetantdonneacute le nombre dindividus et la vitesse agrave laquelle ils volent Malgreacute cette complexiteacute il ny apas doiseau meneur deacutecidant de la direction agrave prendre et un individu seul na pas la capaciteacuteintellectuelle susante pour planier ce genre de deacuteplacements complexes dans un environne-ment en 3 dimensions On retrouve bien lagrave les caracteacuteristiques dun systegraveme multi-agents ougrave desagents simples provoquent de par leurs interactions un comportement intelligent et complexedeacutepassant de loin les capaciteacutes dun individu seul Le domaine des systegravemes multi-agents sestdonc inteacuteresseacute agrave creacuteer un modegravele permettant agrave laide de simulations informatiques de recreacuteer lesmumurations deacutetourneaux Ce modegravele ougrave les agents sont appeleacutes des boids 28 permet dobtenirinformatiquement des murmurations dagents dans un environnement simuleacute gracircce agrave trois regraveglesimplanteacutees dans chaque agent donneacutees ici par ordre de prioriteacute [Reynolds 1987]

28 Le terme boid provient de la contraction de lexpression bird-oid object et signiant objet ressemblant agrave unoiseau

34

24 Les systegravemes multi-agents

1 Eacutevitement des collisions eacuteviter les collisions avec les agents se trouvant agrave proximiteacuteSi un agent est trop proche seacuteloigner dans une autre direction

2 Coordination de la vitesse aller agrave la mecircme vitesse que les agents se trouvant agraveproximiteacute

3 Centrage rester le plus proche possible des autres agents se trouvant agrave proximiteacute sansdeacuteclencher la regravegle deacutevitement de collision

Ces trois regravegles sont donc exeacutecuteacutees par les agents en permanence de la plus prioritaire agravela moins prioritaire et permettent dobtenir virtuellement un comportement de murmurationougrave tous les agents restent proches les uns des autres et changent de direction ensemble commemontreacute dans la Figure 24 Ce modegravele a par exemple eacuteteacute utiliseacute dans lindustrie du divertissementpour simuler des foules coheacuterentes dans des jeux videacuteos ou des lms [Silva et al 2009]

Figure 24 Simulation de boids ougrave lon peut voir les agents se deacuteplaccedilant dans la mecircme directionagrave une certaine distance les uns des autres dans un environnement simuleacute [Reynolds 1987]

Le fourragement des fourmis algorithme de colonies de fourmis

Un autre exemple de systegraveme biologique complexe ougrave lon peut observer leacutemergence duneintelligence collective est le comportement des fourmis dans la nature Dans la section preacuteceacutedentenous avons deacutejagrave vu que par un meacutecanisme de stigmergie certains insectes sociaux comme lesfourmis ou les termites eacutetaient capables de construire des structures tregraves complexes Un autrepheacutenomegravene dauto-organisation a eacuteteacute observeacute lors du fourragement 29 des fourmis de lespegravece de lafourmi dArgentine En eet les ouvriegraveres de cette espegravece se deacuteplacent de maniegravere aleacuteatoire auxalentours de la fourmiliegravere jusquagrave trouver une source de nourriture Une fois que des fourmis onttrouveacute de la nourriture elles retournent agrave la fourmiliegravere Apregraves un certain temps de plus en plusdouvriegraveres se dirigent vers cette source de nourriture jusquagrave ce quun chemin de fourmis allantde la fourmiliegravere jusquagrave la nourriture se forme Ce chemin a cependant la particulariteacute decirctreoptimiseacute en termes de distance agrave parcourir et dobstacles agrave eacuteviter de sorte que les ouvriegraveres em-pruntent eectivement le plus court chemin possible entre leur nid et la nourriture [Deneubourg

29 Le fourragement deacutesigne le comportement des fourmis recherchant de la nourriture et revenant avec celle-ciagrave la fourmiliegravere

35

Chapitre 2 Eacutetat de lart

et al 1990] La Figure 25 donne un exemple de ce agrave quoi peut ressembler un de ces chemins unefois emprunteacute par beaucoup dindividus Ce comportement est remarquable quand on le replacedans le contexte des individus qui en sont agrave lorigine Les ouvriegraveres ne font pas plus de 1 ou 2centimegravetre(s) de long et peuvent couvrir des distances jusquagrave 100 megravetres an de trouver de lanourriture Lenvironnement dans lequel elles se deacuteplacent est complexe joncheacute dobstacles eteacutevolue en permanence alors quelles nont quun sens de lorientation limiteacute et une faible capaciteacutede traitement ducirce agrave leur tregraves petit nombre de neurones (environ 250000)

Figure 25 Illustration dun chemin creacuteeacute par des fourmis appartenant agrave lespegravece des fourmisleacutegionnaires (creacutedit photo Mehmet Karatay)

An de comprendre les meacutecanismes permettant leacutemergence de ce comportement intelligentdes expeacuterimentations ont eacuteteacute meneacutees en laboratoire avec de petites colonies de fourmis dansun environnement controcircleacute [Goss et al 1989] Voici donc le principe de fonctionnement de lacreacuteation de chemins optimiseacutes chez les fourmis

1 Des fourmis se deacuteplacent aleacuteatoirement autour de la colonie agrave la recherche de nourriture

2 Quand une fourmi trouve de la nourriture elle retourne du mieux possible agrave la fourmiliegravereen deacuteposant des pheacuteromones

3 Dautres fourmis attireacutees par ces pheacuteromones vont avoir tendance agrave suivre ce cheminLes nouvelles fourmis atteignant la nourriture vont elles aussi revenir agrave la fourmiliegravere endeacuteposant des pheacuteromones

4 Les fourmis reacuteussissant agrave revenir plus rapidement avec des chemins plus courts agrave la four-miliegravere vont redeacuteposer plus rapidement de nouvelles pheacuteromones eacutetant donneacute quellesmettront moins de temps pour faire des allers-retours entre la nourriture et la fourmi-liegravere

5 Agrave linverse les fourmis ayant emprunteacute des chemins plus longs vont deacuteposer de nouvellespheacuteromones moins rapidement puisquelles mettront plus de temps agrave faire leurs allers-retours

6 Petit agrave petit le chemin le plus court va ecirctre emprunteacute par de plus en plus de fourmisdeacuteposant chacune des pheacuteromones renforccedilant de plus en plus ce mecircme chemin

36

24 Les systegravemes multi-agents

7 Les chemins les plus longs sont peu agrave peu abandonneacutes dautant plus que les pheacuteromonesseacutevaporent avec le temps renforccedilant encore plus les chemins fortement emprunteacutes

8 Au bout dun certain temps seul le chemin le plus court est emprunteacute par la majoriteacute desfourmis

9 Quelques fourmis ne prennent cependant pas ce chemin permettant la recherche de nou-velles sources de nourriture ou de nouveaux chemins En eet si jamais le chemin em-prunteacute par la majoriteacute des individus se voit perturbeacute par un nouvel obstacle (un arbrevenant de tomber par exemple) alors ces quelques fourmis pourront eacuteventuellement trou-ver le nouveau meilleur chemin le plus court et le cycle de renforcement recommencera

Comme pour les murmurations deacutetourneaux on retrouve bien les caracteacuteristiques de lauto-organisation dans un systegraveme multi-agents aucun meneur nest preacutesent les agents suivent seule-ment quelques regravegles simples permettant leacutemergence dun comportement deacutepassant les capaciteacutescognitives de lespegravece Ces regravegles ont eacuteteacute deacutecrites de maniegravere formelle par Marco Dorigo durant sathegravese dans un modegravele appeleacute Ant System (AS) permettant de recreacuteer le comportement des four-mis au sein dune simulation informatique [Dorigo et al 1996] Dans ce modegravele lenvironnementest repreacutesenteacute par un graphe dont les sommets sont les points dinteacuterecircts ougrave lagent peut se rendreet dont les arecirctes sont les chemins disponibles permettant de se deacuteplacer de point en point Agravechaque arecircte (i j) est associeacutee deux valeurs numeacuteriques la premiegravere repreacutesentant la distanceagrave parcourir pour se deacuteplacer du sommet i au sommet j la deuxiegraveme repreacutesentant la quantiteacutede pheacuteromones preacutesente sur cette arecircte Un agent se trouvant agrave un sommet i a connaissancede lensemble des sommets Vi accessibles directement agrave partir de i Pour deacutecider quelle arecircteemprunter lagent prend en compte la distance et la quantiteacute de pheacuteromones associeacutees agrave chaquearecircte Une fois que lagent a atteint un sommet speacutecique deacutesigneacute agrave lavance comme objectif ildeacutepose des pheacuteromones sur chacune des arecirctes emprunteacutees La quantiteacute de pheacuteromones deacuteposeacuteeest deacutependante de la longueur du chemin emprunteacute de sorte quun agent ayant trouveacute un chemincourt deacuteposera plus de pheacuteromones quun agent ayant trouveacute un chemin plus long Ce cycle peutensuite recommencer avec une multitude dagents jusquagrave ce quune solution eacutemerge de la mecircmemaniegravere que pour les fourmis dans la nature Marco Dorigo a dans la suite de ses travaux deacuteve-loppeacute dautres modegraveles ayant tous comme base le modegravele AS mais posseacutedant quelques variationsou ajouts orant une plus grande varieacuteteacute doutils pour reacutesoudre les nombreux problegravemes de larecherche en informatique Dans les faits le modegravele original AS a aujourdhui pratiquement dis-paru au prot de ses descendants et cest pour cette raison que nous nallons pas ici deacutetailler plusavant le modegravele AS [Dorigo and Birattari 2010] Tous ces dieacuterents modegraveles sont maintenantregroupeacutes sous le nom de Ant Colony Optimization (ACO) [Dorigo and Birattari 2011] Cesderniers ont eacuteteacute exploiteacutes dans de nombreux domaines de la recherche scientique pour reacutesoudredes problegravemes varieacutes On peut par exemple citer trois de ces problegravemes tregraves connus et eacutetudieacutesen informatique de par leur complexiteacute qui ont chacun vu des solutions leur ecirctre trouveacutees gracircceagrave ACO

Le problegraveme du voyageur de commerce [Dorigo and Gambardella 1997] Le problegraveme des tourneacutees de veacutehicules [Bell and McMullen 2004] Le problegraveme de gestion de projet agrave contraintes de ressources [Merkle et al 2002]

Dans la prochaine section nous allons nous inteacuteresser plus particuliegraverement agrave lun des modegravelesde la famille ACO nommeacute Ant Colony System (ACS) Nous allons voir son fonctionnement deacutetailleacuteet expliquer les speacuteciciteacutes qui le rendent particuliegraverement inteacuteressant dans le cadre de cette thegravese

37

Chapitre 2 Eacutetat de lart

243 Ant Colony System

Le modegravele ACS possegravede plusieurs modications majeures par rapport au modegravele initial ASnotamment par rapport aux meacutecanismes lieacutes aux pheacuteromones et agrave la prise de deacutecision des agents[Dorigo and Birattari 2010] Premiegraverement seul lagent ayant trouveacute le meilleur chemin est au-toriseacute agrave deacuteposer des pheacuteromones sur les arecirctes quil a emprunteacute alors que dans AS tous les agentsdeacuteposaient des pheacuteromones Deuxiegravemement et pour contrer la relatif manque de pheacuteromones en-gendreacute par cette premiegravere modication les agents possegravedent un nouveau comportement appeleacutemise agrave jour locale de pheacuteromones (locale pheromone update) consistant en la mise agrave jour despheacuteromones par chaque agent sur la derniegravere arecircte emprunteacutee durant la construction dun che-min Cette mise agrave jour sarticule autour dun seuil de pheacuteromones speacutecieacute comme meacutetavariableavant lexeacutecution du programme Si une arecircte traverseacutee par un agent possegravede une quantiteacute depheacuteromones infeacuterieure agrave ce seuil alors lagent deacutepose des pheacuteromones Agrave linverse si la quantiteacutede pheacuteromone sur cette arecircte est supeacuterieure au seuil alors lagent retire une certaine quantiteacute depheacuteromones En dautres termes dans ACS degraves quun agent emprunte une arecircte il met agrave jourla quantiteacute de pheacuteromones sur cette arecircte et ce quelle que soit la qualiteacute du chemin quil est entrain de construire Marco Dorigo explique lui-mecircme les avantages que possegravede ACS par rapportagrave dautres versions existantes [Dorigo and Birattari 2011]

ACS permet de diversier lexploration eectueacutee par les agents pendant une iteacuterationde lalgorithme en diminuant la quantiteacute des pheacuteromones sur les arecirctes les plusutiliseacutees les agents suivants sont encourager agrave se deacuteplacer sur dautres arecirctes moinsexploreacutees permettant de diversier les solutions trouveacutees agrave la n dune iteacuterationCette meacutecanique rend moins probable le fait que plusieurs agents puissent produiredes solutions identiques durant une iteacuteration

Une autre modication du modegravele ACS par rapport au modegravele AS concerne le deacuteplacementdes agents Il est maintenant possible gracircce agrave une nouvelle meacutetavariable de donner limportancesouhaiteacutee entre les pheacuteromones et la distance lors du processus de choix de la prochaine arecircte agraveemprunter par un agent Dans le reste de cette sous-section nous allons expliquer les principalesformules reacutegissant le comportement des agents et la mise agrave jour des pheacuteromones dans ACS

Regravegle de transition deacutetat - la regravegle de transition (state transition rule) deacutetat utilise laregravegle proportionnelle pseudo-aleacuteatoire (pseudo-random proportional rule) ougrave une variable aleacutea-toire q isin [0 1] est compareacutee agrave une meacutetavariable q0 an de deacutecider si lagent courant va explorerle graphe ou sil va exploiter la connaissance produite par les autres agents avant lui En dautrestermes il est possible deacutequilibrer avec cette variable limportance des pheacuteromones et de la dis-tance lors du choix des arecirctes q0 = 0 entraicircne lexploration du graphe en tenant uniquementcompte de la distance associeacutee aux arecirctes tandis que q0 = 1 correspond agrave un comportement derenforcement pur via les pheacuteromones sans aucune exploration LEacutequation 27 permet de choisirentre lexploitation de la connaissance ou lexploration du graphe donnant plus de latitude aumodegravele ACS par rapport agrave AS

Exploitation (Equation 28) si q le q0Exploration biaiseacutee (Equation 29) si q ge q0

(27)

LEacutequation 28 repreacutesente lexploitation directe du graphe ougrave la meilleure arecircte est toujourschoisie

arg maxlisinVi ταil middot η

βil (28)

38

24 Les systegravemes multi-agents

ougrave Vi est lensemble des sommets accessibles depuis le sommet i τil isin [0 1] est la quantiteacute depheacuteromones deacuteposeacutee sur larecircte (i l) par les agents preacuteceacutedents ηil est linformation heuristique delarecircte (i l) α et β sont deux meacutetavariables repreacutesentant respectivement le poids des pheacuteromoneset celui de lheuristique dans le calcul Lheuristique ηil repreacutesente classiquement linformationrelative agrave la distance seacuteparant les sommets i et l et sera deacutecrite apregraves

Il est agrave noter quon ne parle pas ici de pure exploration mais dexploration biaiseacutee dans lesens ougrave les meilleures arecirctes ont une probabiliteacute plus eacuteleveacutee decirctre seacutelectionneacutees Lexpressionmeilleure arecircte est ici deacutenie comme le produit de lheuristique avec la quantiteacute de pheacuteromonesassocieacutees agrave cette arecircte LEacutequation 29 correspond agrave lexploration biaiseacutee du graphe

pij =

ταij middot η

βijsum

lisinViταil middot η

βil

si j isin Vi

0 sinon

(29)

Mise agrave jour globale des pheacuteromones - Apregraves chaque iteacuteration cest-agrave-dire apregraves que tousles agents aient termineacute leur chemin seul lagent qui a trouveacute le meilleur chemin est autoriseacute agravemettre agrave jour le niveau de pheacuteromones τij sur chaque arecircte (i j) quil a emprunteacute

τij =

(1minus ρ) middot τij + ρ middot∆τij si (i j) appartient au meilleur chemin

τij sinon(210)

ougrave ρ est le taux deacutevaporation des pheacuteromones et ∆τij = 1Lbest ougrave Lbest est la longueur dumeilleur chemin

Mise agrave jour locale des pheacuteromones - Un autre ajout du modegravele ACS par rapport aumodegravele AS est la mise jour locale des pheacuteromones Eacutetant donneacute que seul lagent ayant trouveacute lemeilleur chemin deacutepose des pheacuteromones dans ACS (contrairement agrave tous les agents proportion-nellement agrave la qualiteacute de leur solution dans AS) tregraves peu de pheacuteromones sont deacuteposeacutes avec laregravegle de mise agrave jour globale des pheacuteromones Pour contrer ce problegraveme tous les agents mettentagrave jour la quantiteacute de pheacuteromones agrave chaque arecircte emprunteacutee lors de la construction du chemincomme deacutecrit dans lEacutequation 211

τij = (1minus ρ) middot τij + ρ middot τ0 (211)

ougrave τ0 est le niveau de pheacuteromones placeacute sur chaque arecircte du graphe agrave linitialisation du modegravele

Information heuristique - linformation heuristique ηij repreacutesente linformation que lafourmi possegravede a priori sur une arecircte (i j) Dans lalgorithme ACS linformation heuristiqueest calculeacutee en se basant sur la distance entre les deux sommets i et j de larecircte (i j) plus lesdeux sommets sont eacuteloigneacutes lun de lautre et plus la valeur de ηij sera basse indiquant agrave unagent situeacute sur le sommet i quil nest a priori pas inteacuteressant pour lui demprunter larecircte (i j)LEacutequation 212 deacutecrit comment obtenir la valeur de linformation heuristique ηij de larecircte (i j)

ηij =1

dij (212)

ougrave dij est la distance entre les sommets i et j

39

Chapitre 2 Eacutetat de lart

244 Discussion sur le modegravele ACS

Dans cette sous-section nous allons revenir sur un des principes de lalgorithme ACS laregravegle proportionnelle pseudo-aleacuteatoire et son importance danc le fonctionnement du modegraveleCette regravegle comme deacutetailleacutee ci-dessus permet de geacuterer leacutequilibre dans lexploration et lex-ploitation de maniegravere semi-aleacuteatoire (ie avec une variable aleacuteatoire servant agrave xer le seuil debasculement dun comportement vers lautre) Cette dualiteacute explorationexploitation est bienconnue des systegravemes de recherche et de creacuteation de connaissances [March 1991] en voici leurdeacutenition

Lexploration est deacutenie comme eacutetant lexpeacuterimentation avec de nouvelles alternatives sanstenir compte de la connaissance du domaine Les reacutesultats obtenus via cette tactique sont incer-tains mais peuvent aussi aboutir agrave de nouveaux et potentiellement meilleurs reacutesultats que ceuxdeacutejagrave deacutecouverts

Lexploitation quant agrave elle est deacutenie comme le perfectionnement et lextension de reacute-sultats deacutejagrave connus Les reacutesultats obtenus via cette tactique sont plutocirct certains et preacutevisiblesCependant un processus trop axeacute sur lexploitation aura des diculteacutes agrave trouver de tregraves bonnessolutions agrave un problegraveme et aura tendance agrave deacutevelopper la premiegravere solution trouveacutee mecircme sidautres solutions de meilleures qualiteacutes pourraient ecirctre deacutecouvertes en explorant plus avant les-pace de recherche

Il est donc important de trouver un eacutequilibre entre lexploration de lespace de recherchepour trouver de nouvelles solutions et lexploitation permettant daner ces solutions Dautresmeacutethodes dexploration et de deacutecouverte de solutions dans un espace de recherche proposent destechniques speacuteciques pour solutionner ce problegraveme On peut par exemple citer la meacutethode dela descente du gradient consistant agrave minimiser une fonction reacuteelle dans un espace de rechercheCette meacutethode procegravede par iteacuterations successives et se deacuteplace dabord de maniegravere importantedans lespace de recherche an dexplorer un maximum de solutions Puis une fois quune bonnesolution est trouveacutee la meacutethode va diminuer son deacuteplacement dans lespace de recherche andaner la solution trouveacutee La descente de gradient utilise donc une approche ougrave lexplorationest dabord privileacutegieacutee puis petit agrave petit se dirige vers de lexploitation comme illustreacute dans laFigure 26

On pourrait penser agrave premiegravere vue que lexploitation autrement dit le fait que lagent prennela meilleure arecircte disponible agrave chaque choix sorant agrave lui permettrait dobtenir les meilleursreacutesultats En eet le but est ici de trouver le meilleur chemin soit le plus court chemin dans lecadre dune distance euclidienne dun sommet a agrave un sommet b Le fait de permettre agrave lagentde ne pas forceacutement prendre la meilleure arecircte lors de la construction du chemin est donc relati-vement contre-intuitif On peut cependant lever cette intuition avec une seacuterie dexpeacuterimentationsprovenant de la litteacuterature et des observations meneacutees sur les fourmis dans la nature Jean-LouisDeneubourg dont nous avons deacutejagrave parleacute au deacutebut de cette section a beaucoup eacutetudieacute le compor-tement des fourmis en milieu reacuteel et la modeacutelisation de leur processus deacutecisionnel collectif Il aainsi proposeacute en 1990 une expeacuterience appeleacutee le pont binaire [Deneubourg et al 1990] pouvantecirctre reacutesumeacutee ainsi le nid dune colonie de fourmis est seacutepareacutee dune source de nourriture par deuxchemins de longueurs identiques Pour ramener la nourriture au nid les fourmis peuvent doncemprunter lune de ces deux voies sans conseacutequence sur la longueur du chemin total Au deacutepartles fourmis empruntent les deux voies sans distinctions puis une fois un certain temps passeacute

40

24 Les systegravemes multi-agents

Figure 26 Exemple de descente de gradient ougrave lon peut voir lexploration au deacutebut avecun deacuteplacement rapide puis lexploitation ensuite vers la solution trouveacutee ( creacutedit image JorisGillis

une des voies est privileacutegieacutee par rapport agrave lautre et la majoriteacute des fourmis lempruntent Cecomportement est la conseacutequence des pheacuteromones deacuteposeacutees par les fourmis au bout de quelquestemps une des deux voies est emprunteacutee par plus de fourmis que lautre et comme les four-mis deacuteposent des pheacuteromones et sont attireacutees par celles-ci cette dieacuterence saccentue jusquagrave cequune voie soit majoritairement emprunteacutee Il est agrave noter que ce comportement de renforcementnest pas forceacutement vrai pour toutes les espegravece de fourmis dans la nature Cependant cest surce principe que Deneubourg a modeacuteliseacute les eacutequations deacuteterminant le choix eectueacutee par chaquefourmi Ces eacutequations sont agrave la base mecircme des modegraveles ACO deacuteveloppeacutes par Dorigo quelquesanneacutees plus tard Le dispositif de lexpeacuterience des ponts binaires est preacutesenteacute par la Figure 27

Figure 27 Illustration de lexpeacuterience des ponts binaires par Jean-Louis Deneubourg (a)Apregraves un certain temps les fourmis choisissent majoritairement une des deux voies possibles (b)[Deneubourg et al 1990]

Une autre expeacuterimentation du mecircme genre a eacuteteacute reacutealiseacutee par la mecircme eacutequipe de chercheurs ougraveles fourmis doivent se deacuteplacer dun point A agrave un point B en choisissant parmi dieacuterentes voiespossibles [Goss et al 1989] Le dispositif expeacuterimental contient cependant une dieacuterence notable

41

Chapitre 2 Eacutetat de lart

avec lexpeacuterience initiale dans le sens ougrave les dieacuterentes voies ne font pas la mecircme longueurComme le montre la Figure 28 pour aller du nid jusquagrave la nourriture les fourmis disposentdun chemin ougrave deux embranchements similaires sont proposeacutes Chacun de ces embranchementspossegravede une voie courte et une voie longue La fourmi a donc 4 choix agrave eectuer lors dun aller-retour pour partir de son nid et ramener de la nourriture Au deacutebut de lexpeacuterimentation lesfourmis ont besoin de 5 agrave 10 minutes pour explorer leur environnement et trouver la nourritureTous les chemins sont dabord choisis de maniegravere aleacuteatoire puis quelques minutes plus tard etde maniegravere abrupte le meacutecanisme de renforcement rentre en jeu et les voies les plus courtes sontprivileacutegieacutees Une trentaine de minutes apregraves le deacutebut de lexpeacuterimentation les fourmis empruntentmajoritairement le chemin le plus court

Figure 28 Scheacutema du dispositif expeacuterimental utiliseacute pour veacuterier si les fourmis sont biencapables demprunter rapidement la voie la plus courte lorsque leur sont preacutesenteacutes des choixqualitativement dieacuterents [Goss et al 1989]

Alors que la premiegravere expeacuterience a montreacute que les fourmis possegravedent bien un meacutecanismedexploration aleacuteatoire menant au choix puis au renforcement dune des deux voies possibles ladeuxiegraveme expeacuterience montre que les fourmis sont bien capables de choisir le chemin le plus courtlorsquelles sont confronteacutees agrave deux voies possibles ayant des distances dieacuterentes Une critiquepeut ecirctre formuleacutee dans le sens ougrave ces deux expeacuterimentations se sont deacuterouleacutees en laboratoireavec un dispositif expeacuterimental relativement petit (quelques dizaines de centimegravetres pour allerdu nid agrave la nourriture) De par la taille reacuteduite des dispositifs les expeacuterimentations ne duraientgeacuteneacuteralement pas plus dune trentaine de minutes Durant ce laps de temps relativement courtle meacutecanisme deacutevaporation des pheacuteromones ne pouvait pas entrer en jeu car les pheacuteromonesnavaient pas le temps de seacutevaporer

Ces deux expeacuteriences sont inteacuteressantes et illustrent chacune des capaciteacutes fondamentalesdes fourmis dans la nature quant agrave leur deacuteplacement et agrave leur survie Jean-Louis Deneubourg[Deneubourg et al 1990] et Marco Dorigo [Dorigo 2001] ont montreacute comment il eacutetait possible dereproduire ces comportements via des simulations informatiques Dans la tradition des systegravemesmulti-agents les principes permettant de modeacuteliser ces comportements sont relativement simpleset comme montreacute dans la section preacuteceacutedente seules quelques eacutequations susent agrave obtenir unemodeacutelisation de la reacutealiteacute et leacutemergence de comportements intelligents Dans la suite de cettesection nous allons voir quelques exemples dutilisation dalgorithmes provenant des modegraveles

42

25 Utilisation et eacutevolution reacutecentes des algorithmes de colonies de fourmis

ACO dans les systegravemes de recommandation

25 Utilisation et eacutevolution reacutecentes des algorithmes de colonies

de fourmis

Nous avons vu dans les sections preacuteceacutedentes que les algorithmes de colonies de fourmis onteacuteteacute utiliseacutees dans des problegravemes connus comme le voyageur de commerce les tourneacutees de veacutehi-cules ou la gestion de projet agrave contraintes Chacun de ces exemples a la particulariteacute decirctre unproblegraveme doptimisation ougrave le but est de minimiser une distance agrave parcourir ou un temps dexeacute-cution avec certaines contraintes ce qui correspond bien au but premier des ACO La versatiliteacutedes systegravemes multi-agents leur a permis de sadapter dans des domaines comme les systegravemesde recommandation et ils ont particuliegraverement eacuteteacute exploiteacute pour le-eacuteducation Dans la suite decette section nous allons eacutetudier quelques applications des algorithmes de la famille des ACOdans ce domaine particulier

251 Les algorithmes de colonies de fourmis dans les systegravemes de recomman-

dation

Lune des premiegraveres applications des ACO dans le domaine des systegravemes de recommandationa eacuteteacute proposeacutee par [Semet et al 2003] dans le-education Le but de leacutetude eacutetait de recomman-der des cours et des exercices agrave des lyceacuteens avec lobjectif peacutedagogique dameacuteliorer leur reacuteussitescolaire Cette eacutetude est inteacuteressante car en plus de proposer une modication des modegraveles ACOpour la recommandation elle a eacuteteacute reacutealiseacutee en partenariat avec Paraschool 30 une entreprise deacute-dieacutee agrave lapprentissage en ligne pour les lyceacuteens franccedilais permettant aux auteurs de tester leurmodegravele Dans ce dernier le domaine peacutedagogique est repreacutesenteacute par un graphe valueacute ougrave les som-mets sont des items peacutedagogiques et les arcs sont les liens hypertextes ougrave des probabiliteacutes depassage sont associeacutees Les eacutetudiants sont repreacutesenteacutes par des agents se deacuteplaccedilant dans le grapheen laissant des pheacuteromones sur les arcs quils suivent Chaque page de cours ou dexercice (re-preacutesenteacute par un sommet unique dans le graphe) est doteacute dun bouton NEXT amenant leacutetudiantvers un nouveau cours selon une arecircte choisie par lalgorithme selon les facteurs suivants

Poids peacutedagogique W cest la valeur principale de chaque arecircte Il est impleacutementeacutecomme une variable globale accessible agrave tous les agents W est manuellement deacuteni enamont par les professeurs et reegravete limportance des arecirctes venant dun sommet particulier(ie cet exercice est important apregraves la leccedilon x donc W = 0 8 la leccedilon y nest pas tregravesimportante apregraves la leccedilon x donc W = 0 3)

Pheacuteromones S and F S repreacutesente la pheacuteromone de succegraves tandis que F repreacutesente lapheacuteromone deacutechec S est increacutementeacutee quand les eacutetudiants ont reacuteussi agrave compleacuteter lexercicecorrespondant et inversement pour F Ces pheacuteromones sont associeacutees agrave larecircte qui ameneacute lagent au sommet courant mais aussi aux preacuteceacutedents sommets emprunteacutes avec unequantiteacute de plus en plus reacuteduite limiteacutee agrave 4 sommets en arriegravere Le but est de repreacutesenterle fait que le reacutesultat dun exercice deacutepend de lensemble du parcours emprunteacute et nondu dernier sommet uniquement 31 Les pheacuteromones seacutevaporent aussi au fur et agrave mesure

30 http wwwparaschoolcom31 Cette meacutethode est similaire dans son fonctionnement agrave la technique de reacutetropropagation du gradient dans

lapprentissage des reacuteseaux de neurones

43

Chapitre 2 Eacutetat de lart

chaque jour Historique personnel H cest une variable propre agrave chaque sommet visiteacute pour chaque

agent Quand un eacutetudiant valide le module peacutedagogique associeacute au sommet alors la valeurh associeacutee agrave ce sommet particulier est eacutegale agrave 0 5 quand un eacutetudiant eacutechoue le modulepeacutedagogique alors h = 0 75 Cette valeur est ensuite utiliseacutee comme facteur multiplicatifpour reacuteduire la probabiliteacute de visiter le sommet agrave nouveau Si le sommet est revisiteacute Hest agrave nouveau multiplieacute par ces mecircmes valeurs H seacutevapore avec le temps pour tendrevers 1 symbolisant le fait que plus le temps passe et plus un eacutetudiant aura tendance agraveoublier le module peacutedagogique visiteacute

Pour chaque arc a une tness value est calculeacutee selon lEacutequation f(a) = H(ω1W + ω2S minusω3F ) ougrave ω1 ω2 et ω3 sont les poids permettant de moduler limportance des 3 facteurs pris encompte Plus la valeur de f(a) est haute et plus larc sera consideacutereacute attractif Un arc sera doncattractif quand

son ndivideud darriveacutee na jamais eacuteteacute visiteacute ou na pas eacuteteacute visiteacute depuis longtemps (H rarr 1) il est pleacutebisciteacute par les professeurs (W important) il y a une atmosphegravere de succegraves autour de cet arc (S important) peu deacutechecs ont eu lieu pregraves de cet arc (F faible)

An de choisir le prochain arc pour leacutetudiant le systegraveme seacutelectionne aleacuteatoirement un cer-tain nombre darcs possibles et garde celui posseacutedant la plus haute valeur f(a) La seacutelection dunsous-ensemble darcs permet de varier un minimum les recommandations et deacuteviter de proposertout le temps les arcs les plus attractifs

Les auteurs proposent donc ici une adaptation complegravete des ACO pour un systegraveme de recom-mandation dans le-eacuteducation tout en inteacutegrant des principes peacutedagogiques importants Luti-lisation de plusieurs types de pheacuteromones et de dieacuterentes valuations sur les arecirctes du graphepermettent dentrevoir le potentiel et ladaptabiliteacute des algorithmes ACO Quelques critiquespeuvent cependant ecirctre proposeacutees

Une premiegravere critique possible est quil nexiste pas de modegravele utilisateur prenant en compteles caracteacuteristiques personnelles de chaque eacutetudiant (notes niveau style dapprentissage) Pos-seacuteder et utiliser un modegravele par eacutetudiant pourrait permettre agrave lalgorithme de mieux sadapteraux cas particuliers nombreux dans le domaine des systegravemes de recommandation [Gras et al2016] Dans cet article les auteurs montrent que les techniques classiques de ltrage collaboratifnarrivent pas agrave bien deacutetecter les utilisateurs atypiques 32 alors quil est possible de deacutetecter etde satisfaire ces derniers avec des techniques speacuteciques

Une autre critique possible concerne le fait que les professeurs doivent au preacutealable eacutevaluerles chemins possibles agrave partir de chaque sommet sous la forme du poids peacutedagogique W Ce faitreacutevegravele que lexpeacuterimentation na pas utiliseacute un grand nombre de ressources peacutedagogiques (ce quiest le cas car le graphe utiliseacute par les auteurs ne posseacutedait que 20 ndivideuds et 47 arecirctes soit 20ressources peacutedagogiques) Dans la pratique cette meacutethode nest pas adapteacutee pour trois raisonsmajeures Premiegraverement il est dicilement concevable deacutevaluer manuellement la probabiliteacute de

32 Les utilisateurs atypiques (Grey Sheep Users) sont des utilisateurs posseacutedant des preacutefeacuterences dieacuterentes dela majoriteacute des autres utilisateurs du systegraveme

44

25 Utilisation et eacutevolution reacutecentes des algorithmes de colonies de fourmis

passage de chaque arecircte dans des domaines deacutepassant les quelques dizaines de ressources Deuxiegrave-mement lutilisation dexperts du domaine comme les professeurs dans le-eacuteducation nest pasforceacutement possible selon le domaine consideacutereacute Qui peut par exemple juger de la qualiteacute destransitions agrave partir dune musique speacutecique Troisiegravemement un tel modegravele nest que dicile-ment transfeacuterable en leacutetat dun domaine applicatif agrave un autre pour les raisons eacutevoqueacutees ci-dessus

Inteacuteressons-nous maintenant agrave une autre eacutetude dans le-eacuteducation qui propose une solutionpour permettre une plus grande personnalisation des recommandations Dans leur article [Kurilo-vas et al 2015] utilisent eux aussi les ACO avec comme but de fournir des seacutequences composeacutees demodules dapprentissage aux eacutetudiants en fonction de leur style dapprentissage Des recherchesont montreacute quil existait de grands styles dapprentissage et que les apprenants posseacutedaient despreacutefeacuterences pour certains styles plus que dautres Les auteurs utilisent ici la cateacutegorisation en 4grands styles proposeacutee par [Honey et al 1992] 33 Ainsi les agents ne sont deacutesormais plus tousidentiques mais possegravedent un ou plusieurs style(s) dapprentissage preacutefeacutereacute(s) et la mise agrave jourdes pheacuteromones est elle aussi modieacutee an de prendre en compte ces preacutefeacuterences Ainsi un agentpreacutefeacuterera un chemin composeacute de modules dapprentissage correspondant agrave son ou ses propre(s)style(s) dapprentissage et deacuteposera plus de pheacuteromones le cas eacutecheacuteant Ces changements reegravetentune volonteacute de personnalisation des recommandations sinscrivant dans le reacutecent changement deparadigme du domaine des systegravemes de recommandation ougrave les preacutefeacuterences des utilisateurs sontde plus en plus prises en compte Il est neacuteanmoins agrave noter pour cette eacutetude quil est neacutecessairede faire passer un long questionnaire pour deacutenir les styles dapprentissage des apprenants avantde pouvoir utiliser le systegraveme De plus ces styles dapprentissage sont xes et ne peuvent plusecirctre modieacutes apregraves le deacutemarrage du systegraveme empecircchant potentiellement un apprenant deacutevoluerdans sa maniegravere dapprendre

Lideacutee de modier le modegravele ACO pour prendre en compte plusieurs types dutilisateurs aaussi eacuteteacute exploiteacutee dans une autre eacutetude en e-eacuteducation par [Kardan et al 2014] Cette eacutetude a lemecircme but que la preacuteceacutedente agrave savoir recommander des seacutequences personnaliseacutees eacuteducatives avecACO mais les auteurs proposent une autre solution tout aussi inteacuteressante Ils se basent ainsi surla theacuteorie de David Ausubel selon laquelle lapprentissage est faciliteacute lorsque lapprenant peutmettre en relation les nouveaux concepts quil est en train de deacutecouvrir avec ce quil connaicirct deacutejagrave[Ausubel 1963] Les auteurs proposent un algorithme en deux parties

1 Les apprenants sont dabord eacutevalueacutes avec des items de tests correspondant chacun agrave unou plusieurs concepts devant ecirctre appris An de deacuteterminer le degreacute de familiariteacute agraveun concept par un apprenant le score quil a obtenu agrave chaque item de test est utiliseacuteen combinaison avec le degreacute de lien entre les concepts et chaque item pour creacuteer unematrice learners times concepts Lalgorithme des k-means est ensuite utiliseacute an de diviserles apprenants en groupes ayant les mecircmes familiariteacutes avec les concepts

2 lalgorithme ACO est appliqueacute avec autant de groupes dagents speacuteciques quil y a degroupes dapprenants deacutecouverts preacuteceacutedemment avec les k-means Ainsi un chemin opti-mal est trouveacute pour chaque groupe permettant de naviguer parmi tous les concepts dansun ordre preacutecis et speacutecique au degreacutes de familiariteacute de chaque groupe Autrement dit lesystegraveme recommande pour chaque groupe dapprenants une seacutequence eacuteducative person-naliseacutee en fonction de ses connaissances initiales

33 Activist Theorist Pragmatist Reector

45

Chapitre 2 Eacutetat de lart

On retrouve donc ici lideacutee de creacuteer dieacuterents types dagents pour reacutesoudre dieacuterents pro-blegravemes Cette constatation nest pas eacutetonnante dans le sens ougrave lorsquil sagit doptimisationun seul groupe dagents peut sure agrave optimiser une variable unique comme par exemple la dis-tance En revanche dans le domaine des systegravemes de recommandation il nest pas envisageablede proposer la mecircme recommandation agrave tous les utilisateurs Au contraire lapproche agrave privi-leacutegier est de pouvoir sadapter au cas par cas agrave chaque utilisateur et de prendre en compte sespreacutefeacuterences pour lui proposer une solution adapteacutee On peut dailleurs eacutemettre deux critiques decette eacutetude agrave la lumiegravere de cette analyse Premiegraverement mecircme si le modegravele propose un certaindegreacute de personnalisation sa granulariteacute nest encore pas assez ne puisquil traite des groupesdindividus et non un individu unique Ensuite il ny a encore une fois pas de moyen pour unapprenant de changer dynamiquement de groupe eacutetant donneacute que ces derniers doivent ecirctre creacuteeacutesen amont du processus de recommandation

Toujours dans la famille des algorithmes ACO nous pouvons eacutegalement citer le modegraveleAttribute-based Ant Colony System qui est similaire aux derniers modegraveles deacutecrits ci-dessus touten proposant un degreacutes de personnalisation plus n [Yang and Wu 2009] Les auteurs utilisentle modegravele dapprentissage de Kolb [Kolb and Fry 1974] an dassigner agrave chaque ressource eacuteduca-tive et agrave chaque apprenant deux attributs les deacutecrivant (type dapprentissage de la ressourcedelapprenant et niveau de compeacutetence de la ressourcede lapprenant) Les agents possegravedent aussices attributs puisquils correspondent aux apprenants Les auteurs calculent ensuite un niveaude correspondance entre lapprenant et la ressource eacuteducative permettant de juger de la qualiteacutedu chemin trouveacute Finalement la seacutequence dont les ressources eacuteducatives la composant corres-pondent le plus aux caracteacuteristiques de lagent est recommandeacutee agrave lapprenant Ce travail estinteacuteressant car il pousse encore un peu plus la personnalisation des recommandations Cependanton commence agrave remarquer ici que la neacutecessiteacute de personnaliser toujours plus les recommandationscommence agrave complexier de maniegravere importante les systegravemes proposeacutes Nous discuterons plusen deacutetail de ce point dans la conclusion de cette section

Prenons enn une derniegravere eacutetude dans le domaine de le-eacuteducation qui sest particuliegravere-ment inteacuteresseacutee agrave la notion de seacutequence et dobjectif agrave atteindre pour lapprenant [Van den Berget al 2005] En eet les auteurs expliquent que les plateformes deacuteducation en ligne proposentde plus en plus datteindre des objectifs peacutedagogiques de haut niveau (eg acqueacuterir une com-peacutetence speacutecique posseacuteder un certain niveau de connaissance dans un domaine ) tout enlaissant les apprenants libres de suivre les modules quils souhaitent Cependant cette exibiliteacutede fonctionnement complexie les programmes de ces plateformes et peut amener agrave labandondes apprenants Pour remeacutedier agrave ce problegraveme les auteurs proposent un systegraveme de guidage desapprenants utilisant ACO baseacute sur la speacutecication au preacutealable de plusieurs concepts pour chaqueapprenant

Le but de lapprenant cest la description du niveau de compeacutetence que lapprenant veutatteindre)

Le parcours le plan pour atteindre le but de lapprenant deacutecrit comme une seacuterie deseacutequences de ressources eacuteducatives Les plateformes dapprentissage en ligne proposentsouvent elles-mecircmes des parcours via lesquels les apprenants peuvent atteindre leur but

La position de lapprenant repreacutesente lensemble des ressources eacuteducatives ayant eacuteteacutecompleacuteteacutees par lapprenant

Autrement dit an de pouvoir satisfaire un apprenant il est neacutecessaire de savoir quel est

46

25 Utilisation et eacutevolution reacutecentes des algorithmes de colonies de fourmis

le but quil souhaite atteindre la maniegravere dont il veut latteindre et sa position actuelle Cestrois informations sont primordiales pour comprendre la trajectoire dun utilisateur et pour ecirctrecapable de lui recommander une seacutequence adapteacutee agrave ses besoins

Nous avons vu dans cette section le potentiel des algorithmes de colonies de fourmis pour larecommandation Neacuteanmoins la premiegravere partie de leacutetat de lart a montreacute agrave quel point il eacutetaitimportant pour les systegravemes actuels de pouvoir prendre en compte plusieurs facteurs humainsan de satisfaire au mieux les utilisateurs Dans la section suivante nous allons nous inteacuteresseragrave la maniegravere dont les algorithmes de colonies de fourmis sont capables de minimiser non plus unseul objectif (la distance) mais bien plusieurs objectifs pouvant ecirctre opposeacutes les uns aux autres

252 Les algorithmes de colonies de fourmis multi-objectifs

En parallegravele du deacuteveloppement des algorithmes de colonies de fourmis mono-objectif dans lalitteacuterature une partie de la communauteacute scientique sest inteacuteresseacutee aux algorithmes de coloniesde fourmis multi-objectifs dans le but de reacutesoudre de nouvelles classes de problegravemes En eetles algorithmes ACO ont agrave lorigine eacuteteacute conccedilus pour minimiser une valeur souvent repreacutesenteacuteepar la notion de distance Cependant de nombreux problegravemes neacutecessitent la minimisation demultiples valeurs en parallegravele an dobtenir une solution On peut par exemple citer les variantesmulti-objectifs de problegravemes vus dans la section preacuteceacutedente

Le problegraveme du voyageur de commerce multi-objectifs (multi-objective travelling salesmanproblem) ougrave la distance agrave minimiser ainsi que le temps de voyage sont les deux objectifsagrave minimiser (avec lintroduction de contraintes de circulation rendant certains cheminsplus ou moins longs agrave emprunter)

Le problegraveme de la tourneacutee de veacutehicules avec fenecirctre de temps (vehicle routing problem withtime windows) ougrave en plus de minimiser le nombre de veacutehicules utiliseacutes et le trajet totalparcouru par ceux-ci les clients doivent ecirctre livreacutes dans une certaine fenecirctre de temps

Dans le cas de ces deux problegravemes ainsi que pour beaucoup de problegravemes multi-objectifstraiteacutes dans la litteacuterature scientique les objectifs agrave minimiser sont souvent incompatibles entreeux dans le sens ougrave minimiser un objectif speacutecique tend agrave peacutenaliser un ou plusieurs des autresobjectifs Prenons comme exemple le problegraveme du voyageur de commerce multi-objectifs Le butest de trouver le plus court chemin dun point A agrave un point B non seulement dun point devue de la distance parcourue mais aussi du temps neacutecessaire pour faire le chemin Cependantminimiser la distance parcourue impliquera potentiellement demprunter des chemins encombreacutesrallongeant le temps de voyage En dautres termes minimiser lobjectif de distance parcouruepeut deacutegrader lobjectif de temps Inversement optimiser lobjectif de temps demanderait po-tentiellement dutiliser des chemins moins emprunteacutes mais plus longs deacutegradant ainsi lobjectifde minimisation de la distance totale parcourue Ces problegravemes ougrave loptimisation dun objectifaecte les performances des autres objectifs ne possegravedent souvent pas de solution optimale Eneet dans un problegraveme mono-objectif plus un algorithme reacuteussira agrave minimiser cet objectif etmeilleure sera la solution Un problegraveme mono-objectif possegravede donc une solution optimale ougravelobjectif agrave optimiser possegravede une valeur minimale et corollairement il est possible de classerles solutions trouveacutees en fonction de cette valeur Autrement dit pour deux solutions dieacuterentess1 s2 devant minimiser la valeur v pour le mecircme problegraveme si vs1 lt vs2 alors s1 est strictementune meilleure solution que s2 Pour les problegravemes multi-objectifs il nest pas directement possiblede deacuteterminer si une solution est meilleure quune autre Lexemple du voyageur de commerce

47

Chapitre 2 Eacutetat de lart

multi-objectifs avec la distance d et le temps t illustre bien ce fait comment deacuteterminer si une

solution s1 =

d = 13 kmt = 23 mn

est meilleure quune autre solution s2 =

d = 11 kmt = 26 mn

Devant

la multitude de solutions possibles sans moyen direct de les classer il est utile de consideacutererle concept doptimum de Pareto Le principe de Pareto a dabord eacuteteacute inventeacute dans le domainesocio-eacuteconomique pour deacutecrire la distribution de pouvoir et de richesses au sein dune populationIl a ensuite eacuteteacute eacutetendu avec la notion doptimum de Pareto deacutecrivant lensemble des solutionsagrave un problegraveme multi-objectifs ougrave il nest pas possible dameacuteliorer un des objectifs sans deacutegraderles autres 34 Toutes les solutions Pareto-optimales agrave un problegraveme sont donc eacutequivalentes entreelles (mecircme si elles sont bien toutes dieacuterentes les unes des autres) et sont strictement meilleuresque toutes les autres solutions non optimales agrave ce mecircme problegraveme (aussi appeleacutees solutions do-mineacutees) La Figure 29 illustre lespace des solutions sur un problegraveme de minimisation de deuxvariables On remarque la preacutesence dune frontiegravere aussi appeleacute front de Pareto ougrave toutes lessolutions sont optimales

Figure 29 Front de Pareto dun problegraveme de minimisation de deux variables f1 et f2 Toutesles solutions sur cette frontiegravere sont optimales (source Wikipedia)

On peut trouver dans la litteacuterature des exemples de reacutesolution de problegravemes multi-objectifsavec ACO utilisant le concept de Pareto [Alaya et al 2007] proposent un algorithme geacuteneacuteriquebaseacute sur le MAX-MIN Ant System 35 ougrave les nombres de colonies et de structures de pheacuteromonesvarient en fonction du nombre dobjectifsm agrave optimiser Les auteurs proposent ainsi plusieurs va-riantes de leur algorithme ayant des paramegravetres dieacuterents (nombres de colonies de pheacuteromonesde fourmis de cycles et valeur des meta-paramegravetres) Ces dieacuterentes versions sont ensuite testeacuteesavec le problegraveme du sac-agrave-dos multi-objectifs 36 et montrent que la version posseacutedant 1 seulecolonie et m pheacuteromones obtient les meilleurs reacutesultats Outre les reacutesultats obtenus ce travailest inteacuteressant car il propose plusieurs strateacutegies dieacuterentes pour pouvoir adapter les algorithmes

34 On peut deacutecliner ce concept en socio-eacuteconomie ougrave le but est deacutetudier les richesses dune socieacuteteacute an quellessoient reacuteparties selon une solution optimale de Pareto entre toutes les personnes Ce concept a cependant deslimites que nous verrons par la suite35 Le MAX-MIN Ant System [Stuumltzle and Hoos 2000] est une version dieacuterente de lalgorithme initial de

Marco Dorigo posseacutedant deux dieacuterences majeures avec ce dernier seule la fourmi ayant reacutealiseacutee le meilleurparcours peut mettre agrave jour les pheacuteromones du chemin emprunteacute et la quantiteacute de pheacuteromones est limiteacute dans unintervalle speacutecique sur chaque arc36 Le plus souvent reacutefeacuterenceacute dans la litteacuterature en anglais via lacronyme MOKP Multi-Objective Knapsack

Problem

48

25 Utilisation et eacutevolution reacutecentes des algorithmes de colonies de fourmis

ACO aux problegravemes multi-objectifs agrave savoir

Traces de pheacuteromones 2 strateacutegies existent lorsquun problegraveme possegravede plusieurs objec-tifs La premiegravere est de nutiliser quun seul type de pheacuteromones Dans ce cas la quantiteacutede pheacuteromones deacuteposeacutee par les fourmis est deacutenie par une agreacutegation des dieacuterents objec-tifs La deuxiegraveme strateacutegie consiste agrave utiliser plusieurs pheacuteromones Dans ce cas chaqueobjectif est geacuteneacuteralement associeacute agrave une colonie de fourmis unique chacune posseacutedant sonpropre type de pheacuteromones

Deacutenition des heuristiques encore une fois 2 strateacutegies existent pour la partie heuristiqueUne premiegravere solution consiste agrave agreacuteger tous les objectifs en une seule heuristique Unedeuxiegraveme solution consiste agrave consideacuterer chaque objectif seacutepareacutement Dans ce cas il y ageacuteneacuteralement une colonie par objectif

Mise-agrave-jour des pheacuteromones lors de la mise agrave jour des pheacuteromones il est neacutecessaire dedeacutecider sur quelle solution des pheacuteromones doivent ecirctre deacuteposeacutees Une premiegravere possibi-liteacute est de reacutecompenser les meilleures solutions agrave chaque objectif Une seconde possibiliteacuteest de reacutecompenser toutes les solutions appartenant agrave lensemble des solutions Pareto-optimales

Le concept doptimisation multi-objectifs est aussi utiliseacute pour reacutesoudre des problegravemes sansutiliser des algorithmes de type ACO Ces travaux sont inteacuteressants dans le cadre de cette thegravesecar ils peuvent orir un point de comparaison aux modegraveles deacuteveloppeacutes dans le chapitre suivantougrave le but est le mecircme mais la technique utiliseacutee pour y parvenir est dieacuterente Nous allons main-tenant voir plus en deacutetails le travail de [Ribeiro et al 2014] ougrave les auteurs ont proposeacute deuxmeacutethodes de recommandation multi-objectifs sans utiliser dalgorithmes de type ACO

Pareto-ecient ranking dans cette premiegravere meacutethode le principe est ici de re-preacutesenter chaque ressource recommandable agrave un point dans un espace agrave n dimensionsappeleacute le user-interest space Un point dans cet espace est repreacutesenteacute par n coordon-neacutees [c1 c2 cn] ougrave chacune repreacutesente un score de pertinence de la ressource pourlutilisateur estimeacute par dieacuterents algorithmes Les points situeacutes agrave la frontiegravere de Paretocorrespondent aux cas ougrave aucune Pareto-ameacutelioration nest possible dans les dieacuterentesdimensions

Pareto-Ecient Hybridization (PEH) dans cette deuxiegraveme meacutethode le principe estdassocier chaque ressource avec une valeur de pertinence unique pour lutilisateur Cettevaleur est elle-mecircme estimeacutee par une combinaison lineacuteaire des scores de pertinence obtenuspar n dieacuterents algorithmes de recommandation existants (ie αtimesc1+βtimesc2+ +θtimescn)Dans cette tactique lespace appeleacute objective space comporte 3 dimensions ougrave chaquepoint correspond aux niveaux de preacutecision de diversiteacute et de nouveauteacute atteint par unetechnique dhybridation possible Le but est de chercher les poids (ie α β θ) pourlesquels lhybridation des dieacuterents algorithmes permet dobtenir le meilleur reacutesultat pourlutilisateur Il est ensuite possible de moduler cette hybridation an de correspondre aumieux aux prioriteacutes de lutilisateur au moment de la recommandation (eg pour un utilisa-teur reacutecent le systegraveme pourrait proposer des ressources pertinentes et classiques pour luiprouver linteacuterecirct du systegraveme de recommandation tandis que pour un utilisateur ancienil pourrait ecirctre inteacuteressant de privileacutegier la diversiteacute et la nouveauteacute an de lui apporterde nouvelles ressources quil ne connaicirct pas encore)

Selon les auteurs la premiegravere meacutethode permet de trouver un ordonnancement partiel entre

49

Chapitre 2 Eacutetat de lart

les ressources tout en eacutevitant les ressources positionneacutees aux positions extrecircmes de la frontiegravere dePareto La deuxiegraveme meacutethode quant agrave elle utilise la frontiegravere de Pareto pour trouver des hybri-dations capable de sadapter aux demandes et dorir des recommandations eacutetant simultaneacutementpertinentes en termes de preacutecision de diversiteacute et de nouveauteacute Dans le cadre de cette thegravese ladeuxiegraveme technique pareto-ecient hybridization (PEH) est particuliegraverement inteacuteressante carelle correspond aux probleacutematiques poseacutees au chapitre preacuteceacutedent De plus cet article est agrave lafois reacutecent est beaucoup reacutefeacuterenceacute dans la litteacuterature scientique de par la qualiteacute des solutionsproposeacutees Ainsi nous preacuteciserons le fonctionnement de lalgorithme PEH proposeacute par [Ribeiroet al 2014] et nous utiliserons ses reacutesultats comme comparaison pour eacutevaluer les performancesde notre modegravele dans la chapitre preacutesentant les expeacuterimentations meneacutees et les reacutesultats obtenus

253 Discussion sur lutilisation de loptimum de Pareto

Dans ces derniegraveres pages nous nous sommes attardeacutes sur lutilisation du concept doptimumde Pareto dans la litteacuterature Cependant mecircme si lutilisation de cette technique est courantepour reacutesoudre des problegravemes multi-objectifs elle nest pas forceacutement la plus adapteacutee selon lessituations rencontreacutees et les solutions attendues On peut deacutenombrer au moins quatre problegravemesengendreacutes par lutilisation du concept de Pareto

1 Comme le souligne [Iredi et al 2001] lutilisation du front de Pareto est utile lorsquilnest pas possible dordonner limportance des dieacuterents objectifs du problegraveme Lorsquecela est possible des poids sont attribueacutes agrave chacun des objectifs et il devient possible declasser les dieacuterentes solutions obtenues selon ces poids

2 Il est neacutecessaire decirctre capable de geacuteneacuterer beaucoup de solutions pour un problegraveme donneacutean de pouvoir deacuteterminer les solutions Pareto-optimales et les solutions domineacutees

3 Une solution Pareto-optimale nest pas forceacutement une solution inteacuteressante pour le pro-blegraveme Un exemple connu illustre ce fait une socieacuteteacute ougrave un seul homme possegravede lensembledes richesses est optimale car partager ces richesses entraicircnerait la reacuteduction du bien-ecirctredau moins un individu

4 Si le problegraveme exige le choix dune solution le front de solutions Pareto-optimales nepermet pas a priori de faire un choix eacutetant donneacute que toutes les solutions du front sonteacutequivalentes les unes aux autres Le problegraveme dispose alors dun ensemble de solutions lereacutesolvant et non dune seule solution

Le dernier point ci-dessus est eacutegalement eacutevoqueacute dans [Dorigo and Birattari 2010] ougrave lesauteurs expliquent que deux maniegraveres de reacutesoudre les problegravemes multi-objectifs existent dans lalitteacuterature soit il est possible de classer les objectifs par ordre dimportance ou eacuteventuellementde combiner tous les objectifs en un seul gracircce agrave une somme pondeacutereacutee soit les preacutefeacuterences ou lespoids a priori ne sont pas connus et dans ce cas il est inteacuteressant de deacuteterminer un ensemblede solutions Pareto optimales Dans le cadre dun systegraveme de recommandation et comme nouslavons illustreacute dans la Section 22 il est possible destimer les besoins des utilisateurs danschacune des dimensions eacutevalueacutees (diversiteacute nouveauteacute preacutecision ) et donc de moduler leurimportance en amont de la recommandation (eg en leur attribuant des poids par exemple)

26 Discussion geacuteneacuterale

Dans cet eacutetat de lart nous avons fait un tour dhorizon du domaine de la recommandationet de son eacutevolution au cours de ces derniegravere anneacutees Avec la deacutemocratisation dInternet de plus

50

26 Discussion geacuteneacuterale

en plus dutilisateurs ont eacuteteacute ameneacutes agrave utiliser ces systegravemes et aujourdhui ils accompagnentlimmense majoriteacute des grands sites web et prennent une place de plus en plus importante Cettedeacutemocratisation a permis la mise en relief des besoins toujours plus varieacutes des utilisateurs et amontreacute que les systegravemes mono-objectif baseacutes uniquement sur la preacutecision des recommandationsneacutetaient plus susants Agrave la lumiegravere de ce constat nous nous sommes particuliegraverement inteacute-resseacutes aux techniques permettant de prendre en compte le plus de dimensions possibles dans lesbesoins des utilisateurs que nous avons appeleacutes facteurs humains Les travaux de la litteacuteraturedu domaine preacutesenteacutes dans cette section ont permis de mettre en exergue un certain nombre depoints inteacuteressants qui seront utiliseacutes pour reacutepondre aux probleacutematiques de cette thegravese ils sontreacutesumeacutes dans la liste suivante

[Dorigo and Birattari 2011] les auteurs ont preacutesenteacute dieacuterents modegraveles dalgorithmes defourmis permettant de reacutesoudre un grand nombre de problegravemes Ces modegraveles sont inteacuteres-sants notamment de par leur capaciteacute de reacutesoudre des problegravemes multi-objectifs complexesgracircce aux notions dintelligence collective et deacutemergence Ils sont utiliseacutes dans dieacuterentsdomaines dapplication (optimisation recommandation) ils sont tregraves modulables etorent de nombreuses possibiliteacutes pour les probleacutematiques de cette thegravese

[Semet et al 2003] cette eacutetude est lune des premiegraveres agrave proposer lutilisation de plusieurspheacuteromones dieacuterentes dans les ACO dans le cadre dun systegraveme de recommandation dansle-education Ces dieacuterents pheacuteromones eacutetaient chacun destineacutes agrave reacutesoudre une facettedu problegraveme Ce travail a neacuteanmoins aussi montreacute les limites de la creacuteation manuelle dungraphe sur lequel appliquer les ACO deacutemontrant linteacuterecirct davoir une meacutethode automa-tique de creacuteation et de valuation dun graphe repreacutesentant le domaine dapplication et sesressources

[Kurilovas et al 2015] les auteurs ont deacutemontreacute dans cette eacutetude linteacuterecirct de pouvoircateacutegoriser les utilisateurs dun systegraveme an de personnaliser davantage les recommanda-tions mais elle a aussi montreacute le besoin de pouvoir modier en cours de fonctionnementces cateacutegories pour ne pas enfermer les utilisateurs dans les mecircmes recommandations

[Kardan et al 2014] les auteurs ont ici montreacute lutilisation de plusieurs types dagentsdieacuterents qui chacun cherchaient dieacuterentes solutions Cette technique est proche de luti-lisation des dieacuterents types de pheacuteromones de [Semet et al 2003] et permet de chercherdes solutions plus varieacutees agrave des problegravemes complexes

[Yang and Wu 2009] cette eacutetude utilise les modegraveles ACO dans le-education en eacutetoantencore le niveau de personnalisation pour chaque utilisateur Elle illustre cependant leproblegraveme courant ougrave lameacutelioration de la personnalisation des recommandations reacutesultesouvent dans laugmentation de la complexiteacute du modegravele

[Van den Berg et al 2005] cet article propose de recommander des seacutequences de res-sources eacuteducatives agrave des apprenants Il illustre linteacuterecirct de deacutenir une seacutequence de recom-mandation avec des buts peacutedagogiques agrave atteindre un objectif nal et un point de deacutepartougrave lutilisateur se trouve actuellement

[Ribeiro et al 2014] ce dernier article nutilise pas les ACO mais une hybridation de plu-sieurs algorithmes permettant de proposer des recommandations de ressources pertinentespour chaque utilisateur sur 3 dimensions (preacutecision diversiteacute nouveauteacute) Il propose doncde reacutesoudre un problegraveme similaire agrave celui poseacute dans cette thegravese mais avec une techniquedieacuterente des travaux preacutesenteacutes preacuteceacutedemment il sera par conseacutequent une solide base decomparaison pour mesurer les performances dun algorithme de type ACO

Dune maniegravere geacuteneacuterale cette revue des travaux sur les algorithmes de colonies de fourmis

51

Chapitre 2 Eacutetat de lart

ont montreacute leur puissance de reacutesolution de problegravemes varieacutes et leur modulariteacute Cependant nousavons aussi constateacute ici une tendance geacuteneacuterale ces derniegraveres anneacutees agrave complexier toujours plusle modegravele initial et les agents le composant illustrant un certain eacuteloignement avec la philosophiedes modegraveles multi-agents Celle-ci repose sur la reacutesolution de problegravemes complexes gracircce agrave laproprieacuteteacute de leacutemergence et de lauto-organisation dagents simples reacutegis par des regravegles simplesCette complexication deacutecoule cependant de la direction prise par le domaine des systegravemes de re-commandation ces derniegraveres anneacutees avec la deacutemocratisation de nombreuses mesures deacutevaluationtelles que la diversiteacute la nouveauteacute etc Dans la suite de cette thegravese nous eacutetudierons la maniegraveredont il est possible de combiner la neacutecessaire complexication des recommandations an decirctrele plus pertinent possible pour lutilisateur et la simpliciteacute inheacuterente aux modegraveles multi-agents

En conclusion nale de cet eacutetat de lart nous pouvons deacutenir deux enjeux qui guiderontla suite de ce travail la recommandation multi-objectifs et la recommandation enseacutequences Le but de cette thegravese est donc de sinscrire agrave lintersection de ces deux enjeux gracircceagrave un modegravele de colonies de fourmis multi-objectifs qui sera deacutecrit dans le chapitre suivant

52

Chapitre 3

Notre modegravele de recommandationmulti-objectifs AntRS

Sommaire

31 Introduction 54

32 Fonctionnement geacuteneacuteral du modegravele 54

33 Graphe 55

34 Objectifs 60

341 Similariteacute 63

342 Diversiteacute 64

343 Nouveauteacute 64

344 Preacutefeacuterences 66

345 Progressiviteacute 67

35 Tactiques de fusion 70

351 Colonie de fusion 71

352 Fusion de seacutequences 72

353 Conclusion 72

53

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

31 Introduction

Apregraves cet eacutetat des lieux de la recherche sur les systegravemes de recommandation il peut ecirctre utilede rappeler ici les principaux objectifs que nous nous sommes xeacutes pour ecirctre satisfaits par notremodegravele multi-objectifs de recommandation de seacutequences

Ecirctre susamment geacuteneacuterique pour quil puisse ecirctre utiliseacute dans plusieurs domaines touten sadaptant aux diverses contraintes et eacutevolutions de lenvironnement de ces domaines

Permettre de prendre des facteurs humains Pouvoir geacuterer dimportantes quantiteacute de donneacutees cest-agrave-dire ecirctre capable de produire des

recommandations satisfaisantes dans un grand espace de recherche Produire des recommandations sous forme de seacutequences

Tous ces objectifs sont neacutecessaires pour produire un modegravele reacutepondant aux probleacutematiqueseacutenonceacutees dans lintroduction de ce manuscrit Le modegravele que nous avons conccedilu prend inspirationdes modegraveles de colonies de fourmis preacutesenteacutes dans leacutetat de lart et plus particuliegraverement dela variante ACS (Ant Colony System) car cette version possegravede des qualiteacutes intrinsegraveques im-portantes notamment sa capaciteacute supeacuterieure dexploration de lenvironnement pour reacutepondreaux probleacutematiques poseacutees Pour rappel les avantages du modegravele ACS ont eacuteteacute deacutetailleacutes dans laSection 243 En se basant sur Dans la suite de ce chapitre nous deacutetaillerons le fonctionnementgeacuteneacuteral du modegravele dans la Section 32 Ensuite nous preacutesenterons la creacuteation du graphe dansla Section 33 et les facteurs humains consideacutereacutes et leur inteacutegration dans la Section 34 Nousdeacutetaillerons par la suite les deux tactiques de fusion des reacutesultats pour la recommandation naledans la Section 35 et enn nous discuterons du modegravele dans son ensemble

32 Fonctionnement geacuteneacuteral du modegravele

Dans le chapitre preacuteceacutedent sur leacutetat de lart nous avons preacutesenteacute dans la Section 243 lemodegravele ACS de Dorigo et son fonctionnement [Dorigo and Birattari 2010] Notre modegravele sinspiredACS dans le sens ougrave nous reprenons les grandes eacutetapes de ce dernier tout en ladaptant aucontexte et aux contraintes des systegravemes de recommandation Pour rappel voici lalgorithme 1de haut niveau sur lequel se base le fonctionnement de lensemble des algorithmes des ACO

Algorithm 1 Meacutetaheuristique Ant Colony Optimization

Initialisation des paramegravetres et des pheacuteromoneswhile conditions darrecircts non atteintes doConstruction des solutionsRecherche Locale (optionnelle)Mise agrave jour des pheacuteromones

end while

Chaque version existante des ACO a introduit des variations dans une ou plusieurs deseacutetapes centrales de lalgorithme La variante ACS a par exemple introduit la mise agrave jour localedes pheacuteromones dans la derniegravere eacutetape UpdatePheromones Notre modegravele suit cette philosophieen prolongeant les travaux de Dorigo agrave travers une variante multi-colonies et multi-objectifs quenous avons nommeacute AntRS Avant de deacutenir plus en deacutetail ces modications dans le reste duchapitre voici lalgorithme 2 modieacute correspondant au fonctionnement de notre modegravele

54

33 Graphe

Algorithm 2 AntRS

Initialisation des paramegravetres et des pheacuteromonesCreacuteation du grapheInitialisation des dieacuterentes colonieswhile conditions darrecircts non atteintes doConstruction des solutions pour chaque colonieMise agrave jour locale et globale des pheacuteromones modieacutee

end whileFusion des dieacuterentes solutionsRecommandation

Dans notre modegravele inspireacute dACS nous pouvons distinguer un certain nombre dapports quiseront approfondis dans la suite de ce chapitre La creacuteation du graphe prend ainsi une placepreacutepondeacuterante en amont de lexeacutecution de lalgorithme an de pouvoir repreacutesenter correctementle domaine dapplication et ses ressources De plus alors que dans les modegraveles initiaux de Dorigoune seule colonie de fourmis avait pour but de trouver des solutions notre modegravele possegravedeplusieurs colonies travaillant chacune agrave optimiser un objectif (ie un aspect correspondant agraveun facteur humain) de la recommandation nale Ces dieacuterentes colonies constituent le cdivideurde notre approche et seront expliqueacutees en deacutetail Enn apregraves la convergence dune solutiondans chacune des colonies (ie un chemin dans le graphe correspondant agrave une seacutequence deressources dans un ordre preacutecis) un dernier processus de fusion de ces solutions a lieu an dene proposer agrave lutilisateur nal quune seule seacutequence orant le meilleur compromis entre lesdieacuterents objectifs de chaque colonie Apregraves cette derniegravere eacutetape la recommandation peut ecirctreproposeacutee agrave lutilisateur Dans la suite de ce chapitre ces dieacuterentes eacutetapes seront deacutetailleacutees ande mettre en exergue le fonctionnement de notre modegravele

33 Graphe

La premiegravere eacutetape de fonctionnement du modegravele est la creacuteation du graphe Celui-ci repreacute-sente lenvironnement dans lequel les agents eacutevoluent Dans ce contexte les ndivideuds repreacutesententles ressources du domaine (musiques oeuvres dart contenu peacutedagogique etc) tandis que lesarecirctes sont les chemins permettant dacceacuteder agrave ces ressources Les agents se deacuteplacent ainsi dendivideuds en ndivideuds en empruntant des arecirctes Le processus de creacuteation du graphe nest souvent quepeu deacutetailleacute dans la litteacuterature pour plusieurs raisons Premiegraverement un certain nombre deacutetudesse focalisent sur un jeu de test composeacute de peu de ressources limitant linteacuterecirct de deacutevelopperdes tactiques eacutelaboreacutees de creacuteation dun graphe Cela peut ecirctre ducirc agrave la simpliciteacute dutiliser unpetit jeu de donneacutees aux limites poseacutees par le domaine dapplication ou encore agrave la diculteacute dereacutecolter des donneacutees Par exemple si le but est de deacutevelopper un systegraveme de recommandationdans un museacutee contenant 100 divideuvres dart le graphe repreacutesentant le domaine sera relativementpeu complexes (ie 100 ndivideuds et quelques centaines ou milliers darecirctes) De la mecircme maniegraverelorsque le jeu de donneacutees est limiteacute en taille il est possible pour des experts du domaine decreacuteer et de valuer manuellement les arecirctes entre les dieacuterentes ressources comme cela a eacuteteacute faitdans [Semet et al 2003] Cependant la conception dun algorithme permettant de construire latopologie du graphe de maniegravere automatique possegravede agrave la fois des avantages et des inconveacutenients

55

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

Avantages Inconveacutenientsbull La conception algorithmique du graphepermet de sadapter rapidement agrave dieacute-rents domaines applicatifs ayant dieacuterentstypes et nombres de ressources

bull La qualiteacute dun graphe produit automa-tiquement deacutepend fortement de la qualiteacutede son algorithme et peut potentiellementecirctre moins pertinent quun graphe creacutee parun expert du domaine

bull Il devient possible dinteacutegrer untregraves grand nombre de ressources du do-maine applicatif si cela est neacutecessaire (parexemple toutes les musiques dun sitedeacutecoute de musiques en ligne)

bull La prise en compte dun grand nombrede ressources a pour conseacutequence daug-menter signicativement le temps de calculde lalgorithme travaillant sur ce graphe enaval

bull Lintervention dexperts humains ne de-vient plus neacutecessaire pour creacuteer la topolo-gie du graphe et valuer ses arecirctes

bull Lalgorithme de creacuteation automatiquedu graphe doit capturer les informationsdun domaine et les reeacuteter dans la topolo-gie du graphe (ie pourquoi une ressourceest lieacutee par une arecircte agrave une autre etc)

Le but de cette section sera donc de deacutetailler lalgorithme de creacuteation du graphe ainsi que lesreacuteponses proposeacutees aux inconveacutenients eacutenonceacutes ci-dessus

Avant de preacutesenter la meacutethode de creacuteation du graphe il est important de discuter de ceque repreacutesente ce graphe dans le modegravele ACO et de son pendant pour les fourmis Une desdieacuterences principales entre le comportement reacuteel des fourmis dans la nature et les simulationsinformatiques des algorithmes ACO reacuteside dans la deacutenition de lespace de recherche Les four-mis reacuteelles eacutevoluent dans un espace de recherche continu sans aucun point de repegravere ni cheminpreacute-eacutetabli Les fourmis sont en outre libres dexplorer lenvironnement ougrave bon leur semble Lesagents simuleacutes avec ACO sont quant agrave eux limiteacutes agrave un espace de recherche discret (le graphe)et ne peuvent se mouvoir quagrave certains points dinteacuterecircts (les sommets) en empruntant certainschemins deacutejagrave eacutetablis (arecirctes) Cette simplication de lespace de recherche est neacutecessaire agrave la foispour reacuteduire la complexiteacute de lalgorithme et pour permettre de repreacutesenter des domaines dap-plication posseacutedant des ressources connues contrairement agrave un environnement naturel inconnuet potentiellement inni du point de vue dune fourmi Cependant les algorithmes ACO ontavant tout un but de simulation du comportement de ces fourmis An de combiner agrave la fois lescontraintes dune simulation informatique avec le comportement reacuteel observeacute des fourmis dansla creacuteation du graphe plusieurs solutions sont possibles

Lun des moyens les plus simples pour approcher le comportement reacuteel des fourmis dansla nature consiste agrave creacuteer des arecirctes entre chaque sommet du graphe dans le but de creacuteer unenvironnement ougrave lagent simuleacute pourra se deacuteplacer ougrave il veut en empruntant le chemin quildeacutesire Le graphe creacuteeacute serait ainsi complet Neacuteanmoins cette approche nest pas reacutealiste pour deuxraisons principales Premiegraverement lenvironnement peut contenir des obstacles infranchissablespour des fourmis et elles ne peuvent donc pas se deacuteplacer partout Dans un graphe cela setraduirait par une absence darecircte entre deux sommets Deuxiegravemement cette solution est aussipeu pratique degraves que le nombre de sommets deacutepasse plusieurs centaines car le nombre darecirctesn creacuteeacutees se calcule avec |E| = n(nminus1)

2 Le nombre darecirctes dun graphe de 100 sommets est doncde 4950 tandis que pour un graphe de 1000 sommets ce nombre atteint deacutejagrave 499500 comme lemontre la Figure 31 Cette augmentation exponentielle nest eacutevidemment pas envisageable degraveslors que lon traite de domaines pouvant posseacuteder plusieurs dizaines de milliers de ressources agrave

56

33 Graphe

repreacutesenter dans le graphe

Figure 31 Graphe repreacutesentant leacutevolution exponentielle du nombre darecirctes selon le nombrede sommets existants dans un graphe complet

Un des objectifs de cette thegravese eacutetant dappliquer notre modegravele agrave un domaine applicatif reacuteelposseacutedant de tregraves nombreuses ressources la creacuteation dun graphe complet neacutetait pas une op-tion Nous avons donc opteacute pour une approche plus reacutealiste dans la creacuteation du graphe ande diminuer sa taille et les temps de calculs potentiels Pour reacutealiser cette tacircche nous navonsque deux solutions possibles supprimer des sommets etou supprimer des arecirctes La premiegraverepossibiliteacute a rapidement eacuteteacute eacutecarteacutee car supprimer des sommets aecte directement la qualiteacutedes solutions trouveacutees en faisant meacutecaniquement baisser la mesure de couverture du systegraveme derecommandation cest-agrave-dire la capaciteacute qua un systegraveme agrave recommander toutes les ressourcesdun domaine De plus il nest pas eacutevident de justier la suppression de certains sommets parrapport agrave dautres Chaque sommet du graphe repreacutesentant une ressource unique du domainedapplication la suppression de certains sommets ne pourrait se faire que par la creacuteation de regraveglesgeacuteneacuterales Une solution possible pourrait ecirctre par exemple de ne pas inteacutegrer dans le graphe lesressources nayant jamais eacuteteacute consulteacutees ou nayant pas eacuteteacute consulteacutees lors des 6 derniers moisCependant on voit bien que ces regravegles ne sont pas forceacutement adapteacutees agrave chaque utilisateur etont un grand risque de supprimer des ressources que ces derniers auraient pu appreacutecier Nousavons donc preacutefeacutereacute la deuxiegraveme solution supprimer des arecirctes Cette meacutethode a lavantage degarder lensemble des ressources du domaine recommandables par le systegraveme tout en reacuteduisantgrandement la complexiteacute du graphe 37 La question sest donc poseacutee didentier les arecirctes agraveseacutelectionner le but eacutetant de permettre au systegraveme de proposer des recommandations agrave la foisqualitatives adapteacutees mais aussi potentiellement nouvelles agrave lutilisateur tout en reacuteduisant lataille du graphe Pour ce faire nous avons formuleacute deux hypothegraveses aidant agrave la seacutelection desarecirctes

37 Tant quil y a un chemin dans le graphe permettant de se deacuteplacer dun sommet quelconque vers tous lesautres sommets alors toutes les ressources peuvent theacuteoriquement ecirctre recommandeacutees par le systegraveme

57

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

1 Les seacutequences de ressources deacutejagrave consulteacutees par le passeacute contiennentdes informations sur le comportement des utilisateurs qui peuventecirctre exploiteacutees pour la topologie du graphe

2 Les seacutequences de ressources deacutejagrave consulteacutees par les utilisateurs au-paravant ne sont pas toujours les meilleures possibles et auraient puecirctre ameacutelioreacutees avec des recommandations pertinentes

La premiegravere hypothegravese H1 se justie par le fait que lutilisateur est le premier agrave connaicirctreses envies ses besoins et les ressources qui le satisferaient le plus agrave un moment t [Jones 2010]Il est donc neacutecessaire de consideacuterer ces seacutequences de consultations passeacutees an de comprendrelutilisation que font les utilisateurs des ressources du domaine La deuxiegraveme hypothegravese se justiequant agrave elle par le fait quun utilisateur ne peut pas dans la majoriteacute des cas avoir une vue den-semble de toutes les ressources dun domaine Il est en eet courant pour un site de e-commerceou deacutecoute de musiques de posseacuteder plusieurs dizaines de milliers de ressources La deuxiegravemehypothegravese H2 se base donc sur le problegraveme fondamental que les systegravemes de recommandationessaient de reacutesoudre agrave savoir aider les utilisateurs agrave faire les meilleurs choix possibles dans desenvironnements toujours plus complexes et vastes Cette discussion sur les deacutes ameneacutes par cesdeux hypothegraveses nous amegravene agrave consideacuterer le travail dHerbert Simon qui a eacuteteacute deacutecoreacute dun prixnobel deacuteconomie et dun prix Turing Ce dernier a theacuteoriseacute et nommeacute le problegraveme de rationaliteacutelimiteacutee devant des contraintes alteacuterant et limitant les capaciteacutes dun individu (domaine tropvaste manque dinformation etc) il est preacutefeacuterable de se diriger vers des solutions satisfaisantesplutocirct quoptimales [Simon 1997] En reacuteponse agrave ce problegraveme les utilisateurs procegravedent donc paressais-erreurs pour reacutepondre agrave leurs besoins de maniegravere empirique [Jameson et al 2015] Les seacute-quences dinteractions creacuteeacutees par les utilisateurs durant ces processus contiennent donc beaucoupdinformations exploitables par un systegraveme de recommandation mais aussi beaucoup de bruitset dapproximations [Kuhlthau 1991 Castagnos et al 2010] La philosophie de notre modegraveleest les reacuteponses que nous apportons aux problegravemes ci-dessus sont inspireacutees par cette theacuteorie

An de prendre en compte ces deux hypothegraveses nous proposons dans la suite de cette sectionune meacutethode permettant de creacuteer un graphe orienteacute en se basant agrave la fois sur les seacutequencespasseacutees des utilisateurs ainsi que sur la creacuteation de nouvelles arecirctes Lobjectif est dexploiterles informations contenues dans les seacutequences passeacutees des utilisateurs mais aussi de garantirune certaine seacuterendipiteacute du systegraveme de recommandation via la creacuteation de nouvelles arecirctes Lapremiegravere eacutetape de ce processus est de creacuteer un sommet par ressource du domaine Ensuite pourconstruire les arecirctes reliant ou non ces sommets nous calculons les poids associeacutes aux nombrede co-consultations preacutesentes dans lensemble des seacutequences de consultations passeacutees Autrementdit quand un utilisateur consulte une ressource A puis une ressource B directement apregraves nousconsideacuterons que la transition A rarr B est une co-consultation Pour deacuteterminer si une arecircte estconstruire entre deux sommets nous calculons ensuite le poids de la co-consultation cest-agrave-direle nombre de fois quelle apparaicirct dans les seacutequences des utilisateurs En fonction de ce poidsdeux opeacuterations sont reacutealiseacutees

1 Toutes les co-consultations posseacutedant un poids supeacuterieur agrave seuil speacutecique sont ajouteacuteescomme arecirctes orienteacutees dans le graphe reliant les deux sommets concerneacutes Le seuil estdeacutetermineacute de maniegravere empirique car il est deacutependant de chaque domaine et de la base dedonneacutees utiliseacutees

2 En dessous du seuil seules certaines co-consultations sont seacutelectionneacutees pour devenir des

58

33 Graphe

arecirctes selon un processus inteacutegrant une part daleacuteatoire que nous deacutetaillerons dans la suitede cette section

Ces deux opeacuterations permettent de peupler le graphe darecirctes correspondant agrave la fois agrave toutesles transitions les plus eectueacutees par les utilisateurs ainsi quagrave certaines des transitions moinsusiteacutees par ces derniers Apregraves ces deux opeacuterations le graphe possegravede donc un certain nombredarecirctes reliant ses sommets mais rien ne garantit que chaque sommet est bien relieacute au reste dugraphe (si par exemple un sommet repreacutesente une ressource tregraves peu consulteacutee du domaine) Deplus et malgreacute la deuxiegraveme opeacuteration mitigeant cet eet les transitions tregraves usiteacutees (entre desressources populaires par exemple) seront sur-repreacutesenteacutees avec cette meacutethode de constructionCette sur-repreacutesentation produira forceacutement en aval des solutions que lon pourrait qualier declassique dans le sens ougrave elles reprendraient en majoriteacute ces transitions tregraves utiliseacutees et connuesdes utilisateurs An de limiter cet eet et de sassurer que tous les sommets sont bien connecteacutesau graphe une troisiegraveme et derniegravere opeacuteration est eectueacutee

3 Pour chaque sommet si un certain niveau de connectiviteacute nest pas atteint autrement ditsi le sommet possegravede moins darecirctes quun seuil xeacute agrave lavance alors des arecirctes aleacuteatoiressont ajouteacutees an datteindre ce seuil

Cette troisiegraveme opeacuteration permet de sassurer quaucun sommet repreacutesentant une ressourcepeu consulteacutee ne soit laisseacute sans connexion avec le reste du graphe Ainsi chaque sommet pos-seacutedera un certain niveau de connectiviteacute aussi appeleacute degreacute avec le reste du graphe Le grapheainsi obtenu apregraves ces 3 opeacuterations possegravede dans sa topologie agrave la fois les liens les plus usiteacutes parles utilisateurs ainsi que des liens aleacuteatoires permettant la creacuteation de recommandations poten-tiellement nouvelles Lensemble du processus de creacuteation du graphe est repris dans lEacutequation31 ci-dessous

(1) si tij ge m alors creacuteer eij(2) si tij lt m et q lt tij ougrave q isin [min til log(max til)] alors creacuteer eij(3) si deg(i) lt d alors choisir un sommet k aleacuteatoire

et creacuteer eik jusquagrave deg(i) = d

(31)

(1) et (2) sappliquent pour chaque co-consultation tandis que (3) sapplique pour chaque som-met du graphe eij repreacutesente larecircte entre les sommets i et j tij est le poids de la co-consultationde la ressource i vers la ressource j par les utilisateurs dans les seacutequences de consultations passeacuteesm est le seuil au-dessus duquel les co-consultations sont automatiquement ajouteacutees au graphecomme arecirctes q isin [min til log(max til)] est une variable aleacuteatoire uniformeacutement distribueacutee danslintervalle deacutecrit min til est le nombre minimal de co-consultations entre la ressource i et toutesles autres ressources l isin Vi ougrave au moins une co-consultation a eacuteteacute trouveacutee deg(i) est le degreacutedu ndivideud i dans le graphe et d est un paramegravetre speacuteciant le degreacute minimal de connectiviteacute quedoit posseacuteder chaque sommet dans le graphe nal Il est agrave noter quagrave ce stade du processus decreacuteation du graphe les arecirctes ne sont pas valueacutees car les valeurs attribueacutees aux arecirctes varientpour chaque utilisateur Ce processus sera deacutetailleacute dans la suite de la section

Avec cette technique de construction la taille du graphe deacutepend deacutesormais principalementde la variable d deacutenissant le degreacute minimal de connectiviteacute agrave atteindre (en plus du nombrede sommets comme preacuteceacutedemment) La Figure 32 ci-dessous repreacutesente leacutevolution du nombredarecirctes uniquement en fonction de la variable d Dans la pratique le nombre darecirctes sera

59

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

supeacuterieur aux nombres preacutesenteacutes dans la gure eacutetant donneacute que les deux premiegraveres eacutetapes de lacreacuteation du graphe ajoutent des arecirctes en fonction des transitions trouveacutees dans les consultationspasseacutees des utilisateurs

Figure 32 Graphe repreacutesentant leacutevolution lineacuteaire du nombre darecirctes selon le nombre desommets voulus dans un graphe creacuteeacute avec dieacuterentes valeurs de d

Ce processus de construction de graphe a pour double objectif dexploiter les informationsdes seacutequences des utilisateurs et de creacuteer de nouvelles seacutequences possibles Il existe potentiel-lement une inniteacute de creacuteer un graphe agrave partir des ressources dont nous disposons et il esteacutevident que la topologie du graphe a une inuence importante sur les reacutesultats possibles carle graphe repreacutesente lentiegravereteacute de lenvironnement dans lequel les agents vont eacutevoluer Le pro-cessus de construction que nous avons deacutecrit nest quune maniegravere parmi dautres daboutir agraveun graphe Cependant nous faisons lhypothegravese que la combinaison darecirctes repreacutesentant desco-consultations aux poids importants darecirctes repreacutesentant certaines co-consultations moinspreacutesentes et darecirctes creacuteant de nouvelles transitions permet de capturer linformation preacutesentedans le domaine tout en garantissant une certaine seacuterendipiteacute avec leacutemergence possible nouvellesseacutequences

34 Objectifs

Une fois le graphe creacuteeacute le modegravele peut ecirctre appliqueacute sur ce dernier an de produire des recom-mandations Dans cette section nous allons deacutenir comment fonctionne le modegravele pour produiredes recommandations agrave partir du graphe ainsi que les facteurs humains ie les objectifs quilcherche agrave satisfaire

Comme nous lavons vu dans le chapitre preacuteceacutedent sur leacutetat de lart il est deacutesormais lar-gement admis que la mesure de preacutecision seule nest pas susante pour produire de bonnesrecommandations aux utilisateurs Dautres facteurs humains doivent ecirctre consideacutereacutes pour satis-faire la plus grande varieacuteteacute dutilisateurs et de contextes possible Nous proposons donc de deacutenirun ensemble de 4 facteurs humains parmi les plus eacutetudieacutes dans la litteacuterature et de les prendre encompte dans notre modegravele de recommandation Ces facteurs humains seront par la suite appe-

60

34 Objectifs

leacutes objectifs car pour notre modegravele ces facteurs humains sont en eet consideacutereacutes comme desobjectifs agrave atteindre et agrave maximiser Les voici accompagneacutee dune courte description

1 Similariteacute recommander des ressources similaires agrave ce que lutilisateur a aimeacute par lepasseacute

2 Diversiteacute recommander des ressources diverses par rapport agrave ce que lutilisateur a aimeacutepar le passeacute

3 Nouveauteacute recommander des ressources nouvelles que lutilisateur ne connaicirct pas en-core

4 Preacutefeacuterences recommander des ressources que lutilisateur a deacutejagrave appreacutecieacute dans le passeacute

La similariteacute et les preacutefeacuterences sont proches des notions de preacutecision et de rappel mais diegraverenttoutefois dans le sens ougrave lon ne cherche pas agrave reproduire exactement les mecircmes seacutequences quelutilisateur a consulteacute mais agrave lui recommander des seacutequences pouvant le satisfaire Ces objectifsrepreacutesentent des facteurs humains important dans la creacuteation dune bonne recommandationIls seront deacutetailleacutes dans la suite de cette section Agrave ces 4 objectifs concernant les ressourcesrecommandeacutees nous ajoutons un cinquiegraveme objectif sinteacuteressant quant agrave lui agrave la maniegravere dontsont proposeacutees les recommandations agrave un utilisateur

5 Progressiviteacute recommander une seacutequence de ressources de sorte que la transition entrechacune de ces ressources soit uide et adapteacutee aux preacutefeacuterences de lutilisateur

Ces 5 objectifs consideacutereacutes sont tous transposables dans dieacuterents domaines applicatifs ga-rantissant la geacuteneacutericiteacute de cette approche Cependant il est eacutevident que dun domaine applicatifagrave lautre certaines dieacuterences peuvent justier la mise en avant dun objectif plutocirct quun autreDe la mecircme maniegravere les besoins et preacutefeacuterences pour ces objectifs peuvent varier dun utilisateuragrave un autre au sein du mecircme domaine Pour reacutepondre agrave ces deux problegravemes nous expliqueronsaussi dans cette section comment adapter limportance de chaque objectif Il est aussi importantde consideacuterer le fait que nous nous appuyons sur ces objectifs car ils sont les plus freacutequemmentciteacutes dans la litteacuterature Lobjectif est de deacutemontrer que notre modegravele est capable de produiredes seacutequences satisfaisant les objectifs consideacutereacutes Ce faisant nous montrons par la mecircme occa-sion que les objectifs peuvent ecirctre adapteacutes enleveacutes ou ajouteacutes En eet on pourrait tregraves bienconsideacuterer dautres objectifs (personnaliteacute point de congestion si lon est dans un museacutee etc)En dautres termes le but est de deacutemontrer la geacuteneacutericiteacute de notre modegravele

Avant de deacutetailler comment calculer ces objectifs nous allons expliquer ici comment les in-teacutegrer dans le modegravele Le but de notre modegravele est de proposer des recommandations orant unbon compromis entre les dieacuterents objectifs ougrave limportance de ces derniers peut ecirctre ajusteacutees agravevolonteacute Pour ce faire notre modegravele doit ecirctre capable de transformer ces objectifs listeacutes plus hauten valeurs pouvant ecirctre chireacutees et optimiseacutees Autrement dit notre modegravele a pour but de reacute-soudre un problegraveme de recommandation multi-objectifs Le choix des algorithmes ACO est ici dusens eacutetant donneacutes ces besoins speacuteciques En eet nous avons montreacute dans leacutetat de lart que lemodegravele ACS faisant partie des ACO eacutetait capable de reacutesoudre des problegravemes posseacutedant plusieursobjectifs comme par exemple avec le vehicle routing problem with time windows [Gambardellaet al 1999] ou encore avec le multi-objective travelling salesman problem [Angus 2007] Devantla complexiteacute et les dimensions toujours croissantes des problegravemes agrave reacutesoudre en informatique lesapproches multi-dimensionnelles des algorithmes ACO se sont multiplieacutees ces derniegraveres anneacutees

61

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

[Doerner et al 2004 Alaya et al 2007 Angus and Woodward 2009 Dorigo and Stuumltzle 2019]Mecircme si chacune de ces approches a pour but de reacutesoudre un problegraveme multi-objectif la maniegraveredy arriver est dieacuterente tant les algorithmes ACO sont modulaires Pour rappel notre problegravemeconsiste en la recommandation de seacutequences agrave partir dun graphe et prenant en compte plusieursobjectifs pouvant potentiellement ecirctre incompatible entre eux Il est important dinsister sur cedernier point an de comprendre la solution mise en place dans notre modegravele Les objectifs quenous avons deacutecrits ci-dessus peuvent en eet ecirctre incompatibles les uns avec les autres quandbien mecircme le but est de geacuteneacuterer une recommandation posseacutedant un certain eacutequilibre parmi cha-cun dentre eux Lobjectif de preacutefeacuterences dont le but est de proposer des ressources deacutejagrave connueset appreacutecieacutees ainsi que lobjectif de nouveauteacute dont le but est de proposer des ressources en-core non connues sont par exemple en contradiction claire Chaque objectif traiteacute seacutepareacutementproduira potentiellement des recommandations mutuellement exclusives et pourtant il peut ecirctreinteacuteressant de proposer agrave lutilisateur une seacutequence de recommandations posseacutedant ces deux as-pects speacuteciques Partant de ce constat nous avons deacutecideacute dinteacutegrer chaque objectif comme unecolonie dieacuterente dans le modegravele ACS Ainsi nos 4 premiers objectifs (similariteacute diversiteacute nou-veauteacute preacutefeacuterences) seront repreacutesenteacutes par 4 colonies dans notre modegravele tandis que le cinquiegravemeobjectif la progressiviteacute sera quant agrave lui traiteacute agrave part eacutetant donneacute quil concerne la structure dela recommandation et non les ressources recommandeacutees en elles-mecircmes

Inteacutegrer ces objectifs par le biais de plusieurs colonies a neacutecessiteacute quelques changements danslalgorithme ACS Dans le modegravele initial les agents dune seule colonie se deacuteplacent sur le graphedont chacune des arecirctes est valueacutee en fonction de la distance seacuteparant les 2 sommets la consti-tuant Le but des agents est ensuite de se deacuteplacer sur ce graphe an de trouver le plus courtchemin dun sommet A agrave un sommet B agrave laide des pheacuteromones quils y deacuteposent Une fois quunesolution eacutemerge comme eacutetant la meilleure gracircce au meacutecanisme de stigmergie lalgorithme peutsarrecircter et la meilleure solution est retenue

La philosophie derriegravere cette solution deacutecoule des principes mecircme des systegravemes multi-agentsLeacutetat de lart du chapitre preacuteceacutedent la montreacute lapproche multi-agent pour la reacutesolution deproblegravemes est agrave la fois simple eacuteleacutegante et ecace Dautres solutions auraient eacuteteacute possiblescomme par exemple complexier les agents en leur ajoutant de nouveaux comportementS maisnous avons voulu garder lessence des systegravemes multi-agents reacuteactifs leacutemergence de comporte-ments intelligents de par les interactions entre agents tregraves simples An de rester aussi procheque possible des principes de base de lalgorithme nous avons voulu converser le fonctionnementgeacuteneacuteral des colonies et de la deacutecouverte de solutions sur le graphe tout en les adaptant agrave notrecontexte Pour ce faire nous avons jouer sur la maniegravere dont se deacutenit et se calcule la notionde distance dans le graphe Dans les algorithmes ACO la distance d associeacutee agrave chaque arecirctedu graphe repreacutesente comme son nom lindique la distance physique neacutecessaire pour aller dunsommet agrave lautre de larecircte Cette distance ne demande a priori pas de calcul et est simple-ment deacuteduite ou mesureacutee de lenvironnement repreacutesenteacute par le graphe Elle est ensuite utiliseacuteepour calculer lheuristique ηij comme montreacute dans lEacutequation 212 (pour rappel lheuristiquese calcule ainsi ηij = 1

dij) Nous navons pas modieacute le calcul de ηij mais nous avons modieacute

le sens de la distance d qui le compose Au lieu de repreacutesenter la distance physique entre deuxsommets d repreacutesente dans notre modegravele une distance calculeacutee entre deux ressources sa valeureacutetant directement deacutependante de lobjectif de la colonie Prenons un exemple pour illustrer lamaniegravere dont cette distance peut varier entre deux sommets pour dieacuterentes colonies

62

34 Objectifs

Supposons un systegraveme de recommandation dans le domaine museacuteal dont le but est de proposerdes parcours composeacutes de dieacuterentes peintures Le museacutee possegravede entre autres deux tableauxde Vincent van Gogh appartenant agrave la seacuterie des Tournesols Ces tableaux sont tous les deux desnatures mortes repreacutesentant un vase et 15 tournesols ils ont tous les deux eacuteteacute peints en 1889 les palettes de couleurs et le style sont quasi similaires Dans le graphe les sommets A et Brepreacutesentent ces deux tableaux et (AB) repreacutesente larecircte les reliant Pour toutes les raisonseacutevoqueacutees ci-dessus on peut raisonnablement penser que ces deux ressources sont tregraves similairesentre elles La distance dsimilarit de la colonie axeacutee sur la similariteacute sera donc faible indiquant auxagents que les deux sommets sont eectivement proches lun de lautre et favorisant le passagepar cette arecircte pour minimiser la distance totale de la solution Agrave linverse la colonie relativeagrave la diversiteacute aura agrave traverser une plus longue distance ddiversit entre les deux sommets commeces derniers sont tregraves similaires entre eux Agrave travers ces exemples sont illustreacutees les dieacuterencespossibles dans le calcul de la distance d en fonction de lobjectif consideacutereacute La conseacutequence agrave celaest que mecircme si la topologie du graphe peut rester la mecircme pour tous les objectifs le calculdes distances et la valuation des arecirctes seront quant agrave eux dieacuterents selon lobjectif Le reste decette section propose une maniegravere de calculer ces distances pour chaque objectif

341 Similariteacute

Cest lun des facteurs humains les plus importants des systegravemes de recommandation et il estpris en compte par limmense majoriteacute de ces systegravemes En eet un des objectifs majeurs dunsystegraveme de recommandation est de proposer des ressources similaires agrave celles que lutilisateura aimeacute auparavant ou proche des ressources quil consultait reacutecemment La similariteacute est unecaracteacuteristique bien connue et largement utiliseacutee dans la litteacuterature Nous adheacuterons au principeselon lequel un systegraveme de recommandation ne peut pas la neacutegliger et doit linclure pour produiredes recommandations satisfaisantes Cependant la similariteacute ne devrait pas non plus ecirctre lapierre angulaire de chaque systegraveme de recommandation comme elle la eacuteteacute par le passeacute Le butde cette colonie est donc de trouver une liste avec des eacuteleacutements aussi proches que possible dece que lutilisateur appreacutecie ou est en train de consulter Il existe de nombreuses meacutethodespour calculer la similariteacute entre deux ressources Dune maniegravere geacuteneacuterale les ressources dundomaine sont deacutecrites par des meacutetadonneacutees numeacuteriques textuelles binaires etc Le format deces meacutetadonneacutees est entiegraverement deacutependant de chaque domaine applicatif Nous avons deacutecideacutede geacuteneacuteraliser ce problegraveme et de le consideacuterer comme une comparaison entre deux vecteursNous avons ensuite deacutecideacute dutiliser la mesure de la similariteacute cosinus entre ces deux vecteurs depar sa populariteacute dans la litteacuterature scientique et sa pertinence quand aux donneacutees dont nousdisposons [Su and Khoshgoftaar 2009] La maniegravere dimpleacutementer cette similariteacute dun point devue applicatif deacutepend des meacutetadonneacutees disponibles Dans le cas de donneacutees non numeacuteriques il estpossible dobtenir des valeurs numeacuteriques de similariteacute agrave partir de listes ou de valeurs qualitatives[lHuillier 2018] De mecircme dautres maniegravere de calculer la similariteacute peuvent ecirctre utiliseacutees enfonction de leur pertinence par rapport au domaine applicatif Dans notre contexte geacuteneacuteralisteet an de deacuteterminer la valeur de la distance d associeacutee agrave chaque arecircte du graphe nous avonstout dabord calculeacute la similariteacute cosinus entre les deux ressources repreacutesenteacutees par les sommetsPlus formellement pour une arecircte (i j) la similariteacute de ses deux ressources sij est calculeacutee avecla similariteacute cosinus entre les deux vecteurs des caracteacuteristiques descriptives C des ressources iet j comme montreacute dans lEacutequation 32

sij =1

sim(Ci Cj)(32)

63

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

ougrave Ci repreacutesentent les caracteacuteristiques de la ressource i Le terme de caracteacuteristiques estgeacuteneacuterique et peut inclure toutes les meacutetadonneacutees exploitables de domaine applicatif sur une res-source Comme expliqueacute plus haut ces caracteacuteristiques sont donc deacutependantes de chaque basede donneacutees et de chaque domaine dapplication Nous avons ici geacuteneacuteraliseacute ces donneacutees avec laformalisation suivante chaque ressource (ou item) i du domaine dapplication est deacutecrite par ncaracteacuteristiques c comme suit Ci = c1 c2 cn

Dans lexemple donneacute plus haut avec les deux tableaux de van Gogh nous avons expliqueacute quela distance seacuteparant deux sommets sur le graphe repreacutesentait intuitivement leur eacuteloignementselon lobjectif consideacutereacute Ainsi pour la similariteacute deux sommets repreacutesentant des ressourcessimilaires verront larecircte les reliant posseacuteder une faible distance et inversement Le but est icidecirctre le plus proche possible du fonctionnement du modegravele initial ougrave une petite distance entredeux sommets repreacutesentent eectivement une petite distance physique entre ces deux points(par exemple deux points geacuteographiques proches lun de lautre) La similariteacute cosinus produitcependant une valeur comprise entre [0 1] ne correspondant pas agrave la valuation des arecirctes dansle modegravele initial An de convertir cette similariteacute s isin [0 1] en distance d isin [1 +infin] nous avonssimplement utiliseacute linverse multiplicatif d = 1

s Ainsi et agrave linstar du modegravele initial de Dorigoune distance proche de 1 associeacutee agrave une arecircte (i j) signie que les deux ressources i et j sontsimilaires

342 Diversiteacute

Ce facteur est souvent preacutesenteacute en mecircme temps que la similariteacute eacutetant donneacute quils sont tousdeux lieacutes agrave la distance ou agrave la correacutelation entre les ressources consulteacutees par lutilisateur etses recommandations Mais contrairement agrave la similariteacute la diversiteacute illustre agrave quel point deuxeacuteleacutements sont dissemblables lun par rapport agrave lautre La similariteacute et la diversiteacute se complegravetentdans la mesure ougrave elles sont toutes deux neacutecessaires pour adapter le systegraveme de recommandationaux besoins des dieacuterents utilisateurs [Jones 2010] Nous avons choisi dutiliser linterpreacutetationclassique consistant agrave consideacuterer la diversiteacute comme linverse de la similariteacute La diversiteacute divijentre deux ressources i et j est donc obtenue en calculant linverse de la similariteacute entre i etj comme indiqueacute dans Eacutequation 33 De la mecircme maniegravere que pour la similariteacute nous avonsensuite utiliseacute linverse multiplicatif de la diversiteacute pour obtenir une distance d isin [1 +infin]

divij =1

1minus sim(Ci Cj)(33)

Toutefois cette seule mesure ne capture pas lensemble de la diversiteacute dune seacutequence Destravaux de la litteacuterature ont eacuteteacute meneacutes sur les seacutequences et les dieacuterentes maniegraveres de les ca-racteacuteriser On peut citer la diversiteacute relative (RD Relative Diversity) qui permet de mesurerlapport de chaque ressource ajouteacutee agrave une seacutequence existante en cours de construction ou encorela similariteacute intra-liste (ILS Intra-List Similarity) qui est la moyenne des similariteacutes cosinusde toutes les ressources composant une seacutequence [Ziegler et al 2005] Nous navons pas utiliseacuteces deux mesures agrave ce stade de notre modegravele mais nous les exploiteront an de mesurer lesperformances de notre modegravele

343 Nouveauteacute

Ce facteur humain repreacutesente les ressources encore non connues de lutilisateur Il peut sagirde nouvelles ressources reacutecemment ajouteacutees au systegraveme ou de ressources plus anciennes mais

64

34 Objectifs

moins populaires que lutilisateur na pas consulteacutees Selon le domaine dapplication etou selonlancienneteacute de lutilisateur les ressources non consulteacutees peuvent ne constituer quune faible par-tie des ressources totales (eg dans un petit museacutee ne posseacutedant que quelques dizaines ddivideuvres)comme elles peuvent aussi repreacutesenter limmense majoriteacute des ressources totales (eg sur des sitesdeacutecoute de musiques en ligne qui ont souvent des catalogues de plusieurs centaines de milliers demusiques disponibles) La nouveauteacute ne doit cependant pas ecirctre confondue avec la diversiteacute carles ressources consideacutereacutees comme nouvelles peuvent ecirctre soit similaires soit dieacuterentes de cellesque lutilisateur aime habituellement La nouveauteacute est une caracteacuteristique importante dans unsystegraveme de recommandation car elle permet deacuteviter un deacutesinteacuterecirct potentiel des utilisateurs an-ciens En eet apregraves un certain temps passeacute agrave produire des recommandations un systegraveme peutavoir tendance agrave enfermer lutilisateur dans les mecircmes recommandations agrave linstar dun algo-rithme dapprentissage automatique trop bien entraicircneacute 38 Ce problegraveme dans les systegravemes derecommandation reacutesulte en une trop grande preacutevisibiliteacute des ressources recommandeacutees [Vargasand Castells 2011] Lintroduction de la nouveauteacute permet entre autres de mitiger ce problegravemeet de produire des recommandations inattendues agrave lutilisateur

An de deacuteterminer si une ressource est nouvelle ou pas pour un utilisateur en particuliernous avons utiliseacute le travail de Zhang [Zhang 2013] qui a deacuteni la nouveauteacute comme une mesurecomposeacutee de trois caracteacuteristiques

1 Unknown (notion dinconnue) repreacutesente si la ressource est connue ou non de lutilisa-teur

2 Satisfactory (satisfaction) repreacutesente si la ressource est aimeacutee ou non par lutilisateur

3 Dissimilarity (dissimilariteacute) repreacutesente si la ressource est dissimilaire aux autres res-sources connues par lutilisateur

Lauteur a ensuite proposeacute deacutevaluer formellement la nouveauteacute dune ressource i pour luti-lisateur u en proposant lEacutequation 34

Novelty(i u) = p(i|unknown u) middot dis(i prefu) middot p(i|like u) (34)

ougrave p(i|unknown u) est la probabiliteacute que lutilisateur u ne connaisse pas la ressource idis(i prefu) est la dissimilariteacute entre i et les ressources consulteacutees par lutilisateur et p(i|like u)est la probabiliteacute que lutilisateur u appreacutecie la ressource i Cette eacutequation est inteacuteressante maisdans le contexte de ce travail les notions de satisfaction et de dissimilariteacute de lutilisateur enversla ressource i sont proches des autres objectifs de notre modegravele agrave savoir respectivement pour lasatisfaction par lobjectif de diversiteacute et pour la dissimilariteacute par les deux objectifs de similariteacuteet de preacutefeacuterences Nous avons donc deacutecideacute de reacuteduire lEacutequation 34 agrave lEacutequation 35 an deacuteviterune redondance entre les objectifs

p(i|unknown u) = minuslog(1minus popi) (35)

ougrave popi est la populariteacute de la ressource i La notion de populariteacute est ici volontairement lais-seacutee geacuteneacuterale car largement deacutependante du domaine dapplication et des ressources consideacutereacuteesEn eet la populariteacute peut prendre la forme dun nombre de vues dun nombre deacutecoutes dunevaleur calculeacutee de maniegravere interne par des sites dune comparaison entre les consultations des

38 Cest le problegraveme statistique classique de lovertting ou du surentrainement souvent rencontreacute dans ledomaine de lapprentissage automatique

65

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

ressources etc On peut toutefois consideacuterer que cette valeur sera geacuteneacuteralement numeacuterique

Il est important ici de preacuteciser un point de dieacuterence important avec les deux autres objectifsqui ont eacuteteacute vu jusquagrave preacutesent Dans les eacutequations ci-dessus on peut en eet remarquer que lecalcul de la distance se fait non plus en consideacuterant deux ressources mais uniquement avec uneressource et le prol de lutilisateur Ainsi une arecircte du graphe ne repreacutesente plus la distanceentre les deux sommets la composant mais la distance neacutecessaire pour atteindre le sommet selonchaque utilisateur Autrement dit lagrave ougrave jusquagrave maintenant la distance associeacutee agrave larecircte (AB)repreacutesentait la distance entre le sommet A et le sommet B (la similariteacute ou la diversiteacute entreA et B) cette distance repreacutesente maintenant la distance de lutilisateur avec ce sommet BLe sommet dorigine ne rentre plus en compte dans le calcul de la distance dune arecircte maisuniquement son sommet de destination Par conseacutequent toutes les arecirctes arrivant agrave un sommetunique posseacutederont la mecircme valuation Les calculs de valuation des arecirctes du graphe sont doncmoins nombreux mais en contrepartie il est neacutecessaire de recalculer ces valuations pour chaqueutilisateur eacutetant donneacute quelles deacutependent maintenant du prol de ce dernier

344 Preacutefeacuterences

Le facteur que nous avons appeleacute preacutefeacuterences correspond aux ressources que lutilisateur aparticuliegraverement appreacutecieacutees dans le passeacute Cet objectif bien quassez proche de la similariteacute aupremier abord exprime un autre aspect dune recommandation satisfaisante que nous pensonsimportant En eet le but nest pas ici de recommander des ressources proches et potentiellementnouvelles de ce que lutilisateur connaicirct deacutejagrave comme la similariteacute mais bien de lui reproposer desressources quil a deacutejagrave consulteacutees et aimeacutees par le passeacute Autrement dit cet objectif cherche agraverecommander agrave lutilisateur les ressources les plus en accord avec ses preacutefeacuterences (ses ressourcespreacutefeacutereacutees) sans essayer de faire des preacutedictions Par conseacutequent le but de lobjectif de simila-riteacute est de proposer agrave lutilisateur des ressources proches de ce que lutilisateur a consulteacute ouconsulte mais il nest pas possible de savoir si ce dernier va reacuteellement appreacutecier ces recomman-dations Il est par exemple commun dappreacutecier une musique particuliegravere dun artiste et de nepas aimer les autres musiques appartenant pourtant au mecircme album Toutes les musiques de cetalbum sont tregraves similaires les unes aux autres (mecircme artiste mecircme date de sortie mecircme albumprobablement mecircme genre) elles auraient donc de tregraves hautes valeurs de similariteacute entre ellesmais lutilisateur qui se verrait proposer le reste de lalbum jugerait ces recommandations nonsatisfaisantes Lobjectif de preacutefeacuterences favorisera quant agrave lui les ressources connues et aimeacuteespar lutilisateur et pourrait donc recommander dans cette situation uniquement la musique quelutilisateur appreacutecie

Le but des agents de la colonie preacutefeacuterences est donc de trouver un chemin ougrave les ressourcessont connues et aimeacutees de lutilisateur On peut dores et deacutejagrave lister deux conseacutequences agrave cefait Tout dabord nous nous retrouvons dans le mecircme cas de gure que pour lobjectif denouveauteacute ougrave une arecircte du graphe ne repreacutesente plus la distance entre ses deux sommets maisla distance neacutecessaire pour atteindre le sommet darriveacutee Ensuite il est neacutecessaire de deacutenir desmoyens de calculer les preacutefeacuterences des utilisateurs envers les ressources mises agrave leur dispositionComme nous lavons vu dans leacutetat de lart il y a deux grandes maniegraveres de calculer linteacuterecirctdun utilisateur envers une ressource avec des retours explicites (eg notes sur les ressourcesbouton jaime et je naime pas) avec des retours implicites (eg temps passeacute agrave consulterles ressources nombre de consultations) 39 La nature des retours va donc eacutenormeacutement varier

39 Ces deux types de retours ne sont pas redondants mais plutocirct compleacutementaires Lorsque cela est possible

66

34 Objectifs

selon le domaine dapplication mais nous pouvons tout de mecircme formaliser la maniegravere dont ilssont consideacutereacutes Chaque information collecteacutee par le systegraveme concernant le comportement dunutilisateur doit ecirctre prise en compte Plus preacuteciseacutement chaque interaction directe ou indirectequun utilisateur peut avoir avec une ressource doit ecirctre inteacutegreacutee dans lestimation de son inteacuterecirctsur cette ressource Soit Cu lensemble de tous les types dinteractions possibles quun utilisateuru peut avoir avec les ressources du systegraveme cui repreacutesente alors la somme des interactions dunmecircme type c dun utilisateur u sur une ressource i Voici un rapide exemple toujours dans ledomaine musical an dillustrer ces derniers points

Cu eacutecouter une musique noter une musique passer une musique avant la n mettre unemusique dans sa playlist

cui pourrait par exemple renseigner sur le fait que lutilisateur u agrave eacutecouter la musiquei 15 fois

An dagreacuteger tous les types dinteractions possibles dans une unique valeur dinteacuterecirct dunutilisateur envers une ressource nous avons utiliseacute la formule proposeacutee par Castagnos [Castagnosand Boyer 2006] et deacutecrite dans lEacutequation 36

presumed interestui = vmin +

sumcisinC

(w(c) middot c(ui))sumcisinC

w(c)middot (vmax minus vmin)

cmax(36)

ougrave c(u i) correspond aux valeurs normaliseacutees donneacutees agrave la ressource i par lutilisateur u agravechaque type dinteraction c w(c) est le poids ou limportance de chaque type dinteraction cvmin et vmax sont les valeurs minimales et maximales attendues pour linteacuterecirct preacutesumeacute et cmaxest la valeur maximale que c(u i) peut prendre peu importe le critegravere c consideacutereacute

Linteacuterecirct de cette colonie peut ecirctre discuteacute selon les domaines dapplications auquel le mo-degravele est appliqueacute Lexemple preacuteceacutedant portant sur la musique illustre bien linteacuterecirct dinteacutegrerun tel facteur humain dans un systegraveme de recommandations En eet il est rare de neacutecou-ter quune seule fois une musique que lon appreacutecie Comme lont montreacute divers travaux il estbeaucoup plus courant deacutecouter plusieurs fois ses musiques preacutefeacutereacutees parfois de suite parfois agravedieacuterents moments de la journeacutee parfois sur plusieurs semaines mois ou anneacutees etc [lHuillier2018][Jones 2010] Lideacutee davoir une colonie deacutedieacutee agrave la revisite de ressources deacutejagrave consulteacuteespeut ecirctre eacutetendue agrave dautres domaines a priori moins eacutevidents que la musique Cet objectif depreacutefeacuterences peut par exemple ecirctre inteacuteressant dans le domaine de le-eacuteducation ougrave une ressourceeacuteducative peut avoir eacuteteacute consulteacutee par un utilisateur sans pour avoir eacuteteacute comprise (apregraves avoirpasseacute une eacutevaluation sur les thegravemes de cette ressource par exemple) Dans ce cas il peut ecirctreinteacuteressant de recommander une nouvelle fois agrave lutilisateur cette ressource an quil puisse mieuxla comprendre En conclusion lobjectif de preacutefeacuterences est certes plus speacutecique agrave certains do-maines que les autres objectifs plus geacuteneacuteralistes preacutesenteacutes jusquagrave maintenant mais nous pensonsneacuteanmoins quil a sa place dans le modegravele notamment pour les possibiliteacutes quil apporte dansces domaines dapplication speacuteciques

345 Progressiviteacute

Le concept de la progressiviteacute fait partie inteacutegrante du but de notre modegravele qui est de trouveret de recommander une bonne seacutequence de ressources Contrairement agrave la majoriteacute des systegravemes

il est beacuteneacuteque de les prendre tous les deux en comptes pour estimer linteacuterecirct de lutilisateur

67

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

de recommandation actuels nous ne souhaitons pas proposer quune simple liste agrave lutilisateurnal mais bien une seacutequence construite dans un but posseacutedant un deacutebut une n et une progres-sion entre ses divers eacuteleacutements An de bien faire la dieacuterence entre une liste et une seacutequence derecommandation voici 3 exemples dans 3 domaines dapplications dieacuterents

Listes

1 Musique Les musiques les plus similaires aux derniegraveres eacutecoutes voire agrave la toutederniegravere eacutecoute de lutilisateur sans ordre particulier

2 Museacutee Des divideuvres dart correspondant agrave ce que lutilisateur vient de voir Si lecritegravere principal de la creacuteation de liste est la similariteacute les ressources de celles-ci neseront pas forceacutement adapteacutees agrave la topologie du museacutee ou agrave sa sceacutenographie

3 E-eacuteducation Des ressources eacuteducatives sans ordre particulier (cours videacuteos expli-catives exercices) tous proches de ce que lutilisateur eacutetait en train de consulter

Seacutequences

1 Musique Une playlist de musiques proposant par exemple les titres dun mecircmeartiste selon leur date de sortie ou bien posseacutedant un tempo de plus en plus rythmeacuteou encore proposant une transition douce dun style de musical agrave un autre

2 Museacutee Un chemin composeacute de plusieurs divideuvres dart prenant compte de la distancephysique entre chaque divideuvre an davoir un parcours adapteacute au museacutee et en inteacutegrantune progression dans les divideuvres proposeacutees (par date styles auteurs etc)

3 E-eacuteducation Une seacutequence composeacutee de ressources eacuteducatives adapteacutees au niveauactuel de lutilisateur et agrave son objectif inteacutegrant des cours et des exercices proposantune progression mesureacutee (ni trop rapide ni trop lente) entre chaque ressources eacuteduca-tives de la seacutequences

Comme le montrent ces exemples lideacutee geacuteneacuterale derriegravere la recommandation de seacutequencesest de proposer une suite de ressources eacutetant toutes en lien les unes avec les autres et posseacutedantune progression sur un ou plusieurs critegraveres Cette progression se manifeste alors par de leacutegegraverestransitions entre chaque ressource an de faire avancer petit agrave petit la seacutequence vers un but Lebut est donc ici de parvenir agrave construire une seacutequence dont la progression nest ni trop lenteni trop rapide mais adapteacutee agrave lutilisateur et agrave son but Nous donnons agrave cet objectif le nom deprogressiviteacute optimale o Cette meacutetrique est utiliseacutee an de sassurer que les agents de la colo-nie de progressiviteacute trouvent un chemin dans le graphe ougrave chaque sommet seacutelectionneacute ore unebonne progressiviteacute par rapport agrave son preacutedeacutecesseur et agrave son successeur Pour ce faire nous avonscalculeacute la valeur de o en prenant en compte une ressource de deacutepart et une ressource darriveacuteerepreacutesenteacutee dans le graphe par deux sommets speacuteciques

Colonie de progressiviteacute

Le concept de progressiviteacute est lieacute agrave notre objectif de construire une bonne seacutequence deressources Contrairement agrave la majoriteacute des systegravemes de recommandation nous ne souhaitonspas seulement recommander une liste de ressources mais une seacutequence ayant un deacutebut unen et un ordre speacutecique Comme indiqueacute preacuteceacutedemment dans un museacutee une bonne seacutequencerecommandeacutee pourrait consister en des divideuvres dart lieacutees dune maniegravere ou dune autre (ie du

68

34 Objectifs

mecircme artiste ou de la mecircme peacuteriode) et situeacutees agrave proximiteacute les unes des autres Une telle seacutequencepourrait ensuite progresser lentement vers un autre artiste ou une section dieacuterente du museacuteeNotre objectif est donc de recommander une seacutequence qui ne progresse ni trop lentement ni troprapidement cest ce que nous appelons la progressiviteacute optimale o Cette meacutetrique est utiliseacuteepour sassurer que chaque ressource ore une bonne progressiviteacute par rapport agrave ses preacutedeacutecesseurset successeurs Pour ce faire nous avons calculeacute o sur la base des premier et dernier eacuteleacutementsdune seacutequence donneacutee pour un utilisateur speacutecique comme le montre lEacutequation 37

on =czn minus can

s(37)

ougrave on est la valeur de progressiviteacute optimale de la n-iegraveme caracteacuteristique dune seacutequencespeacutecique czn est la n-iegraveme caracteacuteristique de la derniegravere ressource z de la seacutequence czn estidentique pour la premiegravere ressource de la seacutequence et s est le nombre de ressources de la seacute-quence LEacutequation 37 sera appliqueacutee pour les caracteacuteristiques de la ressource m ce qui donneun vecteur de taille m de valeurs de progressiviteacute optimales (o1 o2 middot middot middot om) pour la seacutequencespeacutecique Ce vecteur sera ensuite utiliseacute dans le calcul de la distance dun bord (i j) pour lacolonie de progressiviteacute Cette meacutethode implique de disposer de caracteacuteristiques numeacuteriques pourappliquer leacutequation comme par exemple le tempo dune piste musicale ou la date dune divideuvredart

La valeur optimale o de la progressiviteacute est alors utiliseacutee pour calculer la distance d entredeux ndivideuds du graphe dans lEacutequation 38

dij =

msumnwon middot

cjnminuscinon

msumnwon

(38)

ougrave m est le nombre de caracteacuteristiques de la ressource consideacutereacutee on est la valeur de pro-gressiviteacute optimale de la n-iegraveme caracteacuteristiques de la ressource won est le poids de la n-iegravemecaracteacuteristique pour lutilisateur deacutependant de ses preacutefeacuterences et cjn est la valeur de la n-iegravemecaracteacuteristique de la ressource j

LEacutequation 38 produit une valeur de distance dij isin [minusinfin +infin] En fonction de lintervallede d nous pouvons deacuteduire que

dij isin [minusinfin 0] les caracteacuteristiques de la ressource j vont dans la direction inverse parrapport agrave la valeur de progressiviteacute optimale o

dij isin [0 1] la progression est trop lente par rapport agrave la valeur o attendue dij = 1 la progression est ideacuteale dij isin [1 +infin] la progression trop rapide

Dans un souci dhomogeacuteneacuteisation des distances entre toutes les colonies et pour respecterle modegravele initial ACS ougrave d repreacutesentait une distance physique nous avons souhaiteacute garder ladistance d isin [1 +infin] Pour ce faire nous avons donc reacutealiseacute une opeacuteration de transformationlorsque dij lt 1 preacutesenteacutee dans lEacutequation 39

69

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

Si dij isin

[minusinfin 0] alors dij = |dij |

[0 1] alors dij =1

dij

(39)

Inteacutegration compleacutementaire de la progressiviteacute dans le calcul de la distance parcou-rue des agents

Dans la section preacuteceacutedente nous avons deacutecrit le fonctionnement dune colonie deacutedieacutee agrave laprogressiviteacute Cependant nous soutenons le fait que la progressiviteacute ne doit pas ecirctre lapanagedune seule colonie mais doit ecirctre preacutesente dans toutes les colonies La progressiviteacute doit avoirune place preacutepondeacuterante dans les seacutequences que notre modegravele construit car cest une notionfondamentale dans la dieacuterence entre une liste de recommandation et une seacutequence de recom-mandation

An de renforcer la progressiviteacute des seacutequences construites par toutes les colonies nous pro-posons une version modieacutee de la mise agrave jour globale des pheacuteromones deacutecrite dans lEacutequation210 Dans lalgorithme initial ACS Lbest est la longueur du plus court chemin trouveacute par unagent Cette valeur est une simple somme de la distance associeacutee agrave chaque arecircte du meilleurchemin Cette valeur est ensuite utiliseacutee dans le calcul deacuteterminant la quantiteacute de pheacuteromonesagrave ajouter sur chaque arecircte du chemin Ainsi plus un chemin est court plus les arecirctes le com-posant sont reacutecompenseacutees par une plus grande quantiteacute de pheacuteromones Ce meacutecanisme est aucdivideur du renforcement de bonnes solutions et de leacutemergence de comportements intelligents Ande maximiser les seacutequences posseacutedant une progression constante nous avons modieacute le calcul deLbest pour inteacutegrer une notion de progressiviteacute Pour ce faire nous nutilisons plus simplementla distance dune arecircte mais aussi sa deacuteriveacutee comme montreacute dans lEacutequation 310

Lbest =sumeisinE

de +

sumeisinE

partde

|E|(310)

ougrave E est lensemble des arecirctes du meilleur chemin et de est la distance associeacutee agrave larecircte eAvec cette eacutequation modieacutee du calcul de la distance totale dun chemin nous peacutenalisons lesgrandes dieacuterences de distance entre des arecirctes successives tout en continuant de favoriser leschemins les plus courts En dautres termes lobjectif des agents est maintenant de trouver deschemins agrave la fois courts et progressifs les uns par rapport aux autres

35 Tactiques de fusion

Dans les sections preacuteceacutedentes nous avons deacutecrit 4 facteurs humains 4 objectifs agrave optimiserpar notre modegravele ainsi quun cinquiegraveme objectif de contrainte de construction des seacutequencesChacun de ces 4 premiers objectifs est associeacute agrave une colonie de fourmis speacutecique dont le but estde trouver un chemin dans le graphe Par conseacutequent apregraves cette premiegravere eacutetape il existe autantde chemins ou de seacutequences de ressources que de colonies dans le modegravele Le but est cependantde ne proposer agrave la n quune seule recommandation agrave lutilisateur Chaque seacutequence repreacutesentedonc ideacutealement une partie de la recommandation nale de lutilisateur An de construire cetteseacutequence nale il eacutetait neacutecessaire de fusionner ces dieacuterentes seacutequences provenant des coloniesen une seacutequence de recommandation unique Pour reacutesoudre ce problegraveme de nombreuses maniegraverede proceacuteder existent Dans la suite de cette section nous avons exploreacute deux tactiques de fusion

70

35 Tactiques de fusion

que nous allons preacutesenter

351 Colonie de fusion

La premiegravere tactique pour fusionner les dieacuterentes seacutequences produites preacuteceacutedemment a natu-rellement eacuteteacute dutiliser le mecircme modegravele que pour la premiegravere eacutetape agrave savoir une colonie speacuteciquedont les agents se deacuteplacent sur un graphe pour trouver une solution Cette colonie est cependantdieacuterente des preacuteceacutedentes pour deux raisons principales

Premiegraverement le graphe sur lequel cette colonie opegravere na aucun inteacuterecirct agrave contenir lensemblede toutes les ressources existantes du domaine Nous consideacuterons ici que la premiegravere eacutetape dumodegravele eectue une seacutelection dun certain nombre de ressources speacuteciques agrave chaque colonie Cesressources peuvent ensuite ecirctre utiliseacutees pour creacuteer un second graphe posseacutedant beaucoup moinsde ndivideuds sur lequel la colonie de fusion pourra chercher une solution Nous avons utiliseacute toutesles ressources seacutelectionneacutees dans la premiegravere eacutetape en tant que ndivideuds du nouveau graphe Nousavons ensuite ajouteacute des arecirctes agrave chaque paire conseacutecutives de ressources dans les seacutequences de lapremiegravere eacutetape an de conserver les meilleurs chemins trouveacutes par les agents Enn nous avonsajouteacute des arecirctes aleacuteatoires en suivant la mecircme meacutethode que deacutecrite au deacutebut de ce chapitre dansla creacuteation du graphe principal en Eacutequation 31 Le but de ces arecirctes aleacuteatoires est le mecircme quepreacuteceacutedemment agrave savoir permettre aux agents dexplorer de nouveaux chemins potentiels Cettepremiegravere tactique reprend donc les points principaux de la creacuteation du graphe principal

Deuxiegravemement et contrairement agrave la premiegravere eacutetape ougrave toutes les colonies avaient un butpreacutecis la colonie de fusion na pas pour vocation doptimiser une caracteacuteristique speacutecique Aucontraire cette colonie a pour essence de regrouper au mieux dans une solution unique les reacute-sultats speacuteciques trouveacutes auparavant Pour ce faire la colonie de fusion utilise lensemble desfacteurs humains preacutesenteacutes preacuteceacutedemment dans une somme pondeacutereacutee an dattribuer aux arecirctesune distance d prenant en compte tous les objectifs Le calcul de cette distance est preacutesenteacuteci-dessous dans lEacutequation 311

dij =sum

colisincoloniesw(col) middot dij(col) (311)

ougrave w(col) est le poids repreacutesentant limportance estimeacutee de lobjectif de la colonie col dansla recommandation nale Nous proposons ici de calculer les poids moyens de chaque objectif(similariteacute diversiteacute nouveauteacute et preacutefeacuterences) sur les derniegraveres n sessions dactiviteacute de lutilisa-teur Par exemple un utilisateur nayant eacutecouteacute que lalbum Wish you were here des Pink Floyddurant ses derniegraveres sessions deacutecoute se verra attribuer des poids forts pour la similariteacute et lespreacutefeacuterences Inversement les poids des objectifs de diversiteacute et de nouveauteacute seront faibles

Cette meacutethode permet dobtenir limportance relative de chacun des objectifs dans lhisto-rique de consultations reacutecent de lutilisateur En faisant varier n il est aussi possible de fairevarier la taille de lhistorique pris en compte Ainsi une valeur de n faible concernera uniquementles derniegraveres interactions de lutilisateur avec le systegraveme tandis quune valeur de n eacuteleveacutee pren-dra en compte agrave la fois lhistorique reacutecent et plus ancien La variation de la fenecirctre dhistoriquepeut ainsi apporter un comportement dieacuterent du modegravele pour dieacuterents types dutilisateurs(utilisateur reacutecent ou ancien peu actif ou tregraves actif etc)

71

Chapitre 3 Notre modegravele de recommandation multi-objectifs AntRS

352 Fusion de seacutequences

Nous avons souhaiteacute impleacutementer une deuxiegraveme tactique de fusion an davoir un point decomparaison avec la colonie de fusion Dans cette deuxiegraveme tactique nous avons eacutegalement cal-culeacute le poids w(col) de chaque objectif sur lhistorique n de lutilisateur de la mecircme maniegravereque dans lEacutequation 311 Ces poids ont ensuite eacuteteacute utiliseacutes dans la construction dune seacutequencenale ressource par ressource Pour ce faire nous avons reacuteunis toutes les ressources composantles seacutequences des colonies speacutecialiseacutees dans un ensemble agrave la maniegravere dun sac de mots Puis agravechaque iteacuteration lapport de chacune des ressources restantes agrave la seacutequence nale a eacuteteacute mesureacuteet la meilleure ressource a eacuteteacute ajouteacutee Les iteacuterations sont stoppeacutees lorsquil nest plus possibledameacuteliorer la seacutequence nale De la mecircme maniegravere que pour la tactique preacuteceacutedente lapportde chaque ressource agrave la seacutequence de recommandation peut ecirctre mesureacute de multiple maniegraveresDe la mecircme maniegravere que dans lEacutequation 311 nous avons choisi de calculer limportance dechaque objectif de la seacutequence nale en construction puis de choisir les ressources permettantde sapprocher des poids correspondant agrave lhistorique n de lutilisateur

353 Conclusion

Dans ce chapitre nous avons preacutesenteacute le fonctionnement de notre modegravele de recommanda-tion multi-objectifs AntRS Notre modegravele sinspire de lalgorithme multi-agents ACS de MarcoDorigo Au lieu de trouver le plus court chemin dans un graphe agrave laide dune colonie dagentsfourmis nous utilisons 4 colonies en parallegravele qui chacune maximise un aspect de la recomman-dation nale Comme nous lavons montreacute dans leacutetat de lart il est deacutesormais neacutecessaire que lesrecommandations prennent en compte de multiples facteurs comme la diversiteacute la similariteacute oula nouveauteacute Il est tout aussi important pour les systegravemes de recommandation decirctre modulaireset geacuteneacuteriques an de sadapter aux situations toujours plus complexes et aux domaines applicatifstoujours plus varieacutes dans lesquels ils sont utiliseacutes Le choix de sinspirer dun modegravele multi-agentsest une reacuteponse agrave ces deacutes de la recommandation moderne Les systegravemes multi-agents ont unefaible complexiteacute algorithmique et sont particuliegraverement adaptables par nature Le modegravele quenous avons proposeacute est de plus susamment geacuteneacuterique pour sadapter aux domaines applicatifsougrave il est possible de faire de la recommandation de seacutequences

Dans la suite de ce manuscrit nous allons appliquer notre modegravele AntRS a un domaineapplicatif et reacutealiser des expeacuterimentations avec des donneacutees dutilisation concregravete an deacutetudierses performances dans des conditions dutilisation reacuteelles

72

Chapitre 4

Expeacuterimentations et reacutesultats

Sommaire

41 Introduction 74

42 Expeacuterimentations preacuteliminaires portant sur le modegravele ACS initial 74

421 Preacutesentation et inteacuterecircts de ces premiegraveres expeacuterimentations 74

422 Expeacuterimentations preacuteliminaires sur le modegraveles ACS 78

423 Conclusion 84

43 Expeacuterimentations sur le modegravele AntRS 84

431 Base de donneacutees utiliseacutee 84

432 AntRS mono-objectif expeacuterimentations sur chaque colonie isoleacutee 89

433 AntRS multi-objectifs expeacuterimentations sur lensemble des colonies si-

multaneacutement et sur les tactiques de fusion 93

434 Optimisation des meacutetavariables de AntRS 99

44 Conclusion 103

73

Chapitre 4 Expeacuterimentations et reacutesultats

41 Introduction

Dans la section preacuteceacutedente nous avons deacutetailleacute le modegravele AntRS que nous avons deacuteveloppeacutepour reacutepondre aux probleacutematiques de cette thegravese Comme nous lavons expliqueacute AntRS se basesur le travail de [Dorigo and Birattari 2011] qui a modeacuteliseacute le comportement de fourragementdes fourmis dans la nature Son modegravele et le notre par extension ont donc au cdivideur de leur fonc-tionnement le mecircme meacutecanisme permettant agrave des agents teacuteleacuteonomiques de suivre et de deacuteposerdes pheacuteromones sur un graphe An de mettre en exergue le cdivideur de ces modegraveles qui sera parla suite enrichi nous avons en premier lieu deacuteveloppeacute les modegravele Ant Colony System de MarcoDorigo [Dorigo and Birattari 2011] en Java avec une interface visuelle Cela nous a permis detester son fonctionnement dans diverses conditions expeacuterimentales controcircleacutees ainsi que de testerses limites Nous avons ensuite impleacutementeacute lensemble de notre modegravele AntRS en utilisant la basedeacutejagrave deacuteveloppeacutee preacuteceacutedemment puis nous avons reacutealiseacute les expeacuterimentations principales de cettethegravese agrave laide dune base de donneacutees deacutecrivant les habitudes de personnes eacutecoutant de la musique

Ce chapitre est constitueacute de deux sections principales Dans la premiegravere section nous allonsdabord nous inteacuteresser agrave limpleacutementation et au fonctionnement expeacuterimental du modegravele ACS deDorigo Cette section mettra en exergue les points importants permettant le bon fonctionnementdu modegravele classique Agrave laide dexpeacuterimentations simples nous reprendrons et expliquerons dunpoint du vue pratique les notions introduites de maniegravere theacuteorique dans leacutetat de lart lors de lapreacutesentation du modegravele ACS Ces premiegraveres expeacuterimentations permettront au lecteur de mieuxappreacutehender la suite du chapitre dans laquelle les notions abordeacutees seront reacute-utiliseacutees et eacutetenduesDans la deuxiegraveme section de ce chapitre nous nous inteacuteresserons aux expeacuterimentations principalesde cette thegravese portant sur notre modegravele AntRS Nous deacutecrirons dabord la base de donneacutees quenous avons utiliseacute pour tester notre modegravele puis lensemble des expeacuterimentations faites et ennles principaux reacutesultats obtenus

42 Expeacuterimentations preacuteliminaires portant sur le modegravele ACS

initial

421 Preacutesentation et inteacuterecircts de ces premiegraveres expeacuterimentations

La premiegravere eacutetape de ce travail expeacuterimental a consisteacute dans limpleacutementation du modegraveleinitial proposeacute par Dorigo sans modication Le but eacutetait agrave la fois de veacuterier si les reacutesultatsobtenus correspondaient agrave ce qui eacutetait attendu dans la litteacuterature et davoir par ailleurs unprogramme repreacutesentant une base fonctionnelle permettant de tester de nouveaux modegraveles pluscomplexes par la suite Nous avons donc commenceacute par impleacutementer le modegravele Ant ColonySystem deacutecrit par Dorigo dans son article [Dorigo and Birattari 2011] Comme nous avons deacutejagravedeacutecrit en deacutetail ce modegravele dans la Section 243 de leacutetat de lart nous ne reviendrons pas surles eacutequations reacutegissant le fonctionnement dACS Cependant nous allons plutocirct nous inteacuteresserici aux reacutesultats obtenus lors dexpeacuterimentations connues de la litteacuterature scientique Le choixdu langage de programmation dans lequel a eacuteteacute reacutealiseacute limpleacutementation et les expeacuterimentationsdurant toute cette thegravese a eacuteteacute Java Ce choix se justie par 3 principales raisons

1 La connaissance avanceacutee de ce langage

2 les bibliothegraveques 40 disponibles correspondant aux besoins de la thegravese

40 Ensemble de ressources (fonctions algorithmes speacuteciques documentation) permettant la creacuteation acceacuteleacutereacuteede programmes

74

42 Expeacuterimentations preacuteliminaires portant sur le modegravele ACS initial

3 Le fait que Java soit un langage de programmation orienteacute objet qui est un paradigmede programmation particuliegraverement adapteacute pour limpleacutementation dagents (chaque agentpeut ecirctre repreacutesenteacute par un objet Java)

Pour rappel lalgorithme geacuteneacuteral des Ant Colony Optimization servant de base pour toutesles dieacuterentes versions proposeacutees par Dorigo (Ant System Ant Colony System Ant-q ) estsyntheacutetiseacute dans lAlgorithme 3 ci-dessous

Algorithm 3 Meacutetaheuristique Ant Colony Optimization

Initialisation des paramegravetres et des pheacuteromoneswhile conditions darrecircts non atteintes doConstruction des solutionsRecherche locale (optionnelle)Mise agrave jour des pheacuteromones

end while

Agrave partir de lalgorithme geacuteneacuteral Ant Colony Optimization voici le fonctionnement de savariante Ant Colony System syntheacutetiseacute dans lAlgorithme 4 ci-dessous

Algorithm 4 Algorithme Ant Colony System

Initialisation des paramegravetres et des pheacuteromoneswhile conditions darrecircts non atteintes dowhile toutes les fourmis nont pas atteint le but dowhile tous les ndivideuds nont pas eacuteteacute pris en compte doAppliquer la regravegle de transition et choisir le prochain ndivideud agrave atteindreAppliquer la mise agrave jour locale des pheacuteromones sur larecircte traverseacutee

end whileend whileMise agrave jour globale des pheacuteromones

end while

Cet algorithme ACS peut aussi ecirctre deacutecrit sous la forme dun diagramme de ux commela proposeacute [Schlunz 2011] dans la Figure 41 Le format du diagramme de ux permet de bienvisualiser le fonctionnement de lalgorithme et notamment ses boucles iteacuteratives imbriqueacutees tantquun critegravere de n na pas eacuteteacute trouveacute tant quil reste des fourmis agrave deacuteplacer et tant quil restedes ndivideuds agrave explorer pour une fourmi

Apregraves avoir impleacutementeacute en Java lalgorithme ACS deacutecrit ci-dessus nous avons voulu testerson fonctionnement Agrave cette n nous avons repris les expeacuteriences des ponts binaires que nousavons preacutesenteacute dans la section 244 de leacutetat de lart Pour rappel ces types dexpeacuterimentationsconsistent agrave placer des fourmis dans un dispositif comportant un point de deacutepart (la fourmiliegrave-re) un point darriveacutee (la nourriture) et deux chemins y menant Ces chemins peuvent avoirla mecircme distance ou des distances dieacuterentes selon le type dexpeacuterimentation Le but est ensuitedobserver le comportement des fourmis sur quelques dizaines de minutes an de deacuteterminer si unchemin est plus emprunteacute quun autre La Figure 42 preacutesente deux exemples de congurationspossibles de cette expeacuterience utiliseacutee sur de vraies fourmis Le but eacutetant bien sucircr dobserver lecomportement de groupes de fourmis et leurs capaciteacutes agrave trouver le chemin le plus court vers

75

Chapitre 4 Expeacuterimentations et reacutesultats

Figure 41 Diagramme de ux repreacutesentant le deacuteroulement de lalgorithme ACS proposeacute par[Schlunz 2011]

une source de nourriture dans un environnement inconnu

Nous revenons sur ces expeacuterimentations dans ce chapitre de la thegravese apregraves les avoir deacutejagrave

76

42 Expeacuterimentations preacuteliminaires portant sur le modegravele ACS initial

Figure 42 Deux exemples de congurations expeacuterimentales dieacuterentes permettant chacune detester la capaciteacute des fourmis agrave trouver le plus court chemin dans un evironnement [Goss et al1989]

mentionneacutees dans leacutetat de lart car elles peuvent ecirctre utiliseacutees pour veacuterier le comportement dumodegravele ACS que nous avons impleacutementeacute En eet ces expeacuterimentations sont simples agrave mettreen divideuvre et les reacutesultats attendus sont connus De plus le modegravele ACS possegravede plusieurs meacuteta-variables permettant chacune de moduler le comportement de certaines parties du systegraveme Leparameacutetrage de ces meacutetavariables inue de maniegravere importante sur les reacutesultats potentiels dumodegravele il est donc important de bien comprendre le rocircle de chacune dentre elles et de les testerextensivement pour maximiser les capaciteacutes du modegravele Voici toutes les meacutetavariables du modegraveleACS

1 τ0 isin [0 1] valeur initiale des pheacuteromones disposeacutees sur chaque arecircte du graphe avant lepremier passage des agents

2 α isin [0 1] importance des pheacuteromones lorsque lagent fourmi choisit dune nouvelle arecircteagrave explorer Plus la valeur de ce paramegravetre est eacuteleveacutee plus lagent privileacutegiera les arecirctesavec un niveau eacuteleveacute de pheacuteromones

3 β isin [0 1] importance de lheuristique lorsque lagent fourmi deacutecide dune nouvelle arecircteagrave explorer Plus la valeur de ce paramegravetre est eacuteleveacutee plus lagent privileacutegiera les arecirctesposseacutedant une bonne heuristique

4 ρ isin [0 1] paramegravetre geacuterant leacutevaporation des pheacuteromones sur les arecirctes du graphe Plusla valeur de ce paramegravetre est eacuteleveacutee et plus les pheacuteromones seacutevaporent rapidement entrechaque passage dagent

5 Q0 isin [0 1] paramegravetre permettant deacutequilibrer la part dexploration et dexploitationbiaiseacutee du modegravele Plus la valeur de ce paramegravetre est eacuteleveacutee et plus les agents auront ten-dance agrave exploiter les arecirctes ougrave beaucoup dautres agents sont deacutejagrave passeacutes Inversementplus la valeur de ce paramegravetre est basse et plus les agents auront tendance agrave explorer denouveaux chemins encore peu visiteacutes

En plus de ces 5 meacutetavariables utiliseacutees dans le modegravele theacuteorique et les eacutequations dACSdautres meacutetavariables sont inheacuterentes au fonctionnement du modegravele en pratique On peut ainsideacutenombrer 2 autres meacutetavariables

77

Chapitre 4 Expeacuterimentations et reacutesultats

6 a nombre dagents fourmis se deacuteplaccedilant sur le graphe Plus le nombre dagents est eacuteleveacuteet plus lintelligence collective du systegraveme baseacutee sur les pheacuteromones se deacuteveloppera Ungrand nombre dagents allonge cependant la dureacutee de lexeacutecution du programme

7 n nombre diteacuterations du programme Lors dune iteacuteration chaque agent se deacuteplace surle graphe et produit un parcours complet Plus le nombre diteacuterations est grand et plusles agents ont de temps pour renforcer leacutemergence dune solution (un chemin particuliersur le graphe) mais plus lexeacutecution prendra du temps

Linteacuterecirct de mettre en place les expeacuterimentations des ponts binaires est donc double

1 Veacuterier le comportement du modegravele ACS impleacutementeacute en Java sur des expeacuterimentationsconnues

2 Observer limpact des 7 meacutetavariables listeacutees ci-dessus sur le comportement et les reacutesultatsdu modegravele dans le but de mieux appreacutehender les expeacuterimentations principales de cettethegravese qui seront preacutesenteacutees dans la suite de cette section

422 Expeacuterimentations preacuteliminaires sur le modegraveles ACS

Expeacuterimentation 11 ponts binaires de mecircme longueur

La premiegravere expeacuterimentation avait pour but de tester le graphe le plus simple possible agravelimage du dispositif de lexpeacuterimentation de Deneubourg dont nous avons deacutejagrave parleacute dans leacutetatde lart et qui est rappeleacute avec la Figure 43 un point de deacutepart un point darriveacutee et deuxchemins possibles strictement eacutequivalents en terme de distance agrave parcourir

Figure 43 Illustration de lexpeacuterience des ponts binaires par Jean-Louis Deneubourg (a)Apregraves un certain temps les fourmis choisissent majoritairement une des deux voies possibles (b)[Deneubourg et al 1990]

Avec le passage successif des fourmis un chemin va petit agrave petit ecirctre privileacutegieacute et renforceacute viales pheacuteromones deacuteposeacutees par ces derniegraveres Au bout dun certain temps un des deux chemins estemprunteacute par la majoriteacute des fourmis mecircme si quelques-unes dentre elles continuent toujoursdemprunter lautre chemin au cas ougrave celui-ci deviendrait plus avantageux Comme les cheminsrestent strictement identiques dans cette expeacuterience le choix nal du chemin nest pas important

An de pouvoir mieux appreacutecier le fonctionnement du modegravele en temps reacuteel nous avonsimpleacutementeacute une interface graphique permettant dacher le graphe ses ndivideuds ses arecirctes et

78

42 Expeacuterimentations preacuteliminaires portant sur le modegravele ACS initial

toutes leurs informations Cette interface a eacuteteacute deacuteveloppeacutee agrave laide dune bibliothegraveque Java gra-tuite nommeacutee GraphStream 41 orant tout un ensemble de fonctions permettant lachage degraphes Cette couche graphique se rajoute au-dessus de limpleacutementation complegravete du modegravelesans toutefois en modier son fonctionnement daucune maniegravere Linterface graphique reacutecupegraveresimplement les donneacutees agrave acher agrave linitialisation (la disposition du graphe avec ses arecirctes etses ndivideuds) ainsi quagrave chaque iteacuteration du modegravele pour mettre agrave jour les valeurs de pheacuteromonesagrave chaque arecircte Une fois lexeacutecution termineacutee le chemin nal trouveacute par les agents est coloreacutepermettant une rapide visualisation des reacutesultats du modegravele Pour cette sous-section les reacutesultatsdes expeacuterimentations seront preacutesenteacutes agrave laide de GraphStream

Figure 44 Repreacutesentation graphique de lExpeacuterimentation 11 meneacutee sur le modegravele ACSgracircce agrave la bibliothegraveque Java GraphStream Le ndivideud repreacutesenteacute par un carreacute rouge correspondau deacutepart le ndivideud repreacutesenteacute par un carreacute bleu repreacutesente larriveacutee les ndivideuds ronds noirsrepreacutesentent des points de passage possible les nombres noirs accoleacutes aux arecirctes repreacutesentent ladistance pour parcourir larecircte les nombres violets repreacutesentent le taux de pheacuteromones deacuteposeacuteessur larecircte

La Figure 44 est une capture deacutecran de la fenecirctre graphique construite avec les fonction-naliteacutes oertes par GraphStream montrant la conguration de lExpeacuterimentation 11 On y voitnotamment lensemble du graphe avec ses 4 ndivideuds distinguables par leur numeacutero didentication0 1 2 9 Le ndivideud 0 repreacutesente le point de deacutepart ougrave les agents sont initialement placeacutes tandisque le ndivideud 9 repreacutesente le ndivideud darriveacutee ougrave les agents atteignent leur but et cessent de sedeacuteplacer Au niveau des arecirctes du graphe on peut distinguer deux informations en violet laquantiteacute de pheacuteromones τ preacutesente sur larecircte en noir la distance d agrave parcourir pour traverserlarecircte Dans cette conguration lheuristique ηij associeacutee agrave chaque arecircte i j est calculeacutee demaniegravere classique uniquement avec la distance dij agrave savoir ηij = 1

dij Lheuristique est donc ici

41 httpgraphstream-projectorg

79

Chapitre 4 Expeacuterimentations et reacutesultats

eacutequivalente agrave la distance et nest pas acheacutee dans la fenecirctre graphique La conguration repreacute-senteacutee par la Figure 44 correspond agrave leacutetat dinitialisation du systegraveme avant que les agents neparcourent le graphe Toutes les arecirctes ont donc les mecircmes valeurs le taux de pheacuteromones τcorrespond au taux de pheacuteromones initial τ0 ici eacutegal agrave 0 1 et la distance est xeacute agrave 10 uniteacutesLes deux chemins possibles permettant aux agents de se deacuteplacer du ndivideud de deacutepart 0 au ndivideuddarriveacutee 9 sont eectivement strictement identiques

Figure 45 Reacutesultats obtenus apregraves 30 iteacuterations sur lExpeacuterimentation 11 Agrave gauche laconguration nale du graphe agrave droite le pourcentage dagents fourmis ayant emprunteacutes lesdeux chemins

LExpeacuterimentation 11 se deacuteroule donc ainsi 100 agents se deacuteplaceront agrave chaque fois etchercheront un chemin du ndivideud 0 au ndivideud 9 durant 30 iteacuterations La Figure 45 preacutesente lesreacutesultats de cette expeacuterimentation Agrave gauche la fenecirctre graphique montre leacutetat du graphe agrave lan des 30 iteacuterations on peut voir le chemin seacutelectionneacute par les agents passant par les ndivideudslt 0 1 9 gt Agrave droite le graphique preacutesentant leacutevolution du pourcentage dagents prenant soitle chemin 1 (lt 0 1 9 gt) ou le chemin 2 (lt 0 2 9 gt) Leacutevolution des pourcentages est similaireaux reacutesultats trouveacutes par Deneubourg avec de vraies fourmis (Figure 43) Une fois quun cheminest privileacutegieacute par rapport agrave un autre entre 80 et 95 des agents y passent Cet eacutecart saccentuede plus en plus au l des iteacuterations Il est toutefois important de noter quil subsiste un faiblepourcentage dagents deacutecidant quand mecircme de prendre le chemin 2 permettant au systegraveme desadapter agrave un potentiel changement denvironnement On voit ici linteacuterecirct de la meacutetavariableQ0 qui eacutequilibre lexploitation du chemin 1 en majoriteacute mais qui autorise aussi quelques agentsagrave explorer dautres chemins du graphe

Expeacuterimentation 12 ponts binaires de mecircme longueur et inuence des meacutetava-riables

LExpeacuterimentation 12 illustre limportance des meacutetavariables sur le comportement du sys-tegraveme La mecircme topologie du graphe est conserveacutee mais certaines meacutetavariables sont modieacutees Q0 et β La premiegravere gegravere leacutequilibre entre exploration et exploitation tandis que la deuxiegravemeconcerne limportance de lheuristique dans lexploration Contrairement agrave lExpeacuterimentation11 Q0 est ici biaiseacute pour privileacutegier lexploration et β est augmenteacute an de donner plus dimpor-tance agrave lheuristique par rapport au pheacuteromones lors de lexploration Les agents ont donc plus

80

42 Expeacuterimentations preacuteliminaires portant sur le modegravele ACS initial

de probabiliteacute dexplorer de nouvelles arecirctes plutocirct que demprunter des arecirctes ougrave beaucoup depheacuteromones sont deacutejagrave deacuteposeacutes Dans cette conguration lexploration se base principalement surlheuristique qui est ici strictement identique quelle que soit larecircte puisque baseacutee sur la distanceLes agents nont donc en theacuteorie pas vraiment de direction claire quant au chemin agrave prendre Onpeut voir le reacutesultat de lExpeacuterimentation 12 sur la Figure 46 les agents oscillent dun chemin agravelautre selon liteacuteration sans quaucun des deux ne soit vraiment privileacutegieacute Quand bien mecircme unchemin serait plus emprunteacute que lautre pendant une iteacuteration les pheacuteromones suppleacutementairesdeacuteposeacutees sur les arecirctes nont que peu dinuence sur la deacutecision lors des prochaines iteacuterations

Figure 46 Reacutesultats obtenus apregraves 30 iteacuterations sur lExpeacuterimentation 12 Comme les agentsse basent principalement sur lheuristique qui est partout eacutegale ils oscillent entre les deux cheminssans en privileacutegier un

Expeacuterimentation 13 ponts binaires de mecircme longueur et inuence des meacutetava-riables

LExpeacuterimentation 13 dont les reacutesultats sont preacutesenteacutes par la Figure 47 montre quil estaussi possible dobtenir linverse du comportement de lExpeacuterimentation 12 En donnant uneforte importance aux pheacuteromones et en favorisant grandement lexploitation par rapport agrave lex-ploration les agents choisissent tregraves rapidement un chemin et nen changent plus Au bout dequelques iteacuterations seulement 100 des agents prennent le mecircme chemin Lautre chemin aban-donneacute nit par voir toutes ses pheacuteromones seacutevaporer et les agents nont plus aucun moyen dyretourner

Expeacuterimentation 2 ponts binaires avec chemins de longueurs dieacuterentes

Apregraves avoir testeacute le comportement du modegravele ACS sur un graphe ougrave les chemins sont iden-tiques dans lExpeacuterimentation 1 nous allons maintenant creacuteer un graphe ayant la mecircme con-guration que dans la Figure 42 Le but est ici de tester la capaciteacute des agents agrave imiter lesfourmis dans la nature qui sont capables apregraves quelques dizaines de minutes de privileacutegier les 2

81

Chapitre 4 Expeacuterimentations et reacutesultats

Figure 47 Reacutesultats obtenus apregraves 30 iteacuterations sur lExpeacuterimentation 13 Les agents ex-ploitent ici les arecirctes ayant le plus de pheacuteromones Tregraves rapidement tous les agents utilisent lemecircme chemin

arecirctes courtes par rapport aux 2 arecirctes longues Nous allons de plus garder les mecircmes valeursde meacutetavariables que pour lExpeacuterimentation 11 sauf pour la quantiteacute initiale de pheacuteromoneτ0 qui sera augmenteacutee an de rester au-dessus de 0 La Figure 48 montre la conguration dugraphe directement apregraves 30 iteacuterations Toutes les arecirctes courtes avec une distance de 10 ont eacuteteacuteseacutelectionneacutees tandis que toutes les arecirctes longues avec une distance de 20 nont pas eacuteteacute utiliseacutees

Figure 48 Conguration nale du graphe pour lExpeacuterimentation 2 apregraves 30 iteacuterations Lesagents ont en majoriteacute bien seacutelectionneacute le chemin le plus court lt 0 1 3 4 9 gt

82

42 Expeacuterimentations preacuteliminaires portant sur le modegravele ACS initial

Expeacuterimentation 3 graphes aleacuteatoires plus complexes

Dans les preacuteceacutedentes expeacuterimentations le graphe eacutetait le plus simple possible pour pouvoirjouer avec le comportement du modegravele Avant de passer agrave la section suivante nous souhaitionstester les capaciteacutes du modegravele sur des topologies de graphes plus complexes Nous avons donccreacuteeacute aleacuteatoirement 10 graphes posseacutedant chacun 20 ndivideuds et des arecirctes aleacuteatoires selon un degreacutemoyen de 5 sur lesquels 100 agents se deacuteplaceront sur 50 iteacuterations La Figure 49 preacutesente lepremier de ces 10 graphes apregraves 30 iteacuterations On peut voir que le but est de trouver un chemindu ndivideud 0 au ndivideud 19 et les agents ont trouveacute le chemin lt 0 1 4 2 19 gt Ce chemin est eecti-vement le plus court avec une distance de 284 le deuxiegraveme meilleur chemin eacutetant lt 0 5 6 19 gtavec une distance de 315

Figure 49 Exemple de graphe de lExpeacuterimentation 3 agrave la n des 50 iteacuterations Ces graphessont geacuteneacutereacutes aleacuteatoirement

Parmi les 10 graphes aleacuteatoires le modegravele a trouveacute le chemin le plus court pour 9 dentre euxcar dans lun des graphes il neacutetait pas possible de rejoindre le ndivideud de n 19 Autrement dit

83

Chapitre 4 Expeacuterimentations et reacutesultats

les agents ont trouveacute le chemin le plus optimiseacute agrave chaque fois que cela eacutetait possible

423 Conclusion

Dans cette premiegravere section nous avons impleacutementeacute et testeacute le modegravele ACS proposeacute parDorigo Malgreacute la relative simpliciteacute des expeacuterimentations reacutealiseacutees nous avons pu comparer etveacuterier les reacutesultats que nous avons obtenus avec ceux de la litteacuterature scientique du domaineOutre ce point nous avons aussi pu deacuteduire quelques informations cruciales pour la suite de cettesection

Les meacutetavariables jouent un rocircle central dans le comportement les performances etles reacutesultats du modegravele

Les meacutetavariables peuvent donner de bons reacutesultats avec un type de graphemais pas forceacutement avec un autre Il sera donc important de pouvoir les adapter auxgraphes des expeacuterimentations principales

Leacutequilibre de ces meacutetavariables est relativement complexe agrave obtenirMecircme avecces congurations simples de graphes et laide de linterface graphique chaque expeacuterimen-tation a demandeacute un certain nombre dessais avant de trouver des valeurs concluantes Deplus comme ces meacutetavariables sont propres agrave chaque expeacuterimentation leacutetat de lart necontient que tregraves peu dindications sur les valeurs agrave leur donner Il sera donc importantdeacutetudier ce problegraveme pour les expeacuterimentations principales de cette thegravese

Il est important de noter que comme notre modegravele AntRS est une extension du modegravele ACSde Dorigo et reprend ses principes de fonctionnement toutes les conclusions ci-dessus pourrontecirctre appliqueacutees dans la section suivante ougrave nous reacutealiserons plusieurs expeacuterimentations avec lemodegravele AntRS

43 Expeacuterimentations sur le modegravele AntRS

Dans cette section nous allons maintenant deacutecrire les expeacuterimentations meneacutees sur le modegraveleAntRS que nous avons conccedilu dans le cadre de cette thegravese et deacutecrit dans le chapitre 3 preacuteceacutedentNous nallons pas re-deacutetailler la theacuteorie du modegravele AntRS ici comme cela a deacutejagrave eacuteteacute fait dansle chapitre preacuteceacutedent mais nous allons plutocirct nous concentrer sur son application et sur sescomportements dun point de vue expeacuterimental De la mecircme maniegravere que pour le modegravele ACSdans la section preacuteceacutedente il est important de proceacuteder agrave quelques tests pour jauger notremodegravele avant de lancer des expeacuterimentations pouvant ecirctre longues Toutefois et contrairementagrave la section preacuteceacutedente toutes les expeacuterimentations qui vont ecirctre preacutesenteacutees ici ont eacuteteacute reacutealiseacuteessur une base de donneacutees reacuteelles Avant de sinteacuteresser agrave ces expeacuterimentations nous allons doncpreacutesenter la base de donneacutees utiliseacutee

431 Base de donneacutees utiliseacutee

Tout dabord et avant de discuter du choix des donneacutees il est important de preacuteciser pour-quoi nous navons pas eu recours comme dans la section preacuteceacutedente pour le modegravele ACS agrave desdonneacutees simuleacutees Lexplication de cette deacutecision reacuteside dans lobjectif viseacute par ces expeacuterimen-tations Les expeacuterimentations reacutealiseacutees preacuteceacutedemment avaient seulement pour but de tester lebon fonctionnement du modegravele son comportement et linuence de ses meacutetavariables Lobjectifdes expeacuterimentations que nous allons preacutesenter maintenant est dieacuterent proposer des seacutequences

84

43 Expeacuterimentations sur le modegravele AntRS

de ressources correspondant aux preacutefeacuterences de lutilisateur Il serait theacuteoriquement possible desimuler un grand nombre de ressources aleacuteatoires posseacutedant des caracteacuteristiques elles aussi aleacutea-toires Cependant nous souhaitons principalement eacutevaluer la pertinence des seacutequences produitespar notre modegravele Pour ce faire il est neacutecessaire de disposer de donneacutees dusage pour veacuteriera posteriori si ces seacutequences sont susceptibles dinteacuteresser les utilisateurs Lexploitation dunebase de donneacutees reacuteelle posseacutedant ces donneacutees dusages eacutetait essentielle

Choix du domaine applicatif

Le choix du domaine applicatif a eacuteteacute un point crucial pour pouvoir tester notre modegravele dans debonnes conditions La recommandation de seacutequences restreint le choix du domaine en imposantcertaines contraintes

Les utilisateurs doivent consulter reacuteguliegraverement les ressources du domaine applicatif Lors dune peacuteriode dactiviteacute les utilisateurs doivent consulter un nombre susant (au

moins une dizaine) de ressources dans un court intervalle de temps Par conseacutequent les ressources doivent pouvoir ecirctre consulteacutees et consommeacutees rapide-

ment Ces ressources doivent aussi ecirctre disponibles en nombre susant

En se basant sur les eacutetudes de leacutetat de lart explorant les algorithmes de fourmis ou la recom-mandation de seacutequences deux domaines applicatifs sont majoritairement utiliseacutes les ressourceseacuteducatives ou les ressources multimeacutedias Le domaine eacuteducatif permet de geacuteneacuterer des seacutequencesdestineacutees aux apprenants comme le ferait un vrai professeur tandis que le domaine du divertisse-ment multimeacutedia est en plein essor depuis quelques anneacutees gracircce agrave la deacutemocratisation dInternethaut deacutebit et des smartphones permettant agrave tout un chacun de regarder des lms ou deacutecouter dela musique par exemple Un troisiegraveme domaine a aussi eacuteteacute consideacutereacute car il a eacuteteacute le sujet de monstage de n de Master en collaboration avec le projet europeacuteen CrossCult 42 le domaine museacutealautrement dit les seacutequences que creacuteent les visiteurs dun museacutee en se deacuteplaccedilant physiquementdans un museacutee [Osche et al 2016 Osche et al 2019b]

Toutefois mecircme si ces trois domaines sont adapteacutes agrave notre application la reacutecupeacuteration dunebase de donneacutees assez importante pour reacutealiser des expeacuterimentations ne pose pas les mecircmes pro-blegravemes selon le domaine consideacutereacute

Domaine eacuteducatif dans ce domaine les ressources sont des supports peacutedagogiques denatures dieacuterentes 43 et le but est de creacuteer des seacutequences permettant agrave des utilisateurs dat-teindre des connaissances speacutecieacutees Il existe des bases de donneacutees publiques provenantduniversiteacutes ouvertes comme par exemple lUniversiteacute Ouverte des Humaniteacutes 44 maisces derniegraveres nont pas de prols utilisateurs assez fournis pour pouvoir les utiliser icinotamment ducirce agrave une connexion avec une session unique et anonyme sans prol Commeil est preacutefeacuterable davoir plusieurs dizaines (voire centaines) dentreacutees preacute-existantes pourmodeacuteliser le graphe et les prols utilisateurs il est neacutecessaire dutiliser les donneacutees dunsite permettant la connexion de lutilisateur et lenregistrement de ses habitudes pendantune certaine dureacutee

42 httpwwwcrossculteu projet europeacuteen ayant pour but de modier la maniegravere dont les citoyens europeacuteensvoient et sapproprient lHistoire en creacuteant de nouvelles interconnexions entre lheacuteritage culturel des lieux deculture (museacutees villes etc) et le point de vue des citoyens eux-mecircmes43 Les supports peacutedagogiques peuvent inclure des cours eacutecrits oraux des videacuteos des exercices des tests etc44 httpwwwuohfr

85

Chapitre 4 Expeacuterimentations et reacutesultats

Domaine museacuteal ce domaine est unique car il est le seul des trois agrave neacutecessiter dereacutecolter des donneacutees de maniegravere physique et non sur ordinateur Comme nous lavons vudans leacutetat de lart des eacutetudes existent dans ce domaine et ont reacutecolteacute les positions desutilisateurs avec plus ou moins de preacutecision mais il nexiste agrave notre connaissance pas debase de donneacutees publique permettant de savoir ce que le visiteur regarde preacutecisemment 45Or cette information est essentielle agrave notre modegravele car la position seule ne permet pas dedeacuteterminer ce que fait preacuteciseacutement lutilisateur (par exemple il peut sassoir en face dunedivideuvre mais regarder derriegravere lui ou encore discuter avec quelquun sans precircter attentionagrave ldivideuvre devant lui etc) Autrement dit sans savoir ce que regarde lutilisateur il nestpas possible de savoir les ressources quil a consulteacute Eacutetant donneacute le sujet du stage eectueacuteavant cette thegravese cest sur ce problegraveme preacutecis que nous nous sommes dabord concentreacutesCependant devant le coucirct en temps de la mise en place dune telle expeacuterimentation nousavons chercheacute des alternatives plus reacutealisables Il est agrave noter quil existe aussi la possi-biliteacute dun museacutee virtuel ougrave les visiteurs utilisent un ordinateur et un casque de reacutealiteacutevirtuelle pour se deacuteplacer ddivideuvre en divideuvre dans un espace recreacuteeacute pour simuler un museacuteeLa creacuteation de lensemble des composants permettant cette expeacuterimentation ainsi que lerecrutement des visiteurs virtuels est cependant complexe et tregraves coucircteux en temps nechangeant pas le problegraveme principal de la reacutecolte de donneacutees dans notre cas

Domaine du divertissement multimeacutedia depuis le tout deacutebut des systegravemes de re-commandations le domaine multimeacutedia (musique lms etc) occupe une place majeuredans leacutetat de lart On peut citer par exemple la base de donneacutees publique MovieLensqui depuis 1998 a eacuteteacute utiliseacutee dans des milliers deacutetudes sur la recommandation de lms[Harper and Konstan 2015] La raison de cette omnipreacutesence est la grande quantiteacute desites web permettant souvent de maniegravere gratuite de regarder des videacuteos deacutecouter dela musique etc Les donneacutees dutilisation de ce genre de sites sont aussi relativementsimples agrave reacutecupeacuterer et agrave exploiter Leacutecoute de musique en ligne est speacuteciquement inteacute-ressante dans le cadre de cette thegravese car elle est propice agrave la consommation de multiplesressources agrave la suite dans une mecircme session orant ainsi la possibiliteacute de travailler avecdes seacutequences De plus il existe plusieurs sites de diusion de musique en ligne orantla possibiliteacute dacceacuteder agrave leur API et agrave certaines de leurs donneacutees comme Deezer 46 ouencore Spotify 47

Le choix sest nalement porteacute sur le domaine de leacutecoute de musique en ligne dune part pourla possibiliteacute dexploiter et de recommander des seacutequences de musiques et dautre part pour lapossibiliteacute dobtenir une base de donneacutees de la part de nos partenaires dans lindustrie musicaleNotre modegravele AntRS ayant la capaciteacute de sadapter agrave de nombreux domaines applicatifs nousavons pu nous diriger vers une base de donneacutees existante an de commencer les expeacuterimentationsAmaury LHuillier ancien doctorant de leacutequipe KIWI a reacutecupeacutereacute et exploiteacute durant sa thegraveseune base de donneacutees musicale provenant de Deezer [lHuillier 2018] Dans la section suivantenous allons deacutecrire les caracteacuteristiques de cette base de donneacutees

45 Bien que des solutions soient en cours deacutetudes[Mokatren et al 2018]46 httpswwwdeezercom47 httpswwwspotifycom

86

43 Expeacuterimentations sur le modegravele AntRS

Description de la base de donneacutees

La base de donneacutees que nous avons utiliseacute se base sur le comportement dutilisateurs deDeezer pendant un mois entre le 5 deacutecembre 2016 et le 5 janvier 2017 Durant ce mois nousavons pu identier

3561 utilisateurs uniques 1871919 eacutecoutes enregistreacutees 178910 musiques uniques eacutecouteacutees

En plus de ces donneacutees nous avons calculeacute le nombre de sessions uniques durant ce mois Unesession est deacutetermineacutee par un utilisateur se connectant sur le site eacutecoutant un certain nombre demusiques puis se deacuteconnectant Une session se poursuit tant que lutilisateur eacutecoute des musiquessans pause plus longues que 15 minutes Nous avons ainsi pu identier 91468 sessions uniquescomposeacutees en moyenne de 183 morceaux de musique Ces sessions seront la base de travail nouspermettant de construire le graphe de notre modegravele AntRS et de proposer des recommandationsLa Figure 410 preacutesente en scheacutema la deacutetection de sessions dans la base de donneacutees

Figure 410 Exemple de deacutetection de sessions dans la base de donneacutees Lheure agrave laquelleest lanceacutee chaque musique (ici en bas dans le scheacutema) ainsi que sa dureacutee sont enregistreacutees Silutilisateur ne relance pas de musique pendant 15 minutes apregraves la n de sa derniegravere eacutecoute alorsla session en cours est termineacutee et une nouvelle session est commenceacutee agrave la prochaine musiquelanceacutee

Deezer possegravede des meacutetadonneacutees sur chaque musique quil est possible de reacutecupeacuterer et decoupler agrave dautres API 48 (comme par exemple lAPI de Spotify 49) an de les compleacuteter si neacute-cessaire Sans preacutesenter la base de donneacutees dans lensemble de ses deacutetails voici ci-dessous les ca-racteacuteristiques potentiellement exploitables enregistreacutees pour chaque musique que nous pouvonsregrouper en trois cateacutegories Tout dabord nous disposons dinformations textuelles classiques

id identiant unique de la musique title titre de la musique album nom de lalbum auquel appartient la musique artist nom de lartiste (ou du groupe) qui a creacuteeacute la musique artistGenre genre musical de lartiste

Ensuite les API de descriptions de meacutetadonneacutees musicales disposent dun ensemble de va-leurs numeacuteriques correspondant aux caracteacuteristiques de chaque musique

48 API Application Programming Interface

49 httpsdeveloperspotifycomdocumentationweb-api

87

Chapitre 4 Expeacuterimentations et reacutesultats

duration dureacutee de la musique en secondes acousticness isin [0 1] indique agrave quel point la musique est acoustique cest-agrave-dire si

la musique est plutocirct de type eacutelectronique ou plutocirct classique (ie composeacutee avec desinstruments de musique agrave corde ou agrave vents par exemple)

danceability isin [0 1] indique agrave quel point la musique est adapteacutee agrave la danse energy isin [0 1] indique agrave quel point la musique est eacutenergique instrumentalness isin [0 1] indique agrave quel point la musique possegravede ou non des parties

vocales liveness isin [0 1] indique si la musique a eacuteteacute enregistreacutee avec ou sans la preacutesence dun

public loudness isin [0 1] mesure la preacutesence et la puissance des basses dans la musique speechiness isin [0 1] mesure limportance des paroles dans la musique sil y en a tempo rythme de la musique valence indique si leacutemotion geacuteneacuterale de la musique est plutocirct heureuse ou triste

Enn Deezer eacutetant un service de musique en ligne il dispose des donneacutees de freacutequentationsdes musiques les unes par rapport aux autres Il est donc possible de connaicirctre pour chaquemusique et artiste sa populariteacute

trackRankDeezer repreacutesente la populariteacute de la musique sur le site Deezer artistRankDeezer repreacutesente la populariteacute de lartiste sur le site Deezer

La base de donneacutees possegravede aussi une table concernant les utilisateurs Ces derniers sontbien sucircr anonymiseacutes avec un identiant geacuteneacutereacute automatiquement De plus pour chaque chansonDeezer peut connaicirctre quelles actions lutilisateur a eectueacute durant son eacutecoute (sil en a eectueacute)

idUser identiant unique de lutilisateur idTrack identiant unique de la musique eacutecouteacutee timestamp date preacutecise agrave laquelle lutilisateur a lanceacute la musique skip indique si lutilisateur est passeacute agrave la musique suivante durant son eacutecoute ban indique si lutilisateur a banni la musique eacutecouteacutee de ses futures recommandations love indique si lutilisateur a aimeacute la musique durant son eacutecoute

Ces trois derniegraveres informations sont importantes car elles repreacutesentent lavis de lutilisateursur la musique quil eacutecoute On peut par exemple deacuteduire dun utilisateur qui passe la musiqueen cours (skip) quil ne lappreacutecie pas ou alors quil laime mais que ce nest pas le bon momentpour leacutecouter Un utilisateur supprimant une musique de ses futures eacutecoutes (ban) indique quilne souhaite plus eacutecouter cette musique et ce quelles que soient les circonstances Le Tableau 41preacutesente la freacutequence agrave laquelle les utilisateurs se sont servis de ces fonctionnaliteacutes dans notrebase de donneacutees

Discussion sur la base de donneacutees

Dans cette section nous avons justieacute le choix dune base de donneacutees musicale et deacutecritson contenu Mecircme si initialement nous nous sommes plutocirct dirigeacutes vers lespace museacuteal etle-eacuteducation devant le temps et la complexiteacute de la reacutecupeacuteration de donneacutees dans ces deuxdomaines nous avons nalement proceacutedeacute au choix plus pragmatique du domaine musical dont

88

43 Expeacuterimentations sur le modegravele AntRS

Nombre doccurrences Pourcentage

skip 603773 3225ban 3417 018love 14174 076

Total 621364 3319

Table 41 Tableau repreacutesentant le nombre de fois ougrave un utilisateur a cliqueacute sur les boutonspour passer bannir ou aimer une musique durant son eacutecoute On remarque quau total dansnotre base de donneacutees pregraves dun tiers des utilisateurs ont passeacute la musique quils eacutecoutaient

une base de donneacutees eacutetait deacutejagrave disponible et precircte agrave lemploi Le travail preacuteliminaire sur les deuxdomaines applicatifs non seacutelectionneacutes na cependant pas eacuteteacute vain car des projets en parallegravelesur la creacuteation dune base de donneacutees de visiteurs se deacuteplaccedilant dans le museacutee des Beaux-arts deNancy sont en cours de reacutealisation [Osche et al 2019b][Castagnos et al 2019]

Un autre objectif derriegravere la prise en compte de plusieurs domaines sur lesquels appliquernotre modegravele est la geacuteneacutericiteacute de notre approche Ces trois domaines possegravedent de nombreusesdieacuterences les uns par rapports aux autres Le domaine des museacutees est un environnement physiqueougrave les distances entre les divideuvres dart et la foule sont des notions importantes agrave prendre en compteet unique agrave ce domaine Le domaine de le-eacuteducation quant agrave lui neacutecessite de prendre en comptelobjectif peacutedagogique de lapprenant son niveau ou encore sa vitesse dapprentissage plutocirctque les seules preacutefeacuterences quil est dusage dexploiter dans les systegravemes de recommandationNotre modegravele AntRS a eacuteteacute conccedilu dans le but de pouvoir sadapter agrave ces dieacuterentes speacuteciciteacutesAinsi le fonctionnement du cdivideur du modegravele reste le mecircme quel que soit le domaine et seulsles objectifs des colonies ainsi que le type des colonies neacutecessite decirctre adapteacute en fonctiondes objectifs importants du domaine et des caracteacuteristiques de ses ressources Pour illustrer cedernier point tregraves concregravetement les expeacuterimentations qui suivent nincluent pas la colonie deprogressiviteacute Nous avons reacutealiseacute de nombreux tests avec cette colonie avec le corpus de donneacuteesmais les reacutesultats obtenus nont jamais eacuteteacute concluants Cela sexplique par le fait que les seacutequencesdeacutecoutes utilisateurs que nous avons recueilli ne posseacutedaient elles-mecircmes aucun motif deacutetectablede progressiviteacute selon les critegraveres deacutenis dans notre modegravele Nous avons donc deacutecideacute dutiliser lamodulariteacute quore notre modegravele en enlevant cette colonie

432 AntRS mono-objectif expeacuterimentations sur chaque colonie isoleacutee

Apregraves avoir deacutetailleacute la base de donneacutees nous allons maintenant aborder la premiegravere expeacuteri-mentation que nous avons reacutealiseacute avec celle-ci Comme nous lavons fait au deacutebut de ce chapitreavec le modegravele ACS classique nous avons jugeacute important de reacutealiser quelques expeacuterimentationsde tests an dappreacutecier le fonctionnement en pratique de notre modegravele qui jusquagrave maintenantdans ce manuscrit na eacuteteacute preacutesenteacute que de maniegravere theacuteorique Pour rappel notre modegravele simuleen parallegravele plusieurs colonies de fourmis ayant chacune un objectif unique Ensuite un algo-rithme se charge de fusionner les dieacuterents reacutesultats de lensemble des colonies pour ne proposeragrave lutilisateur quune seule seacutequence de ressources Avant de tester lensemble de notre modegravelenous avons voulu tester les colonies seacutepareacutement an dobserver si les reacutesultats quelles produisentsont bien adapteacutes agrave leurs objectifs respectifs Voici les 4 colonies que nous avons preacutesenteacutes dansle chapitre 3 et que nous allons mesurer ici

1 Similariteacute

89

Chapitre 4 Expeacuterimentations et reacutesultats

2 Diversiteacute

3 Nouveauteacute

4 Preacutefeacuterences

An de mesurer les performances de ces 4 colonies nous allons les isoler et les lancer sur ungraphe identique en tous points La modulariteacute dAntRS nous permettant de changer le nombrede colonies utiliseacutees au vol agrave chaque exeacutecution est ici mis agrave prot pour lancer notre modegraveleavec uniquement une colonie au lieu des 4 habituelles La deuxiegraveme phase de notre modegravele lafusion des seacutequences provenant des dieacuterentes colonies nest ici pas utiliseacutee eacutetant donneacute que nousnaurons que les reacutesultats dune seule colonie autrement dit nous naurons agrave la n quune seuleseacutequence unique par utilisateur et par expeacuterimentation (soit 4 seacutequences par utilisateur pourlensemble des 4 expeacuterimentations) Nous allons donc proceacuteder agrave 4 tests dieacuterents pour chaquecolonie avec des conditions de deacutepart strictement identiques Le but est ici de voir si les reacutesultatsobtenus correspondent bien agrave lobjectif de la colonie testeacutee Autrement dit pour un utilisateurdonneacute les agents de la colonie de similariteacute devraient favoriser les musiques similaires au goucirct delutilisateur en question De son cocircteacute la colonie de nouveauteacute devrait dans les mecircmes conditionsproduire des seacutequences de musiques moins familiegraveres pour lutilisateur

Avant de preacutesenter les reacutesultats de ces premiegraveres expeacuterimentations nous allons deacutecrire dequelle maniegravere nous les avons reacutealiseacutees Nous avons deacutejagrave deacutetailleacute la base de donneacutees avec laquellenous travaillons dans la section preacuteceacutedente mais nous navons pas encore expliqueacute commentnous avons utiliseacute ces donneacutees Comme nous lavons preacuteciseacute nous avons agrave notre disposition plusde 3500 utilisateurs et plus de 91400 sessions Parmi lensemble total des utilisateurs nous enavons seacutelectionneacute 500 au hasard an de travailler uniquement sur eux Cette reacuteduction du nombredutilisateurs nous a permis de reacutealiser beaucoup plus rapidement des expeacuterimentations tout engardant une diversiteacute importante Pour chacun de ces 500 utilisateurs nous avons reacutecupeacutereacute leurssessions deacutecoute et gardeacute toutes celles contenant 5 musiques ou plus Ces 500 utilisateurs ontensuite eacuteteacute diviseacutes aleacuteatoirement en 2 groupes de 400 et de 100 les 400 premiers utilisateursont servi pour lentraicircnement du modegravele (dans notre cas la creacuteation du graphe) et cest sur les100 utilisateurs restants que nous avons meneacute les tests Dans le cadre de cette expeacuterimentationpreacutecise les utilisateurs de la base dentraicircnement ont eacutecouteacute 10621 sessions uniques de plus de5 musiques et les utilisateurs de la base de test ont quant agrave eux eacutecouteacute 2569 sessions Pourchacune des sessions deacutecoute des utilisateurs de la base de test notre modegravele a produit uneseacutequence de recommandations en partant de la premiegravere musique eacutecouteacutee Autrement dit pourchaque session les agents de notre modegravele ont eacuteteacute lanceacutes sur le graphe en prenant comme pointde deacutepart la premiegravere musique que lutilisateur avait eacutecouteacute Par exemple pour la session dunutilisateur consistant en leacutecoute de lalbum entier Dark Side of the Moon des Pink Floyd conte-nant 9 musiques les agents eacutetaient placeacutes sur le ndivideud du graphe correspondant agrave la premiegraveremusique de lalbum Speak to me Breathe puis notre modegravele sexeacutecute et les agents trouventun chemin dans le graphe Les agents possegravedent 3 conditions de parcours de graphe une condi-tion de taille minimale de la seacutequence recommandeacutee et deux conditions darrecircts La conditionde taille minimale de la seacutequence recommandeacutee est xeacutee agrave la moitieacute de la longueur de la sessioninitiale de lutilisateur Dans lexemple de lalbum de Pink Floyd un agent sera donc forceacute deparcourir au moins 5 ndivideuds du graphe avant de pouvoir sarrecircter Les deux conditions darrecirctseacutetaient quant agrave elles imposeacutees dans notre modegravele an de limiter la taille maximale de la seacutequencerecommandeacutee des agents Premiegraverement la derniegravere musique de la session initiale eacutecouteacutee parlutilisateur neacutetait pas donneacutee en amont mais si jamais les agents arrivaient agrave cette musique ils

90

43 Expeacuterimentations sur le modegravele AntRS

arrecirctaient ici leur chemin Deuxiegravemement dans le cas ougrave les agents natteignaient pas la derniegraveremusique de la session initiale de lutilisateur ces derniers sarrecirctaient lorsquils avaient parcourudeux fois la taille de la session initiale Dans notre exemple avec lalbum de Pink Floyd les agentspourraient donc parcourir au maximum 18 ndivideuds du graphe et produire ainsi une seacutequence derecommandations de 18 musiques En prenant en compte le nombre de ndivideuds des graphes surlesquels nous avons travailleacute (entre plusieurs dizaines de milliers jusquagrave plusieurs centaines demilliers) cest cette deuxiegraveme condition darrecirct qui eacutetait tregraves largement atteinte Ces trois condi-tions son neacutecessaires et ont eacuteteacute mises en place an dobtenir des seacutequences de recommandationfaisant sens dans le contexte du domaine applicatif musical Sans ces 3 conditions il est pos-sible dobtenir des seacutequences ne faisant que deux musiques ou posseacutedant des centaines voire desmilliers de musiques Comme le reste des paramegravetres de notre modegravele nous avons fait en sortequil soit aiseacute de les changer au vol en fonction du domaine applicatif voire mecircme en fonctionde chaque utilisateur au sein dun mecircme domaine

Nous allons maintenant nous inteacuteresser agrave la creacuteation du graphe Nous avons deacutecrit la maniegraveredont nous creacuteons le graphe sur lequel les agents se deacuteplacent dans la Section 33 du chapitrepreacuteceacutedent Nous avons utiliseacute un sous-ensemble de 500 utilisateurs choisis aleacuteatoirement parmilensemble des utilisateurs de notre base de donneacutees Deezer pour reacutealiser cette expeacuterimentationApregraves cette seacutelection aleacuteatoire nous avons seacutepareacute ces 500 utilisateurs en 5 blocs de 100 utilisateursan de reacutealiser une validation croiseacutee agrave 5 blocs 4 blocs ont constitueacute la base dapprentissage tandisque le dernier bloc restant a constitueacute la base de test Ce processus a eacuteteacute reacutepeacuteteacute 5 fois pour reacutealiserlexpeacuterimentation avec toutes les combinaisons possibles Le choix speacutecique dutiliser lensembledes connaissances disponibles de 80 des utilisateurs et dessayer de preacutevoir les preacutefeacuterences desderniers 20 est deacutelibeacutereacutement voulu Il nous permet de simuler au mieux le fonctionnement dunservice de recommandations en cours dutilisation En eet un nouvel utilisateur arrivant surle site sera inconnu du systegraveme de recommandation La tacircche de preacutediction est plus ardue etsaidera initialement des preacutefeacuterences des autres utilisateurs deacutejagrave connus du modegravele Au fur et agravemesure que le nouvel utilisateur eacutecoute des musiques et apporte ses retours sur ces derniegraveresle modegravele peut inteacutegrer ses preacutefeacuterences speacuteciques et de ce fait ameacuteliorer les recommandationsquil lui propose Pour simuler cette eacutevolution des connaissances du modegravele nous avons inteacutegreacutechaque session de lutilisateur au graphe apregraves avoir proposer une recommandation pour celle-ciAutrement dit une fois que le modegravele a proposeacute une recommandation de seacutequence en se basantsur une session deacutecoute de lutilisateur le graphe est reconstruit en inteacutegrant les informationsde cette nouvelle session deacutecoute Ainsi agrave chaque nouvelle session deacutecoute pour laquelle notremodegravele propose une recommandation le graphe gagne en information et est plus agrave mecircme depreacutedire correctement les preacutefeacuterences de lutilisateur Cependant linconveacutenient majeur de cettemeacutethode est de devoir reconstruire le graphe apregraves chaque recommandation an dinteacutegrer lesnouvelles informations Apregraves cette premiegravere expeacuterimentation nous proposerons une meacutethodeplus classique de reacutepartition des connaissances apporteacutees par les utilisateurs

Le Tableau 42 preacutesente les reacutesultats de cette expeacuterience pour les 4 colonies choisies Ce for-mat de tableau de reacutesultats et les meacutetriques deacutevaluations qui le compose seront utiliseacutes pour lesprochaines expeacuterimentations nous allons donc les expliquer ici avant de discuter des reacutesultatsobtenus An de mesurer les performances de notre modegravele nous avons utiliseacute diverses mesuresnous permettant de capturer dieacuterents aspects que nous consideacuterons ecirctre importants dans unerecommandation de seacutequence Nous allons deacutecrire ces dieacuterentes mesures ci-dessous

Preacutecision Rappel et F-mesure les mesures classiques dans le domaine de la recherche

91

Chapitre 4 Expeacuterimentations et reacutesultats

Preacutecision Rappel F-mesure Similariteacute SIL Diversiteacute DR Nouveauteacute Preacutefeacuterences

Colonie de Similariteacute 0317 0126 0165 0952 0923 0048 0049 072 0447 Colonie de Diversiteacute 0211 0104 0127 0862 077 0138 019 0806 0393 Colonie de Nouveauteacute 0132 0112 0114 0895 0837 0105 0144 0909 079 Colonie de Preacutefeacuterences 0296 0159 0191 0946 091 0054 008 0695 0804

Table 42 Expeacuterimentations avec le modegravele AntRS mono-objectif pour les 4 objectifs desimilariteacute diversiteacute nouveauteacute preacutefeacuterencesLe code couleur fait reacutefeacuterence agrave la signicativiteacute statistique de la p-valeur avec p isin [0 1] 0 0001 001 005 01 1

dinformation [Baeza-Yates et al 1999] Elles permettent de comparer directement lesseacutequences de recommandation produites par notre modegravele avec les sessions deacutecoute ini-tiales des utilisateurs Dans un contexte dutilisation reacuteel ougrave un utilisateur se connecte etle systegraveme propose une recommandation il ne serait pas possible dutiliser ces mesuresCependant dans le cadre dune eacutevaluation hors-ligne elles apportent des informations ma-jeures sur la qualiteacute des recommandations car nous consideacuterons que les sessions deacutecouteque nous posseacutedons sont de bons modegraveles pour nos recommandations

Similariteacute et SIL (Similariteacute Intra-Liste) bien quelles soient sur-utiliseacutees les me-sures de similariteacute et notamment la similariteacute intra-liste sont de bons indicateurs de lacoheacuterence de nos seacutequences de recommandations La mesure de similariteacute intra-liste pro-vient des travaux de Ziegler amp al[Ziegler et al 2005]

Diversiteacute et DR (Diversiteacute Relative) comme nous lavons expliqueacute plus tocirct dans cemanuscrit la diversiteacute est une caracteacuteristique cruciale des systegravemes de recommandationsen plus de la similariteacute Il eacutetait donc important de mesurer agrave quel point les musiques re-commandeacutees ainsi que les seacutequences en elles-mecircmes eacutetaient diverses [McGinty and Smyth2003 Vargas and Castells 2011]

Nouveauteacute et Preacutefeacuterences pour mesurer ces deux derniegraveres caracteacuteristiques nousavons utiliseacute les deux mesures proposeacutees dans larticle de[Vargas and Castells 2011] quenous avons aussi reproduites preacuteceacutedemment dans les Eacutequations 35 et 36

Apregraves avoir expliqueacute en deacutetail lexpeacuterimentation et le processus deacutevaluation nous pouvonsmaintenant nous inteacuteresser aux reacutesultats agrave proprement parler Le Tableau 42 preacutesente les reacutesul-tats de notre premiegravere expeacuterimentation mono-objectif avec 500 utilisateurs pour chacune des 4colonies isoleacutees

An de sassurer que les reacutesultats obtenus et preacutesenteacutes ci-dessus sont signicatifs nous avonsreacutealiseacute pour chacune des cases du tableau un test de signicativiteacute statistique An de savoirsi nos donneacutees suivaient la loi normale nous avons reacutealiseacute un test de Shapiro-Wilk et ce der-nier sest reacuteveacuteleacute neacutegatif Nous avons ainsi ducirc utiliser le test non parameacutetrique de Wilcoxon quinous a permis de comparer les moyennes des deux eacutechantillons connexes (mecircme utilisateurs maisdieacuterentes colonies) Les reacutesultats pour cette expeacuterimentation se sont tous reacuteveacuteleacutes ecirctre tregraves si-gnicatifs avec un p maximal infeacuterieur agrave p lt 0 001 Nous avons preacutesenteacutes la signicativiteacute dechaque case de reacutesultat avec un systegraveme de symboles coloreacutees ougrave les trois premiers symboles (0 0001 001 ) sont signicatifs Ces tests de signicativiteacute ont eacuteteacute systeacutematiquementeectueacutes agrave chaque expeacuterimentation et par conseacutequent tous les reacutesultats que nous preacutesenterons

92

43 Expeacuterimentations sur le modegravele AntRS

dans la suite de cette section seront accompagneacutes de leur signicativiteacute

Nous pouvons maintenant revenir sur les reacutesultats preacutesenteacutes dans le Tableau 42 Commeil eacutetait preacutevu on peut observer que chaque colonie a produit des recommandations orienteacuteesvers son objectif speacutecique Ainsi la colonie de similariteacute a produit des seacutequences de musiquesayant obtenu les plus hauts scores de preacutecision similariteacute et similariteacute intra-liste la colonie dediversiteacute a produit les seacutequences avec le plus haut score de diversiteacute et de diversiteacute relative tandis que les colonies de nouveauteacute et de preacutefeacuterences ont respectivement produit des seacutequencesavec le plus haut score de nouveauteacute et de preacutefeacuterences On peut cependant remarquer que pourcertaines mesures (la preacutecision la similariteacute ou encore la diversiteacute par exemple) les eacutecarts sontrelativement faibles entre les dieacuterentes colonies Nous pouvons reacutepondre agrave cette constatation endeux points Tout dabord et comme nous lavons preacuteciseacute plus haut toutes les cases ougrave 3 eacutetoilesvertes ont eacuteteacute apposeacutees repreacutesentent des reacutesultats tregraves signicatifs dun point de vue statistiqueEnsuite lobjectif principal de cette expeacuterimentation est de prouver que notre modegravele est biencapable de produire des recommandations diverses et complegravetes suivant plusieurs dimensionsLa deuxiegraveme partie de notre modegravele ougrave les reacutesultats de chaque colonie seront fusionneacutes devraproduire des seacutequences eacutequilibrant au mieux chacune des dimensions Les premiegraveres seacutequencesproduites par les colonies mono-objectifs prouvent que cela est possible mais quil est neacutecessairedavoir cette deuxiegraveme eacutetape an de mieux eacutequilibrer les seacutequences nales qui seront proposeacuteesagrave lutilisateur

433 AntRS multi-objectifs expeacuterimentations sur lensemble des colonies

simultaneacutement et sur les tactiques de fusion

Objectifs de lexpeacuterimentation

Apregraves avoir montreacute que toutes les colonies eacutetaient capables de produire des seacutequences demusiques speacutecialiseacutees dans une dimension speacutecique nous pouvons maintenant reacutealiser des ex-peacuterimentations sur notre modegravele AntRS dans son ensemble cest-agrave-dire avec les 4 colonies enparallegravele suivi de leacutetape de fusion pour ne produire quune seacutequence unique posseacutedant toutes lesqualiteacutes de chaque dimension agrave lutilisateur nal Autrement dit avec la premiegravere expeacuterimenta-tion nous avons obtenu 4 seacutequences excellant chacune dans une dimension speacutecique (similariteacutediversiteacute nouveauteacute et preacutefeacuterences) et doreacutenavant lobjectif est dobtenir une seule seacutequencereacuteunissant ces 4 dimensions

Nous nallons pas reacuteexpliquer en deacutetail ici la construction du graphe ni le fonctionnement descolonies eacutetant donneacute que nous lavons deacutejagrave fait preacuteceacutedemment mais les dieacuterences entre cetteexpeacuterimentation et les preacuteceacutedentes seront cependant souligneacutees Contrairement agrave lexpeacuterimenta-tion preacuteceacutedente les 4 colonies ont eacuteteacute exeacutecuteacutees en parallegravele en exploitant les threads de JavaLa deuxiegraveme et principale dieacuterence se trouve dans lexploitation des seacutequences geacuteneacutereacutees par lescolonies Au lieu de les preacutesenter directement comme nous lavons fait dans lexpeacuterimentationmono-objectif ces seacutequences ont eacuteteacute fusionneacutees avec la deuxiegraveme partie du modegravele preacutesenteacutee dansle chapitre preacuteceacutedent dans la Section 35 Le but est ici dobtenir une seule seacutequence combinantau mieux tous les points forts des 4 colonies Les meacutetavariables utiliseacutees sont les mecircmes que pourlexpeacuterience preacuteceacutedente

93

Chapitre 4 Expeacuterimentations et reacutesultats

Comparaison de performances intra-modegravele

Maintenant que nous avons deacutecrit lobjectif de cette expeacuterimentation nous allons deacutecrire lamaniegravere dont nous avons mesureacute et compareacute les reacutesultats obtenus Tout dabord nous avons testeacute3 versions de notre modegravele les voici deacutecrites ci-dessous

AntRS avec les 4 colonies en parallegravele et le fusion de seacutequences Comme nous lavonsexpliqueacute dans le chapitre preacuteceacutedent Section 35 nous avons proposeacute deux tactiques defusion pour les seacutequences trouveacutees par les dieacuterentes colonies lors de la premiegravere eacutetape dumodegravele La fusion de seacutequences est la premiegravere de ces deux tactiques Pour rappel cettetactique consiste agrave geacuteneacuterer une liste de toutes les ressources de chacune des 4 meilleuresseacutequences trouveacutees par les colonies lors de la premiegravere eacutetape du modegravele puis de les reacutear-ranger an de creacuteer la seacutequence nale

AntRS avec les 4 colonies en parallegravele et la colonie de fusion Le deuxiegraveme modegraveletesteacute est identique au premier sauf en ce qui concerne la tactique de fusion Nous avonsutiliseacute ici la deuxiegraveme tactique de fusion preacutesenteacutee dans la Section 35 Pour rappel cettetactique consiste agrave construire un nouveau graphe constitueacute uniquement des ressources quicomposent les seacutequences des colonies de la premiegravere eacutetape cette derniegravere agissant donccomme une sorte de seacutelection pour reacutecupeacuterer les ressources les plus inteacuteressantes

Colonie de fusion uniquement La troisiegraveme et derniegravere version de cette expeacuterimen-tation sur le modegravele AntRS est dieacuterente des deux premiegraveres Au lieu deectuer seacutequen-tiellement la premiegravere eacutetape (les 4 colonies) puis la deuxiegraveme eacutetape avec les reacutesultats dela premiegravere (la fusion) nous avons voulu tester si le fait dexeacutecuter la colonie de fusiondirectement avec lensemble des ressources de tous les utilisateurs pouvait produire desreacutesultats inteacuteressants En eet dans le modegravele AntRS classique cette colonie est exeacutecuteacuteeavec quelques dizaines de ressources tout au plus qui ont eacuteteacute seacutelectionneacutees par les autrescolonies de la premiegravere eacutetape mais rien nempecircche de lancer directement cette colonieavec le mecircme graphe quutilisent les premiegraveres colonies et qui contient quelques dizainesde milliers de sommets Notre hypothegravese est que la seacutequence nale obtenue par ce biaisobtiendra de moins bons reacutesultats que le processus complet de notre modegravele AntRS avecnotamment la preacute-seacutelection de ressources potentiellement inteacuteressantes par les premiegraverescolonies speacutecialiseacutees

Enn les mecircmes meacutetriques ont eacuteteacute utiliseacutees pour mesurer les performances de chaque ver-sion testeacutee du modegravele que pour lexpeacuterimentation mono-objectif preacuteceacutedente an de garder laconsistance des reacutesultats entre toutes les expeacuterimentations meneacutees

Comparaison de performances inter-modegraveles

En plus de mesurer les performances des dieacuterentes versions de notre modegravele nous avonsvoulu comparer nos reacutesultats obtenus avec dautres systegravemes de recommandation deacutejagrave existantsLe but est ici de conrmer que notre modegravele produit des recommandations compeacutetitives parrapport agrave dautres algorithmes souvent utiliseacutes dans leacutetat de lart Pour ce faire nous avonsutiliseacute deux types dalgorithmes (1) trois algorithmes classiques mono-objectif capables de pro-duire des listes de recommandations et (2) un algorithme speacuteciquement multi-objectifs an dedavoir un point de comparaison provenant dun modegravele de la mecircme classe que le nocirctre Nous

94

43 Expeacuterimentations sur le modegravele AntRS

avons choisi ces 2 familles dalgorithmes an de comparer au mieux notre modegravele Les algo-rithmes mono-objectif permettent deacutetablir une base de comparaison an de deacuteterminer si notremodegravele est compeacutetitif face agrave des systegravemes noptimisant quun seul de nos objectifs De plus cesalgorithmes sont classiques dans le domaine de la recommandation et sont tregraves souvent utiliseacutescomme base de comparaison Lalgorithme multi-objectifs de comparaison permet quant agrave lui demesurer nos performances sur lensemble des objectifs que nous optimisons Nous allons deacutecriresuccinctement le principe de ces algorithmes sans entrer dans les deacutetails eacutetant donneacute que nousavons deacutejagrave deacutecrit leur fonctionnement geacuteneacuteral preacuteceacutedemment dans leacutetat de lart

Algorithmes classiques mono-objectifs

1 UserKNN [Breese et al 2013] algorithme classique de ltrage collaboratif ougrave les k plusproches voisins de lutilisateur actif baseacutes sur la similariteacute des preacutefeacuterences sont seacutelectionneacutesan de participer au processus de recommandation

2 TrustMF [Yang et al 2017] dans cette meacutethode plus reacutecente de ltrage collaboratifles auteurs proposent des ameacuteliorations du modegravele classique de factorisation de matricesan dadresser les problegravemes de deacutemarrage agrave froid et de manque de donneacutees Mecircme silsutilisent la meacutethode classique de la factorisation de matrice ils se deacutemarquent en utilisantla conance quont les utilisateurs les uns envers les autres an de reeacuteter leur inuencereacuteciproque sur leurs opinions

3 SVD++ [Koren 2008] dans cet article les auteurs proposent des ameacuteliorations auxtechniques des facteurs latents et des plus proches voisins qui sont les deux approches dultrage collaboratif obtenant les meilleurs reacutesultats Les auteurs combinent ces deux ap-proches ensemble et utilisent agrave la fois les retours explicites et implicites an dobtenir unepreacutecision plus importante Ce modegravele a eacuteteacute creacutee dans le cadre du Netix Prize de 2008une compeacutetition organiseacutee par Netix ougrave le but eacutetait de creacuteer un algorithme de ltragecollaboratif an de preacutedire au mieux les preacutefeacuterences des utilisateurs [Bennett et al 2007]

Ces trois algorithmes ont eacuteteacute seacutelectionneacutes car ils repreacutesentent des techniques connues et bienutiliseacutees du domaine des systegravemes de recommandation Ils ont prouveacute leur ecaciteacute de par lesnombreuses eacutetudes de leacutetat de lart les utilisant comme nous lavons montreacute dans le chapitre 2de ce manuscrit De plus ces algorithmes sont mis agrave disposition dans la librairie Java Librec 50

[Guo et al 2015] Cette librairie propose plus de 70 algorithmes de systegravemes de recommandationen open source et a deux missions principales la preacutediction de preacutefeacuterences (via des notes) et leclassement de ressources Lutilisation de Librec nous a permis de travailler directement sur desalgorithmes agrave jour et sans erreur

Algorithme multi-objectifs

4 PEH [Ribeiro et al 2014] Nous avons souhaiteacute ajouter agrave cette liste un quatriegraveme algo-rithme qui contrairement aux trois premiers est multi-objectifs Cet algorithme nommeacutePEH pour Pareto-Ecient Hybridization a eacuteteacute preacutesenteacute dans la Section 252 de leacutetatde lart de ce manuscrit et nous allons ici discuter de son impleacutementation PEH est unmodegravele ougrave plusieurs algorithmes de recommandation sont exeacutecuteacutes en mecircme temps Lebut est dobtenir une valeur de pertinence pour chaque paire ressourcetimes utilisateur in-diquant agrave quel point il est pertinent de recommander la ressource agrave lutilisateur Chaquealgorithme produit un score et an de nobtenir quune seule valeur unique par paire

50 Librec la librarie Java pour les systegravemes de recommandation

95

Chapitre 4 Expeacuterimentations et reacutesultats

Table 43 Expeacuterimentations avec 3 versions du modegravele AntRS et 4 algorithmes de compa-raison 3 algorithmes mono-objectifs classiques (UserKNN TrustMF SVD++) et 1 algorithmemulti-objectifs (Pareto-Ecient Hybridization)

Preacutecision Rappel F-mesure Similariteacute SIL Diversiteacute DR Nouveauteacute Preacutefeacuterences Couverture

AntRS (4 colonies+ fusion de seacute-quences)

0344 0131 01838 0947 0908 0053 0069 0741 061 9692

AntRS (4 colonies+ colonie de fu-sion)

0288 0151 01836 0945 0905 0055 0082 0702 0612 9692

AntRS (colo-nie de fusionuniquement)

0197 0118 0141 0953 093 0047 0068 0324 0389 9692

UserKNN 0224 0138 0162 095 0905 005 0081 068 0541 6139TrustMF 0195 0117 014 095 0894 0058 009 0697 0458 6817SVD++ 0195 012 014 0941 0892 006 0093 070 0455 6817PEH 0193 0118 014 0941 0892 0059 0096 0697 0452 9752

Signicance codes (compared to AntRS with 4 colonies + lists merging) 0 0001 001 005 01 1

le modegravele PEH associe chacun de ces scores dans une combinaison lineacuteaire selon une hy-bridation speacutecique (ie des poids dieacuterents attribueacutes agrave chaque algorithme mitigeant ouaugmentant ainsi leur importance sur la valeur de pertinence nale) Le reacutesultat de cettecombinaison lineacuteaire est la valeur de pertinence de la recommandation de la ressource agravelutilisateur Plusieurs hybridations sont ainsi testeacutees et repreacutesenteacutees dans un espace en3 dimensions ougrave chaque point correspond aux niveaux de preacutecision de diversiteacute et denouveauteacute atteint par une hybridation Comme ces 3 dimensions sont aussi importantesles unes que les autres les auteurs utilisent le concept dOptimum de Pareto an de seacute-lectionner les meilleurs hybridations cest-agrave-dire les hybridations les plus proches ou surla frontiegravere de Pareto Dans leur article les auteurs utilisent dieacuterents algorithmes clas-sique de recommandation Ayant agrave notre disposition Librec ainsi que les 3 algorithmespreacutesenteacutes ci-dessus repreacutesentant plusieurs techniques de recommandation agrave la fois dieacute-rentes les unes des autres et tregraves utiliseacutees dans la litteacuterature nous les avons inclus dansle processus dhybridation Le reste du modegravele a eacuteteacute impleacutementeacute agrave partir de larticle desauteurs Ce modegravele est tregraves inteacuteressant pour notre comparaison de performance car il estmulti-objectifs comme le nocirctre mais utilise une technique tout agrave fait dieacuterente de An-tRS non baseacutee sur des modegraveles multi-agents et utilisant le concept dOptimum de Pareto

Pour cette expeacuterimentation nous avons donc un total de 4 algorithmes dieacuterents qui vontecirctre exeacutecuteacutes sur exactement la mecircme base de donneacutees et le mecircme nombre dutilisateurs quepour les trois versions de notre modegravele Les reacutesultats de cette expeacuterimentation sont preacutesenteacutesdans le Tableau 43

Reacutesultats

Comme pour lexpeacuterimentation mono-objectif nous avons mesureacute la signicativiteacute statistiqueavec le test des rangs signeacutes de Wilcoxon an de sassurer que les donneacutees obtenues pouvaientecirctre interpreacuteteacutee De plus les valeurs en gras pour chaque colonne montrent les meilleurs reacutesultatsobtenus

Les reacutesultats de cette expeacuterimentation nous reacutevegravelent plusieurs informations importantes Toutdabord nous allons nous inteacuteresser aux performances de notre modegravele AntRS Comme expliqueacute

96

43 Expeacuterimentations sur le modegravele AntRS

ci-dessus nous avons testeacute deux tactiques de fusion pour combiner les reacutesultats de nos quatreobjectifs Nous avons eacutegalement exeacutecuteacute directement la colonie de fusion sur le graphe completet sans la premiegravere eacutetape de notre modegravele

Les deux premiegraveres lignes du Tableau 43 preacutesentent les reacutesultats de notre modegravele AntRScomplet avec ses deux variations la fusion de seacutequences et la colonie de fusion Nous pouvonsvoir que dune maniegravere geacuteneacuterale notre modegravele obtient de tregraves bonnes performances par rapportaux 4 algorithmes de comparaison Les deux variations de notre modegravele obtiennent la meilleurepreacutecision (jusquagrave +7823) de rappel (jusquagrave +2905) et F-mesure (jusquagrave +3128) de tousles modegraveles testeacutes dans cette expeacuterimentation ce qui signie que notre modegravele est le meilleurpour modeacuteliser les preacutefeacuterences agrave partir des sessions initiales eacutecouteacutees par les utilisateurs AntRSa eacutegalement surpasseacute les autres modegraveles pour les preacutefeacuterences et les meacutetriques de nouveauteacute touten parvenant agrave maintenir un niveau correct de similitude et de diversiteacute Il est utile de rappelerici que nous avons deacutelibeacutereacutement choisi des objectifs non compatibles entre eux (Similariteacute vs Di-versiteacute Nouveauteacute vs Preacutefeacuterences) ce qui rend le processus de recommandations plus complexepour les algorithmes multi-objectifs (AntRS et PEH) par rapport aux algorithmes mono-objectifMalgreacute une diversiteacute un peu plus faible par rapport aux algorithmes de comparaison AntRS oreun meilleur compromis entre tous les objectifs que PEH et dans un temps dexeacutecution beaucoupplus court Enn nous pouvons remarquer que les deux modegraveles multi-objectifs AntRS et PEHont une bien meilleure couverture par rapport aux autres algorithmes

Les reacutesultats montrent que notre modegravele AntRS a obtenu de meilleurs reacutesultats que lesautres algorithmes de comparaison Cependant un autre objectif de cette expeacuterimentation eacutetaitde comparer les deux versions de la deuxiegraveme phase de notre modegravele la fusion de seacutequences et lacolonie de fusion Ces deux tactiques permettant dobtenir une seacutequence de recommandation -nale multi-objectifs agrave partir de plusieurs seacutequences mono-objectif repreacutesentent deux philosophiesdieacuterentes de construction de seacutequences et il est inteacuteressant de pouvoir observer leurs dieacuterencesde performance Dapregraves les reacutesultats obtenus ces deux meacutethodes sont relativement proches lunede lautre avec lexception majeure de la preacutecision qui est plus eacuteleveacutee pour la fusion de seacutequences(0 344) que pour la colonie de fusion (0 288) On peut noter aussi une leacutegegravere dieacuterence au ni-veau de la diversiteacute relative (respectivement 0 069 contre 0 082) et de la nouveauteacute (0 741 contre0 702) Limportance de la preacutecision dans la litteacuterature et la dieacuterence entre les deux tactiquesconcernant cette meacutetrique nous permettent de dire que la fusion de seacutequence est la meilleure desdeux tactiques pour cette expeacuterimentation

Nous allons maintenant nous inteacuteresser agrave la troisiegraveme ligne du tableau de reacutesultats repreacute-sentant lexeacutecution de la 2egraveme partie de notre modegravele seule Pour rappel lhypothegravese de cettetroisiegraveme version de notre modegravele est de veacuterier si la premiegravere eacutetape de notre modegravele permet biendameacuteliorer la qualiteacute des reacutesultats en preacute-seacutelectionnant les ressources correspondant le mieux auxquater objectifs agrave maximiser On peut observer en eet avec les reacutesultats que lexeacutecution directede la colonie de fusion sans la premiegravere eacutetape du modegravele deacutegrade bien la qualiteacute des solutionsnales trouveacutees Nous observons une nette diminution de la preacutecision du rappel de la F-mesureainsi que de la diversiteacute de la nouveauteacute et de preacutefeacuterences Ces reacutesultats nous permettent doncde conrmer que la premiegravere eacutetape de notre modegravele ougrave les 4 colonies travaillent simultaneacutementagrave obtenir des seacutequences speacutecialiseacutees dans leur objectif ameacuteliore bien la qualiteacute nale des recom-mandations dune maniegravere signicative Autrement dit les deux tactiques de fusion que nousavons deacuteveloppeacutees (fusion de seacutequences et colonie de fusion) permettent de trouver un compro-mis entre tous les objectifs de maniegravere plus ecace quand elles se basent sur les reacutesultats de la

97

Chapitre 4 Expeacuterimentations et reacutesultats

premiegravere eacutetape de notre modegravele

Expeacuterimentation alternative techniques de validation croiseacutee et de creacuteation degraphe alternative

Dans lexpeacuterimentation preacuteceacutedente nous avons deacutecideacute de seacuteparer les 500 utilisateurs en 5blocs de 100 ougrave agrave tour de rocircle 400 utilisateurs eacutetaient utiliseacutes pour la construction du grapheet 100 utilisateurs correspondaient agrave la base de test Ainsi le modegravele avait pour tacircche de pro-duire des seacutequences de recommandations baseacutees sur les sessions deacutecoute de ces 100 utilisateursUne fois que le modegravele avait produit sa seacutequence recommandeacutee la session deacutecoute initiale surlaquelle eacutetait baseacutee la recommandation eacutetait deacutevoileacutee au modegravele et le graphe eacutetait reconstruitpour en tenir compte Le but de ce fonctionnement eacutetait de simuler un fonctionnement reacuteel dunservice deacutecoute de musique Cependant un certain nombre deacutetudes du domaine de la recom-mandation de la litteacuterature scientique utilisent une meacutethode dieacuterente lors de la seacuteparationdes informations des utilisateurs pour reacutealiser une validation croiseacutee agrave 5 blocs Cette meacutethodeconsiste agrave peupler les 5 blocs non plus agrave partir dutilisateurs mais agrave partir de sessions deacutecoutedans chaque utilisateur Autrement dit au lieu davoir une base dapprentissage contenant 80des utilisateurs et une base de test contenant les derniers 20 dutilisateurs la base dapprentis-sage consiste en 80 des sessions deacutecoute de chaque utilisateur et la base de test correspond aux20 des sessions restantes Le but du modegravele est ici de recommander pour chaque utilisateurdes seacutequences correspondant agrave la base de test Par rapport agrave la premiegravere meacutethode le graphepossegravede donc en permanence 80 des sessions de tous les utilisateurs Cependant le graphe necontient pas les connaissances provenant de prols complets dutilisateurs Ces deux meacutethodessont toutes les deux valides mais proposent deux approches dieacuterentes concernant lexploitationdes donneacutees des utilisateurs et il est inteacuteressant de les comparer

Par ailleurs et comme nous lavons expliqueacute dans le chapitre 3 deacutecrivant notre modegravele AntRSla construction du graphe exploite les transitions trouveacutees dans les sessions deacutecoute des utilisa-teurs pour creacuteer un reacuteseau de ndivideuds et darecirctes repreacutesentant lensemble des donneacutees de la basedapprentissage Aucune emphase nest porteacutee speacuteciquement sur lutilisateur actif pour lequelle systegraveme est en train de construire des recommandations Cependant nous avons proposeacute dansle chapitre 3 une autre meacutethode de construction du graphe portant une emphase particuliegravere surlutilisateur actif Agrave chaque nouvel utilisateur traiteacute nous calculons ses k plus proches voisinsparmi les 499 utilisateurs restants Pour faire cela nous avons calculeacute la similariteacute cosine agrave partirdes preacutefeacuterences existantes de ces utilisateurs Autrement dit pour chaque utilisateur actif nousavons compareacute ses 80 des sessions deacutecoute de la base dapprentissage avec les 80 des sessionsdeacutecoute des 499 autres utilisateurs Les k utilisateurs les plus similaires sont ensuite utiliseacutespour construire le graphe avec la mecircme technique deacutecrite dans le chapitre 3 Lavantage est icide reacuteduire la taille du graphe dacceacuteleacuterer la dureacutee dexeacutecution et de potentiellement augmenterla qualiteacute des recommandations nales notamment en terme de similariteacute puisque cest le critegraverede seacutelection ici Cette variante de construction du graphe agrave partir des n plus proches voisins nestpossible quavec la technique de validation croiseacutee deacutecrite dans le paragraphe preacuteceacutedent puisquilest neacutecessaire davoir accegraves aux sessions deacutecoute des utilisateurs actifs ce qui nest pas le casavec la premiegravere expeacuterimentation de cette section

Dans la suite de la section nous allons reacutealiser la mecircme expeacuterimentation que preacuteceacutedem-ment avec ces deux modications (le changement du processus de validation croiseacutee et le grapheconstruit agrave partir de n plus proches utilisateurs en termes de similariteacute) puis nous allons preacute-

98

43 Expeacuterimentations sur le modegravele AntRS

Table 44 Expeacuterimentation AntRS multi-objectifs avec les modications de validation croiseacuteeet de creacuteation de graphe

Preacutecision Rappel F-mesure Similariteacute SIL Diversiteacute DR Nouveauteacute Preacutefeacuterences Couverture

AntRS grapheclassique (fusionde seacutequences)

0379 0147 0205 0942 0902 0058 0073 0748 0631 7168

AntRS grapheclassique (coloniede fusion)

0339 0176 0215 0943 09 0057 0085 072 0718 7168

AntRS graphe kvoisins (fusion deseacutequences)

0369 0149 0203 0941 0901 0059 0075 0737 0633 7168

AntRS graphe kvoisins (colonie defusion)

0329 0167 0206 0944 0905 0056 0081 0707 068 7168

senter les reacutesultats obtenus

Le Tableau 44 preacutesente les reacutesultats de cette deuxiegraveme expeacuterimentation Nous avons testeacute4 versions de notre modegravele Pour chacune de ces 4 versions la nouvelle technique de validationcroiseacutee a eacuteteacute utiliseacutee Comme pour lexpeacuterimentation suivante nous avons eacutegalement testeacute lesdeux tactiques de fusion de notre modegravele Quant aux modications portant sur la creacuteation dugraphe nous avons exeacutecuteacute notre modegravele selon 2 modaliteacutes avec la mecircme construction de grapheque lexpeacuterimentation preacuteceacutedente (graphe classique) et avec la prise en compte des k voisinsles plus similaires (graphe k voisins) On remarque deacutejagrave que les reacutesultats sont dune maniegraveregeacuteneacuterale relativement similaires agrave la premiegravere expeacuterimentation Les valeurs de preacutecision obte-nues sont plus eacuteleveacutees que pour lexpeacuterimentation preacuteceacutedente suggeacuterant que le modegravele produitdes recommandations plus proches des sessions deacutecoute des utilisateurs Cette augmentation depreacutecision est la conseacutequence logique du fait que 80 des sessions deacutecoute initiales sont connuesdu modegravele Ces reacutesultats sont cependant agrave nuancer avec la couverture qui est signicativementplus basse dans cette version de notre modegravele (7168 par rapport agrave 9692)

La tactique de fusion de seacutequence obtient une nouvelle fois la meilleure preacutecision par rapportagrave la tactique de colonie de fusion Cependant nous nobservons pas de nette dieacuterence entreles deux meacutethodes de construction du graphe Cette expeacuterimentation ne nous permet donc pasde valider lhypothegravese selon laquelle un graphe moins grand et construit agrave partir dutilisateurssimilaires agrave lutilisateur actif pourrait ameacuteliorer les recommandations nales Cependant lautreobjectif de cette expeacuterimentation qui eacutetait de deacutemontrer que notre modegravele obtient eacutegalementdes reacutesultats satisfaisants avec une meacutethode plus classique de validation croiseacutee est valideacutee Latechnique classique de creacuteation du graphe sans connaicirctre par avance 80 des seacutequences deacutecoutesdes utilisateurs reste cependant plus proche dun fonctionnement en conditions reacuteelles de notremodegravele

434 Optimisation des meacutetavariables de AntRS

Inuence du nombre dagents et diteacuterations sur la preacutecision des recommandations

Comme tous les systegravemes multi-agents AntRS est deacutependant du nombre dagents utiliseacutes etdes iteacuterations eectueacutees Un nombre trop faible dagents ou diteacuterations peut empecirccher leacutemer-gence dun comportement intelligent en raison dun manque dinteraction entre les agents Dansle mecircme temps il est eacutegalement crucial de ne pas augmenter aveugleacutement ces paramegravetres car ils

99

Chapitre 4 Expeacuterimentations et reacutesultats

aectent lineacuteairement le temps dexeacutecution de lalgorithme Nous avons ainsi reacutealiseacute des expeacuteri-mentations sur notre modegravele AntRS an de deacuteterminer un bon compromis entre performance ettemps dexeacutecution Dans la gure 411 la preacutecision moyenne des recommandations obtenues estpreacutesenteacutee en fonction du nombre dagents et diteacuterations par increacutementation de 50 allant de 50 agrave300 On observe comme attendu une leacutegegravere augmentation de la preacutecision suivant laccroissementdes agents et des iteacuterations sans toutefois que celle-ci ne soit majeure On remarque visuellementque la preacutecision obtenue atteint rapidement un plateau agrave partir de 100 agents et iteacuterations Cetteobservation a eacuteteacute conrmeacutee par un test de signicativiteacute statistique avec le test de WilcoxonDans un contexte de fonctionnement en ligne ougrave les utilisateurs sattendent agrave des recommanda-tions quasi immeacutediates laugmentation importante du temps dexeacutecution lieacutee agrave un nombre eacuteleveacutedagents et diteacuterations pour un gain minime de preacutecision nest pas recommandable Ce sontaussi ces valeurs de 100 agents et iteacuterations qui ont eacuteteacute utiliseacutees dans les expeacuterimentations de cechapitre

Figure 411 Inuence du nombre dagents et diteacuterations sur la preacutecision moyenne obtenuepar notre modegravele

Principe de fonctionnement et application dun algorithme geacuteneacutetique

Les meacutetavariables des algorithmes multi-agents ont une place importante dans la qualiteacute desreacutesultats obtenus Pour rappel et en plus du nombre diteacuterations et dagents dont nous avonsdeacutejagrave discuteacute dans la section preacuteceacutedente on peut lister

τ0 isin [0 1] quantiteacute de pheacuteromones deacuteposeacutee sur les arecirctes agrave linitialisation du modegravele q0 isin [0 1] gegravere la part dexploration et dexploitation des agents α isin [0 1] importance des pheacuteromones dans la prise de deacutecision des agents

100

43 Expeacuterimentations sur le modegravele AntRS

β isin [0 1] importance de lheuristique dans la prise de deacutecision des agents ρ isin [0 1] taux deacutevaporation des pheacuteromones

Les valeurs de ces 5 meacutetavariables ont eacuteteacute xeacutees agrave laide des expeacuterimentations preacuteliminairespreacutesenteacutees au deacutebut de ce chapitre dans la Section 422 Les valeurs de ces meacutetavariables ontpermis dobtenir des reacutesultats convaincants agrave la fois sur le modegravele ACS classique de Dorigo et surnotre modegravele ACS Cependant et an de maximiser le potentiel de notre modegravele AntRS nousavons voulu tester une optimisation automatique de ces meacutetavariables agrave laide dun algorithmegeacuteneacutetique Ces derniers font partie de la famille des algorithmes eacutevolutionnaires sinspirant de latheacuteorie de leacutevolution Le principe de ces algorithmes est de creacuteer des individus posseacutedant desgegravenes cest-agrave-dire des valeurs agrave des caracteacuteristiques preacute-deacutetermineacutees puis de tester ces individussur le problegraveme agrave optimiser Agrave la n dune iteacuteration les meilleurs individus transmettent unepartie de leurs gegravenes agrave leurs descendants Ainsi de geacuteneacuteration en geacuteneacuteration les gegravenes seacutelection-neacutes provenant des meilleurs individus permettent daugmenter la qualiteacute des reacutesultats Appliqueacuteagrave notre modegravele un gegravene correspond agrave des valeurs pour les 5 meacutetavariables agrave optimiser Cesvaleurs sont ensuite appliqueacutees agrave notre modegravele et testeacutees durant une exeacutecution complegravete dansles mecircmes conditions que les autres expeacuterimentations de ce chapitre Les reacutesultats sont ensuiteeacutevalueacutes selon les 4 meacutetriques correspondant agrave nos objectifs similariteacute diversiteacute nouveauteacute etpreacutefeacuterences Lutilisation dun algorithme geacuteneacutetique sur notre modegravele a cependant poseacute un pro-blegraveme majeur de temps dexeacutecution En eet chaque individu de chaque geacuteneacuteration a ducirc ecirctretesteacute sur une exeacutecution complegravete de notre modegravele Pour rappel une exeacutecution de notre modegravelecorrespond agrave 100 iteacuterations ougrave dans chacune dentre elles 100 agents se deacuteplacent pour trouverune seacutequence sur un graphe de plusieurs dizaines de milliers de ndivideuds et de plusieurs centainesde milliers darecirctes en moyenne Mecircme si la complexiteacute algorithmique est faible ducirce agrave la naturemecircme des modegraveles multi-agents la quantiteacute dopeacuterations agrave reacutesoudre est conseacutequente En plus delutilisation de serveurs de calculs deacutedieacutes une optimisation importante du code de AntRS a eacuteteacuteneacutecessaire pour pouvoir eectuer loptimisation des meacutetavariables avec un algorithme geacuteneacutetiquedans des temps raisonnables

Choix de lalgorithme geacuteneacutetique doptimisation

De nombreuses familles dalgorithmes geacuteneacutetiques ont eacuteteacute deacuteveloppeacutees depuis leur creacuteation agravelinstar des problegravemes algorithmiques complexes neacutecessitant des techniques doptimisation et dereacutesolution avanceacutees Il est donc neacutecessaire de correctement deacutenir le problegraveme agrave optimiser an dechoisir lalgorithme geacuteneacutetique le plus adapteacute agrave la tacircche AntRS est un modegravele multi-objectifs etles paramegravetres agrave optimiser sont les 4 objectifs de similariteacute diversiteacute nouveauteacute et preacutefeacuterencesIl est ainsi neacutecessaire dutiliser une technique parmi la famille des algorithmes eacutevolutionnairesmulti-objectifs (MOEA 51) Nous avons choisi lalgorithme NSGA-II 52 pour sa rapiditeacute et sonecaciteacute pour trouver de meilleurs solutions non-domineacutees agrave des problegravemes multi-objectifs clas-siques de la litteacuterature par rapport agrave dautres MOEA [Deb et al 2002]

Pour les mecircmes raisons que pour limpleacutementation des algorithmes de comparaison utiliseacutesdans cette section nous avons utiliseacute une librairie Java nommeacutee jMetal 53 [Durillo and Nebro2011] Cette librairie est speacutecialiseacutee dans limpleacutementation et la mise agrave disposition dune vingtaine

51 MOEA Multi-objective evolutionary algorithms

52 NSGA-II Non-dominated Sorting Genetic Algorithm 2

53 jMetal Metaheuristic Algorithms in Java

101

Chapitre 4 Expeacuterimentations et reacutesultats

Table 45 Expeacuterimentations preacutesentant AntRS avec les meacutetavariables empiriques et avec lesmeacutetavariables optimiseacutees via NSGA-II)

Preacutecision Rappel F-mesure Similariteacute SIL Diversiteacute DR Nouveauteacute Preacutefeacuterences Couverture

AntRS meacutetava-riables empiriques(fusion de seacute-quences)

0344 0131 01838 0947 0908 0053 0069 0741 061 9692

AntRS meacutetava-riables empiriques(colonie de fusion)

0288 0151 01836 0945 0905 0055 0082 0702 0612 9692

AntRS meacutetava-riables NSGA-II(fusion de seacute-quences)

0382 0153 0221 0953 091 0047 007 0762 0744 9692

AntRS meacutetava-riables NSGA-II(colonie de fusion)

0312 0174 0226 0946 0906 0054 0082 0703 0802 9692

Code de signicativiteacute statistique 0 0001 001 005 01 1

de MOEA permettant de les adapter agrave tous types de problegravemes multi-objectifs

Reacutesultats

La version du modegravele AntRS utiliseacutee est la mecircme que preacutesenteacutee dans le Chapitre 3 et danslexpeacuterimentation 433 Lalgorithme doptimisation NSGA-II a quant agrave lui eacuteteacute lanceacute sur unserveur de calculs deacutedieacute de leacutequipe KIWI et arrecircteacute agrave partir du moment ougrave 10 geacuteneacuterations de suitenameacutelioraient plus les reacutesultats obtenus Les valeurs obtenues pour les 5 meacutetavariables ont ensuiteeacuteteacute utiliseacutees dans une exeacutecution complegravete de AntRS an de mesurer limpact de loptimisationLalgorithme de comparaison PEH [Ribeiro et al 2014] inclut deacutejagrave dans son fonctionnement unMOEA nommeacute SPEA2 54 [Zitzler et al 2001] dont lobjectif est le mecircme que NSGA-II optimiserles recommandations en termes de similariteacute diversiteacute et nouveauteacute Nous ninclurons donc pasPEH dans les reacutesultats de cette derniegravere expeacuterimentation Outre les meacutetavariables lexeacutecution denotre modegravele sest deacuterouleacutee sous les mecircmes conditions que pour les expeacuterimentations preacuteceacutedentes

Le Tableau 45 preacutesente les reacutesultats obtenus Les deux premiegraveres lignes du tableau sont re-prises de lexpeacuterimentation principale AntRS multi-objectifs Section 433 pour plus de clarteacutePour rappel cette expeacuterimentation avait utiliseacute les meacutetavariables empiriques Les deux derniegravereslignes du tableau correspondent agrave AntRS avec les meacutetavariables optimiseacutees via le NSGA-II Lasignicativiteacute statistique de la dieacuterence des reacutesultats obtenus a eacuteteacute mesureacutee entre chaque paireayant la mecircme tactique de fusion (ie AntRS meacutetavariables empiriques (fusion de seacutequences)vs AntRS meacutetavariables NSGA-II (fusion de seacutequences) et AntRS meacutetavariables empiriques(colonie de fusion) vs AntRS meacutetavariables NSGA-II (colonie de fusion)) Les valeurs en grasindiquent les dieacuterences les plus notables entre les mecircmes versions de AntRS sans et avec opti-misation

Ces reacutesultats mettent principalement en exergue un net gain en preacutecision et rappel obtenuavec loptimisation des meacutetavariables Les valeurs obtenues pour ces meacutetriques sont similaires agravelexpeacuterimentation 44 ougrave le modegravele avait connaissance de 80 des seacutequences deacutecoutes des utili-sateurs On note eacutegalement des ameacuteliorations pour les meacutetriques de nouveauteacute et de preacutefeacuterencesmontrant que les seacutequences recommandeacutees eacutetaient agrave la fois plus proches des preacutefeacuterences de luti-

54 SPEA2 Strenght Pareto Evolutionary Algorithm 2

102

44 Conclusion

lisateur tout en introduisant parfois des musiques quil ne connaissait pas

Cependant il est important de nuancer ces reacutesultats Les gains obtenus mecircme sils sontstatistiquement signicatifs restent relativement peu eacuteleveacutes par rapport au temps neacutecessaire de-mandeacute par lalgorithme doptimisation De plus certaines meacutetriques comme la similariteacute ou ladiversiteacute nont que peu eacuteteacute aecteacutees par loptimisation En conclusion cette expeacuterimentation nousa montreacute quil eacutetait possible doptimiser les meacutetavariables de notre modegravele an dameacuteliorer cer-tains aspects des seacutequences recommandeacutees comme la preacutecision la nouveauteacute ou les preacutefeacuterencesToutefois le temps dexeacutecution dun tel processus doptimisation peut ecirctre prohibitif dans uncontexte dutilisation en ligne et en temps reacuteel

44 Conclusion

Dans ce Chapitre nous avons mis en pratique le modegravele multi-agents et multi-objectifs An-tRS Nous avons utiliseacute une base de donneacutees musicale provenant du site Deezer repreacutesentantun mois complet deacutecoutes en ligne Nous avons ensuite reacutealiseacute plusieurs expeacuterimentations por-tant chacune sur un aspect theacuteorique de AntRS La premiegravere expeacuterimentation preacutesenteacutee dans laSection 432 nous a permis de veacuterier que les colonies de notre modegravele permettent bien dobte-nir des recommandations de seacutequences speacutecialiseacutees dans les facteurs humains identieacutes dans leschapitres preacuteceacutedents Dans le cadre de ce travail nous avons testeacute de maniegravere isoleacutee 4 coloniescorrespondant agrave 4 facteurs humains speacuteciques la similariteacute la diversiteacute la nouveauteacute et lespreacutefeacuterences Les reacutesultats obtenus ont permis de prouver quil eacutetait possible de lier des facteurshumains agrave la recherche de chemins dans un graphe par des agents teacuteleacuteonomiques

La deuxiegraveme expeacuterimentation preacutesenteacutee dans la Section 433 sest appuyeacutee sur ces conclu-sions pour tester le modegravele AntRS dans son entiegravereteacute Le but de cette expeacuterimentation eacutetaittriple

1 Prouver que notre modegravele est capable de produire une seacutequence unique posseacutedant desaspects de chacun des 4 facteurs humains en utilisant les reacutesultats des colonies speacutecialiseacutees

2 Tester les performances des deux tactiques de notre modegravele (fusion de seacutequences et coloniede fusion) permettant de fusionner les seacutequences des colonies speacutecialiseacutees

3 Comparer les performances de AntRS avec dautres systegravemes de recommandations mono-objectif et multi-objectifs de la litteacuterature du domaine

Avec cette expeacuterimentation nous avons montreacute que AntRS eacutetait bien capable de syntheacutetiserdans une mecircme seacutequence les dieacuterents aspects humains consideacutereacutes De plus les seacutequences derecommandations produites par AntRS ont obtenu de meilleurs reacutesultats par rapport aux algo-rithmes de comparaison de leacutetat de lart La premiegravere tactique de fusion de seacutequences sest reacuteveacuteleacuteeecirctre plus ecace que la colonie de fusion pour obtenir un compromis entre les dieacuterents objectifs

Lexpeacuterimentation suivante preacutesenteacutee dans la Section 433 avait pour but de tester des va-riantes dans le fonctionnement de AntRS Au cours de cette thegravese nous avons reacutealiseacute et testeacutede multiples modications et variantes de notre modegravele de maniegravere empirique tant le fonction-nement du modegravele initial ACS de Dorigo est modulable Pour mettre en exergue un exemplede cette modulariteacute nous avons testeacute les performances de notre modegravele en modiant la basedapprentissage et la maniegravere dont le graphe eacutetait creacuteeacute Les reacutesultats obtenus ont mis en eacutevidence

103

Chapitre 4 Expeacuterimentations et reacutesultats

le potentiel deacutevolution et dadaptabiliteacute de AntRS agrave des travaux futurs

Enn nous nous sommes inteacuteresseacutes dans la Section 434 agrave loptimisation automatique desmeacutetavariables de notre modegravele Comme nous lavons illustreacute au deacutebut de ce chapitre avec les ex-peacuterimentations preacuteliminaires sur le modegravele ACS les meacutetavariables jouent un rocircle essentiel dans laqualiteacute des reacutesultats Ces derniegraveres gouvernent le comportement des agents comme par exempleleurs tendances agrave explorer lenvironnement ou au contraire agrave exploiter des chemins deacutejagrave connusAn de maximiser le potentiel de notre modegravele dans ce cadre applicatif nous avons utiliseacute lal-gorithme geacuteneacutetique doptimisation de problegravemes multi-objectifs NSGA-II sur 5 meacutetavariables deAntRS Le reacutesultat de cette optimisation a permis dameacuteliorer de maniegravere statistiquement signi-cative les performances de notre modegravele en termes de preacutecision rappel nouveauteacute et preacutefeacuterencesCependant la longueur du processus doptimisation limite pour le moment son application dansle contexte dune utilisation en temps reacuteel du modegravele

Le choix de la base de donneacutees musicale provenant de Deezer a permis de reacutealiser de nom-breuses expeacuterimentations et de tester dieacuterentes facettes de notre modegravele Cependant nousavons aussi rencontreacute beaucoup de problegravemes quant agrave la notion de progressiviteacute avec cette basede donneacutees et les reacutesultats obtenus nont pas eacuteteacute concluants concernant cette meacutetrique Nousdiscuterons de ce point et dautres perspectives dameacuteliorations dans la conclusion geacuteneacuterale decette thegravese

104

Chapitre 5

Conclusion et perspectives

51 Conclusion

Le domaine de la recommandation est en plein essor depuis maintenant une vingtaine dan-neacutees Durant cette peacuteriode la recommandation na cesseacute deacutevoluer an de sadapter agrave lexplosiondu nombre dutilisateurs et de la quantiteacute de donneacutees disponibles Nous pouvons distinguer troisaspects des recommandations modernes qui ont servi de l directeur dans cette thegravese Premiegrave-rement il y a encore 10 ans seulement la majoriteacute de la recherche avait pour but de maximiserla meacutetrique de preacutecision des reacutesultats des algorithmes il est aujourdhui admis quune bonnerecommandation neacutecessite aussi de satisfaire dautres meacutetriques comme la diversiteacute ou la nou-veauteacute Mecircme si la preacutecision reste centrale il est important de consideacuterer ces autres meacutetriquescar elles permettent de reacutepondre agrave une plus grande diversiteacute de situation chez les utilisateurs de-mandant des recommandations Deuxiegravemement la quantiteacute de donneacutees disponibles sur Interneta exploseacute tandis que lutilisation des systegravemes de recommandation sest tregraves largement deacutemocra-tiseacutee La diversiteacute des domaines applicatifs utilisant des systegravemes de recommandations est telleque lhyper-speacutecialisation dun systegraveme pour un seule domaine fait moins de sens quauparavantLes systegravemes de recommandations capables de sadapter rapidement agrave de multiples domainesapplicatifs sont donc aujourdhui particuliegraverement inteacuteressants Troisiegravemement la croissance etla complexication des donneacutees deacutecrivant les ressources et les utilisateurs permettent de propo-ser agrave ces derniers des recommandations plus complexes quauparavant Comme nous lavons ditdautres aspects que la preacutecision sont deacutejagrave exploiteacutes mais il est aussi possible de complexier lesrecommandations en les proposant par seacutequences et non plus par ressource unique En eet lanorme eacutetait avant de ne proposer agrave lutilisateur quune seule recommandation ou au mieux uneliste de recommandations au mecircme niveau les unes que les autres Or de nombreux domainescomme le-eacuteducation la musique ou encore le tourisme peuvent beacuteneacutecier de systegravemes capablesde recommander une seacutequence de ressources dans un ordre preacutecis Lutilisateur dun tel systegravemedispose donc dune seacutequence de ressources permettant datteindre potentiellement des objectifsqui ne seraient pas atteignables avec des recommandations simples ou en liste Ces trois pointseacutevoqueacutes ci-dessus constituent le cdivideur du travail de cette thegravese et nous allons maintenant rappelerles apports de notre travail sur ces trois points

1 Modegravele multi-objectifs En se basant sur larchitecture des colonies de fourmis notremodegravele AntRS permet dinteacutegrer autant de meacutetriques que voulues dans le processus degeacuteneacuteration de recommandations Dans ce travail nous en avons consideacutereacute 4 la similariteacutela diversiteacute la nouveauteacute et les preacutefeacuterences passeacutees Ces 4 meacutetriques sont inteacutegreacutees en

105

Chapitre 5 Conclusion et perspectives

tant que colonies dans notre modegravele et participent toutes agrave la construction de la seacutequencede recommandations Leur importance dans le processus de recommandation peut ecirctremoduleacutee an de mieux correspondre agrave chaque prol dutilisateur

2 Geacuteneacutericiteacute inter-domaine Dans le point preacuteceacutedent nous avons discuteacute de linteacutegrationde dieacuterentes meacutetriques dans les recommandations Comme nous lavons preacutesenteacute dansleacutetat de lart un certain nombre de modegraveles prennent deacutesormais en compte dieacuterentesmeacutetriques Cependant un des points forts de notre modegravele est la modulariteacute avec laquellenous pouvons lexeacutecuter Il est en eet possible denlever ou de rajouter des colonies agrave lademande Autrement dit nous sommes capable de changer agrave la voleacutee les facteurs humainsagrave consideacuterer pour construire les recommandations nales Outre ce point il est relati-vement simple de passer dun domaine applicatif agrave un autre Nous avons construit notremodegravele de sorte quil soit le plus geacuteneacuterique possible eacutetant donneacute que lors de sa conceptionnous navions pas encore deacutecideacute quelle base de donneacutees utiliser Ainsi la seule modica-tion neacutecessaire lors dun changement de domaine est dadapter le calcul de la distance dentre chaque ressource lors de la construction du graphe Apregraves cette modication le restede lalgorithme est le mecircme

3 Seacutequences de recommandation Eacutetant donneacute que notre modegravele AntRS se base sur lemodegravele des colonies de fourmis de Marco Dorigo les reacutesultats que nous obtenons se preacute-sentent sous le mecircme format que pour ce dernier Initialement dans les modegraveles proposeacutespar Dorigo les fourmis ont comme but de chercher un chemin parmi plusieurs possiblesdans un environnement repreacutesenteacute par un graphe et en empruntant des points de passagerepreacutesenteacutes par les ndivideuds du graphe Le reacutesultat obtenu est donc une suite de noeudavec un point de deacutepart un objectif de n et une seacuterie de points de passage dans unordre preacutecis entre les deux autrement dit une seacutequence Nous avons souhaiteacute garder ceprincipe de production naturelle de seacutequences et de ladapter agrave la recommandation Ainsien construisant avec attention le graphe an quil repreacutesente de la maniegravere la plus degravelepossible les liens preacutesents entre les ressources du domaine applicatif et en adaptant lecalcul de la distance d seacuteparant deux ndivideuds notre modegravele AntRS est capable de produiredes seacutequences avec des ressources varieacutees

Les deux premiers apports eacutenumeacutereacutes ci-dessus permettent de sadapter non seulement agrave denombreux prols utilisateurs gracircce aux dieacuterentes meacutetriques mais aussi agrave dieacuterents domainesapplicatifs gracircce agrave la simpliciteacute des changements agrave faire pour passer dun domaine agrave un autreLe troisiegraveme apport eacutenumeacutereacute permet quant agrave lui de proposer non plus des ressources uniques oudes listes de recommandations agrave lutilisateur nal mais bien des seacutequences posseacutedant un senscar baseacutees sur les habitudes de consommation des ressources des utilisateurs passeacutes

52 Perspectives

Dans ce travail nous avons reacutepondu aux probleacutematiques que nous avons deacutenies au deacutebutdu manuscrit mais nous pouvons cependant distinguer des pistes dameacuteliorations futures

Premiegraverement les seacutequences peuvent beacuteneacutecier dameacuteliorations notamment au niveau dela notion de progressiviteacute Pour le moment dans notre modegravele les seacutequences sont creacuteeacutees via

106

52 Perspectives

les agents fourmis parcourant le graphe agrave partir dun point de deacutepart jusquagrave un objectif Laprogressiviteacute des seacutequences est garantie par deux processus

1 La topologie du graphe qui prend en compte les seacutequences creacuteeacutees naturellement par lesutilisateurs lors de preacuteceacutedentes visites

2 La formule du calcul du meilleur chemin une fois les agents ayant termineacute de se deacuteplacersur le graphe

Nous avons exploreacute dautres pistes pour orir des seacutequences plus progressives aux utilisateursPar exemple en incluant une colonie deacutedieacutee uniquement agrave la progressiviteacute ou encore en modiantles calculs de distance totale de chemin Les tests que nous avons reacutealiseacutes nont cependant pasabouti agrave des reacutesultats concluants Nous attribuons ces reacutesultats au fait que le domaine de la mu-sique nest pas optimal pour utiliser ce genre de technique Quand bien mecircme il est courant pourles utilisateurs deacutecouter des musiques sous formes de playlists de reacutecentes eacutetudes ont montreacute quelordre dans lequel les musiques sont proposeacutees nest pas une caracteacuteristique prioritaire dans lasatisfaction de lutilisateur On peut par exemple citer les eacutetudes suivantes [Vall et al 2018 Vallet al 2019] ougrave les auteurs ont chercheacute agrave mesurer limportance de lordre dans lequel eacutetaient preacute-senteacutees les musiques dune playlist Les auteurs nobtiennent pas de dieacuterences de reacutesultats entreplusieurs expeacuterimentations ougrave lordre des musiques eacutetait maintenu ou lorsquil eacutetait rompu Lesauteurs concluent que lordre des musiques nest pas une variable cruciale pour la geacuteneacuteration au-tomatique de playlists Dautres domaines sont ainsi potentiellement plus agrave mecircme decirctre le sujetdeacutetudes plus approfondies sur la progressiviteacute comme par exemple les recommandations de par-cours dans des museacutees ou les recommandations de seacuteries de cours et dexercices dans le-eacuteducation

Une autre perspective dameacutelioration deacutecoulant du paragraphe preacuteceacutedent est lapplication denotre modegravele agrave un ou plusieurs autres domaines applicatifs Nous avons deacutejagrave mentionneacute dans cemanuscrit que nous avions consideacutereacute les domaines museacuteal et de le-eacuteducation en plus du domainemusical Ces deux autres domaines proposent chacun des deacutes uniques et pourraient proter deseacutequences de recommandations reacutepondant aux besoins speacuteciques de leurs utilisateurs Il a mal-heureusement eacutetait trop complexe de reacutecupeacuterer ou de creacuteer une base de donneacutees exploitable surces deux domaines durant cette thegravese Une expeacuterimentation est toutefois meneacutee actuellement enpartenariat avec le Museacutee des Beaux Arts de Nancy an de construire une base de donneacutees deschemins emprunteacutes par les visiteurs du museacutee ce qui permettra alors dappliquer notre modegravelean de proposer des parcours personnaliseacutes dans le museacutee

Une derniegravere perspective dameacutelioration reacuteside dans leacutevaluation des seacutequences geacuteneacutereacutees parnotre modegravele Notre but eacutetait de consideacuterer plusieurs facteurs humains pour geacuteneacuterer et eacutevaluernos recommandations tout en uniant leacutevaluation avec une seule meacutetrique de satisfaction Sinous avons reacuteussi agrave inteacutegrer plusieurs facteurs dans notre modegravele nous avons cependant rencon-treacute des problegravemes quant agrave lunication des eacutevaluations Lobjectif eacutetait de proposer une mesurede progressiviteacute permettant de mesurer la qualiteacute de la seacutequence recommandeacutee mais comme nouslavons expliqueacute nous navons pas obtenu de reacutesultats concluants au regard de la progressiviteacutedans notre base de donneacutees Ainsi la mesure de progressiviteacute optimale on proposeacutee et deacutetailleacuteedans la Section 345 na pas pu ecirctre testeacutee dans de bonnes conditions Mecircme si les expeacuterimenta-tions meneacutees dans ce travail nont pas pu exploiter cette mesure de progressiviteacute optimale nouspensons quelle pourrait agrave termes donner une indication geacuteneacuterale de la qualiteacute dune seacutequence deressources dans dautres domaines comme le-eacuteducation ou le tourisme

107

Chapitre 5 Conclusion et perspectives

Dun point de vue plus geacuteneacuteral sur le fonctionnement de notre modegravele AntRS certaines ameacute-liorations sont possibles si lon considegravere le fonctionnement du systegraveme dans des conditions reacuteelleset non plus pour une expeacuterimentation hors-ligne comme nous lavons fait dans ce travail Dans lecadre dune utilisation en conditions reacuteelles quelques modications du fonctionnement de notrealgorithme pourraient ameacuteliorer la satisfaction de lutilisateur Prenons lexemple dun utilisateurse connectant sur un site de diusion de musique et commenccedilant la lecture dune musique enparticulier Notre systegraveme sera capable agrave partir de ce point de deacutepart et des preacutefeacuterences passeacuteesde lutilisateur de creacuteer une seacutequence de musiques Cependant si lutilisateur ne clique pas surla recommandation de playlist ou eacutecoute une deuxiegraveme chanson complegravetement dieacuterente desrecommandations du systegraveme il serait inteacuteressant de pouvoir consideacuterer et inteacutegrer ces informa-tions dans le modegravele an que ce dernier puisse sadapter et satisfaire au mieux lutilisateur Deplus on voit bien linteacuterecirct de ces adaptations en temps reacuteel dans les domaines museacuteal (re-calculdun nouvel itineacuteraire de visite si lutilisateur ne suit pas la recommandation agrave linstar dunGPS par exemple) et de le-eacuteducation (adapter le contenu peacutedagogique en fonction du chemin delapprenant ou de ses reacutesultats) Une derniegravere remarque geacuteneacuterale concernant notre modegravele peutecirctre faite sur le temps dexeacutecution Malgreacute les optimisations reacutealiseacutees dans la derniegravere sectiondu chapitre preacuteceacutedent le temps dexeacutecution eacutetait relativement eacuteleveacute lors des expeacuterimentationsCependant les expeacuterimentations concernaient 100 utilisateurs agrave la fois et eacutetaient lanceacutees majo-ritairement sur un ordinateur portable Ainsi la recommandation en temps reacuteel dune seacutequencede ressources agrave un seul utilisateur peut ecirctre faite en temps reacuteel en utilisant un serveur deacutedieacute

Le domaine de la recommandation seacutelargit et se complexie chaque anneacutee agrave linstar du mondedans lequel nous vivons Devant la myriade de contenus accessibles sur Internet les utilisateurspeuvent plus que jamais beacuteneacutecier de recommandations intelligentes personnaliseacutees pertinenteset reacutepondant agrave leurs besoins Dans le futur les systegravemes dassistance aux utilisateurs devrontecirctre agrave la fois geacuteneacuteriques adaptables agrave tout types de contextes et toujours plus ecaces Cestdans cette direction que sinscrit le travail de cette thegravese et le modegravele AntRS

108

Bibliographie

[Adomavicius and Tuzhilin 2005] Adomavicius G and Tuzhilin A (2005) Toward the nextgeneration of recommender systems A survey of the state-of-the-art and possible extensionsIEEE Transactions on Knowledge amp Data Engineering (6) 734749

[Adomavicius and Tuzhilin 2011] Adomavicius G and Tuzhilin A (2011) Context-aware re-commender systems In Recommender systems handbook pages 217253 Springer

[Aggarwal et al 2016] Aggarwal C C et al (2016) Recommender systems Springer

[Agrawal et al 1995] Agrawal R Srikant R et al (1995) Mining sequential patterns Inicde volume 95 pages 314

[Alaya et al 2007] Alaya I Solnon C and Ghedira K (2007) Ant colony optimization formulti-objective optimization problems In Tools with Articial Intelligence 2007 ICTAI 200719th IEEE International Conference on volume 1 pages 450457 IEEE

[Angus 2007] Angus D (2007) Crowding population-based ant colony optimisation for themulti-objective travelling salesman problem In 2007 IEEE Symposium on ComputationalIntelligence in Multi-Criteria Decision-Making pages 333340 IEEE

[Angus and Woodward 2009] Angus D and Woodward C (2009) Multiple objective ant co-lony optimisation Swarm intelligence 3(1) 6985

[Antenucci et al 2018] Antenucci S Boglio S Chioso E Dervishaj E Kang S ScarlattiT and Dacrema M F (2018) Artist-driven layering and users behaviour impact on re-commendations in a playlist continuation scenario In Proceedings of the ACM RecommenderSystems Challenge 2018 page 4 ACM

[Aucouturier and Pachet 2002] Aucouturier J-J and Pachet F (2002) Scaling up music play-list generation In Proceedings IEEE International Conference on Multimedia and Expo vo-lume 1 pages 105108 IEEE

[Ausubel 1963] Ausubel D P (1963) The psychology of meaningful verbal learning

[Baeza-Yates et al 1999] Baeza-Yates R Ribeiro-Neto B et al (1999) Modern informationretrieval volume 463 ACM press New York

[Belkin and Croft 1992] Belkin N J and Croft W B (1992) Information ltering and infor-mation retrieval two sides of the same coin In Communications of the ACM Citeseer

[Bell and McMullen 2004] Bell J E and McMullen P R (2004) Ant colony optimizationtechniques for the vehicle routing problem Advanced engineering informatics 18(1) 4148

[Benbasat and Wang 2005] Benbasat I and Wang W (2005) Trust in and adoption of onlinerecommendation agents Journal of the association for information systems 6(3) 4

[Bennett et al 2007] Bennett J Lanning S et al (2007) The netix prize In Proceedingsof KDD cup and workshop volume 2007 page 35 New York

109

Bibliographie

[Bonabeau et al 1999] Bonabeau E Marco D d R D F Dorigo M Theacuteraulaz G The-raulaz G et al (1999) Swarm intelligence from natural to articial systems Number 1Oxford university press

[Borragraves et al 2014] Borragraves J Moreno A and Valls A (2014) Intelligent tourism recommen-der systems A survey Expert Systems with Applications 41(16) 73707389

[Boyer et al 2015] Boyer A Casanova G Roussanaly A and Ducreau F (2015) Periclesor how to assess and to improve quality in higher education

[Breese et al 2013] Breese J S Heckerman D and Kadie C (2013) Empirical analysis ofpredictive algorithms for collaborative ltering arXiv preprint arXiv 13017363

[Brooks 1991] Brooks R A (1991) Intelligence without reason

[Castagnos 2008] Castagnos S (2008) Modeacutelisation de comportements et apprentissage sto-chastique non superviseacute de strateacutegies dinteractions sociales au sein de systegravemes temps reacuteel derecherche et daccegraves agrave linformation PhD thesis Universiteacute Nancy II

[Castagnos and Boyer 2006] Castagnos S and Boyer A (2006) A clientserver user-basedcollaborative ltering algorithm Model and implementation In 17th European Conferenceon Articial Intelligence (ECAI 2006) pages 617621

[Castagnos et al 2013] Castagnos S Brun A and Boyer A (2013) Utiliteacute et perception dela diversiteacute dans les systegravemes de recommandation

[Castagnos et al 2010] Castagnos S Jones N and Pu P (2010) Eye-tracking product re-commenders usage In Proceedings of the fourth ACM conference on Recommender systemspages 2936 ACM

[Castagnos et al 2019] Castagnos S Marchal F Bertrand A Colle M and Mahmoudi D(2019) Inferring art preferences from gaze exploration in a museum In Adjunct Publicationof the 27th Conference on User Modeling Adaptation and Personalization pages 425430

[Castells et al 2015] Castells P Hurley N J and Vargas S (2015) Novelty and diversity inrecommender systems In Recommender Systems Handbook pages 881918 Springer

[Chen and Li 2019] Chen H and Li J (2019) Adversarial tensor factorization for context-aware recommendation In Proceedings of the 13th ACM Conference on Recommender Systemspages 363367

[Cheverst et al 2000] Cheverst K Davies N Mitchell K Friday A and Efstratiou C(2000) Developing a context-aware electronic tourist guide some issues and experiencesIn Proceedings of the SIGCHI conference on Human Factors in Computing Systems pages1724 ACM

[Chou et al 2005] Chou S-C Hsieh W-T Gandon F L and Sadeh N M (2005) Semanticweb technologies for context-aware museum tour guide applications In Advanced InformationNetworking and Applications 2005 AINA 2005 19th International Conference on volume 2pages 709714 IEEE

[Davis 1989] Davis F D (1989) Perceived usefulness perceived ease of use and user acceptanceof information technology MIS quarterly pages 319340

[Deb et al 2002] Deb K Pratap A Agarwal S and Meyarivan T (2002) A fast and elitistmultiobjective genetic algorithm Nsga-ii IEEE transactions on evolutionary computation6(2) 182197

[Deneubourg et al 1990] Deneubourg J-L Aron S Goss S and Pasteels J M (1990) Theself-organizing exploratory pattern of the argentine ant Journal of insect behavior 3(2) 159168

110

[Doerner et al 2004] Doerner K Gutjahr W J Hartl R F Strauss C and Stummer C(2004) Pareto ant colony optimization A metaheuristic approach to multiobjective portfolioselection Annals of operations research 131(1) 7999

[Dorigo 2001] Dorigo M (2001) Ant algorithms solve dicult optimization problems InEuropean Conference on Articial Life pages 1122 Springer

[Dorigo and Birattari 2010] Dorigo M and Birattari M (2010) Ant colony optimizationSpringer

[Dorigo and Birattari 2011] Dorigo M and Birattari M (2011) Ant colony optimization InEncyclopedia of machine learning pages 3639 Springer

[Dorigo et al 2006] Dorigo M Birattari M and Stutzle T (2006) Ant colony optimizationIEEE computational intelligence magazine 1(4) 2839

[Dorigo and Gambardella 1997] Dorigo M and Gambardella L M (1997) Ant colonies forthe travelling salesman problem biosystems 43(2) 7381

[Dorigo et al 1996] Dorigo M Maniezzo V Colorni A et al (1996) Ant system optimiza-tion by a colony of cooperating agents IEEE Transactions on Systems man and cyberneticsPart B Cybernetics 26(1) 2941

[Dorigo and Stuumltzle 2019] Dorigo M and Stuumltzle T (2019) Ant colony optimization overviewand recent advances In Handbook of metaheuristics pages 311351 Springer

[Drachsler et al 2015] Drachsler H Verbert K Santos O C and Manouselis N (2015)Panorama of recommender systems to support learning In Recommender systems handbookpages 421451 Springer

[Durillo and Nebro 2011] Durillo J J and Nebro A J (2011) jmetal A java framework formulti-objective optimization Advances in Engineering Software 42(10) 760771

[Ekstrand et al 2014] Ekstrand M D Harper F M Willemsen M C and Konstan J A(2014) User perception of dierences in recommender algorithms In Proceedings of the 8thACM Conference on Recommender systems pages 161168 ACM

[Ferber 1995] Ferber J (1995) Les systegravemes multi-agents Vers une intelligence collectiveintereditions 1995 Connaissances et compeacutetences requises Cette thegravese s adresse agrave des eacutetu-diants ayant un prol Intelligence ArticielleBase de Donneacutees et elle neacutecessite davoir descompeacutetences theacuteoriques dans les domaines 1

[Ferber and Weiss 1999] Ferber J and Weiss G (1999) Multi-agent systems an introductionto distributed articial intelligence volume 1 Addison-Wesley Reading

[Frolov and Oseledets 2017] Frolov E and Oseledets I (2017) Tensor methods and recom-mender systems Wiley Interdisciplinary Reviews Data Mining and Knowledge Discovery7(3) e1201

[Gambardella et al 1999] Gambardella L M Taillard Eacute and Agazzi G (1999) Macs-vrptw A multiple ant colony system for vehicle routing problems with time windows

[Gan et al 2020] Gan L Nurbakova D Laporte L and Calabretto S (2020) Enhancingrecommendation diversity using determinantal point processes on knowledge graphs In Pro-ceedings of the 43rd International ACM SIGIR Conference on Research and Development inInformation Retrieval pages 20012004

[Gavalas et al 2014] Gavalas D Konstantopoulos C Mastakas K and Pantziou G (2014)Mobile recommender systems in tourism Journal of network and computer applications39 319333

111

Bibliographie

[Goodenough et al 2017] Goodenough A E Little N Carpenter W S and Hart A G(2017) Birds of a feather ock together Insights into starling murmuration behaviour revealedusing citizen science PloS one 12(6) e0179277

[Goss et al 1989] Goss S Aron S Deneubourg J-L and Pasteels J M (1989) Self-organized shortcuts in the argentine ant Naturwissenschaften 76(12) 579581

[Gras et al 2016] Gras B Brun A and Boyer A (2016) Identifying grey sheep users incollaborative ltering a distribution-based technique In Proceedings of the 2016 Conferenceon User Modeling Adaptation and Personalization pages 1726 ACM

[Grasseacute 1959] Grasseacute P-P (1959) La reconstruction du nid et les coordinations interindi-viduelles chez bellicositermes natalensis etcubitermes sp la theacuteorie de la stigmergie Essaidinterpreacutetation du comportement des termites constructeurs Insectes sociaux 6(1) 4180

[Guo et al 2015] Guo G Zhang J Sun Z and Yorke-Smith N (2015) Librec A javalibrary for recommender systems In UMAP Workshops

[Han et al 2007] Han J Cheng H Xin D and Yan X (2007) Frequent pattern mining current status and future directions Data mining and knowledge discovery 15(1) 5586

[Harper and Konstan 2015] Harper F M and Konstan J A (2015) The movielens datasets History and context Acm transactions on interactive intelligent systems (tiis) 5(4) 119

[Herlocker et al 2004] Herlocker J L Konstan J A Terveen L G and Riedl J T (2004)Evaluating collaborative ltering recommender systems ACM Transactions on InformationSystems (TOIS) 22(1) 553

[Houmllldobler et al 1990] Houmllldobler B Wilson E O et al (1990) The ants Harvard UniversityPress

[Honey et al 1992] Honey P Mumford A et al (1992) The manual of learning styles

[Hu et al 2008] Hu Y Koren Y and Volinsky C (2008) Collaborative ltering for implicitfeedback datasets In 2008 Eighth IEEE International Conference on Data Mining pages263272 Ieee

[Iaquinta et al 2008] Iaquinta L De Gemmis M Lops P Semeraro G Filannino M andMolino P (2008) Introducing serendipity in a content-based recommender system In 2008Eighth International Conference on Hybrid Intelligent Systems pages 168173 IEEE

[Iredi et al 2001] Iredi S Merkle D and Middendorf M (2001) Bi-criterion optimizationwith multi colony ant algorithms In Evolutionary Multi-Criterion Optimization pages 359372 Springer

[Jameson et al 2015] Jameson A Willemsen M C Felfernig A de Gemmis M Lops PSemeraro G and Chen L (2015) Human decision making and recommender systems InRecommender Systems Handbook pages 611648 Springer

[Jannach et al 2016] Jannach D Kamehkhosh I and Bonnin G (2016) Biases in auto-mated music playlist generation A comparison of next-track recommending techniques InProceedings of the 2016 Conference on User Modeling Adaptation and Personalization pages281285 ACM

[Jawaheer et al 2010] Jawaheer G Szomszor M and Kostkova P (2010) Comparison ofimplicit and explicit feedback from an online music recommendation service In proceedingsof the 1st international workshop on information heterogeneity and fusion in recommendersystems pages 4751 ACM

112

[Jones 2010] Jones N (2010) User Perceived Qualities and Acceptance of Recommender Sys-tems The Role of Diversity PhD thesis EPFL

[Kaminskas and Bridge 2016] Kaminskas M and Bridge D (2016) Diversity serendipity no-velty and coverage A survey and empirical analysis of beyond-accuracy objectives in recom-mender systems ACM Trans Interact Intell Syst 7(1) 2 12 42

[Kardan et al 2014] Kardan A A Ebrahim M A and Imani M B (2014) A new perso-nalized learning path generation method Aco-map Indian Journal of Scientic Research5(1) 17

[King and Sumpter 2012] King A J and Sumpter D J (2012) Murmurations Current Bio-logy 22(4) R112R114

[Kolb and Fry 1974] Kolb D A and Fry R E (1974) Toward an applied theory of experientiallearning MIT Alfred P Sloan School of Management

[Konstan et al 1998] Konstan J A Riedl J Borchers A and Herlocker J L (1998) Re-commender systems A grouplens perspective In Recommender Systems Papers from the1998 Workshop (AAAI Technical Report WS-98-08) pages 6064 AAAI Press

[Koren 2008] Koren Y (2008) Factorization meets the neighborhood a multifaceted collabo-rative ltering model In Proceedings of the 14th ACM SIGKDD international conference onKnowledge discovery and data mining pages 426434 ACM

[Koren et al 2009] Koren Y Bell R and Volinsky C (2009) Matrix factorization techniquesfor recommender systems Computer (8) 3037

[Kuhlthau 1991] Kuhlthau C C (1991) Inside the search process Information seeking fromthe users perspective Journal of the American society for information science 42(5) 361371

[Kurilovas et al 2015] Kurilovas E Zilinskiene I and Dagiene V (2015) Recommending sui-table learning paths according to learners preferences Experimental research results Com-puters in Human Behavior 51 945951

[lHuillier 2018] lHuillier A (2018) Modeacuteliser la diversiteacute au cours du temps pour comprendrele contexte de lutilisateur dans les systegravemes de recommandation PhD thesis

[LHuillier et al 2014] LHuillier A Castagnos S and Boyer A (2014) Understanding usagesby modeling diversity over time In 22nd Conference on User Modeling Adaptation andPersonalization volume 1181

[Logan 2002] Logan B (2002) Content-based playlist generation Exploratory experimentsIn ISMIR

[Lops et al 2011] Lops P De Gemmis M and Semeraro G (2011) Content-based recom-mender systems State of the art and trends In Recommender systems handbook pages73105 Springer

[Mahmood and Ricci 2009] Mahmood T and Ricci F (2009) Improving recommender sys-tems with adaptive conversational strategies In Proceedings of the 20th ACM conference onHypertext and hypermedia pages 7382 ACM

[March 1991] March J G (1991) Exploration and exploitation in organizational learningOrganization science 2(1) 7187

[McGinty and Smyth 2003] McGinty L and Smyth B (2003) On the role of diversity inconversational recommender systems In Proceedings of the 5th International Conference onCase-based Reasoning Research and Development ICCBR03 pages 276290

113

Bibliographie

[McNee et al 2006] McNee S M Riedl J and Konstan J A (2006) Being accurate is notenough how accuracy metrics have hurt recommender systems In CHI06 extended abstractson Human factors in computing systems pages 10971101 ACM

[Merkle et al 2002] Merkle D Middendorf M and Schmeck H (2002) Ant colony optimi-zation for resource-constrained project scheduling IEEE transactions on evolutionary compu-tation 6(4) 333346

[Mokatren et al 2018] Mokatren M Kuik T and Shimshoni I (2018) Exploring the po-tential of a mobile eye tracker as an intuitive indoor pointing device A case study in culturalheritage Future Generation Computer Systems 81 528541

[Nurbakova et al 2018] Nurbakova D Laporte L Calabretto S and Gensel J (2018) Re-commandation de seacutequences dactiviteacutes lors deacutevegravenements distribueacutes

[Oard et al 1998] Oard D W Kim J et al (1998) Implicit feedback for recommendersystems In Proceedings of the AAAI workshop on recommender systems pages 8183

[Osche et al 2019a] Osche P-E Castagnos S and Boyer A (2019a) Antrs Recommendinglists through a multi-objective ant colony system In European Conference on InformationRetrieval pages 229243 Springer

[Osche et al 2019b] Osche P-E Castagnos S and Boyer A (2019b) From music to museum Applications of multi-objective ant colony systems to real world problems In Adaptive andLearning Agents Workshop at AAMAS (ALA 2019)

[Osche et al 2016] Osche P-E Castagnos S Napoli A and Naudet Y (2016) Walk theline toward an ecient user model for recommendations in museums In Semantic and SocialMedia Adaptation and Personalization (SMAP) 2016 11th International Workshop IEEE

[Oster 1981] Oster G (1981) E 0 wilson 1978 caste and ecology in the social insects Mo-nographs in Population Biology 12 1352

[Qiu et al 2015] Qiu J Lin Z and Li Y (2015) Predicting customer purchase behavior inthe e-commerce context Electronic commerce research 15(4) 427452

[Quadrana et al 2018] Quadrana M Cremonesi P and Jannach D (2018) Sequence-awarerecommender systems ACM Computing Surveys (CSUR) 51(4) 136

[Resnick et al 1994] Resnick P Iacovou N Suchak M Bergstrom P and Riedl J (1994)Grouplens an open architecture for collaborative ltering of netnews In Proceedings of the1994 ACM conference on Computer supported cooperative work pages 175186 ACM

[Reynolds 1987] Reynolds C W (1987) Flocks herds and schools A distributed behavioralmodel volume 21 ACM

[Ribeiro et al 2014] Ribeiro M T Ziviani N Moura E S D Hata I Lacerda A andVeloso A (2014) Multiobjective pareto-ecient approaches for recommender systems ACMTrans Intell Syst Technol 5(4) 53 153 20

[Ricci et al 2015] Ricci F Rokach L and Shapira B (2015) Recommender Systems Hand-book Springer US

[RISK 2002] RISK U (2002) Draft standard for learning object metadata IEEE standard1484(1)

[Rubtsov et al 2018] Rubtsov V Kamenshchikov M Valyaev I Leksin V and IgnatovD I (2018) A hybrid two-stage recommender system for automatic playlist continuation InProceedings of the ACM Recommender Systems Challenge 2018 page 16 ACM

114

[Russell and Norvig 2016] Russell S J and Norvig P (2016) Articial intelligence a modernapproach Malaysia Pearson Education Limited

[Salton 1989] Salton G (1989) Automatic text processing The transformation analysis andretrieval of Reading Addison-Wesley 169

[Salton and McGill 1986] Salton G and McGill M J (1986) Introduction to modern infor-mation retrieval

[Sammut and Webb 2010] Sammut C and Webb G I editors (2010) Mean Absolute Errorpages 652652 Springer US Boston MA

[Schlunz 2011] Schlunz E B (2011) Decision support for generator maintenance scheduling inthe energy sector PhD thesis Stellenbosch Stellenbosch University

[Schnabel et al 2018] Schnabel T Bennett P N Dumais S T and Joachims T (2018)Short-term satisfaction and long-term coverage Understanding how users tolerate algorithmicexploration In Proceedings of the Eleventh ACM International Conference on Web Search andData Mining pages 513521

[Semet et al 2003] Semet Y Lutton E and Collet P (2003) Ant colony optimisation fore-learning Observing the emergence of pedagogic suggestions In Swarm Intelligence Sympo-sium 2003 SIS03 Proceedings of the 2003 IEEE pages 4652 IEEE

[Shani and Gunawardana 2011] Shani G and Gunawardana A (2011) Evaluating recommen-dation systems In Recommender systems handbook pages 257297 Springer

[Shardanand and Maes 1995] Shardanand U and Maes P (1995) Social information ltering Algorithms for automating word of mouth In Chi volume 95 pages 210217 Citeseer

[Silva et al 2009] Silva A R D Lages W S and Chaimowicz L (2009) Boids that see Using self-occlusion for simulating large groups on gpus Computers in Entertainment (CIE)7(4) 51

[Simon 1997] Simon H A (1997) Models of bounded rationality Empirically grounded econo-mic reason volume 3 MIT press

[Smyth and McClave 2001] Smyth B and McClave P (2001) Similarity vs diversity InInternational Conference on Case-Based Reasoning pages 347361 Springer

[Stuumltzle and Hoos 2000] Stuumltzle T and Hoos H H (2000) Maxmin ant system Futuregeneration computer systems 16(8) 889914

[Su and Khoshgoftaar 2009] Su X and Khoshgoftaar T M (2009) A survey of collaborativeltering techniques Advances in articial intelligence 2009 4

[Tesoriero et al 2008] Tesoriero R Gallud J A Lozano M and Penichet V M R (2008) Alocation-aware system using rd and mobile devices for art museums In Fourth InternationalConference on Autonomic and Autonomous Systems (ICAS08) pages 7681 IEEE

[Tesoriero et al 2014] Tesoriero R Gallud J A Lozano M and Penichet V M R (2014)Enhancing visitors experience in art museums using mobile technologies Information SystemsFrontiers 16(2) 303327

[Tintarev et al 2017] Tintarev N Lo C and Liem C (2017) Sequences of diverse songrecommendations An exploratory study in a commercial system In Proceedings of the 25thConference on User Modeling Adaptation and Personalization pages 391392 ACM

[Twardowski 2016] Twardowski B (2016) Modelling contextual information in session-awarerecommender systems with neural networks In Proceedings of the 10th ACM Conference onRecommender Systems pages 273276 ACM

115

Bibliographie

[Vall et al 2018] Vall A Quadrana M Schedl M and Widmer G (2018) The impor-tance of song context and song order in automated music playlist generation arXiv preprintarXiv 180704690

[Vall et al 2019] Vall A Quadrana M Schedl M and Widmer G (2019) Order contextand popularity bias in next-song recommendations International Journal of Multimedia In-formation Retrieval 8(2) 101113

[Van den Berg et al 2005] Van den Berg B Van Es R Tattersall C Janssen J ManderveldJ Brouns F Kurvers H and Koper R (2005) Swarm-based sequencing recommendationsin e-learning In Intelligent Systems Design and Applications 2005 ISDA05 Proceedings 5thInternational Conference on pages 488493 IEEE

[Vargas and Castells 2011] Vargas S and Castells P (2011) Rank and relevance in noveltyand diversity metrics for recommender systems In Proceedings of the fth ACM conferenceon Recommender systems pages 109116 ACM

[Veacuteron and Levasseur 1989] Veacuteron E and Levasseur M (1989) Ethnographie de lexposition lespace le corps et le sens Centre Georges Pompidou Bibliothegraveque publique dinformation

[Volkovs et al 2018] Volkovs M Rai H Cheng Z Wu G Lu Y and Sanner S (2018)Two-stage model for automatic playlist continuation at scale In Proceedings of the ACMRecommender Systems Challenge 2018 page 9 ACM

[Wang et al 2012] Wang X Rosenblum D and Wang Y (2012) Context-aware mobile musicrecommendation for daily activities In Proceedings of the 20th ACM international conferenceon Multimedia pages 99108 ACM

[Weiss 2013] Weiss G (2013) Multiagent systems MIT press

[Yang et al 2017] Yang B Lei Y Liu J and Li W (2017) Social collaborative ltering bytrust IEEE transactions on pattern analysis and machine intelligence 39(8) 16331647

[Yang et al 2018] Yang H Jeong Y Choi M and Lee J (2018) Mmcf Multimodal colla-borative ltering for automatic playlist continuation In Proceedings of the ACM RecommenderSystems Challenge 2018 page 11 ACM

[Yang and Wu 2009] Yang Y J and Wu C (2009) An attribute-based ant colony system foradaptive learning object recommendation Expert Systems with Applications 36(2) 30343047

[Yoshimura et al 2014] Yoshimura Y Sobolevsky S Ratti C Girardin F Carrascal J PBlat J and Sinatra R (2014) An analysis of visitors behavior in the louvre museum a studyusing bluetooth data Environment and Planning B Planning and Design 41(6) 11131131

[Yu and Riedl 2012] Yu H and Riedl M O (2012) A sequential recommendation approachfor interactive personalized story generation In Proceedings of the 11th International Confe-rence on Autonomous Agents and Multiagent Systems-Volume 1 pages 7178 InternationalFoundation for Autonomous Agents and Multiagent Systems

[Zhang 2013] Zhang L (2013) The denition of novelty in recommendation system Journalof Engineering Science amp Technology Review 6(3)

[Zhao et al 2014] Zhao G Lee M L and Wynne H (2014) Utilizing purchase intervals inlatent clusters for product recommendation In Proceedings of the 8th Workshop on SocialNetwork Mining and Analysis page 4 ACM

[Ziegler et al 2005] Ziegler C-N McNee S M Konstan J A and Lausen G (2005) Im-proving recommendation lists through topic diversication In Proceedings of the 14th inter-national conference on World Wide Web pages 2232 ACM

116

[Zitzler et al 2001] Zitzler E Laumanns M and Thiele L (2001) Spea2 Improving thestrength pareto evolutionary algorithm TIK-report 103

117

Bibliographie

118

Reacutesumeacute

Les systegravemes de recommandations repreacutesentent un thegraveme de recherche fondamental agrave linter-section entre plusieurs grandes disciplines telles que lapprentissage automatique linteractionhomme-machine et les sciences cognitives Ils constituent en outre un cadre applicatif ambitieuxpour la communauteacute des chercheurs en Intelligence Articielle de par leur tregraves grande complexiteacuteet les nombreuses contraintes quils geacutenegraverent

Lobjectif de ces systegravemes est dameacuteliorer les interactions entre le grand public et les sys-tegravemes de recherche et daccegraves agrave linformation Il est en eet devenu dicile dans un contexte demasse de donneacutees heacuteteacuterogegravenes didentier les ressources les plus pertinentes Il sagit dassisterles utilisateurs dans leurs explorations (que cela soit dans un environnement virtuel ou physique)mais eacutegalement de proposer des ressources susceptibles de les inteacuteresser mais quils nauraientpas consulteacutees spontaneacutement

Les systegravemes actuels ont largement prouveacute leur valeur ajouteacutee et reposent sur des techniquesdapprentissage varieacutees (numeacuterique ou symbolique superviseacute ou non etc) [Castagnos 2008]Neacuteanmoins ils sourent encore de limitations lorsquil sagit de faire des recommandations deseacutequences (recommandations ditems dans un ordre preacutecis pouvant deacutependre des preacute-requis dela progressiviteacute requise du contexte des contraintes de temps etc) Certains modegraveles tels quele modegravele DANCE [Castagnos 2015] integravegrent cette dimension temporelle en suivant en tempsreacuteel leacutevolution en diversiteacute des ressources consulteacutees par les utilisateurs pour mieux comprendrele contexte dexploration Dans [Bonnin 2010] lauteur propose eacutegalement un modegravele temporelcapable de deacutetecter des motifs de consultations freacutequents dans un historique de consultationsan de fournir des recommandations de ressources a priori lieacutees agrave un mecircme contexte Neacuteanmoinssi la modeacutelisation temporelle et spatiale a eacuteteacute rendue possible [Zheng 2015] les modegraveles de leacutetatde lart sinteacuteressant agrave lordre dans lequel les recommandations doivent ecirctre faites ou agrave la qualiteacuteglobale dune seacutequence de recommandations sont encore trop rares

Dans le cadre de cette thegravese nous nous attacherons agrave deacutenir un nouveau formalisme etun cadre meacutethodologique permettant (1) la deacutenition de facteurs humains menant agrave la prisede deacutecision et agrave la satisfaction des utilisateurs (2) la construction dun modegravele geacuteneacuterique etmulti-critegraveres (contraintes physiques ou temporelles diversiteacute progressiviteacute etc) inteacutegrant cesfacteurs humains dans le but de recommander des ressources pertinentes sinscrivant dans uneseacutequence coheacuterente (3) une eacutevaluation holistique de la satisfaction utilisateur vis-agrave-vis de sonparcours de recommandations Leacutevaluation des recommandations tous domaines confondus sefait pour lheure recommandation par recommandation chaque meacutetrique deacutevaluation prise in-deacutependamment (preacutecision diversiteacute nouveauteacute couverture ) Il sagira de proposer un cadreplus complet mesurant leacutevolutiviteacute et la compleacutetude du parcours

Un tel modegravele de recommandations multi-critegraveres preacutesente de nombreux cadres applicatifs Agravetitre dexemple il peut ecirctre utiliseacute dans le cadre de leacutecoute de musique en ligne avec la recom-mandation de playlists adaptatives (recommandation de seacutequences de musique pour faire eacutevoluerlambiance dans un lieu tel quun bar pour susciter une certaine progressiviteacute de leacutemotion res-

119

sentie par le public ou pour sadapter aux attentes compleacutementairessimilairesdieacuterentes dungroupe) Il peut eacutegalement ecirctre utile pour adapter le parcours de recommandation aux progregraves delapprenant et au sceacutenario peacutedagogique de lenseignant dans un contexte de-eacuteducation Citonsaussi le domaine touristique ougrave ce modegravele pourrait inteacutegrer les contraintes spatiales et tempo-relles dun environnement physique (villes museacutees etc)

Mots-cleacutes Systegravemes de recommandation Systegravemes multi-agents Modeacutelisation utilisateur

120

Abstract

Recommender systems are a fundamental research topic at the intersection of several majordisciplines such as machine learning human-computer interaction and cognitive sciences Theyalso constitute an ambitious application framework for the community of researchers in ArticialIntelligence by their great complexity and the numerous constraints they generate

The purpose of these systems is to improve the interaction between the general audience andthe systems of search and access to information It has become dicult to identify the mostrelevant items in the context of big data The goal is thus to assist users in their explorations(whether in a virtual or physical environment) but also to propose items that may interest thembut that they would not consult spontaneously

Current systems have largely proven their added value and are based on various machinelearning techniques (numerical or symbolic supervised or not etc) [Castagnos 2008] Neverthe-less they still suer from limitations when making recommendations of sequences (recommendingitems in a specic order may depend on requirements progressiveness context time constraintsetc) Some models such as the DANCE model [Castagnos 2015] integrate this temporal di-mension by following in real time the evolution in diversity of resources consulted by users tobetter understand the exploration context In [Bonnin 2010] the author also proposes a temporalmodel capable of detecting frequent consultation patterns in a history of consultations in orderto provide a priori resource recommendations related to the same context Nevertheless whiletemporal and spatial modeling have been made possible [Zheng 2015] state-of-the-art modelsthat focus on sequence recommendations or on the overall quality of the sequence are still too rare

In the framework of this thesis we will focus on dening a new formalism and a method-ological framework allowing (1) the denition of human factors leading to decision making anduser satisfaction (2) the construction of a generic and multi-criteria model (physical or tem-poral constraints diversity progressiveness etc) integrating these human factors in order torecommend relevant resources in a coherent sequence (3) a holistic evaluation of user satisfac-tion with its recommendation path The evaluation of recommendations all domains includedis currently done recommendation by recommendation with each evaluation metric taken inde-pendently (accuracy diversity novelty coverage ) Thus we expect a more comprehensiveevaluation framework measuring the progressiveness and the completeness of the path

Such a multi-criteria recommendation model has many application frameworks As an exam-ple it can be used in the context of online music listening with the recommendation of adaptiveplaylists (recommendation of music sequences to change the atmosphere in a place such as a barto raise or lower the emotion felt by the audience progressively or to adapt to the complemen-tarysimilardierent expectations of a group) It can also be useful to adapt the recommendationpath to the learners progress and the teachers pedagogical scenario in an e-education contextLet us also mention the tourism eld where this model could integrate the spatial and temporalconstraints of a physical environment (cities museums etc)

Keywords Recommender systems Multi-agent systems User modeling

121

122

123

  • Introduction
    • Introduction
    • Preacuteambule
    • Contributions
      • SP1 les facteurs agrave prendre en compte pour satisfaire les utilisateurs
      • SP2 la conception de seacutequences de recommandations en accord avec les facteurs seacutelectionneacutes
      • SP3 et SP4 la creacuteation dun modegravele geacuteneacuterique prenant en compte plusieurs meacutetriques et produisant des seacutequences
        • Plan de la thegravese
          • Eacutetat de lart
            • Les systegravemes de recommandation
              • Le filtrage par contenu
              • Le filtrage collaboratif
              • Les actions des utilisateurs
              • Discussion et limites des systegravemes classiques
                • Les facteurs humains agrave prendre en compte dans la recommandation
                  • La similariteacute
                  • La diversiteacute
                  • La nouveauteacute
                  • Discussion
                    • La recommandation en seacutequence
                      • Deacutefinition et geacuteneacuteraliteacutes sur les seacutequences
                      • Domaines dapplication des modegraveles seacutequentiels
                      • Discussion
                        • Les systegravemes multi-agents
                          • Deacutefinition
                          • Preacutesentation de deux systegravemes multi-agents reacuteactifs
                          • Ant Colony System
                          • Discussion sur le modegravele ACS
                            • Utilisation et eacutevolution reacutecentes des algorithmes de colonies de fourmis
                              • Les algorithmes de colonies de fourmis dans les systegravemes de recommandation
                              • Les algorithmes de colonies de fourmis multi-objectifs
                              • Discussion sur lutilisation de loptimum de Pareto
                                • Discussion geacuteneacuterale
                                  • Notre modegravele de recommandation multi-objectifs AntRS
                                    • Introduction
                                    • Fonctionnement geacuteneacuteral du modegravele
                                    • Graphe
                                    • Objectifs
                                      • Similariteacute
                                      • Diversiteacute
                                      • Nouveauteacute
                                      • Preacutefeacuterences
                                      • Progressiviteacute
                                        • Tactiques de fusion
                                          • Colonie de fusion
                                          • Fusion de seacutequences
                                          • Conclusion
                                              • Expeacuterimentations et reacutesultats
                                                • Introduction
                                                • Expeacuterimentations preacuteliminaires portant sur le modegravele ACS initial
                                                  • Preacutesentation et inteacuterecircts de ces premiegraveres expeacuterimentations
                                                  • Expeacuterimentations preacuteliminaires sur le modegraveles ACS
                                                  • Conclusion
                                                    • Expeacuterimentations sur le modegravele AntRS
                                                      • Base de donneacutees utiliseacutee
                                                      • AntRS mono-objectif expeacuterimentations sur chaque colonie isoleacutee
                                                      • AntRS multi-objectifs expeacuterimentations sur lensemble des colonies simultaneacutement et sur les tactiques de fusion
                                                      • Optimisation des meacutetavariables de AntRS
                                                        • Conclusion
                                                          • Conclusion et perspectives
                                                            • Conclusion
                                                            • Perspectives
                                                              • Bibliographie
Page 6: Recommanding sequences in a multidimensional space
Page 7: Recommanding sequences in a multidimensional space
Page 8: Recommanding sequences in a multidimensional space
Page 9: Recommanding sequences in a multidimensional space
Page 10: Recommanding sequences in a multidimensional space
Page 11: Recommanding sequences in a multidimensional space
Page 12: Recommanding sequences in a multidimensional space
Page 13: Recommanding sequences in a multidimensional space
Page 14: Recommanding sequences in a multidimensional space
Page 15: Recommanding sequences in a multidimensional space
Page 16: Recommanding sequences in a multidimensional space
Page 17: Recommanding sequences in a multidimensional space
Page 18: Recommanding sequences in a multidimensional space
Page 19: Recommanding sequences in a multidimensional space
Page 20: Recommanding sequences in a multidimensional space
Page 21: Recommanding sequences in a multidimensional space
Page 22: Recommanding sequences in a multidimensional space
Page 23: Recommanding sequences in a multidimensional space
Page 24: Recommanding sequences in a multidimensional space
Page 25: Recommanding sequences in a multidimensional space
Page 26: Recommanding sequences in a multidimensional space
Page 27: Recommanding sequences in a multidimensional space
Page 28: Recommanding sequences in a multidimensional space
Page 29: Recommanding sequences in a multidimensional space
Page 30: Recommanding sequences in a multidimensional space
Page 31: Recommanding sequences in a multidimensional space
Page 32: Recommanding sequences in a multidimensional space
Page 33: Recommanding sequences in a multidimensional space
Page 34: Recommanding sequences in a multidimensional space
Page 35: Recommanding sequences in a multidimensional space
Page 36: Recommanding sequences in a multidimensional space
Page 37: Recommanding sequences in a multidimensional space
Page 38: Recommanding sequences in a multidimensional space
Page 39: Recommanding sequences in a multidimensional space
Page 40: Recommanding sequences in a multidimensional space
Page 41: Recommanding sequences in a multidimensional space
Page 42: Recommanding sequences in a multidimensional space
Page 43: Recommanding sequences in a multidimensional space
Page 44: Recommanding sequences in a multidimensional space
Page 45: Recommanding sequences in a multidimensional space
Page 46: Recommanding sequences in a multidimensional space
Page 47: Recommanding sequences in a multidimensional space
Page 48: Recommanding sequences in a multidimensional space
Page 49: Recommanding sequences in a multidimensional space
Page 50: Recommanding sequences in a multidimensional space
Page 51: Recommanding sequences in a multidimensional space
Page 52: Recommanding sequences in a multidimensional space
Page 53: Recommanding sequences in a multidimensional space
Page 54: Recommanding sequences in a multidimensional space
Page 55: Recommanding sequences in a multidimensional space
Page 56: Recommanding sequences in a multidimensional space
Page 57: Recommanding sequences in a multidimensional space
Page 58: Recommanding sequences in a multidimensional space
Page 59: Recommanding sequences in a multidimensional space
Page 60: Recommanding sequences in a multidimensional space
Page 61: Recommanding sequences in a multidimensional space
Page 62: Recommanding sequences in a multidimensional space
Page 63: Recommanding sequences in a multidimensional space
Page 64: Recommanding sequences in a multidimensional space
Page 65: Recommanding sequences in a multidimensional space
Page 66: Recommanding sequences in a multidimensional space
Page 67: Recommanding sequences in a multidimensional space
Page 68: Recommanding sequences in a multidimensional space
Page 69: Recommanding sequences in a multidimensional space
Page 70: Recommanding sequences in a multidimensional space
Page 71: Recommanding sequences in a multidimensional space
Page 72: Recommanding sequences in a multidimensional space
Page 73: Recommanding sequences in a multidimensional space
Page 74: Recommanding sequences in a multidimensional space
Page 75: Recommanding sequences in a multidimensional space
Page 76: Recommanding sequences in a multidimensional space
Page 77: Recommanding sequences in a multidimensional space
Page 78: Recommanding sequences in a multidimensional space
Page 79: Recommanding sequences in a multidimensional space
Page 80: Recommanding sequences in a multidimensional space
Page 81: Recommanding sequences in a multidimensional space
Page 82: Recommanding sequences in a multidimensional space
Page 83: Recommanding sequences in a multidimensional space
Page 84: Recommanding sequences in a multidimensional space
Page 85: Recommanding sequences in a multidimensional space
Page 86: Recommanding sequences in a multidimensional space
Page 87: Recommanding sequences in a multidimensional space
Page 88: Recommanding sequences in a multidimensional space
Page 89: Recommanding sequences in a multidimensional space
Page 90: Recommanding sequences in a multidimensional space
Page 91: Recommanding sequences in a multidimensional space
Page 92: Recommanding sequences in a multidimensional space
Page 93: Recommanding sequences in a multidimensional space
Page 94: Recommanding sequences in a multidimensional space
Page 95: Recommanding sequences in a multidimensional space
Page 96: Recommanding sequences in a multidimensional space
Page 97: Recommanding sequences in a multidimensional space
Page 98: Recommanding sequences in a multidimensional space
Page 99: Recommanding sequences in a multidimensional space
Page 100: Recommanding sequences in a multidimensional space
Page 101: Recommanding sequences in a multidimensional space
Page 102: Recommanding sequences in a multidimensional space
Page 103: Recommanding sequences in a multidimensional space
Page 104: Recommanding sequences in a multidimensional space
Page 105: Recommanding sequences in a multidimensional space
Page 106: Recommanding sequences in a multidimensional space
Page 107: Recommanding sequences in a multidimensional space
Page 108: Recommanding sequences in a multidimensional space
Page 109: Recommanding sequences in a multidimensional space
Page 110: Recommanding sequences in a multidimensional space
Page 111: Recommanding sequences in a multidimensional space
Page 112: Recommanding sequences in a multidimensional space
Page 113: Recommanding sequences in a multidimensional space
Page 114: Recommanding sequences in a multidimensional space
Page 115: Recommanding sequences in a multidimensional space
Page 116: Recommanding sequences in a multidimensional space
Page 117: Recommanding sequences in a multidimensional space
Page 118: Recommanding sequences in a multidimensional space
Page 119: Recommanding sequences in a multidimensional space
Page 120: Recommanding sequences in a multidimensional space
Page 121: Recommanding sequences in a multidimensional space
Page 122: Recommanding sequences in a multidimensional space
Page 123: Recommanding sequences in a multidimensional space
Page 124: Recommanding sequences in a multidimensional space
Page 125: Recommanding sequences in a multidimensional space
Page 126: Recommanding sequences in a multidimensional space
Page 127: Recommanding sequences in a multidimensional space
Page 128: Recommanding sequences in a multidimensional space
Page 129: Recommanding sequences in a multidimensional space
Page 130: Recommanding sequences in a multidimensional space
Page 131: Recommanding sequences in a multidimensional space
Page 132: Recommanding sequences in a multidimensional space
Page 133: Recommanding sequences in a multidimensional space
Page 134: Recommanding sequences in a multidimensional space
Page 135: Recommanding sequences in a multidimensional space