conception centrée utilisateur de prototypes interactifs...

4
Conception centr ´ ee utilisateur de prototypes interactifs pour la gestion de contenu multimedia par similarit´ e Christian Frisson Universit ´ e de Mons, laboratoire TCTS Boulevard Dolez 31 7000 Mons, Belgique [email protected] RESUME Cet article pr´ esente les travaux en cours d’une recherche doctorale visant ` a proposer une m´ ethodologie de con- ception centr´ ee utilisateur et de prototypage rapide afin de concevoir des applications interactives destin´ ees ` a la navigation par similarit´ e dans des bases de donn´ ees mul- timedia, adapt´ ees ` a des cas d’utilisation divers et pro- fils d’utilisateurs vari´ es. Les modalit´ es d’interaction sont volontairement restreintes ` a la visualisation d’information et l’interaction manuelle. Une m´ ethode de d´ eveloppement rapide, r´ eutilisable et durable est propos´ ee, exemplifi´ ee par quelques prototypes ` evaluer par des tests utilisateur. MOTS CLES : Prototypage rapide, visualisation d’infor- mation, interaction gestuelle, navigation hypermedia. ABSTRACT This paper presents a work-in-progress of doctoral re- search aiming at defining a user-centered methodology combined with rapid prototyping dedicated to the design of interactive applications for the navigation by similar- ity in multimedia databases, adapted to different use cases and multiple user profiles. The interaction modalities are voluntarily restricted to information visualization and ges- tural interaction. A rapid, reusable and sustainable devel- opment method is proposed, applied in several prototypes that are to be validated by usability tests. CATEGORIES AND SUBJECT DESCRIPTORS: H5.m. Information interfaces and presentation (e.g., HCI): Mis- cellaneous. GENERAL TERMS: Design, Experimentation KEYWORDS: Rapid prototyping, information visual- ization, gestural interaction, hypermedia navigation. Permission to make digital or hard copies of all or part of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. To copy otherwise, to republish, to post on servers or to redistribute to lists, re- quires prior specific permission and/or a fee. IHM 2010, 20-23 Septembre 2010, Luxembourg, Luxembourg . INTRODUCTION Contexte Media et similarit ´ e L’essor d´ emesur´ e des technologies des t´ el´ ecommunications et de l’information nous place dans une ` ere de l’explosion num´ erique, repoussant les lim- ites de l’acc` es et de la mise ` a disposition de divers con- tenus d’information. Les actualisations successives des termes emprunt´ es pour d´ ecrire les syst` emes informatis´ es erant ces multiples contenus marquent ces ´ evolutions: “multimedia” pour plusieurs types simultan´ es, “hyperme- dia” pour la connectivit´ e entre ces divers types, “crossme- dia” vers leur corr´ elation. Face ` a la vari´ et´ e cons´ equente, l’utilisateur ` a de plus en plus recours ` a des syst` emes de recommandation pour ˆ etre assist´ e dans ses choix, sur base de son exp´ erience et ses pr´ ef´ erences. Mais comment in- formatiser des propositions de contenu similaire? L’interface utilisateur au service des cas d’utilisation La navigation et manipulation de documents multimedia touche de nombreux praticiens et amateurs: sur leurs appareils, mobiles ou fixes: une grande partie de la population mondiale; en m´ ediath` eque: les abonn´ es et les documentalistes; dans leurs bureaux et studios: les compositeurs de musique ´ electro-acoustique, de bande-son de films, les designers sonores, les monteurs vid´ eo; sur sc` ene: les musiciens (DJ) et vid´ eastes (VJ) qui utilisent des ´ echantillons audio-visuels: dans des mus´ ees: les visiteurs d’installations et bornes interactives, leurs concepteurs (artistes, commissaires...). Mais alors comment bien adapter l’interface utilisateur aux divers cas et domaines d’application, aux multiples profils d’utilisateurs? Plusieurs familles d’interfaces utilisateur, plus ou moins inspir´ ees par la m´ etaphore des documents sur un bu- reau, ont d´ ej` a permis de mettre en oeuvre ces syst` emes: graphiques (GUI), zoomables (ZUI), naturelles (NUI), etc... [7]. Choisir des techniques de visualisation d’informa- tion en consid´ erant leurs effets cognitifs [9] permet d’am´ e- liorer la fouille ou le “data mining” visuel dans d’autres domaines que la gestion de bases de donn´ ees multimedia.

Upload: lehanh

Post on 15-Sep-2018

216 views

Category:

Documents


0 download

TRANSCRIPT

Conception centree utilisateur de prototypes interactifspour la gestion de contenu multimedia par similarite

Christian Frisson

Universite de Mons, laboratoire TCTSBoulevard Dolez 31

7000 Mons, [email protected]

RESUMECet article presente les travaux en cours d’une recherchedoctorale visant a proposer une methodologie de con-ception centree utilisateur et de prototypage rapide afinde concevoir des applications interactives destinees a lanavigation par similarite dans des bases de donnees mul-timedia, adaptees a des cas d’utilisation divers et pro-fils d’utilisateurs varies. Les modalites d’interaction sontvolontairement restreintes a la visualisation d’informationet l’interaction manuelle. Une methode de developpementrapide, reutilisable et durable est proposee, exemplifieepar quelques prototypes a evaluer par des tests utilisateur.

MOTS CLES : Prototypage rapide, visualisation d’infor-mation, interaction gestuelle, navigation hypermedia.

ABSTRACTThis paper presents a work-in-progress of doctoral re-search aiming at defining a user-centered methodologycombined with rapid prototyping dedicated to the designof interactive applications for the navigation by similar-ity in multimedia databases, adapted to different use casesand multiple user profiles. The interaction modalities arevoluntarily restricted to information visualization and ges-tural interaction. A rapid, reusable and sustainable devel-opment method is proposed, applied in several prototypesthat are to be validated by usability tests.

CATEGORIES AND SUBJECT DESCRIPTORS: H5.m.Information interfaces and presentation (e.g., HCI): Mis-cellaneous.

GENERAL TERMS: Design, Experimentation

KEYWORDS: Rapid prototyping, information visual-ization, gestural interaction, hypermedia navigation.

Permission to make digital or hard copies of all or part of this work forpersonal or classroom use is granted without fee provided that copiesare not made or distributed for profit or commercial advantage and thatcopies bear this notice and the full citation on the first page. To copyotherwise, to republish, to post on servers or to redistribute to lists, re-quires prior specific permission and/or a fee.IHM 2010, 20-23 Septembre 2010, Luxembourg, Luxembourg.

INTRODUCTIONContexteMedia et similarite L’essor demesure des technologiesdes telecommunications et de l’information nous placedans une ere de l’explosion numerique, repoussant les lim-ites de l’acces et de la mise a disposition de divers con-tenus d’information. Les actualisations successives destermes empruntes pour decrire les systemes informatisesgerant ces multiples contenus marquent ces evolutions:“multimedia” pour plusieurs types simultanes, “hyperme-dia” pour la connectivite entre ces divers types, “crossme-dia” vers leur correlation. Face a la variete consequente,l’utilisateur a de plus en plus recours a des systemes derecommandation pour etre assiste dans ses choix, sur basede son experience et ses preferences. Mais comment in-formatiser des propositions de contenu similaire?

L’interface utilisateur au service des cas d’utilisationLa navigation et manipulation de documents multimediatouche de nombreux praticiens et amateurs:

• sur leurs appareils, mobiles ou fixes: une grande partiede la population mondiale;

• en mediatheque: les abonnes et les documentalistes;• dans leurs bureaux et studios: les compositeurs de

musique electro-acoustique, de bande-son de films, lesdesigners sonores, les monteurs video;

• sur scene: les musiciens (DJ) et videastes (VJ) quiutilisent des echantillons audio-visuels:

• dans des musees: les visiteurs d’installations et bornesinteractives, leurs concepteurs (artistes, commissaires...).

Mais alors comment bien adapter l’interface utilisateuraux divers cas et domaines d’application, aux multiplesprofils d’utilisateurs?

Plusieurs familles d’interfaces utilisateur, plus ou moinsinspirees par la metaphore des documents sur un bu-reau, ont deja permis de mettre en oeuvre ces systemes:graphiques (GUI), zoomables (ZUI), naturelles (NUI),etc... [7]. Choisir des techniques de visualisation d’informa-tion en considerant leurs effets cognitifs [9] permet d’ame-liorer la fouille ou le “data mining” visuel dans d’autresdomaines que la gestion de bases de donnees multimedia.

ProblemesDans la methode L’interaction homme-machine, inter-disciplinaire, rassemble plusieurs domaines d’expertise:le design d’interaction, l’ingenierie logicielle, l’etude dela cognition, de l’ergonomie... La navigation par sim-ilarite dans des bases de donnees multimedia est unepratique naissante issue de technologies recentes qui apeu d’analogies pre-existantes. Une equipe qui tentede proposer des systemes informatises le permettant estconfrontee a devoir supposer les attentes et besoins del’utilisateur pour pouvoir concevoir ces systemes; a moinsd’adopter, en parallele du developpement logiciel et mate-riel, d’une approche centree-utilisateur. Mais commentbien concilier ces deux voies d’expertise? Comment biendegager les genericites et specificites communes a ou dis-tinguant les divers profils et domaines? Comment soutenirun developpement logiciel et materiel qui soit rapide,reutilisable, modulaire et durable; en connaissance de cesgenericites et specificites?

Dans les domaines d’application Les dispositifs inter-actifs disponibles permettent de plus en plus de supporterplusieurs types de media, mais sans transversalite dans leclassement des medias, actuellement par type de media.

Les gestionnaires de bibliotheques multimedia sont sou-vent peu ergonomiques et pas forcement bien adaptes ala tache: des listes interminables de documents proposeesque l’on peut classer selon leurs meta-donnees et parfoisannoter avec des grades de preferences. Bien que des tech-niques de visualisations mieux adaptees apparaissent (fluxde couvertures d’album, similarite de sous-segments dumedia), elle restent encore isolees. Certains lecteurs audioagrementes de visualisations apparemment basees sur lesignal affichent une volonte de proposer une interface util-isateur agreable et engageante, pourquoi ne pas redirigerces efforts pour visualiser correctement une informationutile, en plus d’etre plaisante?

La democratisation des appareils et logiciels d’enregistre-ment, de montage et de traitement multimedia rend lafrontiere entre l’amateur et l’expert plus floue: l’interfaceutilisateur peut-elle etre adaptee a ces deux profils extremes?

OBJECTIFSChoix de restrictions de l’etendue de la rechercheL’implementation et l’optimisation des techniques d’ana-lyse et de classification basees signal sont confies aux col-laborateurs du projet permettant cette these. Toutefois, ilserait illusoire de mener a bien ces travaux sans une bonnecomprehension de l’influence de ces algorithmes.

Par multimedia nous retiendrons surtout les medias a tem-poralite (audio et video) qui ont des specificites en tantque series temporelles pour la visualisation d’information.Les donnees textuelles, pouvant faire office de documentsa part entiere, seront en premier lieu considerees unique-ment pour l’annotation semantique.

Comme modalite d’entree, nous nous concentrerons es-sentiellement sur le controle manuel, tangible, instrumen-tal; par opposition aux modalites d’entree sans contact,selon la taxonomie proposee par Saffer [8]. Nous pensonsque les experts potentiellement interesses par la gestionpar similarite de contenu multimedia ont une pratique sou-vent de longue duree et qui necessite par consequent unemoindre fatigue corporelle avec des mouvements reduits;et que la manipulation d’outils manuels fait partie de leurexperience cognitive (le controle rotatif pour la navigationau sein d’un media est present chez les monteurs videoaussi bien que chez les DJs).

En modalite de sortie, nous considererons particulierementle retour visuel par le choix de techniques de visualisationd’information adaptees en utilisant pertinemment les vari-ables visuelles selon la perception humaine [9].

Resultats attendusNous comptons proposer plusieurs prototypes adaptes ala tache et a l’utilisateur et pratiquer des tests utilisa-teur sur ces prototypes afin trouver une solution a desproblemes tels qu’augmenter la rapidite a trouver un me-dia que l’utilisateur recherche, ou assurer que l’utilisateuraura une experience attrayante avec de tels systemes.

METHODOLOGIEApproche centree utilisateurNous avons adopte une approche centree utilisateur large-ment inspiree de celle etablie par Bernsen et Dybkjaer [1]:

• mener des enquetes contextuelles aupres d’utilisateursexperts a l’aide de de questionnaires comme supportde discussion,

• proposer des solutions a travers des brainstormings enpresence de tous les collaborateurs du projet;

• produire des maquettes, storyboards... avant d’entre-prendre une implementation logicielle et materielle quipourrait s’averer inutile;

• assurer la continuite entre les divers cas d’utilisation,domaines d’application, profils utilisateurs, par la con-ception d’un environnement de prototypage rapide,modulaire et reutilisable;

• valider les prototypes produits par des tests utilisateursen situation reelle.

Developpement durableComme de nombreux produits redondants saturent lemarche sans toujours offrir de solutions originales etuniques et que la contrainte d’etre a jour decharge lesproduits en fin de vie vers les pays et populations moinsfavorises, nous voulons reduire l’impact de nos travauxde recherche sur l’environnement: en pre-evaluant desmaquettes, par prototypage rapide et reutilisable en re-adaptant des dispositifs interactifs pre-existants. Desimplementations multi-plateformes et sous licences libresdevraient permettre d’assurer aux solutions proposees unemeilleure perennite.

CONTRIBUTIONSConceptualisationVocabulaire et metaphores Un classement de la termi-nologie utilisee pour decrire des metaphores issues de casanalogues a la gestion de contenu multimedia mais noninformatises permet de degager et identifier des modesd’interaction et de suggerer des modalites d’interaction:

• a l’echelle de la base de donnees: “classer”, ”“empiler”(classer en groupes), “compiler” (retenir l’essentiel)...

• au sein d’un element: “skim” et “scrub” (parcourircursivement), “cue” (mettre des marqueurs temporels),“jist” (produire un resume)...

• conjoints: “naviguer”, “manipuler”, “annoter”...

Modes d’interaction et echelles Nous distinguons deuxmodes d’interaction: la navigation dans la base de donnees,entre elements; et la navigation au sein d’un element.

Modes de navigation dans la base de donnees Nousdiscernons deux modes de navigation: exploratoire par“clustering” avec visibilite integrale sur la bibliothequemultimedia organisee par similarite autour d’un elementchoisi comme referent; et de proches en proches par voisi-nages, partant egalement d’un referent.

PrototypesMaquettes, storyboards Les travaux de recherches dece projet sur la gestion de contenu multimedia par simi-larite ont ete demarres avant cette these avec une methodemue par l’ingenierie logicielle, avec un accent sur l’imple-mentation et l’amelioration des algorithmes d’extractionde caracteristiques du signal et de classification sur basede ces caracteristiques. Nous nous sommes cependant as-treints a preceder les implementations de l’interface util-isateur par des maquettes papier et storyboards, illustresen Figure 1, suivant l’approche centree utilisateur decriteprecedemment. Cela nous a permis de gagner du tempsde developpement et d’ameliorer notre comprehensionmutuelle des objectifs.

Name: _______Author: _______Date: _______Type: _______Tags: _____, ___

Name: _______Position: _______Tags: _____, ___

Figure 1 : Exemples de mockups et storyboards surdivers supports: papier, tableaux blanc et noir, dessinvectoriel

Framework MediaCycle, applications AudioCycle Pourimplementer nos prototypes, nous avons consolide aucours de court projets applicatifs le framework MediaCy-cle, dont les dernieres avancees sont presentees dans [3].MediaCycle a pour vocation de permettre le developpementrapide d’applications en ligne ou autonomes necessitant leclassement par similiarite de contenu multimedia (actuelle-ment: audio, images et videos, separement). Les pre-miers travaux dont il est question ici ont ete essentielle-ment bases sur l’application AudioCycle pour la navi-gation dans des bibliotheques de boucles et echantillonsaudio. Outre la variation possible sur la nature du me-dia, MediaCycle adopte une architecture modulaire, lenoyau interconnectant des composants d’extraction decaracteristiques, de classification, de visualisation, d’inter-action et de communication client/serveur.

Visualisation d’information modulaire Pour realiserles deux types de vues (exploratoires par clusters , illusteeen Figure 2 en haut; et de proches en proches, en bas),nous avons commence par emprunter des techniques exis-tantes de visualisation d’information, notamment les dia-grammes noeud-lien pour la vue par voisinages.Les algo-rithmes de classification (par clusters ou voisins), de cal-cul de position des noeuds representant chaque media, etde rendu graphique sont tous dissociables, ce qui permetde s’adapter rapidement aux contraintes d’implementationlogicielles (par exemple: choix du langage). Nous avonsporte certaines implementations d’algorithmes de visu-alisation en arbre de la librairie Prefuse1. Nous avonsegalement introduit des transitions animees [5] lors deschangements de vues et de noeuds referents car nous pen-sons que cela ameliore cognitivement pour l’utilisateur saperception progressive de la nature de la base de donneemultimedia et de son historique de navigation.

Figure 2 : Exemples de visualisations en modes ex-ploratoire (haut) et de proches en proches (bas) d’unebase de donnees de boucles audio avec AudioCycle.

Prototypage rapide et interaction gestuelle Pour lecontrole manuel de la navigation dans la base de donneeset la manipulation d’elements de cette base, nous avonscommence par tester des dispositifs du marche (“off-theshelf”) qui proposaient un controle rotatif et/ou dans unespace 2D/3D. Bien que de plus en plus de boıtes a outilsdediees au prototypage rapide d’interaction multimodale

1http://www.prefuse.org

sont disponibles [2], nous avons choisi l’environnementde programmation visuelle de traitement de signal Pure-Data2, comme explique dans [4], car cette boite a outilsmulti-plateforme et sous licence libre permet: d’explorerles dispositifs HID (Human Interface Device), d’en fil-trer les evenements, et de communiquer par reseau avecd’autres applications. Nous avons par consequent imple-mente un support client / serveur du protocole Open-SoundControl3 dans le framework MediaCycle et definiun namespace classifiant les differentes actions de l’utili-sateur selon les modes d’interaction, augurant de futuresapplications multi-utilisateur et multi-dispositifs. Nousavons pour l’instant concu trois prototypes: (1) la combi-naison traditionnelle souris et clavier “WIMP”, amelioreepar une surface de contact multi-doigts; (2) un controlebimanuel de la navigation de la base par une souris 3D etdans un element par une molette rotative, illustre en Fig-ure 3; (3) une variante a retour d’effort, avec une souris3D a 3 degres de liberte.

Figure 3 : Interaction bimanuelle et assignation: navi-gation a la main gauche (souris 3D) et manipulation a lamain droite (controleur rotatif).

PERSPECTIVESRenforcer l’expression de la similarite par l’annotationPour consolider la representation de la base de donnees,nous comptons allier les algorithmes de traitement de sig-nal a des techniques d’annotation semantique, vers uneclassification semi-automatique, plus proche de l’utilisateur.

Affiner et diversifier l’interactionNous comptons etudier des methodes d’interaction collab-oratives, pour proposer par exemple une application derecherche multi-utilisateur dans une mediatheque. Pourmieux adapter l’interaction aux souhaits de l’utilisateur etsa morphologie, nous avons commence a re-adapter lesdispositifs d’interaction testes.

Rendre le prototypage infovis plus rapideOutre la possibilite de changer de vue et de technique devisualisation au sein d’une vue, nous evaluerons commentmodeler les scenarios de fouille visuelle et les program-mer visuellement, similairement a VisTrails4.

2http://www.puredata.info3http://www.opensoundcontrol.org4http://vistrails.org

Valider les prototypes par des tests utilisateursIl est necessaire de valider et ameliorer nos prototypespar des tests utilisateurs, qualitatifs a l’aide de question-naires de satisfaction [6] pour evaluer des facteurs commela “pleasurability”; quantitatifs, notamment la rapidite atrouver un media cible. Nous pensons que retablir le re-tour d’effort dans l’interaction gestuelle informatisee de-vrait permettre d’accroıtre ces deux criteres.

Enquete contextuellesDes enquetes contextuelles visant le design sonore et lesperformances DJ sont en cours pour preciser les besoinsou attentes d’utilisateurs potentiels.

REMERCIEMENTSCe travail a ete finance par la Region Wallonne, Belgique,a travers numediart5, programme de recherche autour destechnologies des arts numeriques (financement 716631).

PROMOTEURSThierry Dutoit, Universite de Mons.Jean Vanderdonckt, Universite catholique de Louvain.

BIBLIOGRAPHIE1. Bernsen, N. O., and Dybkjaer, L. Multimodal Usabil-

ity. Springer, 2009.

2. Dumas, B., Lalanne, D., and Oviatt, S. HumanMachine Interaction, volume 5440 of LNCS, chapterMultimodal Interfaces: A Survey of Principles, Mod-els and Frameworks, pages 3–26. Springer, 2009.

3. Dupont, S., Frisson, C., Siebert, X., and Tardieu, D.Browsing sound and music libraries by similarity. In128 AES Convention, London, UK, May 22-25 2010.

4. Frisson, C., Dupont, S., Siebert, X., Tardieu, D.,Dutoit, T., and Macq, B. DeviceCycle: rapid andreusable prototyping of gestural interfaces, appliedto audio browsing by similarity. In Proceedingsof the New Interfaces for Musical Expression++(NIME++), Sydney, Australia, June 15-18 2010.

5. Heer, J., and Robertson, G. Animated transitions instatistical data graphics. In IEEE Information Visual-ization (InfoVis), 2007.

6. Lewis, J. R. IBM computer usability satisfactionquestionnaires: Psychometric evaluation and instruc-tions for use. International Journal of Human-Computer Interaction, 7, 57-78., 7:57–78, 1995.

7. Moggridge, B. Designing Interactions. The MITPress, 2007.

8. Saffer, D. Designing Gestural Interfaces. O’ReillyMedia, Inc., 2009.

9. Ware, C. Visual Thinking: for Design. InteractiveTechnologies. Morgan Kaufmann, 2008.

5http://www.numediart.org