lille by inria n°5 : la santé à l'ère du numérique

24
FOCUS > GRID'5000 : L'INFORMATION DISTRIBUÉE À GRANDE ÉCHELLE BD > MIXTCOMP : CLASSIFICATION & PRÉDICTION FOCUS > GUESS WHAT ?! QUAND L’HUMAIN JOUE, L’ORDINATEUR S’INITIE AU LANGAGE #05 LE MAGAZINE DU CENTRE INRIA LILLE - NORD EUROPE JUIN 2017 LA SANTE À L'ÈRE DU NUMÉRIQUE DOSSIER

Upload: inria

Post on 22-Jan-2018

610 views

Category:

Science


0 download

TRANSCRIPT

focus >

Grid'5000 :l'information distribuée à Grande échelle

BD >

mixtcomp : classification& prédiction

focus >

Guess what ?!quand l’humain joue,l’ordinateur s’initieau lanGaGe

#05

LE MAGAZINE DU CENTRE INRIA LILLE - NORD EUROPE

juin 2017

la santeà l'ère du numérique

DossieR

eDito

C’est avec un très grand plaisir que je rédige pour la première fois l’édito du magazine « Lille by Inria », dont le dossier thématique est consacré à la santé. L’avancée des connaissances dans ce domaine implique fortement les sciences du numérique, par exemple en analyse de données, en imagerie, en modélisation numérique… Inria et son centre Lille – Nord Europe en ont fait une de leurs priorités stratégiques, comme en témoignent l’accord-cadre signé avec l’Institut Pasteur de Lille et l’accord-cadre sur les plates-formes en biologie santé de la métropole lilloise. Comme vous le savez, chacune de nos 16 équipes-projets et équipes de recherche est spécialisée dans un domaine de recherche : robotique, réseaux et objets connectés, traitement des données… mais aussi sur un ou plusieurs sujets applicatifs. Ce magazine vous permettra de découvrir les travaux, menés par les chercheurs des équipes-projets du centre Inria Lille – Nord Europe, afin de faire progresser la recherche scientifique dans le domaine de la santé.

Dans ce numéro, j’ai également souhaité mettre en avant l’infrastructure nationale Grid’5000, qui permet de réaliser des expérimentations numériques pour les systèmes distribués, le cloud et le big data. Dans le cadre du Contrat de Plan État-Région (CPER) « Data », porté par Inria, plus d'un million d'euros est investi sur le nœud lillois de Grid’5000 sur une période de quatre ans. Une jouvence de l’infrastructure Grid’5000 a ainsi été réalisée en mars avec l’arrivée de nouveaux clusters de calcul.

Dernier sujet d’importance : l’année 2017 célèbre les 50 ans d’Inria, créé en 1967 sur le site de Rocquencourt. Pour célébrer cet anniversaire, je vous invite le 5 octobre prochain au « Forum numérique 2067 », que nous organisons à la Plaine Images. Ce forum sera l’occasion d’imaginer ensemble le monde numérique des 50 prochaines années, dans un jeu de prospective collective. En décembre, un numéro spécial du magazine « Lille by Inria » reviendra sur cet événement.

Dès à présent, je vous souhaite à tous et toutes une très bonne lecture de notre magazine et un très bel été.

Isabelle HERLIN

02

03

sommaiRe

Dessine-moi la RecheRche 12-13

focus 14-15• Grid'5000

focus 16-17• Guess What ?!

Best-of 18-19

poRtRait 20-21

RenDez-vous 22

contact 23

DossieR

• La santé à l'ère du numérique

07-11

face a face• Patrick Berche 04• Dominique Tierny 05

mots cles 06

03

Semestriel édité par Centre de recherche Inria Lille - Nord Europe : Parc scientifique de la Haute Borne, 40, avenue Halley. Bât. A, Park Plaza, 59650 Villeneuve d’Ascq. [email protected]. Directeur de la publication : Isabelle Herlin. Rédactrice en chef : Marie-Agnès Enard. Coordinatrice : Marion Blasquez. Conception graphique et mise en page : Élise Cattoire agence KaméléCom, 11/1 sentier du Christ, 59960 Neuville-en-Ferrain. Rédacteurs : Franck Deflandre agence KaméléCom et service communication et médiation Inria Lille - Nord Europe. Crédits photos : Crédits photos : © Inria / Photo Kaksonen - Inria / Photo C. Morel - Inria / Photo G. Scagnelli - Inria / Photo M. Blasquez - Inria / Photo P. Caron - Inria / Photo N. Fagot. © Fotolia. Impression : C&P Partenaires Conseil - 03 20 27 11 89. Le centre remercie chaleureusement l’ensemble des contributeurs / contributrices et partenaires de ce cinquième numéro de Lille by Inria. Imprimé en juin 2017 - Série limitée à 1000 exemplaires.

04

> Quels sont, selon vous, les grands enjeux à venir autour de la santé et du numérique ?

La gestion de données de plus en plus volumineuses représente un enjeu très important dans le domaine des sciences du vivant. Il faut être capable de les

analyser, de les traiter et de les stocker pour pouvoir comprendre le génome de l’homme et des êtres vivants. En biologie, le séquençage ADN réalisé par certains instituts peut en effet gé-nérer quotidiennement des téraoctets de données.

L’ intégration de l ’ensemble des données de la recherche biomédicale représente un autre enjeu essentiel. Le développement des technologies « omiques » et les essais cliniques génèrent un nombre de résultats croissant qui ont pour but d’améliorer le diagnostic, d’élaborer des stratégies préventives mais aussi de mettre au jour des phénomènes imperceptibles. Le domaine de l’imagerie médicale et cellulaire, qui s’automatise de plus en plus, est également concerné puisqu’il faut désormais d’énormes puissances de calcul pour pouvoir analyser les données et suivre l’évolution des effets biologiques.

Enfin, les technologies du numérique sont aussi exploitées pour la mo-délisation et le design de nouveaux médicaments et vaccins, ou encore des épidémies.

Toutes ces évolutions ont généré des volumes de données tellement énormes qu’elles créent des goulots d’étranglement qu’il est impératif de surmonter. Cela passe par une col-laboration étroite entre biologistes, statist ic iens , informatic iens et mathématiciens.

> Quelle place les sciences du numé-rique ont-elles au sein de l’Institut Pasteur de Lille ?

Nous développons actuellement un projet qui nécessite un important volet numérique dans les domaines de la génomique, l’imagerie et le design de molécules. Il s’agit d’un travail de recherche que nous menons sur la lon-gévité, centré sur les problématiques des maladies du vieillissement et de leur prévention. Ce projet rassemble les 6 unités de recherche, en co-tutelle avec l’Université et le CHRU de Lille, l’Inserm et le CNRS. Chez nous, la place des sciences du numérique est surtout liée aux activités de recherche dans le domaine de la génomique et de l’imagerie cellulaire.

> Quel regard portez-vous sur les initiatives communes entre Inria et l'Institut Pasteur de Lille ?

Je suis très heureux que nous ayons signé un accord de coopération qui favorise la mise en place de projets communs. La complémentarité entre les équipes de recherche de l’Institut Pasteur de Lille et d’Inria est évidente.

Certaines questions soulevées par les biologistes peuvent être résolues grâce aux sciences du numérique. En effet, les chercheurs d’Inria créent des concepts d’analyse, d’outils et d’algo-rithmes, pour extraire l’information de très grands volumes de données complexes, et définissent des modèles appropriés au domaine de la santé. Il faut continuer à favoriser le dialogue entre nos deux mondes pour ouvrir encore de nouvelles perspectives à la recherche.

º pasteur-lille.fr

// face a face

inteRviewspatrick berche > directeur-Généralde l’institut pasteur de lille

#05 juin 2017 05

dominique tierny >docteur vétérinaire, présidente déléGuée du pôle de compétitiviténutrition, santé et lonGévité

> Quelle place les sciences du numérique ont-elles au sein du pôle Nutrition, Santé et Longé-vité ?

Les sciences du numérique s’imposent progressivement et assez naturellement dans

notre pôle comme dans la sphère santé de manière plus générale. Elles permettent par exemple d’exploiter un nombre important de données afin d’optimiser encore le pilotage d’essais cliniques. Le domaine de la santé n’échappe pas non plus à l’avènement des objets connectés qui contribue à l’amélioration de la prise en charge des patients et de l’observance de traitements. Dans la sphère longévité, le numérique a permis de développer des outils pour prolonger l’autonomie des personnes âgées et favoriser leur maintien à domicile dans leur cadre de vie habituel (détecteurs de chute, cap-teurs de présence). Enfin, il est aussi devenu incontournable sur le thème de l’agroalimentaire-nutrition. Notre pôle accompagne le développement de solutions dans la sphère agro et agritech : les acteurs du réseau et leurs partenaires travaillent à l’intégration des capteurs permettant l’optimisa-tion des cultures et le pilotage des intrants. Les domaines de la santé et des TIC-numérique sont au cœur de plus en plus de projets communs développés par des services R&D d’acteurs innovants. Il est devenu essentiel pour nous de rester connecté avec d’autres pôles de compétitivités

experts dans les domaines du numé-rique (CapDigital, Systématic).

> Quels sont, selon vous, les grands enjeux à venir autour de la santé et du numérique ?

Le numérique est un vecteur d’amé-lioration de l’offre de soins et de la qualité de vie des citoyens, d’optimi-sation de la couverture territoriale, de renforcement de la coordination entre les acteurs, et d’économies budgétaires. D’un côté, les patients peuvent plus facilement prendre en charge leur suivi médical et peuvent bénéficier de solutions de téléméde-cine, une forme de pratique médicale à distance, particulièrement adaptée aux déserts médicaux. De l’autre, les professionnels peuvent désormais disposer d’outils, comme le dossier médical électronique, qui améliorent la prise en charge et favorisent une

meilleure coordination des soins. Les sciences du numérique offrent égale-ment de nouvelles perspectives aux administrations et aux organismes payeurs. Des outils qui traitent les données relatives aux soins délivrés et aux traitements suivis permettent de mieux maîtriser les dépenses de santé. > Quel regard portez-vous sur les initiatives communes entre Inria et le pôle NSL ?

Elles sont indispensables. Inria s’implique à nos côtés depuis 2008. Nos compétences complémentaires ont déjà permis de mener à bien des projets concrets. Des équipes Inria ont par exemple déjà travaillé avec les sociétés Florimond-Desprez et Gènes Diffusion dans l’optimisation des process de sélections variétales végétales et animales, via l’usage du BigData et de la bioinformatique.

º pole-nsl.org

6

// mots cles

Génétique Génomique

maladies infectieuses viroloGie

maladies neuro-déGénératives

PharmacoloGie et toxicoloGie

maladies métaboliqueséPidémioloGie

assistance aux Personnes âGées

handicaP sensori-moteurs

instruments médicaux

résistance aux médicaments

chirurGie motricité

cancerimmunoloGie

Plusieurs équipes de recherche du centre Inria Lille - Nord Europe travaillent sur les thématiques suivantes :

#05 juin 2017 0707

la sante a l'eRe Du numeRique 08-09

un nouveau cap

pouR la plate-foRme Bilille 09

tRavaux De RecheRche 10

zoom suR le logiciel viDjil 11

sommaiRe

DossieR \\

la santeà L'ère Du numérique

08

// DossieR > santé

Les sciences du numérique ont fait entrer la médecine dans une nouvelle ère. Chiffre symbole de cette évolution en marche, actuellement près d'une équipe-projet Inria sur cinq mène des recherches

sur des sujets directement liés au domaine de la biologie-santé. En y ajoutant celles qui travaillent sur des thèmes comme les statistiques, le calcul numérique ou la robotique - sujets également exploités pour des applications en médecine, chirurgie et biologie - on s’aperçoit que la santé fait actuellement partie des enjeux pour près de la moitié de nos 172 équipes-projets.

Dans ce domaine, la stratégie d’Inria est nécessairement menée en concertation très étroite avec les acteurs publics et privés. On peut citer quelques exemples qui sym-bolisent cette stratégie comme nos trois équipes communes Inria-In-serm, nos partenariats avec les IHU (Instituts Hospitalo-Universitaires) ou l’accord-cadre en cours d'élaboration avec l'AP-HP (Assistance Publique - Hôpitaux de Paris) qui permet d’ac-cueillir des médecins en formation

recherche dans des équipes-projets Inria. Les collaborations sont aussi nombreuses avec les grands indus-triels du domaine de la santé mais aussi avec des PME et des start-up dans le cadre des dispositifs Inria Innovation Lab et LabCom, dont l’ob-jectif est de favoriser le transfert des résultats des recherche.

la modélisation numérique au service de la santé

Dans le domaine de la santé, plu-sieurs chercheurs membres d’équipes-projets Inria offrent de nou-velles approches en mathématique et en informatique pour la conception de modèles numériques très précis. Il s’agit de nouveaux outils pour les médecins, les chirurgiens ou les spé-cialistes destinés à la formation, la prévention, au diagnostic ou à l’ac-tion thérapeutique, qu’il est possible d’adapter individuellement à chaque patient. La construction de ces modèles permet de mieux connaître le corps humain et de mieux com-prendre l’évolution de certaines pathologies grâce à la simulation numérique. À ces modèles, peuvent être incorporées des composantes

très précises au niveau physiolo-gique pour les rendre très réalistes et éventuellement pouvoir les adapter aux cas individuels. Dans le traite-ment des pathologies cardiaques par exemple, les sciences du numérique permettent de modéliser en détail le cœur mais également le système cardiovasculaire. À partir de ces modèles, les médecins peuvent réali-ser des simulations en tenant compte des processus physiologiques et ainsi tester différentes hypothèses.

un nouvel environne-ment numérique pour la chirurGie et l'assistance à la personne

Grâce à certaines solutions dévelop-pées par nos scientifiques dans les domaines de la simulation numé-rique, de la réalité augmentée ou de la création d’interfaces, les sciences du numérique se mettent directement au service du travail des médecins et des chirurgiens. Un simulateur mis au point sur la plate-forme SOFA permet par exemple aux chirurgiens de vi-sualiser et naviguer à l’intérieur des vaisseaux sanguins pendant une opé-ration de résection locale de tumeur. Inria travaille sur d’autres axes de recherche essentiels comme l’assis-tance à la personne en situation de handicap physique ou cognitif, en ré-habilitation ou en situation « normale » (suivi et prévention).

Dans ce cas également, les sciences du numérique fournissent des modèles pour recueillir une mul-titude de données, formaliser les raisonnements nécessaires à son interprétation et mettre en œuvre les meilleurs traitements.

la sante

à l'ère du numérique

#05 juin 2017 09

Avec la signature de l’accord-cadre des plates-formes en biologie santé de la métropole lilloise, la plate-forme de service bilille, labellisée par les deux programmes investissements d'avenir Institut Français de Bioinfor-matique et France Génomique depuis 2013, est entrée dans une nouvelle dimension. C’est désormais une plate-forme fédérative multi-organismes (Université de Lille, CNRS, Inserm, Inria, Institut Pasteur de Lille, CHRU Lille et Institut pour la Recherche sur le Cancer de Lille) qui s’adresse à tous les laboratoires en biologie et santé de la métropole lilloise. Son péri-mètre d’actions couvre l’ensemble des activités en bioinformatique et biostatistique liées à l’analyse de données biologiques. Cela comprend

le soutien à des projets scientifiques avec l’aide des ingénieurs de la plate-forme, l’acculturation des chercheurs à la bioinformatique et à la biostatis-tique avec l’organisation de journées scientifiques, de séminaires techno-logiques, de cycles de formations, la mise à disposition de moyens de calcul à haute-performance et la mise à disposition d’un serveur web Galaxy dédié à l’analyse de données omiques. L’enjeu est d’aider les labo-ratoires de recherche en biologie et santé à accomplir leur transition vers le traitement numérique des données biologiques massives, telles que les données de séquençage, de protéo-mique, d’imagerie cellulaire, ...

Inria accompagne cette belle dyna-mique avec la participation active de chercheurs des équipes-projets Modal et Bonsai, et en prenant part à l’organisation de journées scienti-fiques thématiques deux fois par an. bilille forme un pont très fructueux entre la recherche en biologie-santé et la recherche en sciences du numé-rique menée chez Inria pour poser de nouvelles questions de recherche interdisciplinaires et ouvrir de nouvelles collaborations.

Un autre axe de développement de bilille concerne l'ouverture vers les acteurs industriels locaux du domaine de la santé, de l'agro-alimen-taire et des biotechnologies, où toute forme de partenariat est à étudier.

un nouveau cappour la plate-forme bilille

la santé vue par inria lille - nord europe

Si le centre Inria Lille - Nord Europe s’investit dans le domaine de la santé, ce n’est pas seulement à travers les travaux de recherche de ses équipes-projets. En effet, une stratégie plus globale a été définie avec la signature de partenariats ou d’accords-cadres avec des acteurs de poids en région Hauts-de-France. Inria et l’Institut Pasteur de Lille ont ainsi décidé de relever ensemble certains défis. Avec chacun leurs compétences spécifiques et très dif-férentes, les deux instituts doivent faire face à de nouveaux enjeux communs en matière de santé. La signature d’un accord-cadre de par-tenariat transdisciplinaire résonnait donc comme une évidence. Une meilleure compréhension de cer-taines maladies, le développement de nouveaux vaccins et médicaments ou encore la définition de nouvelles stratégies thérapeutiques ou de pré-vention, nécessitent une approche

pluridisciplinaire des recherches. Santé et sciences du numérique se retrouvent donc très logiquement autour de certains sujets d’investi-gation comme la comparaison de génomes, le traitement des données, ou la modélisation d’épidémies ou des mécanismes métaboliques. Concrètement, la collaboration a déjà commencé à travers des projets lancés en commun entre des équipes du campus de l’Institut Pasteur de Lille et des équipes-projets Inria sur des thèmes de recherche à la frontière entre la santé et le numé-rique comme la bioinformatique, la biologie intégrative ou l’apprentissage automatique.

Récemment, le centre Inria Lille - Nord Europe a également signé un autre accord-cadre commun avec une série d’acteurs régionaux de la santé (Université de Lille - sciences et technologies, Université de Lille - droit et santé, Inserm, CNRS, CHRU, Institut Pasteur de Lille, Institut pour la recherche sur le cancer de Lille),

qui ont tous mutualisé leurs moyens, pour le développement de plates-formes en biologie-santé. Toutes regroupées sur la métropole lilloise, elles représentent des ressources technologiques de haut niveau pour la communauté scientifique au service de projets de recherche dans sept thèmes spécifiques : ressources expérimentales, bioinformatique et bioanalyse, génomique, imagerie cellulaire, imagerie du vivant, protéo-mique et spectrométrie de masse et résonance magnétique nucléaire et résonance paramagnétique électro-nique. Ces plates-formes disposent d’équipements de pointe mais aussi de l’expertise de techniciens ingé-nieurs et chercheurs. Tout comme la collaboration entre Inria et l’Institut Pasteur de Lille, elles contribuent au développement d’un pôle d’excel-lence scientifique local avec un fort rayonnement international.

10

Algorithme de détection des erreurs de séquençage dans les données ADN de patients atteints de cancer, afin d'identifier les vrais variants et poser un meilleur diagnostic.> équipe-projet Bonsai

Étude de la motricité fine de personnes atteintes de la maladie de Parkinson par analyse de mouvements effectués quo-tidiennement à la souris ou sur un pavé tactile.> équipe de recherche mjolnir

Stratification de patients et sélection de marqueurs pour approfondir les connais-sances en biologie moléculaire, offrir des traitements personnalisés ou identifier des parcours type du patient à l'hôpital.> équipe-projet modal

Automatisation d’un processus de re-cherche biologique par apprentissage actif : création d'agents artificiels intelligents (robots, programmes) capables de choisir et d’exécuter les prochaines expérimentations qu’ils auront jugées optimales par rapport à un objectif donné. Ainsi, on espère créer des laboratoires « intelligents » où les instruments automatiques et les humains collaborent plus efficacement.> équipe-projet magnet. recherche me-née au sein de la Katholieke universiteit leuven

Utilisation de la technologie "Body Area Network" de réseaux sans fil qui consiste à interconnecter par des modèles de canaux ad-hoc, sur/autour/dans le corps humain de minuscules dispositifs (capteurs) pouvant effectuer des mesures, collecter des données, ou réaliser des actions en conséquences, et créer un modèle cohérent de communication entre ces capteurs.> équipe-projet Fun

Décryptage de la diversité de la flore intes-tinale pour comprendre son influence sur notre santé et notamment sur nos fonctions digestives, métaboliques, neurologiques et immunitaires.> équipe-projet Bonsai

Étude sur la détection du stress d’un individu grâce à l’analyse des signaux électriques provenant d’un bracelet, notamment la conductance cutanée.> équipe-projet non-A

Visualisations interactives permettant l’analyse approfondie de phénotypes visant à améliorer les connaissances de maladies génétiques (manifestations et développement), et offrir un support aux médecins pour un meilleur pronostic et diagnostic de telles maladies.> équipe de recherche mjolnir

Développement de Nor ine , l 'unique plate-forme logicielle dédiée aux peptides non-ribosomiques, des molécules naturelles utilisées, par exemple, comme antibiotiques (pénicilline, daptomycine) ou en prévention du rejet de greffes (ciclosporine). Norine facilite la découverte de nouveaux médica-ments ou d'autres produits naturels actifs comme des biopesticides.> équipe-projet Bonsai

Amélioration et automatisation, grâce à des techniques de machine learning, de l’analyse des protéines par spectrométrie de masse (détection et l'identification de molécules par leur masse et la caractérisation de leur structure chimique). Application à l’identifi-cation ou le suivi de maladies.> équipe-projet magnet. recherche me-née au sein de la Katholieke universiteit leuven

// DossieR > santé

tRavaux De RecheRche

en santé

DossieR > santé \\

11 #05 juin 2017

Les globules blancs sont les cellules contribuant à notre défense immu-nitaire au quotidien. mais parfois certaines de ces cellules deviennent hors de contrôle : elles sont cancé-reuses et provoquent une leucémie. en 2015, le premier numéro de Lille by inria présentait le logiciel Vidjil de l'équipe-projet Bonsai spécialisée en bioinformatique. Vidjil analyse les séquences ADn des globules blancs pour mieux suivre l 'évolution de leucémies ou mieux comprendre la réponse immunitaire. Deux ans après, où en est ce projet ?

Début 2015, le CHru de Lille com-mençait à utiliser Vidjil au diagnostic pour identifier les séquences ADn des globules blancs cancéreux de tous les patients atteints de leucé-mies aigues lymphoblastiques (LAL).

Depuis, trois autres hôpitaux français (à Paris et Toulouse) ont suivi les traces du CHru de Lille. Aujourd'hui, en 2017, la majorité des patients atteints de LAL en France ont leur échantillon de sang analysés par séquençage haut-débit et avec Vidjil. Vidjil est également utilisé pour une autre forme de leucémie : la leucémie lymphocytique chronique, touchant davantage les adultes âgés, ce qui a conduit à des adaptations pour répondre aux besoins des biologistes et médecins sur cette pathologie. D'autres laboratoires autour du monde (europe, Asie, Amérique) ont recours à Vidjil. Le logiciel a ainsi été lancé plus de 20 000 fois depuis 2015 pour analyser plus de 35 milliards de séquences ADn.

Le recul qu’a désormais l’équipe- proje t Bonsai sur la prat ique hospitalière ouvre de nouvelles questions théoriques pour la gestion de ces masses de données ou pour mieux comprendre l'évolution des cellules cancéreuses au cours du temps (thèses en cours ou à venir). L’équipe réfléchit aussi à transférer les activités de développement, de maintenance et d'administration de l'application web dans une structure au service de tous les usagers.

º vidjil.org

tRavaux De RecheRche

en santézoom suRle loGiciel vidjilun logiciel bioinformatiquepour mieux diagnostiquer les leucémies

12

// Dessine-moi la RecheRche

13 #05 juin 2017

14

Les nouvelles applications logi-cielles développées nécessitant des puissances de calcul de plus en plus importantes, il est essentiel pour les chercheurs de disposer d’outils toujours plus performants. Soutenue par Inria, le CNRS, différents

conseils régionaux et Universités, la plate-forme Grid’5000 offre à ses uti-lisateurs un environnement idéal pour des travaux autours de la recherche expérimentale sur l’informatique pa-rallèle distribuée à grande échelle, comme le Calcul Haute Performance, le cloud computing et le big data. L’objectif est de permettre aux cher-cheurs de relever de nouveaux défis scientifiques et de traiter des pro-blèmes de très grandes tailles, dans des domaines tels que l’intelligence artificielle, beaucoup plus rapidement qu’auparavant. Grid’5000 réduit en effet à quelques heures la résolution de calculs qui pourraient prendre des années sur une seule machine. Ce

n’est pas là le seul atout de cette plate-forme qui peut s’appuyer sur des ressources réparties sur 8 sites en France et au Luxembourg. « Elle favo-rise les synergies entre les équipes de recherche en informatique et le montage de projets de collabora-tion multi-sites » , précise Nouredine Melab, responsable scientifique pour le site lillois de Grid’5000 et chercheur dans l’équipe de recherche Dolphin du centre Inria de Lille.

poursuivre le dévelop-pement Grâce au finance-ment cper data

Avec un nouveau financement, de plus d’un million d’euros* dans le cadre d’un Contrat de plan État-Ré-gion (CPER) « Data » porté par Inria, la plate-forme franchit un nouveau cap. Grid’5000 s’apprête notamment à favoriser encore davantage la trans-formation des résultats des travaux des équipes de chercheurs en innova-

tions, pour répondre à la mission de transfert inhérente à Inria. « Le but est de développer la recherche autour de la science des données en lien avec le tissu économique régional via, entre autres, des laboratoires com-muns Inria-Entreprises » . Ce finan-cement va aussi permettre de favo-riser une recherche de qualité et de lui donner une dimension plus interna-tionale en privilégiant trois secteurs : l’internet des objets, l’intelligence des données et des connaissances et le calcul haute performance. L’attracti-vité d’Inria, sa capacité de transfert vers les PME, ses démonstrateurs et ses infrastructures de recherche re-présentent déjà de puissants leviers pour ces domaines de recherche. L’intégration prochaine d’accéléra-teurs graphiques, de coprocesseurs et d’un cluster de stockage doivent encore faire évoluer la plate-forme qui compte déjà 600 utilisateurs chaque année.

gRiD'5000ou l’informatique distribuéeà Grande échelle

// focus > plate-forme d'expérimentation

Depuis le 1er mars dernier, le centre Inria Lille - Nord Europe abrite Grid’5000, une plate-forme d’expérimentation pour les systèmes distribués qui permet de tester des concepts de logiciels très pointus grâce à une incroyable puissance de calcul et une capacité de stockage très importante.

* Financements du FEDER (Fonds Européen de Développement Régional) et du Ministère de l’Enseignement supérieur et de la Recherche.

Gr

id'5

00

0

15 #05 juin 2017 15 #05 juin 2017

un outil de formationultra-performantDepuis 2005, Grid’5000 a déjà permis de former 500 étudiants de l’Université Lille - sciences et tech-nologies à l’utilisation de cluster et à la programmation parallèle. Ces élèves en master informatique et en master « calcul scientifique » ont pu exploiter la plate-forme dans le cadre de travaux pratiques pour encore parfaire leur spécia-lisation. De plus, depuis 2005, de jeunes ingénieurs assurent l’administration système et réseau de Grid’5000 sur le site lillois. « Ces ingénieurs que nous formons sur deux ans deviennent de véritables experts dans leur domaine et s'in-sèrent très bien dans le privé ou le public par la suite » , souligne Nouredine Melab.

Dans le futur, la plate-forme devrait permettre de relever plusieurs défis. « Le premier est scienti-fique. Grid’5000 doit permettre de répondre aux changements significatifs d’échelle des appli-cations. Il faudra aussi mettre en

place des mesures pour favoriser le transfert des recherches déve-loppées autour de Grid’5000 au service du transfert technologique et de la société » .

Un rapprochement avec FIT (Future Internet of Things), une plate-forme dédiée aux tests des technologies liées aux objets connectés est en route. Selon Frédéric Desprez, directeur scientifique de Grid’5000, cela devrait permettre à l’avenir de disposer d’un grand instrument nommé SILECS pour s’attaquer, avec beaucoup d’ambition, à tous les défis scientifiques de l’Internet des objets, des centres de données et des réseaux les reliant. Cette plate-forme expérimentale poly-valente préfigurera, à une échelle réaliste, les infrastructures qui seront déployées demain afin de tester les modèles, les algorithmes et les langages.

16

// focus > machine learning

avec guesswhat ?! quand l’humain joue,l’ordinateur s’initie au lanGaGe

repérer un é lément d ’une image en posant une série de questions.

C’est l’objet de GuessWhat ?!, un jeu interactif créé par des chercheurs de l’équipe-projet Sequel, en collaboration avec une équipe canadienne. Plus qu’un simple jeu, il s’agit d’un véritable défi technique : ap-

prendre à un ordinateur à dialoguer naturellement à partir d’une image. les premiers résultats, prometteurs, ont valu à l’équipe une publication au très prestigieux CVPr, la plus grande conférence internationale dans le domaine de la vision.

« En machine learning, travailler uniquement sur des images ou sur du texte est assez classique. C’est lorsque l’on commence à mélanger les deux que les choses se compliquent. Et pourtant, image et texte sont intrinsèquement liés » , indique Florian Strub, doctorant au sein de l’équipe-projet Sequel du centre Inria de Lille (commune avec le CNRS, l'Université de Lille − sciences et technologies et l'Université Lille − sciences humaines et sociales*). Depuis un an l'équipe travaille, en collaboration avec l’Université de Montréal sur un projet de recherche en machine learning qui implique image et dialogue. Financé dans le cadre du projet international IGLU (programme CHIST-ERA), l’objectif

est de montrer que le langage s'apprend en interagissant avec le monde extérieur. Pour ce faire, les chercheurs avaient initialement envi-sagé un cas pratique : la conception d’un robot assistant cuisinier. « Nous devions travailler sur l’interaction avec le robot » , précise Florian Strub, doctorant au sein de l’équipe Sequel. « Par exemple, il fallait qu’il com-prenne des consignes telles que : " Prends la cuillère dans le troisième tiroir à gauche ". L’ordinateur devait donc apprendre à compter et à se repérer dans son environnement. » C’est alors que les chercheurs ont eu l’idée de développer cet apprentis-sage à partir d’un jeu : GuessWhat ?!

Le principe : deux utilisateurs jouent ensemble, le premier sélectionne un objet dans une image, le second doit trouver l’objet en posant une série de questions : est-ce que l’objet est rouge ? Est-ce qu’il est à droite de l’image ? Est-ce que c’est une voiture ? Et ainsi de suite... Pour les chercheurs, l’objectif est de recueillir un maximum de parties jouées pour que l’ordinateur apprenne à son tour à poser les questions. « Les concepts de gauche et droite, de dénombre-ment ou même les couleurs sont des choses naturelles pour nous. Et pourtant, nombreux sont les modèles informatiques qui échouent à cette tâche. Avec GuessWhat ?!, nous construisons un environnement où l’ordinateur n’a d’autre choix que

d'utiliser ces concepts pour réussir. Plus difficile encore, il doit combiner les notions acquises pour développer une suite de questions cohérente et retrouver l’objet caché. »

L’apprentissage automatique, c’est précisément l’expertise de Sequel. Les chercheurs de cette équipe-projet du centre Inria de Lille développent des al-gorithmes permettant de résoudre des problèmes séquentiels (par exemple une suite de questions) avec une méthode dite, de renforcement, c’est-à-dire en ayant une récompense à la fin. Avec GuessWhat ?!, la récompense est claire : retrouver l’objet caché dans l’image.

Pour autant, le traitement de l’image reste un problème à part entière. C’est pourquoi, dès le début du projet, les chercheurs de Sequel ont collaboré étroitement avec le laborato i re MIL A (Montreal Institute for Learning Algorithms). « Il s’agit du plus grand laboratoire de recherche en matière de deep learning appliquées aux images, précise Harm de Vries, étudiant de l’Université de Montréal participant au projet. Notre expertise, ce sont les systèmes de vision par ordinateur à grande échelle. L’équipe Sequel, elle, s’intéresse aux systèmes de dialogue. Ces deux compétences sont essen-tielles pour avancer dans le projet GuessWhat ?! »

Gu

es

s w

ha

t ?

!

17 #05 juin 2017

* au sein de l'UMR 9189 CNRS-Centrale Lille-Université de Lille − sciences et technologies, CRIStAL.

Le projet se déroule en trois phases. Les chercheurs ont d’abord recueilli des informations lors de 150 000 par-ties jouées en ligne par des humains. Puis, à partir de ces données, ils ont entrainé un ordinateur à poser des questions en imitant un humain. Le projet en est désormais à sa troisième phase : l’ordinateur joue lui-même à une infinité de jeux. Il pose les ques-tions au fur et à mesure et apprend de ses erreurs. « Au début les questions de l’ordinateur n’ont aucun sens. Il doit apprendre petit à petit à poser des questions grammaticalement correctes, puis qui ont un sens. Il doit donc s’entrainer en faisant des milliers d’essais. Pour cela, nous avons créé une seconde intelligence artificielle qui répond par oui ou par non à ces questions. Les deux ordina-teurs interagissent comme dans une partie d’échec. À un détail près ! Ils ne s’affrontent pas mais collaborent… » Si, in fine, un joueur pense qu’il joue contre un humain et non contre un ordinateur, les chercheurs auront réussi leur pari.

D’ores et déjà, les résultats de l’ordi-nateur sont surprenants. Sur ce type de tâche, un humain arrive à trouver en général l’objet près de 9 fois sur 10. Avec les algorithmes les plus basiques, un ordinateur obtient 35 à 40% de réussite. Avec les derniers mo-dèles conçus dans le cadre du projet GuessWhat ?!, l’ordinateur arrive à un score de 55% de réussite et d’après les chercheurs, ce n’est qu’un début. « Quand nous analysons les questions posées, nous nous apercevons que l’ordinateur comprend la notion de gauche et de droite et la plupart des relations entre les objets. Il a en revanche encore du mal à poser des questions en ce qui concerne les couleurs. Mais la vraie réussite est qu’il enchaîne les questions selon un sens logique. Dans nos modèles, l’ordinateur apprend à développer une stratégie, et c’est une première dans ce type de scénario. »

Ce beau succès a déjà valu à l’équipe des retombées prestigieuses. De nom-breuses entreprises du web, suivent de près ce projet de recherche. Et l’équipe

créatrice du jeu vient d’obtenir deux publications d’articles au CVPR et à l’IJCAI, parmi les plus importantes conférences internationales dans les domaines respectifs de la vision et de l’intelligence artificielle. « C’est une belle reconnaissance. Cela nous prouve que nous sommes sur la bonne voie et que ce problème vaut la peine d’être étudié » , conclut Florian Strub.

º guesswhat.aiº team.inria.fr/sequel

18

// Best-of

> des lycéens des hauts-de-france à l’unesco

Lundi 3 avril 2017, Inria et l'UNESCO ont acté leur engagement pour la préservation du patrimoine logiciel par la signature d'une convention autour du projet Software Heritage. À cette occasion, dix élèves en spécialité ISN (informatique et science du numérique) du Lycée Blaise Pascal de Longuenesse ont été conviés à l’UNESCO pour présenter leurs travaux scolaires en sciences du numérique à la directrice générale Irina Bokova et au président François Hollande.

> l’équipe inocs : 1er prix scientifique du challenGe roadef-euro 2016

L’équipe de recherche Inocs en collaboration avec des scientifiques de l’École des Mines de Saint-Étienne ont reçu le 1er prix dans la catégorie prix scientifique du challenge Roadef-Euro 2016, sur des problèmes d’optimisation. Le challenge consistait à étudier un problème de livraison de gaz avec une flotte de camions tout en gérant le stock chez les clients. La cérémonie a eu lieu le 23 février à Metz durant la conférence Roadef.

il ne fallait pas manquer...

prix

retour sur...

> une nouvelle direction

Le Président-directeur général d’Inria, Antoine Petit, a nommé Isabelle Herlin directrice du centre de recherche Inria Lille – Nord Europe. Précédemment directrice de recherche Inria, Isabelle Herlin a pris la direction du centre depuis le 1er mars 2017.

> 2 ans d’inriatech à lille

En deux années d 'ex is tence , le dispositif InriaTech initié dans le centre de recherche Inria Lille - Nord Europe, a déjà de nom-

breux succès à son actif. Soutenu par la Région Hauts-de-France, la Métropole Européenne de Lille et le FEDER (Fonds Européen de Développement Régional), son but est de faciliter l'adéquation des résultats des recherches menées par les équipes-projets Inria aux besoins des entreprises. Contrats avec des PME, des start-up mais aussi avec des grands comptes de la région, la démarche séduit de plus en plus d'entreprises.

> prix de thèse du Gdr macs

En mars, le jury du GdR MACS a attribué un des prix de meilleures thèses à Hafiz Ahmed pour son travail « Modélisation et synchronisation des rythmes biologiques : du comportement des cellules à celui des huîtres » . Cette thèse a été co-encadrée au sein de l’équipe-projet Non-A du centre Inria Lille – Nord Europe et de l’équipe EA du laboratoire EPOC, Arcachon.

> pharo days 2017

Pharo Days 2017 est une conférence sur le langage de programmation dynamique open-source Pharo. Elle s’est tenue les 18 et 19 mai, au sein du centre de recherche Inria Lille - Nord Europe. Près d’une cinquantaine ont participé à cette conférence dont l’objectif était de rassembler entrepreneurs, développeurs et utilisateurs pour un partage d’expériences.

sur twitter...

19 #05 juin 2017

20

21 #05 juin 2017

Pour Rapsodi, le long processus de création d’une équipe-pro-jet arrive à son terme dans quelques semaines. Une fois que les objectifs scientifiques seront définitivement validés, l’équipe franchira donc une étape

importante et elle pourra poursuivre ses travaux dans un cadre très précis défini par Inria. Mais Claire Chainais, la responsable de Rapsodi, et les six chercheurs et quatre doctorants qui l’entourent, travaillent déjà depuis plusieurs années sur leurs thèmes de recherche. Le sujet de l’équipe ? Travailler sur des méthodes numé-riques de simulation des phénomènes issus de la physique comme les écoulements en milieux poreux, les phénomènes électromagnétiques ou encore la corrosion des containers de stockage des déchets radioactifs. Pour ses recherches, Rapsodi doit dé-velopper des méthodes adaptées pour la simulation. « Ces modèles dissipent de l’énergie. Nous développons des méthodes numériques qui préservent les propriétés physiques, c’est l’un de nos défis. Pour les modèles stratigra-phiques par exemple, il faut pouvoir simuler l’évolution de l’érosion et de la sédimentation sur plusieurs millions d’années » , précise Claire Chainais.

des thématiques liées à l’analyse numérique

Plusieurs industriels s’intéressent d’ail-leurs déjà à ces travaux pour certaines

applications comme IFP Energies Nouvelles (anciennement l’Institut Français du Pétrole) ou encore EDF. « L’un de nos chercheurs a travaillé sur des simulations d’extraction de pétrole par injection de vapeur. Pour EDF, la problématique tourne autour de phénomènes électromagnétiques basse fréquence » . S’ils ont tous un domaine de recherche très précis, les mathématiciens qui composent Rapsodi, se retrouvent tous autour de thématiques liées à l’analyse numé-rique. Autre point commun entre les chercheurs de l’équipe, ils ont des par-cours majoritairement universitaires. Ils partagent donc leur temps entre la faculté et le centre Inria Lille - Nord Europe où ils encadrent également des doctorants. « Nous échangeons régulièrement entre scientifiques sur l’aspect formation. La présence des doctorants est très enrichissante et nous donne l’occasion d’avoir des interactions autour de nos sujets de recherche » .

une conférence interna-tionale sur la méthode numérique des volumes finis

L’environnement de travail des cher-cheurs et chercheuses ne se limite jamais à l’institut et aux laboratoires universitaires. Les équipes sont en effet souvent sollicitées pour organi-ser des conférences internationales très pointues dans leurs thématiques

de recherche. Rapsodi s’est ainsi vu confier l’organisation de la conférence internationale FVCA, consacrée à la méthode numérique des volumes finis, l’un des axes de recherche de l’équipe. Elle aura lieu dans le learning center de l’Université de Lille - sciences et technologies. « Pour nous, c’est une belle marque de confiance. Il s’agit de la huitième édition d’une série de conférences qui devrait accueillir 150 participants. Après Berlin et Prague, c’est Lille qui a été choisi » . Au-delà de ses travaux scientifiques, Rapsodi est un bel exemple de parité dans le monde de la recherche, une valeur importante que l’équipe partage avec Inria. Avec trois femmes parmi les sept membres la composant, l’équipe est l’une de rares à assurer cet équilibre. Une réalité qui s’explique par le faible taux de femmes dans les filières scientifiques, et ce, dès le lycée. « Nous sommes encore très loin de la parité parmi les scientifiques mais plusieurs décisions politiques prises ces dernières années pour favoriser la présence des femmes dans des instances ou des commissions encouragent à lentement inverser la tendance » , conclut Claire Chainais.

º team.inria.fr/rapsodi

poRtRait \\

simuler l’évolution de l’érosionet de la sédimentationsur plusieurs millions d’années

Claire Chainais

22

// RenDez-vous

forum numérique 2067Le 5 octobre 2017, Plaine Images, Tourcoing

En 2017, Inria célèbre ses 50 ans ! Rendez-vous à la Plaine Images de Tourcoing, le 5 octobre prochain : l’occasion d’imaginer, débattre et confronter vos points de vue avec des experts d’horizon divers sur la place du numérique dans notre société à l’horizon 2067. Lors de cette journée nous vous proposons d’explorer 4 mondes, au travers de tables rondes thématiques : travail, santé, loisirs et environnement seront au cœur des échanges.

º inria.fr/ForNum2067

école d’été« atom » Les 6 et 7 juillet 2017, M3 - Cité scientifique, Villeneuve d’Ascq

Organisée par le GT ATOM (Application e t T h é o r i e d e l ' O p t i m i s a t i o n Multiobjectif) du GDR RO, cette école d'été s'inscrit dans une démarche de formation de jeunes chercheurs en optimisation. Des membres de l’équipe de recherche Dolphin, dont la thématique de recherche est au cœur du sujet, font partie du comité d’organisation.

18e conférence« jobim » Du 3 au 6 juillet 2017, Lille Grand Palais, Lille

JOBIM est une conférence annuelle interdisciplinaire majeure pour la commu-nauté scientifique française. Elle rassemble toutes les personnes travaillant aux frontières de la biologie, de l’informatique, des mathématiques et de la physique et s’intéressant à l’analyse, la comparaison et l’exploitation des données géno-miques et post-génomiques. Comme chaque année, la conférence JOBIM est placée sous l’égide de la Société française de bioinformatique. La conférence, co-organisée par les deux équipes-projets lilloises Modal et Bonsai, prévoit d’accueillir environ 500 professionnels et chercheurs sur le sujet.

8e rjc ihm 2017Du 3 au 6 juillet 2017, Hôtel Faidherbe, Boulogne sur Mer

Depuis 2000, les Rencontres des Jeunes Chercheurs en Interaction Homme-Machine visent à former au métier de chercheurs / chercheuses en IHM. La 8e édition, co-organisée par l’équipe de recherche Mjolnir du centre Inria de Lille, se déroulera à Boulogne-sur-Mer.

workshop« jebif »Les 6 et 7 juillet 2017, Centre Inria Lille - Nord Europe, Villeneuve d’Ascq

À l’occasion de JOBIM 2017 à Lille, JeBiF, le site des jeunes bio-informaticiens de France organise son workshop annuel en satellite de la conférence principale. L’édition 2017 sera une année toute particulière car elle constituera également la 3e édition du Symposium étudiant BeNeLuxFra, coorganisé avec les RSG Luxembourg, RSG Belgium et RSG Netherlands.

8e conférence

« finite volumes for complex applications » Du 12 au 16 juin 2017, Centre LILLIAD - Cité scientifique, Villeneuve d’Ascq

FVCA est une conférence internatio-nale qui se réunit tous les trois ans depuis sa première édition à Rouen en 1996. Son but est de rassembler des mathématiciens, des physiciens et des ingénieurs concernés par les méthodes numériques volumes finis,

aussi bien sur des aspects théoriques qu’applicatifs, et de leur permettre de présenter leurs derniers résultats scientifiques dans le domaine. Cette 8e édition est co-organisée par l’équipe de recherche Rapsodi du centre Inria de Lille.

Retrouvez ces évènements et bien d'autres dans l'agenda du centre !

º inria.fr/lille

23 #05 juin 2017

Parc scientifique de la Haute Borne40, avenue HalleyBât A - Park Plaza59650 VILLENEUVE D’ASCqFRANCE

(+33) 03 59 57 78 00 (+33) 03 59 57 78 50

º inria.fr/lille º [email protected] @Inria_Lille

Découvrez les coulisses du centreau travers de notre Tumblr Between us !

º inrialille.tumblr.com

// centre de rechercheinria lille - nord europe

// plateau inria, euratechnoloGiesInria est présent au sein d'EuraTechnologies avec un plateau de 200 m² présentant les travaux de ses équipes de recherche. L’objectif est de favoriser les interactions entre la communauté scientifique, le monde économique et la société par le biais de démonstrateurs et d'un programme d’animation thématique proposé tout au long de l’année.

Suivez les activités du Plateau sur Twitter @Plateau_Inria

contact \\