l'historien et l'algorithme : présentation aux entretiens du nouveau monde industriel...
DESCRIPTION
Présentation au ENMI 2013 : Entretiens du Nouveau Monde Industriel - Centre Pompidou.TRANSCRIPT
!11
L’historien et l’algorithme !FREDERIC KAPLAN DIGITAL HUMANITIES LABORATORY
!21
Pourquoi s’intéresser aux sciences historiques ? !
!31
Parce qu’elles sont sur le point de subir un profond bouleversement. !
!41
Parce que leur importance est capitale, alors que les nouvelles technologies nous donnent l’impression de vivre dans un “grand maintenant”, sans passé, ni futur.
!51
La conquête du passé est la nouvelle frontière.
!61
Cette reflexion commence par une visite aux archives d’Etats de Venise.
!71
!81
80 km d’archives couvrant 1000 ans d’histoire !
!91
La mémoire du “Google” du moyen-âge. !
!101
Nous sommes face à des “Big data” du passé. !
!111
Comment transformer cette archive en un système d’information ? !
!121
Les archives constituent un objet trop gros pour être étudié par des équipes isolées de chercheurs. !
!131
Comme le système génomique !
!141
Comme le système cérébral !
!151
Comme le système planétaire !
!16
Comme pour le Genome, le Cerveau ou la Terre, nous avons besoin de l’ac$on coordonnée d’un grand groupe de chercheurs et d’étudiants pour espérer transformer ce mega-‐objet en un système informaKonnel.
!17
Comme pour le Genome, le Cerveau ou la Terre, les algorithmes joueront sans doute un rôle central dans ceNe entreprise collecKve.
!18
«[...] l'historien de demain sera programmeur ou il ne sera plus ». !Emmanuel Leroy Ladurie Le Nouvel Observateur, 1968
!19
Les relations houleuses qu’histoire et informatique entretiennent ne sont pas nouvelles. !
!20
Déjà, des la fin des années 1960, la plupart des grandes conférences d’Histoire incluaient dans leur programme des tables rondes conflictuelles opposant les « nouveaux » historiens aux historiens « tradiKonnels ».
Thomas 2004 “CompuKng and Historical ImaginaKon” in A companion to Digital HumaniKes, Blackwell
!21
Les « nouveaux » vantaient les mérites de gros ordinateurs pour réaliser des calculs à grande échelle. Ils défendaient une histoire moins narraKve, appuyée par des méthodes quanKtaKves. Le terme « cliométrique » fut forgé durant ceNe période pour nommer ceNe nouvelle manière de faire l’histoire avec l’aide des grands nombres.
!22
Le camp des « tradiKonnels » accueillait ce type d’approches avec un profond scepKcisme.
!23
« Toutes les questions importantes sont importantes précisément parce qu’elles ne peuvent recevoir de réponse quantitative ». !Robert Swierenga, 1970 Quantification in American History, Atheneum.
!24
« Ce sont toujours les projets qui ont été financés avec le plus d’ampleur, ceux qui ont rassemblé des ambitieuses armées de chercheurs payés, ceux dont la science était la plus liée aux dernières technologies informatiques, ceux qui impliquaient les présentations mathématiques les plus sophistiquées, qui, au final, se sont révélées les plus décevantes » !Lawrence Stone, cité par Thomas 2004
!25
Des décennies ont passé, les mêmes débats se perpétuent. Les méthodes quanKtaKves ont montré leur force pour certains domaines et leur manque de perKnence pour d’autres. Il n’y a pas vraiment eu de révoluKon.
!26
Il y a dix ans, pourtant, dans un arKcle de 2004, William Thomas III notait déjà que quelque chose de plus excitant et de plus dérangeant que les premiers projets «cliométriques » était en train de se consKtuer.
!27
« Les historiens sont en train de construire des systèmes à grande échelle pour reconstituer les données historiques sous des formes géographiques pour divers lieux dans le monde (…). Considérés dans leur ensemble ces efforts ouvrent des possibilités remarquables pour reconstituer des ensembles intégrés et organisés en réseau » !William Thomas, Computing and Historical Imagination, 2004
!28
« Ces modèles en quatre dimensions pourraient reconstituer les immeubles, les routes et les ruines des territoires historiques autant que les géographies légales, économiques, sociales ou religieuses qui leur sont associées. Les réseaux informationnels, financiers, commerciaux et culturels pourraient également trouver leur place dans ces modèles » !William Thomas, Computing and Historical Imagination, 2004
!29
« Le rôle pour l’historien qui travaillera dans ce média numérique sera de rendre ces technologies informatiques transparentes » !William Thomas, Computing and Historical Imagination, 2004
!30
En dix ans, ce tournant cartographique a effecKvement eu lieu avec le développement des systèmes d’informaKon géohistorique (Historical Geographical InformaKon Systems).
!31
Mon hypothèse : (1) Ce tournant spa$al est en fait un tournant algorithmique dans la mesure où il impose les algorithmes comme nouveaux médiateurs des sciences historiques.
!32
Mon hypothèse : (2) Une nouvelle généra$on d’étudiants sera à la base ceNe grande transformaKon.
!33
Parce que nous parlons d’une transformaKon technique et généraKonnelle, il faut replacer ce tournant cartographique propre aux sciences historiques dans le contexte plus large de nouvelles interfaces pour l’explora$on de l’espace.
!34
!35
!36
!37
Avec les interfaces d’exploration de l’espace, tout se passe comme si nous vivions dans un grand maintenant. Le temps a disparu.
!38
Peut-‐on construire des “Google maps” du passé ?
!39
Peut-‐on construire des “Facebooks” du passé ?
!40
Peut-‐on reconstruire numériquement un passé aussi dense que notre présent ?
!41
!42
!43
!44
L’EPFL et l’université Ca’Foscari ont lancé cette année un projet intitulé la “Venice Time Machine” construit selon cette approche.
!45
Cette initiative regroupe aujourd’hui quelques dizaines de chercheurs et d’étudiants qui collaborent pour construire un modèle multidimensionnel de Venise.
!46
L’enjeu est de constituer une grande base de données, open access, dont chacun pourrait se sentir co-auteur. Faire de ce modèle de Venise un bien commun, collectivement construit.
!47
La stratégie de développement consiste à faire converger recherche et éducation en créant un programme de cours associé à ce programme de recherche.
!48
Nous expérimentions ce programme cette année avec 60 étudiants. L’objectif pour l’an prochain est d’ouvrir un cours en ligne pouvant être suivi par plusieurs dizaines de milliers d’étudiants simultanément.
!49
Comment numériser efficacement des archives aussi anciennes ?
!50
Pourrait-on numériser ces documents sans les ouvrir ?
!51
Comment transcrire les documents numérisés ?
!52
Comment adapter les techniques générales aux cas particuliers ?
!53
Comment extraire et coder les informations qu’ils contiennent ?
!54
Pourrait-on utiliser les techniques du “web sémantique” ?
!55
Connectées les unes aux autres, ces données forment un grand graphe.
!56
Ce graphe permet de poser des questions inédites. Quel est le salaire moyen d’un apprenti en 1622 ? Combien de fils de peintres sont eux-mêmes peintres ? Quels sont les procès qui ont impliqué des travailleurs du verre à Murano au XVIIe siècle ?
!57
Ce graphe peut aussi se deployer dans le temps et l’espace.
!58
1500
Les cartes du passé sont riches de détails.
!59
1550
!60
1572
!61
1576
!62
1765
!63
1829
Au XIXe siècle, les cartes changent.
!64
1859
!65
1910
!66
Reconstruire les Venise(s) du passé est comme résoudre un “Sudoku” géant
!67
Quand l’espace de solutions de ce Sudoku est trop grand, les algorithmes sont d’une grande aide.
!68
Ces reconstructions disparates sont intégrées dans des modèles spatiotemporels unifiés.
!69
!70
!71
!72
!73
!74
!75
!76
!77
!78
!79
900
La même logique est déployée à l’échelle des échanges méditerranéens.
!80
1000
!81
1100
!82
1200
!83
1300
!84
1400
!85
1500
!86Le trafic mois par mois peut être simulé
!87
En juin 1322, quel est le prochain bateau de Constantinople à Corfou ? Combien de temps prendra le voyage ? Quels sont les chances de rencontrer des pirates ?
!88
Pour tracer les routes, il faut transformer les hypothèses en algorithmes.
!89
La quesKon centrale de ce programme de recherche est la gesKon et la représentaKon des incer$tudes et des inconsistances.
!90
Trois processus renforcent le rôle de la formalisaKon et les algorithmes dans ce contexte.
!91
(1) Ce type de projets demande une éthique de la représenta$on et ceci impose un certain niveau de formalisa$on. Il faut documenter les différents regimes d’incer$tude qui sous-‐tendent les données visualisées.
!92
(2) Le besoin d’interopérabilité nécessaire pour la consKtuKon des grandes bases de données conduit à définir un formalisme permeNant de coder non seulement l’informaKon historique, mais la meta-‐informa$on historique (les processus intellectuels et techniques qui ont conduit aux données).
!93
(3) Les cartographies historiques et la simulaKon invitent à transformer les hypothèses en algorithmes. Les chercheurs peuvent aller au delà du débat d’arguments, en opposant dans le domaine cartographique leurs hypothèses appareillées sous la forme d’algorithmiques.
!94
Ces trois évoluKons tendent à introduire les algorithmes comme nouveaux médiateurs des sciences historiques. !
!95
Près de cinquante ans après la prédicKon d’Emmanuel Leroy Ladurie, il faut sans doute former une nouvelle généra$on d’étudiants capables de maîtriser les algorithmes comme ouKls de connaissance et de débats mais aussi de s’interroger sur ces changements.
!96
En rapprochant recherche et éducaKon, ceNe nouvelle généra$on d’étudiants va non seulement bénéficier de ces projets de grande ampleur, mais jouer un rôle crucial dans leur succès ou leur échec.
!97
Il s’agit “simplement” d’organiser, chaque année, la rencontre entre des dizaines de milliers d’étudiants et des dizaines de milliers de documents.
!98
Les algorithmes seront les médiateurs de ceNe rencontre.
!99125
dhlab.epfl.ch [email protected] @frederickaplan