introduction à l'open data et au datajournalisme
DESCRIPTION
Intervention de Sabine Blanc dans le cadre du séminaire de travail “Développer le datajournalisme en Rhône-Alpes” organisé par Fréquence écoles pour 12 journalistes, le 20 février 2014, à la Région Rhône-Alpes, dans le cadre du projet #dataviz_rraTRANSCRIPT
Flickr CC by Libertic
Sabine Blanc@sabineblanc
http://sabineblanc.net
jeudi 4 juillet 13
Définitions \0/
Flickr CC by LUNARIX-PIX
jeudi 4 juillet 13
Donnée ?
jeudi 4 juillet 13
1/Donnée = information
Flickr CC by sa tangi_bertin
jeudi 4 juillet 13
Flickr CC by nd pjen
jeudi 4 juillet 13
2/«Représentation conventionnelle d'une information en vue de son
traitement informatique.» Larousse
jeudi 4 juillet 13
jeudi 4 juillet 13
Base de données (BDD) > Système de gestion de base de données = SGBD
jeudi 4 juillet 13
Flickr CC by dret
Flickr CC by Theis Kofoed Hjorth
Ko, Mo, Go, To, Po, Eo, Zo, Yo
Flickr CC by sa Arthur40A
jeudi 4 juillet 13
Donnée personnelle
Flickr CC by Adelaide Archivist
jeudi 4 juillet 13
«Toute information identifiant directementou indirectement une personne physique» Cnil
jeudi 4 juillet 13
Donnée sensible
Flickr by nc sa dan mogford
jeudi 4 juillet 13
« Information concernant l’origine raciale ou ethnique, les opinions politiques, philosophiques ou religieuses, l’appartenance syndicale, la santé ou la vie sexuelle. » Cnil
jeudi 4 juillet 13
jeudi 4 juillet 13
jeudi 4 juillet 13
• Open data
• Datajournalisme
• Big data
• Données personnelles
jeudi 4 juillet 13
Open Data
jeudi 4 juillet 13
Décembre 2007 : huit principes pour un « gouvernement ouvert »
« Les données publiques seront considérées comme ‘ouvertes’ si elles sont rendues publiques d’une manière qui respecte les principes suivants : »
Traduction Hubert Guillaud/InternetActu
jeudi 4 juillet 13
1. Complètes. Toutes les données sont mises à disposition. Les données publiques sont des données qui ne sont pas sujettes à des limitations valables concernant la vie privée, la sécurité ou des privilèges d’accès.
jeudi 4 juillet 13
2. Primaires. Les données sont telles que collectées à la source, avec la plus grande granularité possible, et ne se présentent pas sous des formes agrégées ou modifiées.
jeudi 4 juillet 13
3. Opportunes. Elles sont mises à disposition aussi rapidement que nécessaire pour préserver leur valeur.
jeudi 4 juillet 13
4. Accessibles. Les données sont accessibles au plus grand éventail d’utilisateurs possible et pour des usages aussi divers que possible.
jeudi 4 juillet 13
5. Lisibles par des machines. Les données sont structurées pour permettre le traitement automatisé.
jeudi 4 juillet 13
6. Non discriminatoires. Les données sont accessibles à quiconque, sans aucune obligation préalable ni inscription.
jeudi 4 juillet 13
7. Non propriétaires. Les données sont accessibles dans un format sur lequel aucune entité ne dispose d’un contrôle exclusif.
jeudi 4 juillet 13
8. Sans permis. Elles ne sont pas soumises au droit d’auteur, à brevet, au droit des marques ou au secret commercial. Des règles raisonnables de confidentialité, de sécurité et de priorité d’accès peuvent être admises.
jeudi 4 juillet 13
9. Permanence Elles devraient toujours être disponibles en ligne dans les archives.
10. Coûts d’usageUne des barrières les plus importantes à l’accès de l’information disponible au public de façon ostentatoire est le coût imposé au public, même si ce coût est de minimus.
2010
jeudi 4 juillet 13
Flickr CC by nd Gilberto Viciedo
jeudi 4 juillet 13
2009 : data.gov
jeudi 4 juillet 13
• 2010 : Rennes
• 2011 : data.gouv.fr / Etalab
• 2013 : une vingtaine de collectivités locales
jeudi 4 juillet 13
• 1978 : loi Cada et loi informatique et liberté
• 2003 : directive PSI (Public sector information), transcrite en 2005 dans le droit français
• 2013 : article 111 du projet de loi de décentralisation
• 2013 : révision de la directive PSI
jeudi 4 juillet 13
Plus de transparence
jeudi 4 juillet 13
Améliorer les services
jeudi 4 juillet 13
Marché de la donnée
jeudi 4 juillet 13
$€£ (en théorie)
UE : 40 milliards d’euros de retombées directes, 140 indirectes ?
jeudi 4 juillet 13
jeudi 4 juillet 13
Datajournalisme
Flickr CC by sa jwyg
jeudi 4 juillet 13
Objectif identique : raconter des histoires pour informer, mais avec des moyens différents
jeudi 4 juillet 13
1821
jeudi 4 juillet 13
• Travail d’équipe
• Hybridation des métiers
• Un luxe...
• Qui se démocratise
Flickr CC by sa jwyg
jeudi 4 juillet 13
• Choisir les données : base de données, rapports, crowdsourcing, etc.
• Trier, nettoyer
• Mettre en forme
Flickr CC by sa jwyg
jeudi 4 juillet 13
Datavisualisation statique
jeudi 4 juillet 13
Datavisualisation interactive > lecture personnalisable
Isokron
jeudi 4 juillet 13
Carte des morts aux frontières de l’Europe, Owni, 2011
jeudi 4 juillet 13
Vidéo
Une demi-seconde de trading haute fréquence en 5 minutes, développé par Nanex
jeudi 4 juillet 13
jeudi 4 juillet 13
Big data (big buzz)
Datapublica
jeudi 4 juillet 13
2,5 trillions d’octets de données par jour (source IBM qui propose des solutions big data)
jeudi 4 juillet 13
Règle des 3V :
volume, vélocité, variété
jeudi 4 juillet 13
Croissance annuelle de plus de 30%.
23,8 milliards de dollars en 2016 (source IDC)
jeudi 4 juillet 13
Business
Macy’s :
social media +
achats en magasins
jeudi 4 juillet 13
SciencesGoogle Flu Trends
jeudi 4 juillet 13
PolitiqueCampagne d’Obama : analyser les données pour
faire du porte-à-porte hyper ciblé
Flickr CC by nd Steve Rhodes
jeudi 4 juillet 13
Small data
« Le défi est celui de la logistique de l'information : comment transmettre exactement la bonne information à, et depuis, les bonnes personnes, au bon format, au bon moment. Une affaire de 'Toutes Petites Données. »
Alan Mitchell, cabinet Ctrl-Shift, InternetActu
« Le vrai enjeu, ce n’est pas que des grosses organisations gèrent en même temps des logiciels différents sur des dizaines de milliers de serveurs, mais qu’une masse inédite de gens puissent collaborer autour d’un écosystème d’information distribué, un écosystème de petites données. »
Rufus Pollock, OKFN
jeudi 4 juillet 13
jeudi 4 juillet 13
Si vous ne payez pas, c’est que c’est vous le produit
Flickr CC by sa dkalo
jeudi 4 juillet 13
Révision du cadre législatif européen
jeudi 4 juillet 13
Directive de 1995 > règlement
jeudi 4 juillet 13
Enjeux
• Vie privée vs business
• Droit à l’oubli vs histoire
Flickr CC by sa opensourceway
jeudi 4 juillet 13
• Consentement
• Portabilité des données
• Notification des violations de traitements de données personnelles
• etc.
jeudi 4 juillet 13
Rejeté par les Etats-membres début juin
Flickr CC by schillergarcia
jeudi 4 juillet 13
Lobbying intense
jeudi 4 juillet 13
RéférencesDavid McCandless, Information is beautifulOwni.frJournalism++The GuardianWeDoDataThe Data Journalism HandbookOpen knowledge foundationDossier open data sur La Gazette des communes
Open data France
Regards citoyens
Dossier La Quadrature du Net sur la vie privéeAn introduction to data protection, EDRIL’Europe au chevet de vos données personnelles, PCInpact
Google prédit les épidémies de grippe
Retail Goes Shopping Through Big Data
La victoire d’Obama : cas d'étude concret d’utilisation des Big Data
jeudi 4 juillet 13