métadonnées et catalogage: où en sommes-nous · 3 métadonnées et catalogue : un cas idéal...
TRANSCRIPT
1
Métadonnées et catalogage: Où en sommes-nous ?
Paris, 30 mars 2005
Pierre LAGARDEFrançois-Xavier PRUNAYREOffice International de l’Eau
2
Les métadonnées, une volonté …• de gérer ces données cartographiques• de partager et échanger ces données
… à une exigence• Réglementaire : Directive Inspire• Technique : Profusion de la diffusion et de la recherche via Internet• Commerciale : Faire connaître ses produits
Métadonnées, un enjeu croissant ?
La technologie actuelle permet-elle de répondre à ces besoins ?
3
Métadonnées et catalogue : Un cas idéal
Mettre en œuvre un « Google »cartographique– Rechercher des données géographiques
avec des critères divers– Données gérées par des structures
différentes utilisant des outils différents– Accéder aux métadonnées caractérisant
ces données cartographiques– Accéder aux données géographiques
Exploitation
Exploration
Découverte
4
L’existant
Existant : Saisie des métadonnées dans ArcCatalog suivant le profil ESRI.
Objectif : Déployé un catalogue permettant de rechercher dans les métadonnées.
Test de mise en place / saisie :– Test d’importation des métadonnées ISO de ESRI dans
différents outils (m3cat, GeoNetwork, IONIC)– Test des outils de catalogue
5
Les différentes composantes pour réussir
Le besoin de standardisation
������������� ���
����������� ��
��������
Trois composantesConfrontation
Standardisation / Implémentation
6
Sémantique : Normalisation
Des normes…
Objectif : Utiliser un même langage pour décrire les métadonnées Objectif : Utiliser un même langage pour décrire les métadonnées
Dublin CoreInitiative
Dublin CoreInitiative
FGDCFGDCCEN
TC218CEN
TC218ISO/TC211ISO/TC211 ....
Dublin CoreISO 11179
Dublin CoreISO 11179
CSDGmetadataCSDG
metadataprENV12657
prENV12657
ISO19115:2003
ISO19115:2003
....
La norme 19115 prédomine
7
Sémantique : Normalisation ISO 19115
Une grande richesse– 300 éléments de description (86 classes, 282 attributs, 56
relations)– Un « core » obligatoire d’une dizaine de descripteurs– Possibilité d’ajouter des nouveaux descripteurs
Les profils 19115– Permet de préciser les éléments obligatoires / facultatifs– D’ajouter de nouveaux descripteurs– De définir des listes de codes
Les profils naissent…– Des profils par pays : France avec GT Catalogage CNIG– Des profils par thématique ou contexte : géologie GIC,
Marines OHI, OGC pour le catalogage…– Des profils locaux
8
Sémantique : Le marché actuel
Les principaux outils du marché ont intégré la norme ISO-19115 :
– Des produits commerciaux� ESRI ArcCatalog� IONIC RedSpiderCatalog (metadata manager)� Intergraph Spatial Metadata Management Tool� …
– Des solutions « opensource »� Geonetwork� M3cat
– … Et de nombreux développements spécifiques (Suisse, Belgique, …)
9
Sémantique : Le marché actuel
Chaque produit repose sur un profil particulier (Profil ESRI, Core de la norme, …)
Certain d’entre eux ont mis en place des fonctionnalités d’aide à la saisie :
– Annuaire de contact (Listes simple ou LDAP)– Calcul d’attribut automatique (projection, emprise) à partir d’un
jeu de donnée ou d’un service (Découverte automatique appelée « harvest »)
– Thésaurus– Gestion des langues (Interface & traduction)
10
Sémantique : Le marché actuel
Norme prENVDistribué librementReports
Liste de valeurs, Thesaurus, aide à la traduction
FGDC et profil personnalisé
ISO (CORE) sans profil particulier
OpensourceM3cat
ISO (CORE) sans profil particulier
OpensourceGeonetwork
FGDCISO (CORE) sans profil particulier
CommercialeIntergraph
LDAP, Harvesting
CommercialeIONIC RedSpiderCatalog
Annuaire de contact, Emprise, Projection
Profil ESRICommercialeESRI ArcCatalog
FonctionnalitésAutres normes
ISO19115 & profils
DistributionProduits
11
Echanges de données : Normalisation
La norme ISO 19115 ne définit par les modalités d’échanges
XML : le format préféré…
… mais la définition des balises commune tarde…
Objectif : Utiliser un formalisme unique pour échanger des métadonnéesObjectif : Utiliser un formalisme unique pour échanger des métadonnées
� Publication de la norme et du schéma XML ISO 19139� Publication de la norme et du schéma XML ISO 19139
12
Echanges de données : Le marché actuelGeonetwork
m3cat
ArcCatalog
ISO-19139
13
Echanges de données : Le marché actuel
Les divergences observées :– Structure des fichiers (Attributs ou éléments XML,
position)– Stockage des identifiants ou de la valeur– Plusieurs normes dans le même schéma– Différence de Casse
� Aujourd’hui les échanges de fichier de métadonnées entre les logiciels sont difficiles
� Aujourd’hui les échanges de fichier de métadonnées entre les logiciels sont difficiles
Profil ESRIProfil ESRI Profil GeonetworkProfil GeonetworkTransformation XSLT
� L’ISO 19139 normalise le format de stockage� L’ISO 19139 normalise le format de stockage
14
Catalogage et services : Normalisation
Objectif : Mettre en œuvre un service de catalogage partagéObjectif : Mettre en œuvre un service de catalogage partagé
��� �����������
�����������
Service Web (OGC v1, v2)
SOAP / Z39.50
Système de fichier d’un partenaire ISO-19139 générée à partir d’une information existante (REPORT,
ArcCatalog, Doc, …)
Référencement Saisie en ligne via interface web
Catalogue Web
Catalogue de métadonnées avec accès via WebServices
Moisson de fichier distant
via HTTP
15
Catalogage et services : Normalisation
Standardiser les services– Répondre aux questions « Quoi », « Quand », « Où »– Renvoyer les métadonnées adéquates (fichier XML ISO
19139)– Rendre accessible aux données géographiques
Les normes actuelles– ISO 19119 (services)– OGC Catalogue Services Specifications– Des spécifications techniques du transport des données :
Z39.50 / SOAP / HTTP / CORBA…
16
Catalogage et services : Le marché actuel
Quelques outils du marché ont intégré la notion de catalogue de métadonnées :
– Des produits commerciaux� ESRI ArcIMS� IONIC RedSpiderCatalog� Galdos� Intergraph Spatial Metadata Management Tool
– Des solutions « opensource »� Geonetwork� M3cat
17
Catalogage et services : Le marché actuel
Z39.50ISO Z39.50M3cat
Z39.50ISO Z39.50Geonetwork
Z39.50OGC CS v1Intergraph
SOAP et RESTOGC CS v1 & v2, ebXML ebRIMMoisson de fichiers/services
IONIC RedSpiderCatalog
SOAP et RESTISO Z39.50 OGC CSv1
ESRI ArcIMS
Protocole technique
Service utilisés
Produits
18
Catalogage et services : Le marché actuel
Pas de difficultés majeures pour la communication entre des catalogues d’un même éditeur !
Pas de grande visibilité sur l’interopérabilité entre les catalogues– Protocole Z39-50 :
� assez répandu� communication entre éditeur logiciel différent aisée
(plus de problème sur les firewall)– Webservice (SOAP/HTTP) :
� peu répandu car « jeune » (fin 2004)
19
Conclusion
Les trois composantes de la normalisation sont prêtes
ISO 19115profil X
ISO 19115profil X
ISO 19139Fichier XMLISO 19139
Fichier XMLISO 19119 / OGC CAT /
SOAP
ISO 19119 / OGC CAT /
SOAP
… mais les implémentations robustes et interopérables ne sont pas encore disponibles
– Importation des métadonnées entre des outils différents difficile � Profil ISO-19139 non fixé
– Saisie des métadonnées � plus ou moins d’interface d’aide à la saisie
– Échange entre catalogue � Si même outil ok, Si outil différent ~ (pas de test sur la v2 des spécifications)
20
Découverte / Recherche simple
21
Découverte / Recherche avancée
22
« Cours d’eau »
23
Description simple
24
Description complète
25
Description ISO / ISO-19139
26
Catalogue autour de la thématique « eau »
27
Données sur les cours d’eau (données sur le monde ou l’Europe)
28
Recherche multi-catalogue via Z39-50
29
Résultats agrégés