représentation et accès: continuités et transformations. chapitre 4. métadonnées et...

26
Métadonnées et normalisation INRIA Seminaire 2008 par Sylvie Dalbin - ATD [email protected] (2)

Upload: dalb

Post on 21-Dec-2014

249 views

Category:

Technology


3 download

DESCRIPTION

INRIA 2008 (2) - Métadonnées : mutations et perspectives http://www.adbs.fr/metadonnees-mutations-et-perspectives-46545.htm

TRANSCRIPT

Page 1: Représentation et accès: continuités et transformations. Chapitre 4. Métadonnées et normalisation

Métadonnées et normalisation

INRIA

Seminaire 2008

par Sylvie Dalbin - [email protected]

(2)

Page 2: Représentation et accès: continuités et transformations. Chapitre 4. Métadonnées et normalisation

INRIA IST - Session Métadonnées et normalisation par Sylvie Dalbin 30 Sept 2008 - p.2

Fil conducteur de l’intervention

1. Contexte de l’intervention

2. NormalisationContexte - Enjeux - Acteurs en présence

3. Modèles - Schémas1. Un modèle conceptuel métier : FRBR2. Succession cohérente d’outils : FRBR, RDA, MODS et ONIX3. Notation particulière : CRM4. Profil d’application : TEF5. Conteneur et transporteur : METS6. Livres numériques7. Schémas de concepts8. Composants transversaux9. Familles de schémas : cohérence métier

4. Conclusion1. Sur le plan technique 2. Sur le plan des métiers

Page 3: Représentation et accès: continuités et transformations. Chapitre 4. Métadonnées et normalisation

1. CONTEXTE DE L’INTERVENTION

1.

Page 4: Représentation et accès: continuités et transformations. Chapitre 4. Métadonnées et normalisation

INRIA IST - Session Métadonnées et normalisation par Sylvie Dalbin 30 Sept 2008 - p.4

Préparer l’Atelier Fabriqué avec http://wordle

Page 5: Représentation et accès: continuités et transformations. Chapitre 4. Métadonnées et normalisation

INRIA IST - Session Métadonnées et normalisation par Sylvie Dalbin 30 Sept 2008 - p.5

Autres ?

Notez des noms de normes, recommandations ou modèles que vous connaissez ou sur lesquels

vous souhaiteriez des informations

Page 6: Représentation et accès: continuités et transformations. Chapitre 4. Métadonnées et normalisation

2. NORMALISATION

Contexte

Enjeux

Acteurs en présence

2.

Page 7: Représentation et accès: continuités et transformations. Chapitre 4. Métadonnées et normalisation

INRIA IST - Session Métadonnées et normalisation par Sylvie Dalbin 30 Sept 2008 - p.7

Contexte

• L’information – fait partie intégrante de toute activité humaine

[F.Moreau] - La méta-information permet de localiser un bien informationnel et de décider de l’intérêt de le consommer

« La méta-information est ainsi indéniablement au cœur du processus de création de valeur à l’heure du numérique ».

• Les TIC – sont des technologies qui agissent sur l’information

– elles sont structurantes et modèlent les dispositifs

2.1

Page 8: Représentation et accès: continuités et transformations. Chapitre 4. Métadonnées et normalisation

INRIA IST - Session Métadonnées et normalisation par Sylvie Dalbin 30 Sept 2008 - p.8

Enjeux

• Standardisation - normalisation – Des formats des données numériques

Des méta-informations

– Des systèmes d’encodage ?

• Plusieurs strates complémentaires

Codage de base Unicode

Technique Technologies du Web

Structure Identifiants, schémas de ressources, méta-

informations

Encodage des contenus Nomenclatures, terminologies

2.2

Page 9: Représentation et accès: continuités et transformations. Chapitre 4. Métadonnées et normalisation

INRIA IST - Session Métadonnées et normalisation par Sylvie Dalbin 30 Sept 2008 - p.9

Acteurs en présence (1)

• Histoires, fonctionnements et périmètres variables

• Coordination : une nécessité• ISO TC46 avec ISO TC37

• L’ISO et l’IEEE (concepteur entre autres du LOM) en 2008

• ISO TC46 (Information et Documentation) et l’IETF en 2008

• Organes-clés pour l’infodoc• ISO TC46 - piloté actuellement par la France (C.Dhérent / Bnf)

– Un rôle essentiel, des moyens faibles au regard du travail réalisé et à réaliser

– Activité des groupes - les professionnels terrain sont absents !

• NISO - National Information Standards Organization

• Library of Congress : http://www.loc.gov/standards/

2.3

Page 10: Représentation et accès: continuités et transformations. Chapitre 4. Métadonnées et normalisation

INRIA IST - Session Métadonnées et normalisation par Sylvie Dalbin 30 Sept 2008 - p.10

Acteurs en présence (2)

• ISO et organes locaux• Comités centrés sur l’information et les TIC : JTC1 (TIC,

ISO/CEI), TC37 (Terminologie), TC46 (Infodoc)

• Internet et le Web• IETF - « groupe informel et auto-organisé » qui développe les

spécifications des standards de l'Internet : les RFC

• ICANN - organes normalisateurs du Web– IANA = bureau central d'enregistrement des activités IETF

• Autres organismes par métiers ou domaines• OASIS - consortium mondial, autour d’XML - DocBook, UDDI,…

• IEEE - à l’origine du LOM ; ADL - standards du e-learning

• IPTC, IFLA (bibliothèque), SMTPE (cinéma et télévision), …

2.3

Page 11: Représentation et accès: continuités et transformations. Chapitre 4. Métadonnées et normalisation

3. MODELES - SCHEMAS

Quelques exemples

3.

Page 12: Représentation et accès: continuités et transformations. Chapitre 4. Métadonnées et normalisation

INRIA IST - Session Métadonnées et normalisation par Sylvie Dalbin 30 Sept 2008 - p.12

Un modèle conceptuel métier : FRBR

Entités du Groupe 2 - FRANAR « identifiants » 

Entités du Groupe 3 - FRSAR « sujets »

Functional Requirements for Bibliographic Records, IFLA, initié en 1997

3.1

Page 13: Représentation et accès: continuités et transformations. Chapitre 4. Métadonnées et normalisation

INRIA IST - Session Métadonnées et normalisation par Sylvie Dalbin 30 Sept 2008 - p.13

3.2

Succession d’outils : FRBR et ….

« Or, pour gérer des données, ces gens-là (les geeks)

travaillent de la manière suivante : ils font de la

modélisation, puis des spécifications, et enfin ils

implémentent. Nous, pauvres bibliothécaires et

catalogueurs, le nez dans le guidon trop souvent, nous

avons commencé par créer un format d'implémentation

(MARC), s'appuyant quand même sur une norme (l'ISBD).

Mais mieux vaut tard que jamais, nous avons fini par faire la

modélisation et les spécifications de nos données

bibliographiques : ce sont les FRBR. » Figoblog, 10/03/05

Page 14: Représentation et accès: continuités et transformations. Chapitre 4. Métadonnées et normalisation

INRIA IST - Session Métadonnées et normalisation par Sylvie Dalbin 30 Sept 2008 - p.14

3.2 Succession d’outils : … RDA, MODS et ONIX

• Schémas et outils techniques en cours de révision !– Outils métiers

• RDA / description bibliographique

• FRAD / autorités

– Outils informatiques• MODS / remplacement de MARC en XML

• Compatible avec le format de livre ONIX (ONline Information eXchange)

Page 15: Représentation et accès: continuités et transformations. Chapitre 4. Métadonnées et normalisation

INRIA IST - Session Métadonnées et normalisation par Sylvie Dalbin 30 Sept 2008 - p.15

Notation particulière : CRM (1)

• Au cœur du modèle– Des évènements et des phénomènes temporels

– La modélisation de l’activité versus la description d’objets

Conceptual Reference Model (Museum!), ISO 2127:2006

Actions (Activity)

La Seconde Guerre mondiale, la bataille de Stalingrad, le tremblement de terre de Lisbonne, la naissance de Cléopâtre, la fête donnée pour mon anniversaire le 28 juin 1995, la conférence de Yalta, une tuile est tombée de mon toit, la conférence Inria de 2008, …

Début d’existence : naissance, création, formation, etc.

Fin d’existence : destruction, dissolution, mort, etc.

3.3

Page 16: Représentation et accès: continuités et transformations. Chapitre 4. Métadonnées et normalisation

INRIA IST - Session Métadonnées et normalisation par Sylvie Dalbin 30 Sept 2008 - p.16

Notation particulière : CRM (2)

« un Lieu » (E53 - Place )

« est identifié par » (P87 - identified by)

« une appellation » (E4 - Appellation)

• Des métadonnées libérées • Des applications à construire

« un élément physique fabriqué par l’homme » (E24 - Physical man-made thing)

« A par héritage des propriétés de tout objet physique »

« une localisation ou une position » (P53 - has former location)

« Dans un lieu précis » (E53 - Place)

QuickTime™ et undécompresseur sont requis pour visionner cette image.

3.3

Page 17: Représentation et accès: continuités et transformations. Chapitre 4. Métadonnées et normalisation

INRIA IST - Session Métadonnées et normalisation par Sylvie Dalbin 30 Sept 2008 - p.17

Profil d’application : TEF

• Thèses électroniques françaises, recommandation

Afnor 2006

• Composition de la recommandation – Un modèle pour le genre « thèse » s’appuyant sur les FRBR

• travail universitaire validé par des pairs, une œuvre de l’esprit, un document administratif pour la délivrance d’un diplôme national

– Un format informatique de structuration et d’encodage XML selon le vocabulaire Schematron. (binding)

– Un format informatique d’organisation des données selon le vocabulaire METS

3.4

Page 18: Représentation et accès: continuités et transformations. Chapitre 4. Métadonnées et normalisation

INRIA IST - Session Métadonnées et normalisation par Sylvie Dalbin 30 Sept 2008 - p.18

Conteneur et transporteur : METS

• Metadata Encoding and Transmission Standard– Maintenu par la LC

– Enveloppe pour transporter des ressources – Une carte de la structure (Structural Map) de l’objet METS – La liste des fichiers (File Section)– Cinq autres sections, facultatives et répétables en fonction des

ressources intégrées : l’en-tête, les métadonnées descriptives et administratives, les liens structurels entre les différents éléments de la carte, ainsi que des exécutables.

• Autre conteneur : MXF (Material eXchange Format)– Etabli par la SMPTE (Soc. Motion Picture & TV Engineers).

– Enveloppe unique : contenus (essences), métadonnées, informations administratives sur la ressource globale

3.5

Page 19: Représentation et accès: continuités et transformations. Chapitre 4. Métadonnées et normalisation

INRIA IST - Session Métadonnées et normalisation par Sylvie Dalbin 30 Sept 2008 - p.19

Livres numériques

DAISY

ePub de l’IDPF

format harmonisé ?

DocBook

• Digital Accessible Information System, Z39.86:2005Adopté par Braillenet en 2002 ;

• Structuration XML des livres audionumérique, DTBook Métadonnées spécifiques : navigation dans la structure du livre + synchronisation sonore

• Norme SMIL/XHTML du W3C

• acteurs variés (Adobe, Hachette, OCLC, universités…)• 3 spécifications: structure (OPS), format (OPF), conteneur

(OCF)• Vocabulaire établi à partir du DTBook (Daisy) et XHTML

• Depuis 1992, par OASIS - intégré aux outils bureautiques• Noyau standardisé extensible; modèle et schéma XML• Un vocabulaire intégrant la structure des documents et les

métadonnées (dont 3 éléments du DC)

3.6

Page 20: Représentation et accès: continuités et transformations. Chapitre 4. Métadonnées et normalisation

INRIA IST - Session Métadonnées et normalisation par Sylvie Dalbin 30 Sept 2008 - p.20

Schémas de concepts (1)

• Derrière des schémas, des modèles différents– TMF (ISO 16642:2003) - Terminological Markup Framework

– SKOS/RDF du W3C, Juin 2008 - thésaurus et classification pour la recherche

– NP25964 - projet de refonte des normes du thésaurus, pour l’indexation (et la recherche)

• Composants– Concepts et relations entre concepts ; termes reliés avec des

concepts et entre eux

– Entités - attributs - relation

3 modèles - 3 finalités différentesAtelier - étudier la représentation UML d’un schéma

3.7

Page 21: Représentation et accès: continuités et transformations. Chapitre 4. Métadonnées et normalisation

INRIA IST - Session Métadonnées et normalisation par Sylvie Dalbin 30 Sept 2008 - p.21

Composants transversaux

• Représentation de haut niveau– Modélisation qui convient dans de nombreux contextes (A)

– Développement de schémas normalisés, réutilisables (B)

• Utilisables dans d’autres schémas ou profils

• Exemples– Jeu de métadonnées générique : Dublin Core

– Eléments de données ou groupe d’éléments de données• Identifiants normalisés• Langues, Pays,…• Microformats : hCard (vCard), hCalendar,…• Certaines balises imposées dans (X)Html : rel: «license »• Schémas de concepts

3.8

Page 22: Représentation et accès: continuités et transformations. Chapitre 4. Métadonnées et normalisation

INRIA IST - Session Métadonnées et normalisation par Sylvie Dalbin 30 Sept 2008 - p.22

Familles de schémas : cohérence métier

3.9

Page 23: Représentation et accès: continuités et transformations. Chapitre 4. Métadonnées et normalisation

4. EN CONCLUSION

Sur le plan technique

Sur le plan des métiers

Sur le plan de la normalisation

4.

Page 24: Représentation et accès: continuités et transformations. Chapitre 4. Métadonnées et normalisation

INRIA IST - Session Métadonnées et normalisation par Sylvie Dalbin 30 Sept 2008 - p.24

Sur le plan technique

• Des formalismes variés– Ne facilitant pas la prise en main de schémas ou modèles

• Qu’est-ce-qu’un schéma de représentation ?– Une entité globale (le profil d’application LOM Fr)

– Ou un ensemble de composants (langue, DRM,…)

• Correspondance entre schémas– Alignement conceptuel plutôt qu’alignement technique

– Utiliser Dublin Core comme un cadre général et non comme une spécification technique

4.1

Page 25: Représentation et accès: continuités et transformations. Chapitre 4. Métadonnées et normalisation

INRIA IST - Session Métadonnées et normalisation par Sylvie Dalbin 30 Sept 2008 - p.25

Sur le plan des métiers

• Continuum de la conception à l’exploitation des ressources– Métadonnées à la source : « recyclage infini » des métadonnées

produites, et non (re)création

– Ne pas rester à la lisière du document

4.1

Page 26: Représentation et accès: continuités et transformations. Chapitre 4. Métadonnées et normalisation

INRIA IST - Session Métadonnées et normalisation par Sylvie Dalbin 30 Sept 2008 - p.26

Annexe 1 - Outil : langage graphique UML

relation

entités

attributsDraft Schema np25964