2013 bibnum ebd
DESCRIPTION
bibliothèque numérique, numérisation, formation à destination des étudiants de 1° année à l'Ecole des bibliothécaires et documentalistes (ebd.fr)TRANSCRIPT
![Page 1: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/1.jpg)
numérisation et bibliothèque numérique
Luc Bellier, BnF
École de bibliothécaires documentalistes, Septembre-Octobre 2013
![Page 2: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/2.jpg)
Travaux pratiques : Travaux pratiques : manipuler un document manipuler un document
numériquenumérique Objectif : appréhender les différents composant le document
numérique Télécharger un document PDF sur Gallica
http://gallica.bnf.fr/ark:/12148/bpt6k145269m Le manipuler (mode texte et mode image, appréhender les méta-
données et les qualifier) Consulter le document sur Gallica et retrouver les éléments du
document numérique Télécharger un ePub et le manipuler retrouver les mêmes éléments
(http://fr.feedbooks.com/book/16/bel-ami ou http://gallica.bnf.fr/ark:/12148/bpt6k145269m)
A la maison : consulter un document sur Google Books, athi trust ou autre et décrire les services proposés par la bibliothèque numérique
Prendre quelques images et les passer à l’OCR (presse, patrimonial, illustré, moderne) => préparer le dossier avec images concernées
![Page 3: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/3.jpg)
Travaux pratiques : Travaux pratiques : manipuler un document manipuler un document
numériquenumérique•TéléchargerPDF
•Trouver le mode texte•Télécharger l’ePub•Changer le .ePub en .zip•Ouvrir le dossier
![Page 4: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/4.jpg)
•Le titre = métadonnées descriptives•Les pages = métadonnées de structure
Travaux pratiques : Travaux pratiques : manipuler un document manipuler un document
numériquenumérique
![Page 5: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/5.jpg)
•?
•Un document numérique / électronique, c’est une suite de fichiers sans lien entre eux
•Métadonnées descriptives•rattacher le document à l’original / différentes versions d’un document
•donner accès à la copie numérique / électronique
• identifiant unique (localisation / identification)
•Métadonnées de structure
•rattacher les fichiers entre eux
•reconstituer la structure du document
•Métadonnées administratives
•gérer la collection, c’est-à-dire
•gérer les droits d’accès
•préserver les informations techniques nécessaires à la lecture des fichiers
•garantir l ’intégrité des fichiers et le suivi de leurs éventuelles modifications
•LesLes métadonnéesmétadonnées
![Page 6: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/6.jpg)
•Le contenu d’un ePub
Travaux pratiques : Travaux pratiques : manipuler un document manipuler un document
numériquenumérique
![Page 7: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/7.jpg)
•Le manifeste *.opf
Travaux pratiques : Travaux pratiques : manipuler un document manipuler un document
numériquenumérique
![Page 8: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/8.jpg)
•Toc.ncx
Travaux pratiques : Travaux pratiques : manipuler un document manipuler un document
numériquenumérique
![Page 9: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/9.jpg)
Produire et décrire le Produire et décrire le document numériquedocument numérique
» Le cas des livres numériques ePub
•Métadonnées•Descriptives?
Métadonnées de structure ?
•OPF
•XH
TML
•JPG
•NC
X
![Page 10: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/10.jpg)
•?
•Un document numérique / électronique, c’est une suite de fichiers sans lien entre eux
•Métadonnées descriptives•rattacher le document à l’original / différentes versions d’un document
•donner accès à la copie numérique / électronique
• identifiant unique (localisation / identification)
•Métadonnées de structure
•rattacher les fichiers entre eux
•reconstituer la structure du document
•Métadonnées administratives
•gérer la collection, c’est-à-dire
•gérer les droits d’accès
•préserver les informations techniques nécessaires à la lecture des fichiers
•garantir l ’intégrité des fichiers et le suivi de leurs éventuelles modifications
•LesLes métadonnéesmétadonnées
![Page 11: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/11.jpg)
Travaux pratiques : Travaux pratiques : manipuler un document manipuler un document
numériquenumérique
![Page 12: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/12.jpg)
Travaux pratiques : Travaux pratiques : manipuler un document manipuler un document
numériquenumérique
![Page 13: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/13.jpg)
Travaux pratiques : Travaux pratiques : manipuler un document manipuler un document
numériquenumérique
![Page 14: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/14.jpg)
Travaux pratiques : Travaux pratiques : manipuler un document manipuler un document
numériquenumérique
![Page 15: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/15.jpg)
Fiche à faire à la Fiche à faire à la maisonmaison
À compléter et à envoyer à [email protected]
Présentation du site Nom de la bibliothèque numérique Nom de l’institution éditrice
Présentation des collections Nature des collections proposées par la bibliothèque Quantité estimée des documents Autres informations
Services proposés par la bibliothèque numérique Quels accès aux documents ? Quels type de lecture est proposée ? Autres informations
![Page 16: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/16.jpg)
•?
•Un document numérique / électronique, c’est une suite de fichiers sans lien entre eux
•Métadonnées descriptives•rattacher le document à l’original / différentes versions d’un document
•donner accès à la copie numérique / électronique
• identifiant unique (localisation / identification)
•Métadonnées de structure
•rattacher les fichiers entre eux
•reconstituer la structure du document
•Métadonnées administratives
•gérer la collection, c’est-à-dire
•gérer les droits d’accès
•préserver les informations techniques nécessaires à la lecture des fichiers
•garantir l ’intégrité des fichiers et le suivi de leurs éventuelles modifications
•LesLes métadonnéesmétadonnées
![Page 17: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/17.jpg)
![Page 18: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/18.jpg)
![Page 19: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/19.jpg)
Qu’est-ce qu’une bibliothèque numérique?
Luc Bellier, BnF
École de bibliothécaires documentalistes, octobre-novembre 2010
![Page 20: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/20.jpg)
PlanPlan
Qu’est-ce qu’une bibliothèque numérique?
Des collections de documents Sélectionner Numériser Décrire et organiser Conserver et stocker
Un espace
Des publics
Des services
![Page 21: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/21.jpg)
Qu’est-ce qu’une bibliothèque?Qu’est-ce qu’une bibliothèque?
des livres(sélectionnés et classés)
un espace…
des outils de référence
un publicdes publics…
…qui ont besoin de confort,de lumière, d’espace, d’outils pour lire, écrire, discuter, travailler etc...
![Page 22: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/22.jpg)
La bibliothèque numérique : visiteLa bibliothèque numérique : visite
Entrée
La liste des nouveautés
Le bureau de renseignements
Votre place
Les actualitésde la bibliothèque
La sélection du bibliothécaire
Accès au moteur de recherche
Les rayonnages en libre-accès pour le butinage
Les outils de fidélisationet de communication
accès
valorisation
services
accès
valorisation
accès
valorisation
accès
services
![Page 23: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/23.jpg)
Une collection de documents
![Page 24: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/24.jpg)
La chaîne de numérisation : qu’est-ce que numériser ?La chaîne de numérisation : qu’est-ce que numériser ?
Sélectionner
Scanner : Couleurs, niveaux de gris ou noir et blanc ? 72 dpi ? 300 ? 600 ? Quels formats ? Tiff, jpeg etc.
Océriser Pour chercher (texte uniquement) Pour afficher (faire correspondre texte et image => métadonnées) Pour vocaliser (qualité optimum ou garantie => comment évaluer la
qualité?) Pour transférer (le texte sans l’image , mais que le texte, sur un
format portable)
Décrire et organiser Le document (signalement) Les images constituant le document Les fichiers textes issus de l’ocr
![Page 25: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/25.jpg)
1- La chaîne de numérisation :
sélectionner
![Page 26: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/26.jpg)
•Estimation et analyse de besoins
•Recherche et collecte d’informations
•Sélection, acquisition des documents
•Traitement des documents
•Traitement intellectuel :•Catalogage et indexation•Analyse, résumé etc.
•Enregistrement de l’information
•Traitement matériel :•Enregistrement du document•Équipement, reproduction, conservation (reliure etc.)
•Classement
•Diffusion de l’information :•Prêt •Mise à disposition des produits secondaires (catalogue, bibliographies, revue de presse etc.)
![Page 27: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/27.jpg)
La chaîne de numérisationLa chaîne de numérisation
NumérisationNumérisation
En mode texteEn mode texte
RelectureRelecture encodageencodage
Compétences bibliothéconomiques
Compétences techniques
Pas de compétences particulières
SélectionSélection
AcquisitionAcquisition
SignalementSignalement
Mise en ligne
Mise en ligneIndexationIndexation
En mode imageEn mode image
structurationstructuration transformationtransformationContrôleContrôle
Prestataire
![Page 28: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/28.jpg)
La chaîne de numérisation, 1 : « sélection- acquisition»La chaîne de numérisation, 1 : « sélection- acquisition»
NumérisationNumérisation
En mode texteEn mode texte
RelectureRelecture encodageencodage
SélectionSélection
AcquisitionAcquisition
SignalementSignalement
Mise en ligne
Mise en ligneIndexationIndexation
En mode imageEn mode image
structurationstructuration transformationtransformationContrôleContrôle
Politique documentaire de la bibliothèqueOrganisation logistique
![Page 29: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/29.jpg)
« Sélection » : la politique documentaire« Sélection » : la politique documentaire
Politique documentaire
Collections de la bibliothèque Public visé
Objectifs & missions
Contraintes juridiques
et techniques
Numérisation de sauvegarde : les documents fragiles, en danger?
Numérisation à la demande des utilisateurs?
Numérisation pour la diffusion
Public de la bibliothèque?
Public à distance?
Grand public, chercheurs, étudiants?
Droits d’auteur
État physique des documents
Collection encyclopédique?
Collection spécialisée?
Types de supports
Types de documents
Programmes de numérisation
![Page 30: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/30.jpg)
Les programmes de numérisation à la BnFLes programmes de numérisation à la BnF
Collection encyclopédique
Documents libres de droits
Tout support Monographies, périodiques, images, son
Pour un public de Chercheurs, étudiants, érudits, « médiateurs » (enseignants, journalistes,
associations) Grand public de plus en plus ciblé
Grands axes : le patrimoine national (somme des œuvres et des connaissances dans
toutes les disciplines, philosophie, histoire, littérature, religion, sciences,…), des programmes à vocation internationale (rapprochement et
confrontation de corpus patrimoniaux portant sur le même sujet mais issus d’autres nationalités : presse quotidienne, documentation juridique, histoire et sciences auxiliaires telles que la généalogie, les langues et leur apprentissage,…)
un corpus d’œuvres et de documents consacrés spécifiquement à l’Europe dans tout ses aspects (philosophie politique, identités nationales, histoire, économie, commerce, le travail, les métiers les sciences et techniques, les questions sociales, les grands évènements culturels,…).
![Page 31: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/31.jpg)
La question des droits : considérer le contenuLa question des droits : considérer le contenu
Robert Doisneau (1912-1994) Epouvantails, 1964
Robert Doisneau (1912-1994)SAVIGNAC aux échecs. Paris, 1950
personneoeuvre
auteur
auteur
![Page 32: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/32.jpg)
La question des droits (http://print.google.com)La question des droits (http://print.google.com)
Recherche dans l’ensemble du texte, visualisation d’extraits
![Page 33: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/33.jpg)
La question des droits (http://www.persee.fr)La question des droits (http://www.persee.fr)
Blocage des images
![Page 34: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/34.jpg)
« Acquisition » : mettre à disposition les « Acquisition » : mettre à disposition les
originaux?originaux?
Une fois la sélection faite, il faut se procurer les documents
C’est en partie une question technique et financière Achat de document pour la numérisation Ou numérisation des documents originaux
Numériser le papier ou le microfilm ? Différence de prix, de rapidité et de qualité Question de préservation du document original
Numériser des originaux Le scanner tourne page ? Dérelier ou massicoter ? Différences de prix et de qualité
Problèmes logistiques liés à la numérisation patrimoniale Sortir les ouvrages des magasins Problèmes d’indisponibilité pour les lecteurs Le transport et la livraison (conditions de conservation) La numérisation sur site (coût)
![Page 35: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/35.jpg)
Filière Papier Filière Microformes
Reliés
Massicots
Films
Fiches
« Acquisition » : mettre à disposition les originaux?« Acquisition » : mettre à disposition les originaux?
![Page 36: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/36.jpg)
Les « objets » sont transportés dans des caisses scelléesLes « objets » sont transportés dans des caisses scellées
« Acquisition » : mettre à disposition les originaux?
![Page 37: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/37.jpg)
2- La chaîne de numérisation : signaler
![Page 38: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/38.jpg)
La chaîne de numérisation, 2 : « signalement »La chaîne de numérisation, 2 : « signalement »
NumérisationNumérisation
En mode texteEn mode texte
RelectureRelecture encodageencodage
SélectionSélection
AcquisitionAcquisition
SignalementSignalement
Mise en ligne
Mise en ligneIndexationIndexation
En mode imageEn mode image
structurationstructuration transformationtransformationContrôleContrôle
![Page 39: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/39.jpg)
La chaîne de numérisation, 2 : « signalement »La chaîne de numérisation, 2 : « signalement »
![Page 40: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/40.jpg)
La chaîne de numérisation, 2 : « signalement »La chaîne de numérisation, 2 : « signalement »
![Page 41: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/41.jpg)
« Signalement » : la notion de métadonnées« Signalement » : la notion de métadonnées
Des données sur les données ...
– qui servent à organiser la connaissance et à utiliser et exploiter le document
• Métadonnées descriptives, contextuelles et structurelles
– Ex. : Notice bibliographique, indexation
– Ex. : Date et formats de numérisation
– Ex. : Données sur les fichiers pour reconstituer l’ouvrage (Cf. plus loin)
• initiales et ajoutées tout au long du cycle de vie du document numérisé
– qui servent à le maintenir accessible dans le temps et à garantir et contrôler cet accès
• Métadonnées administratives et techniques
– Ex. : Droits de lecture en interne seulement ou droit sur Internet
• initiales et ajoutées tout au long du cycle de vie du document numérisé
– Ex. : passage d’un document protégé dans le domaine public
![Page 42: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/42.jpg)
Pourquoi a-t-on besoin de métadonnées? Pourquoi a-t-on besoin de métadonnées?
La déconstruction du document numériqueLa déconstruction du document numérique
![Page 43: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/43.jpg)
« Signalement » : les métadonnées« Signalement » : les métadonnées
?
Un livre numérisé, c’est une suite de fichiers sans lien entre eux : la numérisation déconstruit le livre
Métadonnées de structure
•rattacher les fichiers entre eux
•reconstituer la structure du document
Métadonnées descriptives
•rattacher le document à l’original
•donner accès à la copie numérisée
Métadonnées administratives
•gérer les droits d ’accès
•préserver les informations techniques nécessaires à la lecture des fichiers
identifiant unique
![Page 44: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/44.jpg)
Le document : notion de granularitéLe document : notion de granularité
Collection Document(notice
bibliographique)
Volume, tome, fascicule...
Page
• Notion de document complexe
• Un document peut avoir plusieurs niveaux d’accès
• Par ex. les périodiques :
Vue de détail
(article)
![Page 45: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/45.jpg)
3- La chaîne de numérisation : numériser
![Page 46: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/46.jpg)
La chaîne de numérisation, 3 : « Numérisation »La chaîne de numérisation, 3 : « Numérisation »
NumérisationNumérisation
En mode texteEn mode texte
RelectureRelecture encodageencodage
SélectionSélection
AcquisitionAcquisition
SignalementSignalement
Mise en ligne
Mise en ligneIndexationIndexation
En mode imageEn mode image
structurationstructuration transformationtransformationContrôleContrôle
![Page 47: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/47.jpg)
Numériser en mode imageNumériser en mode image
La numérisation en mode image s’intéresse à la forme et donc à la structure physique
Avantages : un fac-similé
préserve l’intégrité de l’original
Inconvénients : un seul point d ’accès : la
notice bibliographique
pas de possibilités de manipulation du texte
poids des images > stockage, temps de téléchargement
mise en place de chaînes de numérisation complexes
![Page 48: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/48.jpg)
Numériser en mode texteNumériser en mode texte
La numérisation en mode texte s’intéresse directement au contenu et donc à la structure logique
Avantages recherche plein texte et
autres manipulations souplesse et portabilité Accessibilité pour les
personnes en situation de handicap visuel
Inconvénients lourdeur de réalisation coût
![Page 49: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/49.jpg)
Numériser en mode texteNumériser en mode texte
Il y a deux techniques de création du mode texte…
La reconnaissance automatique de caractères ou OCR fortement conditionnée par la qualité de numérisation problèmes : caractères anciens, mal formés, caractères
spéciaux, titres, documents en mauvais état… recherches en cours, amélioration des logiciels mais correction manuelle obligatoire pour une qualité à
100%
La saisie saisie manuelle : coût en termes de ressources humaines « double saisie manuelle comparée »
![Page 50: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/50.jpg)
Numériser en texte et imageNumériser en texte et image
Il existe des solutions qui combinent les deux modes
Avantage Combiner les avantages du texte et de l’image
Inconvénients Difficulté de réalisation et de contrôle Globalement, cela revient à numériser deux fois… donc
deux fois plus de travail, et coûts élevés
![Page 51: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/51.jpg)
Numériser en texte et image Numériser en texte et image
(http://www.bium.univ-paris5.fr/histmed/medica.htm)(http://www.bium.univ-paris5.fr/histmed/medica.htm)
Liste des chapitres en mode texte
Pages en mode image
![Page 52: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/52.jpg)
Numériser en texte et image Numériser en texte et image
(http://www.persee.fr)(http://www.persee.fr)
Mode imageMode texte (OCR de
très bonne qualité, documents récents)
![Page 53: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/53.jpg)
Numériser en texte et image Numériser en texte et image
(http://books.google.fr/)(http://books.google.fr/)
Visualisation du mode image uniquement, mode texte issu d’OCR en sous-couche permettant la
recherche plein texte et le surlignage des résultats de la recherche
![Page 54: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/54.jpg)
L’OCRL’OCR
L’OCR est un processus automatique
La qualité comme la reconnaissance sont calculés par des machines
C’est le nombre de caractères suspects divisés par le nombre total de caractères sur une page.
Une page de dix caractères vaut autant qu’une page de 10000 caractères dans un même ouvrage.
![Page 55: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/55.jpg)
Kirtas APT 2400
Les ouvrages de la filière « reliés » sont numérisés soit…. AutomatiquementNumérisation à 90°
Numériser : l’équipement
![Page 56: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/56.jpg)
CopybookDigibook 2000LCSuprascan A0
Les ouvrages de la filière « reliés » sont numérisés soit…. manuellement sur des scanners de livresNumérisation à plat
Numériser : l’équipement
![Page 57: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/57.jpg)
Les microformes sont numérisées sur des scanners de microfilms et de microfiches
Microfiches
Microfilms
Numériser : l’équipement
![Page 58: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/58.jpg)
Les ouvrages de la filière « massicots » sont numérisés sur des scanners de production grande vitesse
Plus de 6000 pages/heure
Docuscan 6000
Numériser : l’équipement
![Page 59: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/59.jpg)
Un opérateur contrôle le traitement des images sur le logiciel SpiFactory
Redressement
Binarisation (transformation des images de niveau de gris et couleur en noir et blanc)
Filtrage des formes(redressement des blancs, des lignes, des caractères à l’intérieur d’une image)
Recadrage des pages
Illustrations
Numériser : un exemple de traitement d’image
![Page 60: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/60.jpg)
4- La chaîne de numérisation : décrire et
organiser
![Page 61: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/61.jpg)
La chaîne de numérisation, 4 : « indexation - mise en ligne »La chaîne de numérisation, 4 : « indexation - mise en ligne »
NumérisationNumérisation
En mode texteEn mode texte
RelectureRelecture encodageencodage
SélectionSélection
AcquisitionAcquisition
SignalementSignalement
Mise en ligne
Mise en ligneIndexationIndexation
En mode imageEn mode image
structurationstructuration transformationtransformationContrôleContrôle
![Page 62: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/62.jpg)
« Indexation » : la création des accès« Indexation » : la création des accès
Le matériau indexable : les métadonnées – descriptives – structurées le texte – en grande quantité – de qualité variable
L’indexation permet de créer des accès aux documents Via un catalogue Via un moteur de recherche
le catalogue adapté pour la recherche avancée Classement par titre, auteur etc.
le moteur de recherche recherche simple conforme aux habitudes du web recherche fine (plein-texte) classement des résultats par pertinence
![Page 63: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/63.jpg)
« Mise en ligne » : la salle de lecture virtuelle« Mise en ligne » : la salle de lecture virtuelle
La « salle de lecture virtuelle » est un espace où l’on consulte les collections Elle met à disposition des lecteurs les instruments d’accès et de
renseignement bibliographique Elle propose des outils de présentation des collections (mise en
contexte, valorisation) : pages éditoriales Elle constitue un espace convivial (rencontres, expositions) Elle constitue un espace de confort pour travailler (lecture du
document) Elle offre des services de valeur ajoutée pour aider les lecteurs
dans leur travail
1. faire aussi bien que le livre
2. faire mieux que le livre
![Page 64: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/64.jpg)
5- La chaîne de numérisation : stocker et
conserver
![Page 65: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/65.jpg)
La conservationLa conservation
Une fois les documents numérisés, sont-il vraiment en sécurité ? Pour combien de temps ?
Sauvegarder n’est pas archiver
Surveiller et renouveler régulièrement les supports (de façon préventive)
Collecter toutes les informations nécessaires pour maîtriser le document (métadonnées)
Transformer le document dans une forme plus facile à conserver dans le temps (« migration »)
Collecter des environnements et des plateformes de références pour l’avenir (« émulation »)
![Page 66: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/66.jpg)
6- les services
![Page 67: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/67.jpg)
Le partage des données : OAI et coopérationLe partage des données : OAI et coopération
Interopérabilité des données (OAI-PMH, Entrepôts OAI) Initiative OAI : Open Archive Initiative (1999)
Objectif : améliorer le signalement des e-prints, des publications scientifiques et l’interopérabilité des bases d’archives ouvertes
Moyen : création d’un protocole technique de diffusion et de collecte de métadonnées
OAI-PMH : Protocol for Metadata Harvesting Intérêt dans le domaine culturel et patrimonial
Collections partagées dans des architectures réparties
Interrogation centraliséeFournisseurs de données
Fournisseurs de services
![Page 68: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/68.jpg)
OAI et coopération : GallicaOAI et coopération : Gallica
BIUM3970 notices
Bibliothèques virtuelles humanistes
186 notices
363 notices
Library of Congress
serveur OAI
serveur OAI
serveur OAI
Consultation de ces documents sur les autres sites
site BIUM
site LOC
site BVH
Base de données
serveur OAI
CNUM91 notices
site CNUM
Universités de Strasbourg
serveur OAI
435 notices
site SICD Strasbourg
Syndicat national de l’édition
5546 notices
Editeurs
serveur OAI
serveur OAI
![Page 69: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/69.jpg)
Bibliothèques numériques : actualités,
gallica
![Page 70: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/70.jpg)
Hathi trustHathi trust
![Page 71: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/71.jpg)
L’actualité en 2004-2005L’actualité en 2004-2005
Oct. 2004 : annonce du lancement de Google Print à la Foire de Francfort (Google), rebaptisé Google Book Search/ Google Recherche de livres en nov. 2005
Janv. 2005 : article de JN Jeanneney dans Le Monde lance l’idée d’une Bibliothèque numérique européenne (BnF, Commission européenne)
Oct. 2005 : création du consortium Open Content Alliance (Internet Archive, Yahoo!, MSN, Bibliothèques, archives anglophones etc.)
Nov. 2005 : partenariat Microsoft-Bristish Library pour numérisation de 25 millions de pages ($2,5 M) et annonce MSN Live Search
Nov. 2005 : lancement de la World Digital Library par James Billington (Library of Congress + UNESCO) avec l’aide de Google ($3 M)
![Page 72: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/72.jpg)
L’actualité en 2006-2007L’actualité en 2006-2007
Sept. 2006 : réalisation par la BnF d’une maquette (Europeana) préfigurant des accès et services pour une bibliothèque numérique européenne
Déc. 2006 : lancement de MSN Live Search
Mars 2007 : lancement par la BnF du prototype Europeana au Salon du livre (hors ligne depuis fin 2007)
Juillet 2007 : reprise du projet Europeana au niveau européen (géré par EDL Foundation)
Oct. 2007 : lancement de Gallica 2
Mars 2010 : 1 millions de documents accessibles dans Gallica
![Page 73: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/73.jpg)
Google recherche de livres en 2012: 30 bibliothèques partenaires pour la numérisation de leurs collections 10 000 éditeurs et auteurs partenaires Interface dans 35 langues Pas de communication sur le nombre de documents (20 Millions
évoqués)
Arrêt du programme de numérisation de livres de MSN en mai 2008
Open Content Alliance en novembre 2008 : Open Library
Bibliothèques américaines (Boston Library consortium), canadiennes, universités, Sociétés de l’Internet (une cinquantaine de partenaires)
19,401,009 titres de livres numérisés dont 340,083 en plein-texte Documents également accessibles sur Internet Archive
http://www.hathitrust.org/ rassemble depuis 2008 les grandes bibliothèques américaines (NYPL, Yale, Cornell, Columbia…) 10,556,750 volumes
5,556,767 livres274,642 périodiques3,694,862,850 pages Dont 1 702 727 volumes dans le domaine public en 2010 et 1 437 886 en 2012
Que sont devenus ces projets en 2013?Que sont devenus ces projets en 2013?
![Page 74: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/74.jpg)
Google Recherche de LivresGoogle Recherche de Livres
![Page 75: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/75.jpg)
Hathi TrustHathi Trust
![Page 76: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/76.jpg)
Open Content AllianceOpen Content Alliance
![Page 77: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/77.jpg)
World Digital LibraryWorld Digital Library
![Page 78: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/78.jpg)
EuropeanaEuropeana
![Page 79: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/79.jpg)
Principales différences Principales différences entre ces différents entre ces différents
projets projets Bibliothèque (Gallica, Europeana, WDL) versus Entrepôt
(Google, OCA)
Gouvernance centralisée (Google) versus Consortium ou Partenariats (OCA, Europeana, WDL)
Financements majoritairement publics (Europeana, Gallica) versus financements privés (Google, OCA)
Architecture centralisée (Google, OCA) versus architecture répartie (Europeana)
L’utilisateur va vers la ressource (Gallica, Google, Europeana, WDL) versus la ressource va vers l’utilisateur (OCA)
Modèles organisationnels et économiques différents
![Page 80: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/80.jpg)
Les enjeuxLes enjeux Enjeux culturels
Le Web comme média principal pour la diffusion de l’information et de la connaissance, enjeu de démocratisation culturelle
Nécessité de répondre aux attentes des utilisateurs, de s’adapter aux pratiques des internautes (recherche plein texte)
Enjeux technologiques Numérisation comme support de sauvegarde et de diffusion machines pour la numérisation de masse Mise en réseaux de ressources dispersées et nécessité
d’interopérabilité (coopération)
Enjeux économiques Enjeu commercial : plus de contenu pour attirer plus
d’internautes / Enjeu culturel : mission de diffusion et de valorisation des institutions
Besoin de contenu/besoin de financement Partenariats public/privé
![Page 81: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/81.jpg)
GallicaGallica
![Page 82: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/82.jpg)
Conclusion : que retenir de tout cela ?
![Page 83: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/83.jpg)
Règle n° 1 : « Règle n° 1 : « Numériser, ce n’est pas éditer »Numériser, ce n’est pas éditer »
Numériser ce n’est pas interpréter commenter améliorer
Numériser c’est reproduire donner à consulter aider à lire
![Page 84: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/84.jpg)
Règle n° 2 : « Règle n° 2 : « l’information n’est pas connaissance »l’information n’est pas connaissance »
Une bibliothèque numérique ce n’est pas Un entrepôt de données Un moteur de recherche Une librairie en ligne
Une bibliothèque numérique c’est Un ensemble organisé Des services Des informations structurées et contextualisées Un accès à toutes les informations contenues
dans un document
![Page 85: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/85.jpg)
Règle n° 3 : Règle n° 3 : « Numériser n’est pas seulement un acte technique »« Numériser n’est pas seulement un acte technique »
Les choix techniques ne sont pas Déterminés uniquement par les moyens financiers Déterminés par le prestataire qui numérise La première chose à décider
Les choix techniques sont Déterminants pour les conditions de consultation Déterminants pour l’interopérabilité Déterminants pour la conservation à long terme
![Page 86: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/86.jpg)
0010000000100000001000000011000100110010001100000010000000100000001000000010000000110101001110000010000000100000001101010010000000100000001000000011000100111001001110000011000100101101001100000011100100101101001100110011000001010100001100010011010000111010001100100011001000111010001100000011000100101110001101100011001000111001010110100010000000100000001000000011001100111000001110010011100000101110001101110011000000100000001000000010000000110010001100110011010100110010001011100011010000110101001000000010000000100000001000000010000000101101001100010010111000110110001101100010000000100000001000000010110100110111001011100110111001100100010000000100000001011010011000100111000001011100011011000110001001000000010000000101101001110000011000000101100011000000110000001000000010000000101101001110000011000000101110001100000011000000100000001000000010000000110001001000000010000000110100001100110010000000100000001000000011100100100000001000000010000000100000001110010011100000111001001011100011010000110010001000000010000000100000001000000010000000110001001101100010111000110000001100100010000000100000001000000010000000100000001101010011001100101110001110000011001100100000001000000010000000100000001000000011010100110110001011100011011000110010001000000010000000100000001000000010000000100000001101000010111000111000001100010010000000100000001000000010000000110111001110010011001100101110001101010011100000100000001000000010000000100000001000000010000000110011001011100011001100110100000010100010000000100000001000000011000100110010001100000010000000100000001000000010000000110101001110000010000000100000001101010010000000100000001000000011000100111001001110000011000100101101001100000011100100101101001100110011000001010100001100010011010000111010001100100011001000111010001100000011010100101110001101110011100000111000010110100010000000100000001000000011001100111000001110010011010000101110001101100011010000100000001000000010000000110010001101010011010000110110001011100011100000111000001000000010000000100000001000000010000001000000010110100111000001100000010
Bibliothèque physique et bibliothèque numériqueBibliothèque physique et bibliothèque numérique
Sélection
Acquisition
Description : Catalogage
Préparation à la
consultation : Équipement
Magasinage
Conservation
Communication
Valorisation
Sélection
Collecte / production
Description : Métadonnées /
indexation
Préparation à la
consultation : Empaquetage
Gestion
Préservation
Accès
Valorisation
Con
su
ltati
on
d’u
ne
collecti
on
Gesti
on
d’u
ne
collecti
on
Ran
gem
en
t et
con
serr
vato
pn
d’u
ne
collecti
on
Con
sti
tuti
on
d
’un
e
collecti
on
![Page 87: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/87.jpg)
Le rôle du bibliothécaire numériqueLe rôle du bibliothécaire numérique
Ce qui ne change pas : Il travaille à la constitution des collections et à l’élaboration des
instruments de référence qui permettent d’y accéder Il gère physiquement la collection, veille à son organisation, à
son bon état de conservation Il sert d’interface (au sens propre) entre le public et les
collections, fait fonctionner les services au public et la collection
Ce qui change Il acquiert des compétences techniques en informatique
(architecture Web, capacité à rédiger à cahier des charges – même si ce n’est pas lui qui met en œuvre)
Il comprend ce qu’est un document numérique, et la différence avec un document bibliographique et un document analogique, il connaît l’environnement juridique de la propriété intellectuelle
Il est capable de traduire en termes ergonomiques ses compétences de service public pour s’adapter à un public distant
![Page 88: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/88.jpg)
Quelques sitesQuelques sites
http://gallica.bnf.fr / http://gallica2.bnf.fr
http://www.europeana.eu
http://maquette.bnf.fr/labs/scenario/Europeana.demo.html
http://memory.loc.gov/ammem/index.html
http://www.gutenberg.org
http://cnum.cnam.fr/
www.bvh.univ-tours.fr
http://gdz.sub.uni-goettingen.de/de/index.html
http://www.persee.fr
http://elec.enc.sorbonne.fr/
http://books.google.fr/
http://www.openlibrary.org
![Page 89: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/89.jpg)
Quelques sitesQuelques sites http://www.wdl.org/fr/ http://bibliotheque-numerique.inha.fr http://www.gutenberg.org/browse/languages/fr http://www.europeana.eu/portal/ http://fr.wikipedia.org/wiki/Wikisource http://www.archive.org http://classiques.uqac.ca/ http://www.e-corpus.org http://www.livres-et-ebooks.fr/ http://www.cairn.info http://www.persee.fr http://www.revues.org/ http://www.erudit.org http://fr.wikisource.org/ http://web2.bium.univ-paris5.fr http://expositions.bnf.fr/livres/
![Page 90: 2013 bibnum ebd](https://reader037.vdocuments.net/reader037/viewer/2022110118/554fc2dcb4c9050e7d8b4e12/html5/thumbnails/90.jpg)
Quelques ressourcesQuelques ressources
Sur le site Numérisation du patrimoine culturel du Ministère de la Culture : La bibliographie :
http://www.culture.gouv.fr/culture/mrt/numerisation/fr/f_06.htm, Les fiches techniques :
http://www.culture.gouv.fr/culture/mrt/numerisation/fr/f_04.htm
Figoblog http://www.figoblog.org/
Affordance : http://affordance.typepad.com/mon_weblog/
Silex : http://scinfolex.wordpress.com/
Tour de toile du BBF (bibliothèques numériques et numérisation) http://blogbbf.enssib.fr/?Bib_num_numerisation
Bibliothèques sur le Web, BBF 2006 - Paris, t. 51, n° 3
Entretiens de la BnF, 7-8 décembre 2006 “Numérique et bibliothèques : le deuxième choc » http://www.bnf.fr/pages/infopro/journeespro/jp_entretiens06.htm
Dico illustré du Web 2.0 http://www.journaldunet.com/diaporama/0610-dicoweb2/index.shtml
http://www.bnf.fr/pages/zNavigat/frame/infopro.htm : rubrique en cours de mise à jour