ppt msh def

26
PLATEFORME NUMÉRISATION ET DE TRAITEMENT ARCHIVISTIQUE ET DOCUMENTAIRE http://msh-dijon.u- bourgogne.fr/

Upload: consortium-arcmc

Post on 06-Aug-2015

100 views

Category:

Documents


2 download

TRANSCRIPT

Page 1: Ppt msh def

PLATEFORME NUMÉRISATION ET DE TRAITEMENT ARCHIVISTIQUE ET DOCUMENTAIRE

http://msh-dijon.u-bourgogne.fr/

Page 2: Ppt msh def

Décrire les ressources archivistiques et documentaires

Page 3: Ppt msh def

Types de documents concernés• Fonds d’archives• Documents imprimés

• Monographies• Publications en série

Les premiers fonds traités à la MSH ont été des fonds d’archives • Forum Social Européen• Enquête archives de la recherche en SHS

Description des fonds d’archivesRéalisation d’instruments de recherche encodés en XML EAD (2002)Outils successifs : X-Metal , Arkhéïa aide au classement, oXygen depuis 2012

Page 4: Ppt msh def

Fonds de documents imprimés décrits par la plateforme• Revues :

• Cahiers d’histoire (1966-2001)• Société française (1981-1999)

• Brochures / ouvrages• Brochures de la Bibliothèque Marxiste de Paris• Brochures du fonds des archives privées Patrick Kessel• Grande Edition Marx et Engels

Description des documents imprimésRéalisation de catalogues encodés en XML EAD (2002)Outils utilisés : Arkhéïa aide au classement, module bibliothèque, oXygen depuis 2012.Les catalogues EAD produits avec Arkhéïa sont conformes au format ISBD

Page 5: Ppt msh def

Décrire des documents imprimés en XML-EAD• Une question de compétences Plusieurs années de pratique de l ’EAD à la MSH• Un choix contextuelPleade, solution utilisée à la MSH pour la mise en œuvre de son portail PANDOR est un outil de publication et de consultation d'instruments de recherche encodés en XML-EAD• Répondre aux évolutions de la pratique du web par le publicLes catalogues de bibliothèques sont de moins en moins consultés. Opter pour le format XML, c’est être visible par les moteurs de recherche et donc par le public qui ne connait pas le portail de la MSH• Souplesse de la description en EADPossibilité de créer et de distinguer des champs spécifiques aux besoins d’un projet, d’un corpus.Ex : notices de la GEME

Page 6: Ppt msh def

Renvoi vers une autre traduction d’une même œuvre.

Rebond entre notices par lien hypertexte.

Notice « enrichie » de la GEME

Page 7: Ppt msh def

Distinguer la forme du contenuObjectifs• Proposer des affichages différents en fonction de la nature des documents

décrits• Faciliter la mise en correspondance avec d’autres formats de métadonnées (ex : Dublin Core simple) et/ou l’exploitation par d’autres systèmes

Page 8: Ppt msh def

Exemple d’encodage en EAD<c id="brb3612" level="item"><did altrender="isbd-m-fr"><unitid label="Cotes extrêmes">brb3612</unitid><unittitle label="Intitulé de l'unité documentaire">Un aspirant dictateur : André Tardieu / Félicien Challaye.<edition>2ème édition.</edition><imprint><geogname>Paris</geogname><publisher>Librairie du travail</publisher><date normal="1932" type="publication">1932</date></imprint><bibseries>Faits et documents ; 10</bibseries></unittitle><unitdate label="Date de l'unité documentaire" normal="1932">1932</unitdate><physdesc label="Description physique"><genreform >Ouvrages</genreform><lb/><extent label="Collation" type="collation">32 p.</extent><lb/></physdesc></did><prefercite href="http://pandor.u-bourgogne.fr/ead.html?id=FRMSH021_00009&amp;amp;c=FRMSH021_00009_brb3612"/><controlaccess><persname role="auteur">Challaye, Félicien</persname><title >Un aspirant dictateur : André Tardieu</title></controlaccess><dao href="BMP/brb3612/" role="series" title="Consulter la brochure"/></c>

Page 9: Ppt msh def

Affichage par défaut de Pleade pour les documents imprimés

Affichage de type ISBD : sans distinction des zones de description, peu adapté au public.

Page 10: Ppt msh def

Affichage de type catalogue de bibliothèque prévu pour PANDOR

Même contenu en EAD que la vue précédente, l’affichage varie en fonction de paramètres gérés par une feuille de style au niveau de l’application Pleade.

Page 11: Ppt msh def

Notice sur Pandor

Page 12: Ppt msh def

La même notice sur Europeana

Après une mise en correspondance des champs EAD et Dublin Core simple, les métadonnées produites à la MSH sont affichées dans Eureopeana

Page 13: Ppt msh def

Indexation

Index existants• Titres• Auteurs• Éditeurs• Collection

En outre, la navigation par le plan de classement permet une consultation thématique des fonds

Indexation à venir • Indexation matière d’une partie du fonds des brochures de la BMP pendant

un stage de 2 mois (avril – mai 2014)

Page 14: Ppt msh def

Numériser les ressources documentaires et archivistiques

Page 15: Ppt msh def

Constitution d’un parc de scanners depuis 2006

• 2 scanners de production CANON DR 9050 C. Formats de sortie TIFF, JPEG, PDF, résolution max 600 dpi.

• 2 scanners de livres i2s COPIBOOK RGB 300 dpi et i2s COPIBOOK ONYX 600 dpi format de sortie

Page 16: Ppt msh def

Constitution d’un parc de scanners depuis 2006

• 1 scanner de livres précieux ou plans I2s DIGIBOOK A0, résolution max 800 DPI jusqu’au format A1

• 1 scanner de microfilms automatique 16/35 mm WICKS 1 Wilson RS 325, résolution max 600 DPI.

Page 17: Ppt msh def

Numérisation

Le service de numérisation (SNBD) de la MSH de Dijon s’appuie sur les recommandations du Service Interministériel des Archives de France (SIAF), du Centre Informatique National de l’Enseignement Supérieur (CINES) et du TGIR Huma-Num en termes de numérisation, choix des formats numériques en fonction des différentes typologies et résolutions… (« Guide méthodologique pour le choix de formats numériques pérennes » et « le guide des bonnes pratiques numériques »). Une numérisation dite de conservation est effectuée à la MSH.

Le format de numérisation pour les archives de type textuel ou iconographique est le format Tagged Image File Format (TIFF) sans compression. La résolution minimum est de 300 DPI, cependant s’il est prévu une phase de reconnaissance optique de caractères, la résolution sera de 400 DPI. Dans la plupart des cas la numérisation s’effectue en couleur.

Page 18: Ppt msh def

La numérisation des corpus

Grace au soutien de la fondation Gabriel Péri et du Conseil Régional de Bourgogne les corpus suivants ont pu être constitués

• Le fonds de brochures de la BMP : 2933 brochures numérisées, traitées, recadrées soit 128 785 pages

• Le fonds de brochures Patrick Kessel : 475 brochures numérisées, traitées, recadrées soit 16 000 pages

• Numérisation d’ouvrages dans le cadre de la Grande édition Marx-Engels, 41 ouvrages ont été numérisés soit 8800 pages

Page 19: Ppt msh def

La numérisation des corpus

Les revues dites communistes

• Cahiers de l'Institut Maurice Thorez - Cahiers d'histoire, revue d'histoire critique (1966-2001) : 116 numéros numérisés soit 22 080 pages

• Société française, Cahiers de l'institut de recherches marxistes - Société française - Société française, Raisons d'agir, passion de comprendre (1981-1999) : 60 numéros numérisés soit 4520 pages

• La revue Economie et politique : 401 numéros, hors séries, ou conférences ont été numérisés soit 40 700 pages

• La revue l’Ecole & la Nation : 338 numéros, hors séries ou suppléments numérisés soit 18 522 pages

Page 20: Ppt msh def

La numérisation des corpus

Corpus archives du communisme

une partie des fonds suivants : 488, 489, 490, 491, 492, 493, 494, 495, 507, 717, 533, 534, 535, 537, 538, 539 Il s’agissait de numériser 220 microfilms soit 176 000 pages environ (cf. ANR PAPIK@2F pour de plus amples informations.

Page 21: Ppt msh def

Diffuser les ressources documentaires et archivistiques

Page 22: Ppt msh def

Le résultat de l’ensemble du travail réalisé par la plateforme de la MSH de Dijon (instruments de recherche, catalogues électroniques et documents numérisés) est mis en ligne sur internet et librement accessible via le Portail Archives Numériques et Données de la Recherche (PANDOR). http://pandor.u-bourgogne.fr

Cet outil de diffusion permet la mise à disposition des corpus numériques constitués lors de programmes de recherche portés par la MSH et/ou les laboratoires SHS qui lui sont associés.

Page 23: Ppt msh def

Fonctionnement technique du portail PANDOR

L’application utilisée par la MSH de Dijon est issue du monde du libre. C’est une application Web, s’appuyant sur un serveur Apache et l’architecture J2EE (JAVA).Elle permet la publication et la diffusion de documents au format XML, et supporte les documents aux formats XML-EAD, XML-EAC, XML-TEI, et XML METS / ALTO. Elle dispose aussi d’un moissonneur et d’un entrepôt OAI-PMH. En effet, elle supporte le protocole d’échange de données OAI-PMH, ce qui garantit l’interopérabilité avec d’autres bibliothèques numériques.Ainsi, le portail de publication de la MSH de Dijon est moissonné depuis mai 2013 par la Bibliothèque Numérique EUROPEANA, dans le cadre du programme européen Heritage of People’s Europe (HOPE).

Page 24: Ppt msh def

Navigation dans PANDOR

Navigation dans un cadre de classement (classement par thématiques de recherche soutenues à la MSH de Dijon) – Navigation dans l’ensemble des corpus.

Page 25: Ppt msh def
Page 26: Ppt msh def

La recherche sur PANDOR

Recherche simpleRecherche avancée (dans tous les corpus)Recherche spécifique (recherche dans un corpus particulier)Recherche en plein texte dans les documents numérisés (très prochainement) – module XML ALTOAprès obtention d’un identifiant et d’un mot de passe, possibilité de sauvegarder l’historique des requêtes et mise à disposition d’un porte-documents