archivages

Download Archivages

If you can't read please download the document

Upload: chloe-martin

Post on 16-Mar-2016

213 views

Category:

Documents


0 download

DESCRIPTION

Etat des lieux et panorama du système d'archivage numérique de la bnf

TRANSCRIPT

PANORAMA DES SERVICES D'ARCHIVAGE4 fevrier 2008 (CINES)

1- Deux types de plateformes:

archives valeur patrimoniale

(manuscrits anciens, publications scientifiques, internet..)Importance des mtadonnes pour resituer le contexte et conserver le sens.De nombreux tablissements du domaine public (universits, bibliothques, chercheurs, etc.) ont un patrimoine archiver

archives valeur probante

Destin prouver l'authenticit lgale d'un document sur le long terme :acte de naissance, dclaration d'impts, factures, etc.Utilisation des signatures lectroniques.Indispensable suite la dmatrialisation des procduresadministratives (idem dans les entreprises).

2- Plateformes d'archivage actuellement dployes en France

SPAR : Systme de Prservation et d'Archivage Rparti.

Archivage de diffrents flux (internes ou externes) :Numrisation de documents imprims, manuscrit, images, etc. ;Record managment (documents internes) ;Nouveau modes de diffusion : serveur web, publication lectronique, etc.

Volumtrie : 2008 : 400 To / 2010 : 1,3 Po / 2014 : 1,8 Po.

Dpt lgal lectronique (Loi n 2006961 du 1er aot 2006 relative au droit d'auteur et aux droits voisins dans la socit de l'information).

Infrastructure matrielle mise en place en 2005 par la socit StorageTek :Appel d'offre remport par Atos Origin pour le dveloppement de l'applicatif spcifi par la BnF, bas sur l'application opensource FedoraCommons.Mise en service prvue fin 2008. Archivage de tous les flux cits prcdemment progressivement intgrssur 3 ans. Respect strict du modle OAIS (rflexion pousse sur son implmentation).

PILAE Plateforme

Pilote d'archivage lectronique (DAF, en coopration avec la DGME (Direction Gnrale de la Modernisation de l'Etat). Les archives sont dfinies sans distinction de date, de forme et desupport. ADELE confre une valeur probante aux documents numriques ce qui implique la ncessit de les archiver.

Archive publiques :- Les documents qui procdent de l'activit de l'tat, des collectivits territoriales, destablissements et entreprises publicsLes documents qui procdent de l'activit des organismes de droit priv chargs de la gestion des services publics ou d'une mission de service public

les minutes et rpertoires des officiers publics ou ministriels.

Procdure d'archivage, conservation, destruction encadre par la loi (dcret n 791037du 3 dcembre 1979).Dvelopp par la socit Cecurity.com.Recette en cours, exploitation oprationnelle probatoire sur le site de Fontainebleau :

tester la faisabilit dune prise en charge darchives de natures diffrentes tester la faisabilit de conversions de formats en entre du systme tester des outils de scellement et dhorodatage tester la rplication inter et intrasite des donnes.

Plateforme dfinitive sur le site de PierrefittesurSeine. laboration du standard dchange DAF/DGME, en cours de standardisation au niveau de lUN/CEFACT.

- CDPP Centre de Donnes de la Physique des Plasmas (CNES, CNRS).

Le CDPP est n dune double prise de conscience au milieu des annes90 :- lintrt scientifique long terme des observations scientifiques ralisesdans ce domaine ;- la perte inluctable de ces donnes dobservations si elles ntaient pasprises en charge par une entit responsable de leur prennisation.

Gr conjointement par le CNES et le CNRS (convention en 1998 etfvrier 2007). Son maintien en opration est examin tous les quatre ans

Missions du CDPP :

- identifier les donnes de la Physique des Plasmas naturels archiver ;- assurer la collecte de ces donnes ;- assurer larchivage long terme de ces donnes ;- mettre la disposition de la communaut := lensemble des donnes archives= un ensemble de services visant en faciliter et en optimiser lutilisation par la communaut scientifique. Pour cela, des services valeur ajoute seront dvelopps.

quipe d'ingnieurs du CNES et du CNRS mise en place Toulouse. Le CDPP ne sest pas appuy sur le modle OAIS car celui-ci ntait pas encore dfini. Il s'est appuy sur la longue exprience pragmatique du CNES en matire de traitement, de stockage et de mise disposition de donnes numriques, ainsi que le Service de Transfert et dArchivage de Fichiers (STAF), service de stockage prenne mis en service au CNES en 1994.Plus de 10 ans de fonctionnement, prs de 200 collections de donnes et des centaines de milliers de fichiers archivs et dcrits, le CDPP dispose dun rel retour dexprience sur larchivage long terme et la mise disposition de donnes dans le domaine scientifique.

PAC Plateforme d'archivage du CINES.

Mission nationale darchivage prenne de documents lectroniques dupatrimoine scientifique.Projets :archivage des thses soutenues dans les universits franaises (10000 thses par an (~300 Go), collectes par l'ABES)

archivage des revues en sciences humaines et sociales du portail PERSEE

(planifi pour le printemps 2008, 20 To)archivage des publications mises en ligne par le Centre pour la Communication Scientifique Directe (CCSD) sur le portail HAL (Hyper Article en Ligne)

Planifi pour fin 2008, 300 Go ;D'autres projets sont galement l'tude.Equipe mixte d'informaticiens et d'archivistes." PAC v1 dvelopp en interne, en production depuis dcembre 2007." PAC v2, appel d'offre remport par Sun Microsystem, mise en production prvue pour le printemps 2008 :Infrastructure matrielle Sun ; Infrastructure logicielle Arcsys, dveloppe par Infotel SA. selon les spcifications de PAC v1.S'appuie sur OAIS.Ncessit d'utiliser un processus de collecte gnrique afin de grer ladisparit des sources d'archives.

3- Analyse, conclusion

Le modle OAIS est employ par tous sauf CDPP.

Versement :ncessite souvent des conventions prcises car les versements se font dans un cadre lgal strict. C'est un point critique de par l'ventuelle htrognit des sources et cela ncessite un cadre technique rigoureux. Les versements manuels sont difficiles tant donn les contraintes techniques et normatives du procd. Le versement automatis est donc prfrer.

Choix des formats prenne :Aspect critique, tudes visant identifier les formats les plus prennes, outils de validation (Jhove, Droid, ImageMagick).

Diffusion (mise disposition de l'information) : Point tudier selon l'importance, l'audience et la frquence de la diffusion. Offres industrielles et commerciales de plus en plus abouties, gnralement bases sur OAIS. Les logiciels libres jouent un rle important dans le dveloppement de ces plateformes d'archivage : applications et outils cods en java ; FedoraCommons ; outils divers (Jhove, Droid, ImageMagick, etc.).

Gestion des risques (matriels, logiciels, lgaux...).Modularit = prennit : un bloc obsolte peut facilement tre remplacsans mettre en pril l'ensemble de l'application.

Fiabilit systme : plus le systme est complexe, plus il est fragile.L'archivage porte sur de gros volumes, cette question est donc tudierde prs.

Identifiant (cote) : faiblesse actuelle. Il est opportun d'utiliser un identifiantunique, garantissant la prennit et l'interoprabilit (ARK, PURL, DOI).

Intgration de la plateforme darchivage au sein dun contexte matriel etlogiciel plus large.Par dfinition, la russite d'un projet d'archivage prenne ne pourra sevrifier que sur le long terme.

Lun des objectifs explicite de la plateforme PILAE est dtablir une basede connaissance sur la conduite de ce type de projet (difficultsrencontres, solutions trouves). Les retours d'expriences commencent arriver, et dfiniront la validit des implmentations matrielles, logicielles et procdurales choisies. Rendezvousdans 30 ans !

4- Annexes (URL, groupes d'tudes)

En France :SPAR (BnF) : http://www.bnf.fr/PILAE (DAF, DGME) : http://www.archivesdefrance.culture.gouv.fr/CDPP (CNES, CNRS) : http://cdpp.cesr.fr/PAC (CINES) : http://www.cines.fr/spip.php?rubrique4" En Europe :CASPAR : http://www.casparpreserves.eu/DPE : http://www.digitalpreservationeurope.eu/APA : http://www.alliancepermanentaccess.eu/PLANETS : http://www.planetsproject.eu/