schaule sonja ppt

28
Een digitaal archief in 10 stappen Sonja Schaule – Informatie aan Zee 11/09/2009

Upload: vlaamse-vereniging-voor-bibliotheek-archief-documentatie-vzw

Post on 14-Jun-2015

1.610 views

Category:

Technology


0 download

TRANSCRIPT

Page 1: Schaule Sonja Ppt

Een digitaal archief in 10 stappen

Sonja Schaule – Informatie aan Zee 11/09/2009

Page 2: Schaule Sonja Ppt

Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009

[ agenda ]

● basis en belangrijke principes● 10 stappen

+ demonstratie tools JHOVE, DROID, PLATO

Page 3: Schaule Sonja Ppt

Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009

[ Digitaal Depotbasis ]

● digitaal object

● digitaal document

● digitaal archiefdocument

context-informatie

Page 4: Schaule Sonja Ppt

Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009

[ Digitaal Depotbelangrijke principes ]

Archiveren van authentieke en integere documenten vs. snelle technologische ontwikkeling en veroudering van formaten, dragers, leestechnologie en -apparatuur vereist:

● risicospreiding● risicopreventie● risicoherstel

→ actief preserveringsbeleid

Page 5: Schaule Sonja Ppt

Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009

[ 10 stappenoverzicht ]

hard- en softwarearchitectuur

functionaliteitendigitaal archief

documenterendigitaal archief

Page 6: Schaule Sonja Ppt

Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009

[ 10 stappenoverzicht ]

hard- en softwarearchitectuur

functionaliteitendigitaal archief

documenterendigitaal archief

Page 7: Schaule Sonja Ppt

Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009

[ hard- en softwarearchitectuuropslagsysteem 1]

● bestaan duurzame gegevensdragers in de digitale wereld?● nog een probleem: afhankelijkheid van leestechnologie

George W. Hart, disk combobulation

Page 8: Schaule Sonja Ppt

Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009

[ hard- en softwarearchitectuuropslagsysteem 1]

WAT DOEN?● opslagsysteem

● uitbreidbaar● gescheiden van de beheersapplicatie● ondersteunt meerdere interfaces

● genormeerde gegevensdragers● genormeerde bestandssystemen● digitale objecten naar een nieuw opslagsysteem overplaatsen

WANNEER:● de vereiste leestechnologie raakt in onbruik/ wordt niet langer ondersteund (fysieke

dragers, bestandssysteem, aansluitingen, …)● het aantal fouten op een drager stijgt opvallend ● de drager degradeert

Page 9: Schaule Sonja Ppt

Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009

[ hard- en softwarearchitectuuropslagsysteem 1]

WAT DOEN?● kwaliteitscontroles

● alle digitale objecten aanwezig?● bitintegriteit OK?● kwaliteit en performantie opslagsysteem en/of opslagmedia OK?● digitale objecten virusvrij?

● permanent en systematisch● volledig geautomatiseerd (bv. NAS/SAN systemen)● of bij eenvoudigere systemen: steekproefgewijs op een representatief staal● checksums/ CRC's voor controle bitintegriteit

● toegangscontrole

Page 10: Schaule Sonja Ppt

Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009

[ hard- en softwarearchitectuuropslagsysteem 1]

WAT DOEN?● back-ups en veiligheidskopieën

● meerdere kopieën van één digitaal object● verschillende opslagsystemen of -media voor moeder- en veiligheidskopie ● verschillende bestandssystemen voor moeder- en veiligheidskopie● opslagmedia van verschillende producenten● verschillende locaties voor moeder- en veiligheidskopieën● bij opslag op harde schijven:

● RAID-configuratie (min. niveau 5 of 5+)● mirroring van digitale objecten in twee of drie systemen● monitoring performantie van harde schijven

Page 11: Schaule Sonja Ppt

Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009

[ hard- en softwarearchitectuur metadata duurzaam bewaren 2]

Page 12: Schaule Sonja Ppt

Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009

[ hard- en softwarearchitectuur metadata duurzaam bewaren 2]

● digitale duurzaamheid van documenten heeft alleen nut als de metadata over de documenten digitaal duurzaam worden bewaard

● meeste archiveringssystemen slaan metadata in eigen formaat en/of database op

● afhankelijkheid● metadata moeten bij elke versie upgrade worden gemanipuleerd

WAT DOEN?● systeemonafhankelijke opslag (geen vendor lock-in)● metadata niet enkel in applicatieafhankelijke formaten en/of

database bewaren● bv. in XML-formaat in het digitale archiveringssysteem bewaren

● archiveringsstrategie voor metadata● documentatie over datamodel van database archiveren

Page 13: Schaule Sonja Ppt

Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009

[ hard- en softwarearchitectuurband document – metadata 3]

● contextinformatie is essentieel voor het begrijpen en gebruiken van archiefdocumenten

● veel archiveringssystemen slaan metadata gescheiden van documenten op

METADATA

arch

iver

ings

syst

eem

Page 14: Schaule Sonja Ppt

Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009

METADATA

[ hard- en softwarearchitectuurband document – metadata 3]

WAT DOEN?● duurzame/ reconstrueerbare link document-metadata● metadata inbedden in header van bestanden (bv. bij TIFF)● inkapseling van document en metadata in containerformaat

(bv. XML)● opslag metadata bij digitale objecten in het opslagsysteem

(bv. als XML)ar

chiv

erin

gssy

stee

m

Page 15: Schaule Sonja Ppt

Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009

● elk object moet identificeerbaar zijn● elk object moet lokaliseerbaar zijn● elk object moet controleerbaar zijn op fouten ● relatie document – representaties – digitale objecten moet

duidelijk zijn

[ functionaliteiten digitaal archief voor elk digitaal object metadata registreren 4]

Page 16: Schaule Sonja Ppt

Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009

[ functionaliteiten digitaal archief voor elk digitaal object metadata registreren 4]

WAT DOEN?Expliciet registeren van (in datatabel, XML-bestand, ...):

● unieke identificatiekenmerken ID● reference information: locatie binnen het opslagsysteem ● fixity information: CRC/checksum

● tools: MD5summer, md5, MD5/SHA hash tool, Advanced Checksum Verifier, ...● representation information: bestandsformaat en toegepast

profiel ● tools voor extractie van formaatinformatie: JHOVE, DROID, FITS, National Library

of New Zealand Metadata Extractor, Apache Tika, MediaInfo● naar file format registries verwijzen: UDFR (Pronom+GlobalDigitalFormatsRegistry)

● relatie met de representatie en het digitale document

Page 17: Schaule Sonja Ppt

Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009

[ functionaliteiten digitaal archief essentiële eigenschappen definieren en documenteren 5]

● essentiële eigenschappen van documenten moeten worden bewaard

● welke dit zijn hangt af van de ontstaanscontext en archiefwaarde

WAT DOEN:● documenteren welke elementen van een digitaal document

essentieel zijn voor het behoud van authenticiteit en integriteit● Binnen welke context is het document ontstaan (tentoonstelling, werkproces,

evenement, …)?● keuzes van archiveringsformaten, omzettings- en

emulatietools baseren op het behoud van de essentiële eigenschappen van het document

Page 18: Schaule Sonja Ppt

Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009

[ functionaliteiten digitaal archief essentiële eigenschappen definieren en documenteren 5]

Page 19: Schaule Sonja Ppt

Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009

[ functionaliteiten digitaal archief leesbaarheid van documenten bewaren 6]

● leesbaarheid van digitale objecten hangt af van software

WAT DOEN?● afhankelijkheden van softwarepakket, -versie of -leverancier

vermijden door formaten en codecs die:● genormeerd en open gedocumenteerd zijn● voldoende gedocumeeteerd zijn● essentiële eigenschappen van het authentieke document bewaren● geen significant informatieverlies met zich meebrengen● voldoen aan de behoeften van de gebruikersgroep(en)

Page 20: Schaule Sonja Ppt

Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009

[ functionaliteiten digitaal archief leesbaarheid van documenten bewaren 6]

WAT DOEN?● migratie en/of emulatie

● opties open houden door oorspronkelijk en duurzaam archiveringsformaat te bewaren

Page 21: Schaule Sonja Ppt

Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009

[ functionaliteiten digitaal archief leesbaarheid van documenten bewaren 6]

WAT DOEN?● zijn documenten vrij van wachtwoorden/encrypties?● welke representaties van documenten zijn aanwezig?● bij opname in het digitale archief controleren:

● zijn vereiste representaties aanwezig?● voldoen representaties aan voorgeschreven formaatprofiel?

● tools: JHOVE en/of DROID● zijn de documenten niet corrupt of beschadigd?● kunnen documenten geopend worden?● zijn technische metadata aanwezig?● is software-ondersteuning voor het leesbaar maken van documenten aanwezig?

● technologische evolutie opvolgen● PLATO-tool

bewaarstrategie en tools kiezen, preserveringsacties plannen envoorbereiden, preserveringsacties documenteren

Page 22: Schaule Sonja Ppt

Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009

[ functionaliteiten digitaal archief componenten voor getrouwe reconstructie archiveren 7]

In de digitale wereld is het niet altijd voldoende om een digitaal document te archiveren. Voor de getrouwe reconstructie is meestal bepaalde software vereistWAT DOEN?

● alle componenten voor de getrouwe reconstructie identificeren

● documenten openen op computer met minimale hard- en softwareconfiguratie, zonder netwerkverbinding

● vereiste componenten opnemen in digitaal archief● geen afhankelijkheden van externe bronnen● bij archivering in documentvorm: templates, formulieren, stylesheets● bij archivering los van documentvorm: brongegevens en logica ● bij emulatie: ghosts of images van de applicatiesoftware archiveren

● componenten en hun afhankelijkheden en onderlinge relaties documenteren

Page 23: Schaule Sonja Ppt

Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009

[ functionaliteiten digitaal archiefbeheer van documenten documenteren 8]

Hoe kunnen we de authenticiteit van documenten onderbouwen?

WAT DOEN?documenteer de evolutie van een document vanaf creatie/opname in het digitale archief

● beheersmetadata● bepalen voor welke beheersacties welke metadata uitgevoerd worden

● metadata voor het uitvoeren van preserveringsacties● WELKE ACTIE werd WANNEER uitgevoerd?● WELKE TOOLS werden gebruikt?● WIE voerde de actie uit?

Page 24: Schaule Sonja Ppt

Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009

[ functionaliteiten digitaal archief documenten beschrijven 9]

Beschrijvende metadata zijn nodig om documenten terug te vinden en te begrijpen

● WAT DOEN?● documenten identificeren

● ISAD(G), ISAAR, ISDF, ISBD, MARC21, CDWA, … ● trefwoorden, tagging, taxonomie

● documenten contextualiseren● WIE is de archiefvormer?● binnen WELK WERKPROCES had het document een rol?● WELKE RELATIE heeft het document met andere documenten?

● koppeling voorzien● dossierlijsten

● retrieval mogelijk maken● gearchiveerde documenten indexeren

Page 25: Schaule Sonja Ppt

Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009

[ documentatie digitaal archief digitaal archief documenteren 10]

● reconstructie van de levenscyclus van archiefdocumenten moet mogelijk zijn zonder te hoge redundantie

● “gemakkelijk” versiebeheer en probleemopvolging● bescherming tegen vendor lock-in● het digitale archief is geen black box voor archiefbeheerders● verantwoording afleggen over werking en beheer

???

Page 26: Schaule Sonja Ppt

Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009

[ documentatie digitaal archief digitaal archief documenteren 10]

WAT DOEN?

● archiveren van documentatie van:● digitaal archiveringsbeleid, bewaarstrategie, toegepaste

normen en standaarden ● databasemodellen, broncode● procedures, workflows

● UML-diagrammen, use cases, schema's informatie- en systeemarchitectuur● handleidingen, richtlijnen, checklists archiveren

● opslagsysteem, logica● documentatie niet exclusief in het eigen archief bewaren

● escrowregeling, notaris, archiefbeheerende instelling

Page 27: Schaule Sonja Ppt

Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009

[ meer informatie ]

● F. Boudrez, Een digitaal archief in 10 stappen● F. Boudrez, Basisprocessen voor een digitaal archiefdepot● S. Schaule, Organisatorische aspecten bij het bouwen en het

beheren van een digitaal depot● DAVID-handboek. Digitaal archiveren in de praktijk● XML-schema's e-mail, database, calendar, …

Deze en verdere publicaties zijn beschikbaar opwww.edavid.be

Page 28: Schaule Sonja Ppt

Sonja Schaule – Een digitaal archief in 10 stappen – Informatie aan Zee 11/09/2009

Vragen? Suggesties? [email protected]

www.edavid.be