stručný úvod do mets
DESCRIPTION
Stručný úvod do METS. Martin Vojnar Vědecká knihovna v Olomouci . Místo úvodu. REALITA = mnoho digitalizovaných a digitálních objektů doplněných různě provázanou množinou metadat: popisná metadata (abychom mohli objekt nalézt) - PowerPoint PPT PresentationTRANSCRIPT
![Page 2: Stručný úvod do METS](https://reader035.vdocuments.net/reader035/viewer/2022062803/56814652550346895db36783/html5/thumbnails/2.jpg)
2
Místo úvoduREALITA = mnoho digitalizovaných a
digitálních objektů doplněných různě provázanou množinou metadat:– popisná metadata (abychom mohli objekt
nalézt)– technická metadata (abychom mohli vyjádřit
vlastnosti objektu – obrázek, text, audio, ...)– strukturální metadata (abychom mohli propojit
objekty a metadata mezi sebou)– administrativní metadata (abychom mohli
objekty a metadata spravovat včetně zpřístupnění, dodávání a zajištění autorských práv, ... migrace)
![Page 3: Stručný úvod do METS](https://reader035.vdocuments.net/reader035/viewer/2022062803/56814652550346895db36783/html5/thumbnails/3.jpg)
3
Místo úvodu – příklad
PŘÍKLAD – periodikum 19./20. století:– vícenásobná struktura (roky, ročníky,
svazky, čísla, strany, články)• metadata titulu vs. metadata čísla vs.
metadata článku• metadata pro vyhledávání (např. získaná
OCR)• objekty pro zobrazování a služby pro
dodávání (např. konverze do djvu/pdf formátu)
![Page 4: Stručný úvod do METS](https://reader035.vdocuments.net/reader035/viewer/2022062803/56814652550346895db36783/html5/thumbnails/4.jpg)
4
![Page 5: Stručný úvod do METS](https://reader035.vdocuments.net/reader035/viewer/2022062803/56814652550346895db36783/html5/thumbnails/5.jpg)
5
METS – základní informace• METS = standard pro zachycení a výměnu
metadat v prostředí digitálních a digitalizovaných objektů
• METS = schéma založené na XML• z iniciativy Digital Library Federation (DLF,
http://www.diglib.org/)• správcem je Kongresová knihovna (viz www
http://www.loc.gov/standards/mets/), která provozuje elektronickou konferenci na [email protected]
• od r. 2001 (předchůdcem projekt Making of America II: 1997-2001, vlastní SGML DTD)
![Page 6: Stručný úvod do METS](https://reader035.vdocuments.net/reader035/viewer/2022062803/56814652550346895db36783/html5/thumbnails/6.jpg)
6
METS – proč ?• analogická situace s automatizací knihovního
prostředí 70. let – potřeba výměnného formátu (ISO2709/AACR/MARC)
• cílem digitálních knihoven není pouhé seskupení dat, ale poskytování služeb, které vyžadují spolupráci (linkování, dodávání, apod.)
• digitální knihovny zpracovávají složitější části reality než tradiční knihovní systémy
• speciálním úkolem digitálních knihoven je dlouhodobá ochrana obsahu (OAIS: S/A/D)
• standardizace tyto úkoly řeší efektivněji
![Page 7: Stručný úvod do METS](https://reader035.vdocuments.net/reader035/viewer/2022062803/56814652550346895db36783/html5/thumbnails/7.jpg)
7
METS – příklad
![Page 8: Stručný úvod do METS](https://reader035.vdocuments.net/reader035/viewer/2022062803/56814652550346895db36783/html5/thumbnails/8.jpg)
8
METS – základní částiMETS obsahuje (ale primárně
nedefinuje) následujích 5 sekcí metadat:– hlavičku <metsHdr>– popisná metadata <dmdSec>– administrativní metadata <amdSec>– skupiny objektů <fileSec>– strukturální mapa <structMap>– chování podle obsahu <behaviourSec>
![Page 9: Stručný úvod do METS](https://reader035.vdocuments.net/reader035/viewer/2022062803/56814652550346895db36783/html5/thumbnails/9.jpg)
9
METS – základní části
METS Header
Administrativemetadata
FileInventory
Structuremap
Descriptivemetadata
Behavioralmetadata
optional
optional
optional required
optional optional
převzato z prezentace Smith MacKenzie (MIT, 2003)
![Page 10: Stručný úvod do METS](https://reader035.vdocuments.net/reader035/viewer/2022062803/56814652550346895db36783/html5/thumbnails/10.jpg)
10
• lze je zpracovat dvojím způsobem:– odkazem <mdRef>
– druh odkazu: URN, URL, PURL, DOI ...– druh metadat: MARC, EAD, DC,
NISOIMG, TEI, ...– popisek
METS – <dmdSec> odkazem
![Page 11: Stručný úvod do METS](https://reader035.vdocuments.net/reader035/viewer/2022062803/56814652550346895db36783/html5/thumbnails/11.jpg)
11
METS – <dmdSec> přímo– přímo v METS dokumentu
<mdWrap>:
![Page 12: Stručný úvod do METS](https://reader035.vdocuments.net/reader035/viewer/2022062803/56814652550346895db36783/html5/thumbnails/12.jpg)
12
METS – popisná metadata• přímé vkládání i volání odkazem lze
kombinovat• pro stejný objekt lze použít
vícenásobný různý zápis (TEI, MARC i DC)
• důležité je zachování identifikátorů (jak uvidíme záhy)
• využití existujících popisů! (i když každý objekt má mít svůj vlastní popis)
![Page 13: Stručný úvod do METS](https://reader035.vdocuments.net/reader035/viewer/2022062803/56814652550346895db36783/html5/thumbnails/13.jpg)
13
METS – základní částiMETS obsahuje (ale primárně
nedefinuje) následují sekce metadat:– hlavičku <metsHdr>– popisná metadata <dmdSec>– administrativní metadata <amdSec>– skupiny objektů <fileSec>– strukturální mapa <structMap>– chování podle obsahu <behaviourSec>
![Page 14: Stručný úvod do METS](https://reader035.vdocuments.net/reader035/viewer/2022062803/56814652550346895db36783/html5/thumbnails/14.jpg)
14
METS – <amdSec>vyjadřuje různé aspekty objektů:
– technické údaje (formát, typ, velikost, ...)– autorská práva– informace o zdroji, ze kterého digitalizované
verze vznikla (popisné, administrativní)– informace o cestě, jakou objekt ze zdroje
vznikl (konverze, kopie, verze, ...)
![Page 15: Stručný úvod do METS](https://reader035.vdocuments.net/reader035/viewer/2022062803/56814652550346895db36783/html5/thumbnails/15.jpg)
15
METS – základní částiMETS obsahuje (ale primárně
nedefinuje) následují sekce metadat:– hlavičku <metsHdr>– popisná metadata <dmdSec>– administrativní metadata <amdSec>– skupiny objektů <fileSec>– strukturální mapa <structMap>– chování podle obsahu <behaviourSec>
![Page 16: Stručný úvod do METS](https://reader035.vdocuments.net/reader035/viewer/2022062803/56814652550346895db36783/html5/thumbnails/16.jpg)
16
METS – <fileSec><file> vyjadřuje každý fyzický soubor, lze seskupit do <fileGrp>
<FLocat> vyjadřuje umístění souboru
<FContent> nabízí použití kontrolních součtů např. MD5
<GroupID> umožňuje vyjádřit manifestace
![Page 17: Stručný úvod do METS](https://reader035.vdocuments.net/reader035/viewer/2022062803/56814652550346895db36783/html5/thumbnails/17.jpg)
17
METS – <fileSec><file> vyjadřuje každý fyzický soubor, lze seskupit do <fileGrp>
<FLocat> vyjadřuje umístění souboru
<FContent> nabízí použití kontrolních součtů např. MD5
<GroupID> umožňuje vyjádřit manifestace
e tc ., e tc ., e tc.
F ile G ro up F ile
F ile G ro up F ile
F ile In ve n to ry(F ile G ro u p)
převzato z prezentace Smith MacKenzie (MIT, 2003)
![Page 18: Stručný úvod do METS](https://reader035.vdocuments.net/reader035/viewer/2022062803/56814652550346895db36783/html5/thumbnails/18.jpg)
18
METS – základní částiMETS obsahuje (ale primárně
nedefinuje) následují sekce metadat:– hlavičku <metsHdr>– popisná metadata <dmdSec>– administrativní metadata <amdSec>– skupiny objektů <fileSec>– strukturální mapa <structMap>– chování podle obsahu <behaviourSec>
![Page 19: Stručný úvod do METS](https://reader035.vdocuments.net/reader035/viewer/2022062803/56814652550346895db36783/html5/thumbnails/19.jpg)
19
METS – <structMap>• jádro METS dokumentu, které spojuje
jeho jednotlivé části, vyjádřené prostřednictvím identifikátorů
• vazba je realizována prostřednictvím:– <fptr> ... ukazatel na fyzický soubor v
rámci aktuálního METS dokumentu– <mptr> ... ukazatel na jiný METS
dokument, který obsahuje požadovanou informaci
![Page 20: Stručný úvod do METS](https://reader035.vdocuments.net/reader035/viewer/2022062803/56814652550346895db36783/html5/thumbnails/20.jpg)
20
<div> vyjadřuje jednotlivé části dokumentu
<fptr> odkazuje na identifikátory použité v sekci <fileSec>
<mptr> umožňuje zachovat rozumnou velikost METS souborů u složitých reprezentací (např. periodika)
<area> <par> <seq>
![Page 21: Stručný úvod do METS](https://reader035.vdocuments.net/reader035/viewer/2022062803/56814652550346895db36783/html5/thumbnails/21.jpg)
21
e tc ., e tc. e tc ....
D iv is io n M E T S P o in te r F ile P o in te r
D iv is io n M E T S P o in te r F ile P o in te r
D iv is io n
S tru c tu ra l M ap
METS – <structMap>
převzato z prezentace Smith MacKenzie (MIT, 2003)
![Page 22: Stručný úvod do METS](https://reader035.vdocuments.net/reader035/viewer/2022062803/56814652550346895db36783/html5/thumbnails/22.jpg)
22
METS – praktické dopady• poměrně náročná datová struktura, kterou
nelze pohodlně vytvářet s běžným editorem• vyžaduje koordinaci při implementaci:
– existence METS profilů a příslušného schématu pro popis, tj. co lze uvnitř METS dokumentu v dané digitální knihovně očekávat
– existence METS extenzí (DC, MARCXML, MODS; textMD; audioMD, videoMD, rightsMD; připravuje se PREMIS extenze) – co lze vkládat
![Page 23: Stručný úvod do METS](https://reader035.vdocuments.net/reader035/viewer/2022062803/56814652550346895db36783/html5/thumbnails/23.jpg)
23
METS – přehled implementacíhttp://sunsite.berkeley.edu/mets/registry/
– UC, Berkeley (EAD<>METS)– National Library of Portugal (eContent editor)– California Digital Library (TEI, EAD<>METS)– Culturnet Cymru (TEI<>METS)– FCLA (conversion ETD<>METS)– Harvard, Göttingen, Library of Congress,
Oxford, MIT, OCLC, RLG, Stanford, Graz aj.
implementace v řadě sw: Greenstone, Fedora, DContent, DSpace, DigiTool...
![Page 24: Stručný úvod do METS](https://reader035.vdocuments.net/reader035/viewer/2022062803/56814652550346895db36783/html5/thumbnails/24.jpg)
24
METS – současný stav• z amerického standardu se stává
světový standard – potvrzuje i zpráva ICABS o stavu vybraných digitálních knihoven v národních institucích (2005)
• rozšiřuje se nabídka nástrojů a zkušeností z víceletého užívání (je třeba pravidelného sledování www a navázání kontaktů ze zmíněných institucí)
• předpokládá aplikaci shora dolů prostřednictvím doporučené množiny standardů (profily/extenze!)
![Page 25: Stručný úvod do METS](https://reader035.vdocuments.net/reader035/viewer/2022062803/56814652550346895db36783/html5/thumbnails/25.jpg)
25
METS pro uživatele
![Page 26: Stručný úvod do METS](https://reader035.vdocuments.net/reader035/viewer/2022062803/56814652550346895db36783/html5/thumbnails/26.jpg)
26
METS záznamu strany
![Page 27: Stručný úvod do METS](https://reader035.vdocuments.net/reader035/viewer/2022062803/56814652550346895db36783/html5/thumbnails/27.jpg)
27
METS záznamu svazku
![Page 28: Stručný úvod do METS](https://reader035.vdocuments.net/reader035/viewer/2022062803/56814652550346895db36783/html5/thumbnails/28.jpg)
28
... jhove, textMD