sose 2013 | it-zertifikat: amm - digitale bibliotheken, metadatenstandards: marc, dublin core &...

49
Universität zu Köln. Historisch-Kulturwissenschaftliche Informationsverarbeitung Jan G. Wieners // [email protected] Advanced Markup & Metadata Sommersemester 2013 19. Juni 2013 – Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co.

Upload: jan-wieners

Post on 12-Jan-2015

183 views

Category:

Documents


1 download

DESCRIPTION

 

TRANSCRIPT

Page 1: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

Universität zu Köln. Historisch-Kulturwissenschaftliche InformationsverarbeitungJan G. Wieners // [email protected]

Advanced Markup & MetadataSommersemester 2013

19. Juni 2013 – Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co.

Page 2: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

Digitale Bibliotheken, Digitale Archive, Digitale Museen

Bibliographische Metadaten MARC MAB MARCXML Dublin Core (DC) Metadata Object Description Schema (MODS)

Digitale Objekte Metadata Encoding and Transmission Standard (METS)

Gruppierung digitaler Objekte Open Archives Initiative (OAI) OAI-PMH

(Eingebettete) Metadaten für Multimedia Bild: (GIF, PNG, JPEG), TIFF, EXIF Audio: ID3 / ID3v2

Sitzungsüberblick

Page 3: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

© Raimond Spekking

Page 5: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

Digitale Bibliothek

Page 6: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

Vannevar Bush (1890-1974) 1954: „As we may think“ „Memex“ (Memory Extender)

Digitale Bibliothek

Page 7: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

Digitale Bibliothek

http://www.europeana.eu

Page 8: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

Digitale Bibliothek

http://www.deutsche-digitale-bibliothek.de

Page 9: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

Digitale Bibliothek

http://www.deutsche-digitale-bibliothek.de

Page 10: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

Digitale Bibliothek

http://www.deutsche-digitale-bibliothek.de

Page 11: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

“A focused collection of digital objects, including text, video, and audio [and beyond: 3D objects, simulations, dynamic visualizations, and virtual reality], along with methods for access and retrieval, and for selection, organization, and

maintenance of the collection.”[Witten, Bainbridge, Nichols (2010): How to Build a Digital Library]

Digitale Bibliothek

Page 12: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

Sammlung digitaler Objekte Text Video Audio 3D Objekte Simulationen, VR, etc.

Bereitstellung von Zugriffsmöglichkeiten: Benutzerseite:

Zugriff (access)

Abfrage (retrieval) von digitalen Objekten

Bibliothekarinnen-/Bibliothekarseite: Selection Organization Maintenance

Metadaten Kritisch für alle Formen organisierter digitaler Inhalte

Digitale Bibliothek

Page 13: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

Grundfrage: Woher stammen die Metadaten?

Page 14: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

Grundfrage: Woher stammen die Metadaten?

Option I: Ein Mensch hat festgelegt, dass x Ein Mensch betrachtet und analysiert das Dokument und weist einem Metadatenelement einen bestimmten Wert zu.

Option II: Ein Computerprogramm hat x analysiert und bestimmt Ein Algorithmus verarbeitet das Dokument und gibt einen Wert für das Metadatenelement aus.

Metadaten

Page 15: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

Arten von Metadaten: Administrative metadata for managing resources, such as rights

information Descriptive metadata for describing resources (Beispiel: Zettel

des Zettelkataloges) Preservation metadata for describing resources, such as

recording preservation actions Technical metadata related to low-level system information, such

as data formats and any data compression used Usage metadata related to system use, such as tracking user

behavior

“End user’s view is only the tip of the iceberg: Much of the metadata is not intended for public display”

Metadaten“End user’s view is only the tip of the iceberg: Much of the metadata is not intended for public display”

Page 16: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

Arten von Metadaten: Administrative metadata for managing resources, such as rights

information Descriptive metadata for describing resources (Beispiel: Zettel des

Zettelkataloges) Preservation metadata for describing resources, such as recording

preservation actions Technical metadata related to low-level system information, such as

data formats and any data compression used Usage metadata related to system use, such as tracking user

behavior

“End user’s view is only the tip of the iceberg: Much of the metadata is not intended for public display”

Page 17: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

MARC MAB MARCXML Dublin Core (DC) Metadata Object Description Schema: MODS […] OAI

Bibliographische Metadaten: Standards

Page 18: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

MARC

Page 19: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

MARC: MAchine Readable Cataloging

Vorgestellt in den späten 1960er Jahren von Henriette Avram (Library of Congress)

!Grundproblem/-intention: Migration von Zettelkatalogen zu computerbasierter Repräsentation von Datensätzen (Records)

MARC-Datensätze gespeichert als Sammlung von Feldern in einem „ziemlich komplexen Format“[Witten, Bainbridge, Nichols (2010): How to Build a Digital Library]

“Producing a MARC record for a particular publication is an onerous undertaking that is governed by a detailed set of (highly detailed) rules and guidelines called the Anglo-American Cataloging Rules (AACR2R, 2R final revised 2nd edition).”[Witten, Bainbridge, Nichols (2010): How to Build a Digital Library]

MARC

Page 20: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

Beispiel: http://catalog2.loc.gov

MARC

Page 21: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

Variable Control Fields (00x) Variable Data Fields

Numbers and Codes (0xx) Main Entries (1xx) Titles (2xx) Edition, Imprint, etc. (2xx) Physical Description, etc. (3xx) Series Statements (4xx) Notes (5xx) […]

Vgl. die Referenz unter http://www.loc.gov/marc/bibliographic/ecbdhome.html

MARC Tags (die Spitze des Eisbergs)

Page 22: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

MARC Tags (die Spitze des Eisbergs)

Page 24: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co
Page 25: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

MARCXML-Darstellung

MARCXML

Vorteile?Nachteile?

Page 26: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

MARCXML Dublin Core

http://lccn.loc.gov/79459272/dc

Vorteile?Nachteile?

Page 27: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

Maschinelles Austauschformat für Bibliotheken (MAB), MAB 1970er, Deutsche Nationalbibliothek MAB2 1990er Verwendung mit RAK (Regeln zur Alphabetischen Katalogisierung)

Kleiner Exkurs: MAB und VD18

Page 28: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

Intention: Digitalisierung und Erschließung der im deutschen Sprachraum veröffentlichten Drucke des 18. Jahrhunderts

Kontext

VD18

VD 16 VD 17 VD 18

~100 000 erfasste Titel

~255 000Titel

Ziel: Mehr als600 000 Titel

Förderzeitraum: 1969-1999

Förderzeitraum:Seit Juli 1996

Förderzeitraum:Ab 2009

Page 29: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

VD18 – Arbeitsaufteilung / Workflow

SWB

KoordinierungsDB

Page 30: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

VD18: Daten

Page 31: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

MAB Übung

Page 32: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

Dublin Core

Page 33: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

Benannt nach Dublin, Ohio, wo 1995 das erste Treffen der Gruppe / Initiative veranstaltet wurde.

Dublin Core (DC): Satz von vordefinierten Metadatenelementen, intendiert für Nutzung durch Nicht-Spezialisten die Beschreibung digitaler Ressourcen (i.e. Websites),

die häufig keinen eigenen MARC Katalog-Eintrag erhalten würden

Verglichen (z.B.) mit MARC: Sehr einfach Designziel: Allgemeinheit, Einfachheit

Dublin Core

Page 34: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

Satz von 15 Elementen zur Beschreibung von Ressourcen: Title Creator Subject Description Publisher Contributor Date Type Format Identifier Source Language Relation Coverage Rights

Alle Elemente sind optional und wiederholbar, die Reihenfolge ist beliebig

Dublin Core

Page 36: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

Elementübersicht: http://de.wikipedia.org/wiki/Dublin_Core Vgl. auch: http://de.selfhtml.org/html/kopfdaten/meta.htm#dublin_core

Übungsaufgabe: Geben Sie die wesentlichen Charakteristika des Werkes „Die Jungfrau züchtigt den Jesusknaben vor drei Zeugen“ (Max Ernst, 1926) mit Dublin Core wieder.

Dublin Core Übung

Page 37: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

Stärke von Dublin Core: Einfachheit Schwäche von Dublin Core: Einfachheit

Genügen 15 Elemente, um (digitale) Objekte adäquat zu beschreiben?

Dublin Core

Page 38: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

Digitale Objekte:METS / MODS

Page 39: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co
Page 40: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co
Page 41: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

Problemstellung

Page 42: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

Zwei sich ergänzende internationale Formate zur Kodierung von Metadaten und digitalen Objekten, die aus mehreren Teilen (Seiten, Dateien, Kapitel, etc.) bestehen (vgl. http://

www.gbv.de/wikis/cls/METS/MODS): Metadata Encoding and Transmission Standard (METS) Metadata Object Description Schema (MODS)

Heimat von METS: http://www.loc.gov/standards/mets/

METS: „Designed to permit the representation, maintenance, and exchange of the increasingly complex digital objects that make up digital libraries. Library catalogs have for years used MARC records to fulfill these functions for their materials. The METS initiative aims to do the same for digital collections.”

METS / MODS

Page 43: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

Sieben Hauptabschnitte: Kopfteil (METS Header) Erschließungsangaben (Descriptive Metadata) Verwaltungsangaben (Administrative Metadata) Dateienabschnitt (File Section) Strukturbeschreibung (Structural Map) Strukturverknüpfungen (Structural Links) Verhalten (Behavior)

Ein Beispiel: http://vd18-proto.bibliothek.uni-halle.de/de-slub-vd18/oai/?

verb=GetRecord&metadataPrefix=mets&mode=view&identifier=5270690

METS / MODS

Page 44: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

OAI:Open Archives Initiative

Page 45: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

OAI: Beispiel für eine Schnittstelle zur Kommunikation von (Meta-)Daten über das Internet

Konzepte & Co.: Data Provider Systeme, die Metadaten über OAI-PMH

zugänglich machen OAI-PMH OAI Protocol for Metadata Harvesting Service Provider Sammelt Metadaten von

Datenprovidern, bietet Suchinterface für Archive, von denen Metadaten gesammelt wurden

OAI: Begrifflichkeiten, Konzepte

Page 46: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

Datenkommunikation über http-Request Basisadresse + Script (+ Verb (+ Argument)?)* Sechs "Verben" zur Kommunikation

Identify [wer bist du?] ListMetadataFormats [was sprichst du?] ListSets [was hast du für

Sammlungen?] ListIdentifiers [gib mir deine Identifier] ListRecords [gib mir Datensätze] GetRecords [gib mir Datensätze] Sechs "Argumente":

metadataPrefix, identifier, from, until, set, resumptionToken

OAI: Kommunikation

Page 47: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

Beispielanwendung CEEC Handschrift Dom 213 Bild:

http://www.ceec.uni-koeln.de/ceec-cgi/kleioc/0010/exec/pagesma/%22kn28-0213_001.jpg%22/segment/%22body%22

Beschreibung: http://www.ceec.uni-koeln.de/ceec-cgi/kleioc/0010/exec/katl/%22kn28-0213%22

XML (TEI-like): http://www.ceec.uni-koeln.de/projekte/CEEC/database/descriptions/kn28-0213.xml

OAI (oai_dc): http://www.ceec.uni-koeln.de/ceec-oai/kleioc?verb=GetRecord&metadataPrefix=oai_dc&identifier=kn28-0213

OAI: CEEC

Page 48: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

Arten von Metadaten: Administrative metadata for managing resources, such as rights

information Descriptive metadata for describing resources (Beispiel: Zettel

des Zettelkataloges) Preservation metadata for describing resources, such as

recording preservation actions Technical metadata related to low-level system information, such

as data formats and any data compression used Usage metadata related to system use, such as tracking user

behavior

“End user’s view is only the tip of the iceberg: Much of the metadata is not intended for public display”

Metadaten“End user’s view is only the tip of the iceberg: Much of the metadata is not intended for public display”

Page 49: SoSe 2013 | IT-Zertifikat: AMM - Digitale Bibliotheken, Metadatenstandards: MARC, Dublin Core & Co

/