metadata (vad är metadata?)

Post on 18-Dec-2014

117 Views

Category:

Education

0 Downloads

Preview:

Click to see full reader

DESCRIPTION

A short lecture on metadata to an audience of staff at the National Library of Sweden. The theme of the meeting was digitization.

TRANSCRIPT

Sidnummer

<metadata>

Bibliografiskt stormöte Tema digitalisering

KB, Hörsalen 17 dec 2013

Sidnummer

Ska prata om…

• Vad är metadata, vilka metadatatyper pratar vi om, samt är det viktigt att dela in metadata i olika kategorier?

• Metadatastandarder – snabb genomgång av de för oss mest relevanta

• Något kort om digitalt bevarande

2013-12-17

stideg@kb.se 2

Sidnummer

Metadata är…

• ”Data om data”

• Förenklar och effektiviserar uppföljning, tolkning, sökning och sortering av information

• Används av maskiner, måste därför kunna läsas av maskiner

2013-12-17

stideg@kb.se 3

Presentatör
Presentationsanteckningar
Den semantiska betydelsen är ”data om data”, eller ”information om data”. Vi behöver metadata för att lättare och på ett mer effektivt sätt kunna tolka, söka och sortera en mängd information. Men i dagens digitala samhälle är det maskinerna som ska göra jobbet, det är de som använder och läser metadata…

Sidnummer

Strukturerad och väl definierad

• Strukturerad form (t.ex. xml) enligt ett väl definierat schema,

• med semantiska enheter (”data elements”) med definierade betydelser.

• Får extra stöd av ordlistor, auktoriserad data, etc.

• Internationella standarder att föredra

• (Regler – t.ex. RDA)

<titleInfo> <title>DAGENS NYHETER 1869-04-29</title> </titleInfo> <genre authority="marcgt">issue</genre> <language> <languageTerm authority="iso639-2b" type="code">swe</languageTerm> </language>

2013-12-17

stideg@kb.se 4

Presentatör
Presentationsanteckningar
Det är därför viktigt att metadata har en strukturerad form, t.ex. i xml som i exemplet här, och att det är strukturerat enligt ett väl definierat schema (regelsystem) De semantiska enheterna, som också kallas ”data elements” (här i blått) eller ”attribut” (här i orange), deras betydelse måste vara väl definierade. De kan också få stöd av ordlistor och auktoriserad data (här i rött). Självklart är användning av internationella metadatastandarder att föredra, i vilket fall som helst ska hur man använder metadata vara väl dokumenterad.

Sidnummer

”Metadata universe”

Creative Commons Attribution-Noncommercial-Share Alike 3.0 United States License http://www.dlib.indiana.edu/~jenlrile/metadatamap/

Domain (Domän) - scholarly texts, moving images, geospatial data… Community – archives, libraries, museums… Function (Funktion) – record format, markup language, controlled vocabulary… Purpose (Ändamål) – descriptive, metadata wrappers, preservation, provenance…

2013-12-17

stideg@kb.se 5

Presentatör
Presentationsanteckningar
Den här bilden har säkert många av er sätt förut. Den föreställer en slags atlas över “The metadata universe”, för att visa på den enorma mängd av olika metadatastandarder som finns. Man har delat in kartan i 4 olika delområden där varje del representerar en möjlig indelningsgrund för metadatatyper. Några exempel: Domän, Community, Funktion, Ändamål…

Sidnummer

Indela metadata i kategorier

• Deskriptiva/Beskrivande (descriptive) metadata - används för att hitta, identifiera och förstå en resurs

• Administrativa (administrative) metadata - används för att hantera skapandet, användningen och bevarandet av resursen (omfattar tekniska metadata och bevarandemetadata)

• Strukturella (structural) metadata - används för att registrera och underlätta relationerna mellan eller inom digitala resurser

• Användargenererade (use) metadata - metadata som samlas in från (eller handlar om) användarna själva (t.ex. användarnas anteckningar, antalet sökningar på en viss resurs)

Översättning från JISC Digital Media Guide http://www.jiscdigitalmedia.ac.uk/guide/an-introduction-to-metadata

2013-12-17

stideg@kb.se 6

Sidnummer

Bibliografiska metadata

• Synonymt med deskriptiva metadata men med en mer specifik betydelse

• Kontext: bibliotek, förlag, vetenskaplig utgivning, etc.

• Bibliografisk information som förekommer i kataloger, bibliografier, bibliografiska referenser, etc.

2013-12-17

stideg@kb.se 7

Sidnummer

”Metadata som metadata… eller?”

• Fyller dessa indelningar i olika kategorier av metadata egentligen någon funktion?

• Praktiskt vid planering av nya verksamheter (vilka särskilda metadatakategorier måste man inkludera som stöd för dessa verksamheter?)

• Vanlig distinktion är den mellan deskriptiva och administrativa metadata – metadata som riktar sig till slutanvändarna (offentligt) – metadata som i första hand är för internt bruk och för förvaltning av

samlingarna (dolt).

• Gränserna inte knivskarpa.

• Viktigare se metadata som ”informationsbitar” som kan användas av olika system och för olika syften

2013-12-17

stideg@kb.se 8

Presentatör
Presentationsanteckningar
Kan vara praktiskt i vissa sammanhang. Till exempel då man utvecklar nya ramverk kring digitala samlingar. Vilka aktiviteter behöver man stödja? Vilka särskilda metadatakategorier måste man inkludera att stödja dessa verksamheter? Den breda distinktionen mellan "beskrivande metadata" och "administrativ metadata" blir en påminnelse om att en del metadata riktar sig särskilt till slutanvändarna och andra metadata kommer i första hand att vara för internt bruk och för förvaltning av samlingarna. Beskrivande metadata kommer med all sannolikhet att sökas och visas i ett offentligt gränssnitt, medan en stor del av de administrativa metadata måste döljas från offentlig visning.

Sidnummer

Exempel: Filformat

– <dc:format>text/html</dc:format>

– <premis:formatName>Hypertext Markup

Language</premis:formatName>

– <premis:formatVersion>4.01</premis:formatVersion>

– <premis:formatKey>fmt/100</premis:formatKey>

– <premis:formatRegister>pronom</premis:formatRegister>

• Metadata om filformat anses nog i första hand som teknisk

• Är också en viktig del av bevarandemetadata.

• Kan ofta vara viktig för beskrivning (förståelse) av resursen

• I grunden samma information men kan med automatik visas på olika sätt i olika sammanhang och i olika system

2013-12-17

stideg@kb.se 9

Sidnummer

METADATASTANDARDER Ett urval

2013-12-17

stideg@kb.se 10

Sidnummer

Metadatastandarder

Deskriptiva (Bibliografiska)

• Exempel DC

DC/dcterms – Dublin Core Beskrivning av digitala objekt (i så bred mening som möjligt). http://dublincore.org

MODS – Metadata Object Description. Rikt språk – mappning till MARC http://www.loc.gov/standards/mods/

MARCXML – MARC 21 in XML http://www.loc.gov/standards/marcxml

2013-12-17

stideg@kb.se 11

Sidnummer

Metadatastandarder

Arkiv

• Ur ett exempel i EAD (Ediffah)

EAD - Encoded Archival Description. Arkivbeskrivningar. http://www.loc.gov/ead/

EAC-CPF - Encoded Archival Context – Corporate bodies, Persons, and Families. Om arkivbildaren. http://eac.staatsbibliothek-berlin.de/

2013-12-17

stideg@kb.se 12

Sidnummer

Metadatastandarder

Bild och konstföremål

CDWA – Categories for the Description of Works of Art. http://www.getty.edu/research/publications/electronic_public

ations/cdwa

VRA CORE – a data standard for the description of images and works of art and culture http://www.loc.gov/standards/vracore/

Baselitz Skulptur „Armalamor” in der Deutschen Bibliothek in Frankfurt (Foto: stideg)

2013-12-17

stideg@kb.se 13

Sidnummer

Metadatastandarder

”Tekniska”

• om de digitala objekten, exempel MIX

TextMD – Technical Metadata for Text http://www.loc.gov/standards/textMD/

MIX – Metadata for Images in XML http://www.loc.gov/standards/mix/

AES-X098B och AES-X098C. För audio/video (kommer) Audio Engineering Society http://www.aes.org/

audioMD och videoMD http://www.loc.gov/standards/amdvmd/

Grundläggande teknisk info även i:

METS och PREMIS

2013-12-17

stideg@kb.se 14

Presentatör
Presentationsanteckningar
Med tekniska metadata menas ofta metadata som skapas av systemen i samband med skapande av datafilerna. T.ex. kameror, skannrar och programvara för ocr-läsning som används i digitaliseringen. Ofta lagras samma metadata även i filen.

Sidnummer

Metadatastandarder

Digitalt bevarande

• Exempel premis:event

PREMIS – Preservation Metadata: Implementation Strategies. Information för att underlätta digitalt bevarande. http://www.loc.gov/standards/premis/

2013-12-17

stideg@kb.se 15

Presentatör
Presentationsanteckningar
Det finns bara en standard för bevarandemetadata. Här samlas omfattande information om vad som krävs för att underlätta digitalt bevarande. Baserad på erfarenheter från olika institutioner världen över. Har en datamodell som vi använt oss av som grund i data- och metadatamodellen för Mimer. I fokus: Tekniska data om varje objekt, men mer utförligt om filformat. Händelser och agenter (vilka åtgärder har man vidtagit och vilka program har varit inblandade) – som ett led i att kunna spåra bakåt vad som hänt med filerna i arkivet.

Sidnummer

Metadatastandarder

Analys, uppmärkning

• Beskriver layout och innehåll, skapar nytt innehåll. Exempel ALTO (3 rader ur digitaliserad tidningssida)

ALTO – Analyzed Layout and Text Object Exempel dagstidningar http://www.loc.gov/standards/alto/

TEI – Text Encoding Initiative Exempel handskrifter http://www.tei-c.org/

Daisy - Digitalt Anpassat InformationsSYstem (Digital Accessible Information SYstem) Uppmärkt text synkroniserad med ljudfiler www.daisy.org/

2013-12-17

stideg@kb.se 16

Sidnummer

Metadatastandarder

Paketera information

METS - Metadata Encoding and Transmission Standard. Används för paketering av alla typer metadata och digitala objekt. http://www.loc.gov/standards/mets/

Didl - Digital Item Declaration Language. Används framför allt till paketering av filer av typen MPEG-2. http://xml.coverpages.org/mpeg21-didl.html

XFDU - XML Formatted Data Unit. Liknar METS. Från NASA. http://sindbad.gsfc.nasa.gov/xfdu/index.html

2013-12-17

stideg@kb.se 17

Sidnummer

Metadatastandarder

”Att synas på webben”

• Webbsida från BNF. HTML-koden innehåller metadata från schema.org

RSS – Really Simple Syndication Abonnemang på nyhetsflöden. Innehåller ofta DC http://www.rssboard.org/rss-specification

schema.org - samarbete mellan Bing, Google, Yahoo! och Yandex ”to create and support a common set of schemas for structured data markup on web pages”, “to improve the display of search results” http://schema.org

http://data.bnf.fr/11907966/victor_hugo/

2013-12-17

stideg@kb.se 18

Presentatör
Presentationsanteckningar
Hitta olika sätt för oss att göra våra digitaliseringar synliga. Wikipedia, sociala medier som Facebook, Twitter, etc. Metadatastandarder som man kan använda är förstås RSS genom att informera via nyhetsflöden. Franska NB lägger in metadata från schema.org på de sidor som de vill ska få bättre rankning hos de stora sökmotorerna. Schema.org – samarbete för att skapa och stödja en gemensam uppsättning scheman för strukturerad uppmärkning av webbsidor.

Sidnummer

Digitalt bevarande

• Metadata är en viktig del av det digitala bevarandet.

• Planering av metadata behöver komma in tidigt i digitaliserings-processen.

Säkra åtkomsten till KBs digitala samlingar nu, och i framtiden. Bevara för att tillgängliggöra!

Syftar till: Att säkra det digitala materialets fortlevnad, samt att kunna verifiera materialets autenticitet.

Omvärldsbevakning

Åtkomst

Säkerhet

Filformat

Migrering - Emulering

Metadata

Lagringsprognoser

2013-12-17

stideg@kb.se 19

Presentatör
Presentationsanteckningar
Det finns, i huvudsak, två övergripande mål för digitalt bevarande.�Det första är att säkra åtkomsten till Kungliga bibliotekets digitala samlingar nu, och i framtiden. Bevarandet av samlingarna syftar till att säkra det digitala materialets fortlevnad.�Det andra är att kunna verifiera materialets autenticitet. Med autenticitet menar vi här att materialet har hanterats på ett sådant sätt så att man, med hjälp av teknik och dokumentation, kan visa att det material som finns i samlingarna är det som en gång samlades in. http://intranat.kb.se/Styrdokument/policies/2-BEVARA-Digitalt-bevarande/

top related