Öppna data & länkade data

48
Öppna data & länkade data Marie Gustafsson Friberger [email protected] twitter: mariegus Presenterat för Lärosäten Syd Lund 7 oktober 2013 http://www.flickr.com/photos/thomasleuthard/5969305019/

Upload: marie-gustafsson-friberger

Post on 22-Apr-2015

579 views

Category:

Technology


4 download

DESCRIPTION

Presentation för bibliotekarier vid Lärosäten Syd, Lund 7 oktober 203

TRANSCRIPT

Page 1: Öppna data & Länkade data

Öppna data & länkade data

Marie Gustafsson [email protected]

twitter: mariegus

Presenterat för Lärosäten Syd Lund 7 oktober 2013

http://www.flickr.com/photos/thomasleuthard/5969305019/

Page 2: Öppna data & Länkade data

livingarchives.mah.se

Living Archives

Data Gamesdata-games.org

Page 3: Öppna data & Länkade data

3

http://librisbloggen.kb.se/2013/08/09/syftet-med-librissystemen-och-

librissamarbetet/

Page 4: Öppna data & Länkade data

4

Page 5: Öppna data & Länkade data

5

Page 6: Öppna data & Länkade data

Öppna data?

Data kan kallas öppna data om vem som helst fritt får använda, återanvända och distribuera dessa med som största motprestation att ange källa eller krav på att dela data på samma sätt.

http://opendatahandbook.org/en/what-is-open-data/index.htmlÖversättning från Open Knowledge Foundation

Page 7: Öppna data & Länkade data

Tekniskt öppen: maskinläsbart format (minimum)

Juridiskt öppen: tydlig licens som medger både kommerciell och icke-kommerciell användning utan restriktioner

Page 8: Öppna data & Länkade data

Varför?

Insyn

Samhällsnytta

Innovation

...

Fler kan göra intressanta saker med data

Page 9: Öppna data & Länkade data
Page 10: Öppna data & Länkade data
Page 11: Öppna data & Länkade data
Page 12: Öppna data & Länkade data
Page 13: Öppna data & Länkade data
Page 14: Öppna data & Länkade data

★ Tillgänglig på webben (oavsett format),

med en öppen licens

★★ Tillgänglig som maskinläsbar strukturerad

data (t ex Excel i stället för scannad tabell)

★★★ som (2) samt ickeproprietärt format

(t ex CSV i stället för Excel)

★★★★ Alla ovan, plus att använda W3C-standarder (RDF

och SPARQL) för beskriva saker

★★★★★ Alla ovan plus att länka din data till andras data

Page 15: Öppna data & Länkade data

Principer för länkade data1. Använd URI:er för att namnge saker

2. Använd HTTP URI:er så att dessa namn kan användas för att få mer information

3. När någon kollar en URI, ge användbar information genom standarder (RDF*, SPARQL)

4. Inkludera länkar till andra URI:er så att fler saker kan upptäckas

http://www.w3.org/DesignIssues/LinkedData.html

Page 16: Öppna data & Länkade data

16

Page 17: Öppna data & Länkade data

Linking Open Data cloud diagram, by Richard Cyganiak and Anja Jentzsch. http://lod-cloud.net/

Page 18: Öppna data & Länkade data

Semantiska webben

• Data-webb (snarare än dokument-webb).

• Idag kontrollerar applikationer ofta sin egen data och delar inte med sig av den.

• Visionen med den semantiska webben är att göra det möjligt att kombinera data från flera olika källor.

18

Page 19: Öppna data & Länkade data

Why Linked Data matters to libraries

”Although making a library catalogue available as Linked Data is mostly a matter of technical details and transformation of data, the implications are more profound. Sharing data, especially with communities outside the library sector, creates an interest in our work. Using tools and techniques that are not unique to libraries lets us communicate easier with professionals in other areas.

Linked Data finally, truly, connects libraries to the web.”

Martin Malmsten, LIBRIS/KBExposing Library Data as Linked Data – http://bit.ly/1dZ5i4Y

Fix layout

Page 20: Öppna data & Länkade data

En kort introduktion till W3C-rekommendationer

relaterade till den semantiska webben

Page 21: Öppna data & Länkade data

Resource Description Framework

Page 22: Öppna data & Länkade data

“Description”?

Subject - Predicate - Object

Page 23: Öppna data & Länkade data

Subject - Predicate - Object

Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.

Page 24: Öppna data & Länkade data

Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.

Page 25: Öppna data & Länkade data

Flera källor

+

+Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.

Page 26: Öppna data & Länkade data

En graf...

Image from the book Semantic Web for the Working Ontologist by Allemang and Hendler.

Page 27: Öppna data & Länkade data

Vad är vad?

• Om två källor använder samma benämningar, avser de då samma ”sak”?

• URI:er to the rescue!

• En URI avser en specifik resurs.

Page 28: Öppna data & Länkade data

http://librisbloggen.kb.se/2008/12/03/libris-available-as-linked-data/

Page 29: Öppna data & Länkade data

Ontologier – OWL

• Kallas ofta vokabulärer i samband med länkade data

• Används för att beskriva begrepp och relationer mellan begrepp i någon domän

• Kan innehålla allt från en enkel vokabulär till komplexa logiska uttryck för att dra slutsatser baserat på data

29

Page 30: Öppna data & Länkade data

Exempel: Nobelpris

http://www.nobelprize.org/nobel_organizations/nobelmedia/nobelprize_org/developer/manual-linkeddata/terms.rdf

Classes: NobelPrizeLaureateAwardLaureateCategoryPrizeFileAwardFile

Objectproperties:nobelPrize (kopplar Laureate till NobelPrize)university (kopplar Laureate till universitet från DBPedia)....

Datatypeproperties:yearmotivationcontribution...

Page 31: Öppna data & Länkade data

http://librisbloggen.kb.se/2008/12/03/libris-available-as-linked-data/

dc syftar på ”namespace” http://purl.org/dc/elements/1.1/

Page 32: Öppna data & Länkade data

Simple Knowledge Organization System (SKOS)

• RDF vokabulär för att representera semiformella knowledge organization systems (KOSs), exempelvis thesauri o taxonomier.

ex:animals rdf:type skos:Concept; skos:prefLabel "animals"@en; skos:narrower ex:mammals.

ex:birds rdf:type skos:Concept; skos:prefLabel "birds"@en; skos:related ex:ornithology.

Page 33: Öppna data & Länkade data

SPARQL

• SPARQL Protocol and RDF Query Language

• En fråga består av en uppsättning trippel-mönster (tripple patterns).

• Trippel-mönster är som RDF-tripplar förutom att varje subjekt, predikat och objekt kan vara en variabel.

Page 34: Öppna data & Länkade data

Exempel

Libris

Page 35: Öppna data & Länkade data

Libris som länkade dataSedan 2008...

För att leka med SPARQL: http://libris.kb.se/sparql

Länkar till flera olika dataset, bl a DBPedia, Library of Congress

Page 36: Öppna data & Länkade data

PREFIX owl: <http://www.w3.org/2002/07/owl#>PREFIX foaf: <http://xmlns.com/foaf/0.1/>PREFIX dbpedia: <http://dbpedia.org/ontology/>PREFIX rdfs: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>PREFIX dc: <http://purl.org/dc/elements/1.1/>PREFIX rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>

select ?uri ?book ?title where { ?uri foaf:name "August Strindberg" . ?uri rdf:type foaf:Person . ?book dc:creator ?uri . ?book dc:title ?title .}

http://libris.kb.se/sparql

Page 37: Öppna data & Länkade data

37

Page 38: Öppna data & Länkade data

38

Page 39: Öppna data & Länkade data

PREFIX owl: <http://www.w3.org/2002/07/owl#>PREFIX foaf: <http://xmlns.com/foaf/0.1/>PREFIX dbpedia: <http://dbpedia.org/ontology/>PREFIX rdfs: <http://www.w3.org/1999/02/22-rdf-syntax-ns#>PREFIX dc: <http://purl.org/dc/elements/1.1/>

select ?book ?title ?author where { ?book dc:subject <http://libris.kb.se/resource/auth/150197> . ?book dc:title ?title . ?book dc:creator ?author .}limit 100

Page 40: Öppna data & Länkade data

40

Page 41: Öppna data & Länkade data

• Extraherar strukturerad information från Wikipedia och tillgängliggör den via webben.

• Beskriver över 3,77 miljoner saker, varav 2,35 miljoner är klassificerade i en konsistent ontologi som innehåller 764.000 personer, 573.000 platser, 112.000 musikalbum, 72.000 filmer, 18.000 videospel, 192.000 organisationer, 202.000 arter och 5.500 sjukdomar.

Page 42: Öppna data & Länkade data

Möjliga frågor

• DBPedia gör det möjligt att ställa frågor där informationen som behövs för att svara finns spridd över flera olika Wikipedia-artiklar.

• Till exempel...

Page 43: Öppna data & Länkade data

43

Personer födda i Köpenhamn innan år 1900.

Page 44: Öppna data & Länkade data

44

Page 45: Öppna data & Länkade data

45

Page 46: Öppna data & Länkade data

DISKADigitala semantiska kulturarvsauktoriteter

”väsentliga auktoritetslistor som länkbar, öppen data via webben”

46

http://www.flickr.com/photos/nationaalarchief/4398562726/

http://www.digisam.se/index.php/hem/tags/tag/diska

Exempel på poster: http://prezi.com/qdze6qvqmscr/diska-ett-projekt-pa-digisam-i-samarbete-med-kth/

Page 47: Öppna data & Länkade data

http://www.flickr.com/photos/jdhancock/3383629917/

Page 48: Öppna data & Länkade data

Marie Gustafsson [email protected]

twitter: mariegus

Frågor?