ubu 3.0: semantisch web & linked data voor de ub?
Post on 20-Aug-2015
985 Views
Preview:
TRANSCRIPT
UBU 3.0semantisch web & linked data voor de UB?
Eric Sieverts
sector Innovatie & Ontwikkeling
eric sieverts, UBU, april 2011
web 3.0
semantischweb
eric sieverts, UBU, april 2011
wat is die semantiek?
1. betekenis van de "aard" van de gegevens/informatie?(dit is een plaatsnaam, dit is een geboortedatum, …)
– betekenis & definitie van "veldnamen"– concordantie/mapping tussen "velden“ (DC:creator ≈ MARC:100)
of2. betekenis van inhoud van de informatie/gegevens?
(dit woord betekent in deze context ….; dit woord betekent hetzelfde als …. in dat document, …)
– betekenis & definitie van "veldinhouden"
(2011-04-07 betekent 7 april 2011 - volgens ISO8601)
allebei!eric sieverts, UBU, april 2011
hoe wordt die betekenis vastgelegd?
het toverwoord is ontologieënmaar in deze context kan "alles" een ontologie zijn
• elk metadatamodel (dus ook Dublin Core of MARC21)
• elk inhoudelijk beschrijvingsmodel (dus ook een thesaurus of een classificatie)
hoewel "echte" ontologieën nog wel iets meer zijn:
• leggen kennis geformaliseerd & gestructureerd vast
• in computerinterpreteerbare vorm
• zodanig dat computer op grond daarvan kan redeneren
eric sieverts, UBU, april 2011
zo wordt van "alles" de betekenis vastgelegd
maar dat moet wel volgens standaarden
hoe wordt die betekenis vastgelegd?
misschien is het toverwoord dus wel vooral
standaarden
(en het mooie is dat er daar zo veel van zijn)
eric sieverts, UBU, april 2011
vertel er dus wel bijwelke standaard
je gebruikt,als je er een gebruikt
standaardisatie van eigenschappen/kenmerkenin beschrijving van recepten
daardoor kanGoogle eenreceptenzoekmachinemaken
standaardisatie:metadatamodel is GR-ontologiebeschrijving van metadata in RDFa weergave van RDFa in (X)HTML
lagenstructuur van gebruikte standaarden
eric sieverts, UBU, april 2011
ascii, utf-8, unicode, uri, ..
xml
rdf
metadatamodel
technische basisstructuren
weergeven van beschrijving
beschrijven van metadatabeschrijving
kennisorganisatiesysteem/ thesaurus / ontologie
skos beschrijvenvan metadatamodel
de "linked open data cloud" - 28 maart 2011 - 28,5 miljard gegevens onlinecomputers kunnen de betekenis van die data "begrijpen" & ze gebruiken
dankzij standardisatie van dataformats en metadata
from: State of the LOD cloud - 03/28/2011 - http://www4.wiwiss.fu-berlin.de/lodcloud/state/
maar zijn dat soort getallen alleen-zaligmakend ?
> toepassingNL gov. data
interoperabiliteitinteroperabiliteit
kern van semantisch web (en van linked data) is:kern van semantisch web (en van linked data) is:
… … ook tussen systemenook tussen systemendie daar niet bij voorbaat die daar niet bij voorbaat op waren gebouwdop waren gebouwd
interoperabiliteit
• door gebruik van ontologieën(en mapping/concordanties)
• door standaardisatie met RDF(en/of SPARQL)
eric sieverts, UBU, april 2011
RDF (en linked data)
• RDF = resource description framework• computerleesbare standaard beschrijving van metadata • waarbij telkens
– te beschrijven ding een webadres (URI) heeft– eigenschap van dat ding liefst ook een URI heeft– "waarde" van die eigenschap liefst ook een URI heeft
• voorbeeld:– boek (heeft een webadres: URI)– heeft auteur (betekenis van eigenschap ergens beschreven: URI)– persoon (gegevens van persoon ergens op web te vinden: URI)
RDF "triple stores"
eric sieverts, UBU, april 2011
RDF tripels
subject {predicaat} object
doc1 {heeft auteur} auth1
auth1 {heeft naam} john smith
auth1 {heeft affiliatie} home inc.
auth1 {heeft email} smith@home.com
grafische representatie vansimpel netwerk van 4 RDF-tripels
eric sieverts, UBU, april 2011
dezelfde RDF-tripels in XML
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns="http://www.john.smith.net/rdfexample/">
<rdf:Description rdf:about="http://www.xxx.com/yyy/doc1.xml">
<author>
<rdf:Description rdf:about="http://www.xxx.com/autId/7801">
<name>John Smith</name>
<affiliation>Home Inc.</affiliation>
<email>Smith@home.com</email>
</rdf:Description>
</author>
</rdf:Description>
</rdf:RDF>
namespaces
URI's van beschreven resources
eric sieverts, UBU, april 2011
wat kunnen /
moeten / willen
wij hiermee?
linked data
wat een organisatie zich moet afvragen
• wat hebben wij dat voor anderen interessant is?– catalogus, repository, collectie bijzondere collecties,
data in datasets in DVN [maar die data zijn NIET van ons!]
– voor wie is dat interessant? [moeten wij dat bedenken?]
– hoe stellen we dat beschikbaar? (RDF-tripels?)
– welke standaarden? (RDF, … ??)
• wat hebben anderen dat voor ons interessant is?• wat kan ik voor leuke toepassingen bedenken met
andermans data?– zeker als UKB besluit op te houden met de GOO?
eric sieverts, UBU, april 2011
wat een organisatie zich moet afvragen
• wat hebben wij dat voor anderen interessant is?
• wat kan ik voor leuke toepassingen bedenken met andermans data?
• wat hebben anderen dat voor ons interessant is?– wat voor data hebben we nodig?
[ìs er meer te bedenken dan verrijking met gegevens over auteurs, boeken, organisaties, onderwerpen, …?]
– hoe/waar vinden we die data? [DBpedia, andere bibliotheken, semantic radar in Firefox?]
eric sieverts, UBU, april 2011
dbpedia: data from Wikipedia
last.fm: artists
geonames:6.2 M toponyms
BBC: wildlifefinder
Flickr
project Gutenberg
IMDB
music brainz
rechtspraak.nl
Reuters:openCalais
viaf: virtual internationalauthority file
LCSH
NY times
wat een organisatie zich moet afvragen
• wat hebben wij dat voor anderen interessant is?
• wat kan ik voor leuke toepassingen bedenken met andermans data?
• wat hebben anderen dat voor ons interessant is?– wat voor data hebben we nodig?
[ìs er meer te bedenken dan verrijking met gegevens over auteurs, boeken, organisaties, onderwerpen, …?]
– hoe/waar vinden we die data? [DBpedia, andere bibliotheken, semantic radar in Firefox?]
– hoe moeilijk is het om die te gebruiken?– welke vaardigheden hebben we daarvoor nodig?
eric sieverts, UBU, april 2011
bestaan daar ookrecepten voor ?
…. en linked data zijn zeker niet binnen 15 minuten te bereiden ....
top related