open data: dcat en tools
TRANSCRIPT
© Fedict 2014. All rights reserved
Open Data: DCAT en toolsFedict – Brussel – 18 december 2014
Bart Hanssens
© Fedict 2014. All rights reserved
DCAT
Uitwisselen metadata
© Fedict 2014. All rights reserved | p. 3
Meerdere open data portals
■ There cannot be only one !■ Lokale / regionale / nationale / Europese portal(s)■ Per EU Directive (PSI, INSPIRE ...)■ Portals per thema, privé-initiatieven
■ Hoeft geen probleem te zijn■ Belangrijkste is uitwisselen van (meta)data
© Fedict 2014. All rights reserved | p. 4
DCAT
■ Data CATalog vocabulary■ Gebaseerd op metadata UK / USA / …■ Uitgewerkt door DERI (Ierse universiteit)■ Nu beheerd door W3C
■ Hergebruik “Dublin Core” en “DC Terms”■ Titel, beschrijving, linken naar data, licentie …
■ In RDF, RDF/XML, JSON, …
■ Metadata over een dataset■ Dus niet dataset zelf
© Fedict 2014. All rights reserved | p. 5
Concepten
■ Catalogus■ Bevat lijst van (meta)datasets op een portal
■ Dataset■ Metadata■ Wat abstract / algemeen
■ Distributie■ Concrete versie(s) van een dataset■ Bijvoorbeeld: link naar XML download, JSON API ...
© Fedict 2014. All rights reserved | p. 6
DCAT-AP
■ DCAT Application Profile■ Voorgesteld door EC■ Strikter / preciezer dan DCAT■ Aan te raden attributen
■ “Belgische versie” DCAT-AP■ 1e aanzet door CORVE■ Nog verder uitgewerkt (thesauri, …)■ Uitwisselformaat =/= portalen■ Werkgroep Fedict en andere portal owners
© Fedict 2014. All rights reserved | p. 7
Enkele thesauri
■ EUROVOC■ Thematische indeling■ EU Publication Office■ Vertaald naar alle EU talen
■ NUTS■ Nomenclature of Territorial Units for Statistics■ Tot arrondissementsniveau (geen steden)■ Alternatief: GeoNames (community) ?
© Fedict 2014. All rights reserved | p. 8
Aandachtspunten
■ Conversie naar DCAT-AP (BE)■ Via ODIP server (http://data.opendatasupport.eu/) ?■ Eigen client tools ?
■ Mapping eigen thesauri => Eurovoc■ SPARQL ?■ Publicatie SKOS ?
© Fedict 2014. All rights reserved
Enkele tools
© Fedict 2014. All rights reserved | p. 10
CKAN
■ Comprehensive Knowledge Archive Network
■ Ontwikkeld door Open Knowlegde FoundatioN■ Portaal om metadata te beheren■ Open source (Python)
■ Zeer veel gebruikt
■ Work-in-progress:■ Export naar DCAT(-AP)■ Meertaligheid: “linken” tussen vertalingen
© Fedict 2014. All rights reserved | p. 11
Voorbeeld: AWT
© Fedict 2014. All rights reserved | p. 12
The DataTank
■ Ontwikkeld door OKFN (be)■ Uploaden van data■ Conversie XLS naar open formaten (XML, JSON, CSV)■ Open source (PHP / Lavarel Framework)
■ Vaak gecombineerd met CKAN als front-end
■ Work-in-progress: schaalbaarheid
© Fedict 2014. All rights reserved | p. 13
Voorbeeld: Stad Antwerpen
© Fedict 2014. All rights reserved | p. 14
RMLProcessor
■ Open source (Java)
■ RML: RDF Mapping Language
■ Superset van W3C R2RML■ R2RML: mappen RDBMS naar RDF■ RML: ook CSV, JSON, HTML, XML...
© Fedict 2014. All rights reserved
Linken
© Fedict 2014. All rights reserved | p. 16
Enkele linken
■ https://joinup.ec.europa.eu/asset/dcat_application_profile/description
■ http://thedatatank.com
■ http://ckan.org
■ http://rml.io
■ https://github.com/mmlab/RMLProcessor
© Fedict 2014. All rights reserved
Bedankt !Fedict – Federal Public Service ICTWTC 3, Simon Bolivarlaan 301000 Brussel (Belgium)@BartHanssens
bart.hanssens[at]fedict.be | @BartHanssens