designing and developing vocabularies in rdf et

30
DATA SUPPORT OPEN Õpimoodul 2.4 RDF sõnastike kujundamine ja arendamine PwC firms help organisations and individuals create the value they’re looking for. We’re a network of firms in 158 countries with close to 180,000 people who are committed to delivering quality in assurance, tax and advisory services. Tell us what matters to you and find out more by visiting us at www.pwc.com. PwC refers to the PwC network and/or one or more of its member firms, each of which is a separate legal entity. Please see www.pwc.com/structure for further details.

Upload: open-data-support

Post on 21-Jan-2017

466 views

Category:

Technology


2 download

TRANSCRIPT

Page 1: Designing and developing vocabularies in rdf et

DATASUPPORT

OPEN

Õpimoodul 2.4

RDF sõnastike kujundamine ja arendamine

PwC firms help organisations and individuals create the value they’re looking for. We’re a network of firms in 158 countries with close to 180,000 people who are committed to

delivering quality in assurance, tax and advisory services. Tell us what matters to you and find out more by visiting us at www.pwc.com.

PwC refers to the PwC network and/or one or more of its member firms, each of which is a separate legal entity. Please see www.pwc.com/structure for further details.

Page 2: Designing and developing vocabularies in rdf et

DATASUPPORTOPEN

See esitlus on loodud PwC poolt

Autorid: Nikolaos Loutas, Michiel De Keyzer and Stijn Goedertier

Esitluse metaandmed

Slide 2

Avaandmete tugi on rahastatud Euroopa Komisjoni poolt SMART 2012/0107 ‘Lot 2alusel: Teenuste osutamine andmete avaldamiseks, juurdepääsu loomiseks, avalikele andmetele juurdepääsuks ja taaskasutamiseks Euroopa Liidu lõikes läbi olemasolevate avaandmete portaalide (Leping nr. 30-CE-0530965/00-17).

© 2014 Euroopa Komisjon

Täpsustused

1. Esitluses välja toodud seisukohad kuuluvad ainult esitluse koostanud autoritele janeid ei või mitte mingil juhul interpreteerida Euroopa Komisjoni ametlikeseisukohtadena.Euroopa Komisjon ei taga presentatsioonis välja toodud informatsiooni täpsust, ega võtavastutust selle kasutamise eest.Iga viide presentatsioonis spetsiifilisele tootele, täpsustusele, protsessile, teenusele,ärinimele, kaubamärgile või tootjale ei viita Euroopa Komisjoni heakskiidule,soovitustele, ega eelistustele.Autorite poolt on hangitud kõik vajalikud load käsikirjade, illustratsioonide, kaartide jagraafikute kasutamiseks, kui just autor või tema seaduslik esindaja ei oma juba antudintellektuaalse vara kasutusõigust.

2. Esitlus on hoolikalt koostatud PwC poolt, kuid puudub garantii esitluses esitatudinformatsiooni täpsuse ja täielikkuse osas. PwC ei vastuta esitluses esitatudinformatsiooni põhjal tehtud otsuste tagajärgede, ega muu kahju eest. Presentatsioonisesitatud informatsioon on üldist laadi ja mõeldud ainult üldise huvi kohta juhtnöörideandmiseks. Esitlus ei asenda mitte ühegi küsimuse korral antavat professionaalset nõu.Ükski esitluse lugeja ei tohiks langetada otsuseid esitluses sisalduvate andmete põhjalvastava professionaalse nõu küsimiseta.

Page 3: Designing and developing vocabularies in rdf et

DATASUPPORTOPEN

Õpieesmärgid

Käesoleva õpimooduli lõpuks peaksid teil olema omandatud järgnevad teadmised:

• Millised on parimad praktikad RDF sõnastiku ning andmemudelite loomiseks.

• Kust leida RDF sõnastikke taaskasutuseks.

• Kuidas luua oma RDF sõnastikku.

• Kuidas avaldada oma RDF sõnastikku.

• Euroopa Komisjoni ISA programmi poolt arendatud semantiliste kokkulepete tegemise protsess ja metodoloogia.

Slide 3

Page 4: Designing and developing vocabularies in rdf et

DATASUPPORTOPEN

Sisu

See moodul sisaldab…

• Samme andmemudelite loomiseks.

• Juhiseid kuidas taaskasutada olemasolevaid sõnastikke ja luua andmemudeleid.

• Juhiseid kuidas luua uusi klasse ja omadusi RDF-is.

• Juhiseid kuidas ja kus avaldada oma RDF sõnastikku, et seda oleks teistel võimalik taaskasutada.

Slide 4

Page 5: Designing and developing vocabularies in rdf et

DATASUPPORTOPEN

RDF Sõnastik

Slide 5

“Sõnastik on andmemudel, mis koosneb klassidest, omadustest ja seostest, mida on võimalik kasutada andmete ja metaandmetekirjeldamiseks.”

• RDF sõnastikud on terminite komplektid, mida kasutatakse asjade kirjeldamiseks.

• Termin on kas klass või omadus.

Objekt-tüüpi omadused ehk seosed

Andme-tüüpi omadused ehk atribuudid

Page 6: Designing and developing vocabularies in rdf et

DATASUPPORTOPEN

Mis on klassid, seosed ja omadused?

Klass. Konstruktsioon, mis esindab asju päris- ja informatsiooni maailmas. Näiteks inimene, organisatsiooni ning kontseptsioonid nagu tervis ja vabadus.

Omadus: seos. Seos kahe klassi vahel; näiteks dokumendi ja selle avaldanud organisatsiooni vahel (organisatsioon avaldab dokumendi), või seos kaardi ja kujuteldava geograafilise regiooni vahel (kaart kujutab geograafilist regiooni). RDF seosed on kodeeritud objekt-tüüpi omadustena.

Omadus: atribuut. Klassi omadus, mille kohta väidame. Näiteksorganisatsiooni ärinimi või kuupäev ja kellaaeg, millal tähelepanek tehti.

Slide 6

Page 7: Designing and developing vocabularies in rdf et

DATASUPPORTOPEN

Klassi, atribuudi ja seose näide

Slide 7

http://.../org/2172798119

veebisaithttp://example.com/site

/1234

Registreeritud organisatsioon

Aadress

Dahliastraat 24, 2160 Wommelgem“Nike”

Ametlik aadress

Ärinimi

Klass

Omadus

Seos

Page 8: Designing and developing vocabularies in rdf et

DATASUPPORTOPEN

Andmemudelite loomineKuidas taaskasutada andmeid teistest sõnastikest, defineerida oma termineid ning avaldada ja edendada oma sõnastikke andmete kirjeldamiseks.

Slide 8

Page 9: Designing and developing vocabularies in rdf et

DATASUPPORTOPEN

6 sammu andmemudelite loomiseni

Alustage valdkonna mudeli arendusega jälgides struktureeritud protsessi ja metodoloogiat.

Analüüsige olemasolevaid termineid ja nende kasutamist, et maksimeerida nende taaskasutamine.

Kui uusi termineid on võimalik vaadelda olemasolevate terminite täpsustustena, looge alamklassid ja alamomadused.

Kui uute terminite loomine on vajalik, looge need jälgides kokkulepitud parimaid praktikaid kasutades.

Avaldage väga stabiilses keskkonnas, mis on püsivana loodud.

Reklaamige RDF skeemi registreerides selle asjakohaste teenustega.

Slide 9

1

Vaata ka:https://joinup.ec.europa.eu/community/semic/document/cookbook-translating-data-models-rdf-schemas

2

3

4

56

Page 10: Designing and developing vocabularies in rdf et

DATASUPPORTOPEN

Alustage valdkonna mudeli arendusega

Slide 10

1

class Domain Model

RegisteredOrganisation

- identifier

- name

- registrationDate

- status

- type

Address

- identifier

- fullAddress

- postcode

ContactPoint

- identifier

- name

- telephone

- email

- fax

- website

Activ ity

- identifier

- name

Certificate

- identifier

- name

location

organisationCertificate

contactInformation

organisationActivity

Page 11: Designing and developing vocabularies in rdf et

DATASUPPORTOPEN

Kasutage uuesti juba eksisteerivaid termineid ja sõnastikke

• Üldised sõnastikud: DCMI, RDFS

• Asjade nimetamiseks: rdfs:label, foaf:name, skos:prefLabel

• Isikute kirjeldamiseks: FOAF, vCard, Core Person Vocabulary

• Projektide kirjeldamiseks: DOAP, ADMS.SW

• Koosvõimevara kirjeldamiseks: ADMS

• Registreeritud organisatsioonide kirjeldamiseks: Registered Organisation Vocabulary

• Aadressi kirjeldamiseks: vCard, Core Location Vocabulary

• Avalike teenuste kirjeldamiseks: Core Public Service Vocabulary

• Andmekogude kirjeldamiseks: DCAT, DCAT Application Profile, VoID

Slide 11

2

Page 12: Designing and developing vocabularies in rdf et

DATASUPPORTOPEN

Rakenduste profiili loomine

• Erinevatel valdkondadel on erinevad nõuded valdkonna spetsiifilistele tähendustele, näiteks klassifitseerimise põhimõtted.

• Üldised RDF sõnastikud annavad tavaliselt kõige põhilisemad klassid, mis on vajalikud laienduste lisamiseks, mis võimaldavad lisada spetsiifilisi alamklassi struktuuri või klassifikatsiooni skeeme.

• Sellistel juhtudel soovitatakse korduvatel kasutajatel defineerida rakenduse profiile rakenduse domeenile lähedaselt täpsustades (vajadusel) alamklasse, alamomadusi ja kontrollitud sõnastikke.

• Näiteks,

DCAT Rakenduse profiil andmeportaalide jaoks Euroopas

Registered Organization vocabulary rakenduse profiilina Organization ontology-le.

Slide 12

Vaata ka:joinup.ec.europa.eu/asset/dcat_application_profile/home

Page 13: Designing and developing vocabularies in rdf et

DATASUPPORTOPEN

Taaskasutuse eelised

• Taaskasutus aitab oluliselt kaasa andmete koosvõimele

Kasutades näiteks dcterms:created, siis selle väärtus peaks olema andmed, mis on esitatud kuupäevana, näiteks 2013-02-21^^xsd:date. Sellisena on andmed koheselt töödeldavad mitmete masinate jaoks. Kui teie skeem soovitab andmete avaldajatel kasutada teistsuguseid termineid ja kuupäeva formaate nagu näiteks ex:date "21 February 2013" – vajaksid teie avaldatud andmed täiendavad töötlemist, et muuta need samasuguseks nagu kõik teised andmed.

• Taaskasutus lisab teie skeemile usaldusväärsust.

See näitab, et see on avaldatud hoolikalt ja professionaalselt ning soosib selle taaskasutust.

• Taaskasutus in lihtsam ja odavam.

Klasside ja omaduste taaskasutamine hästi defineeritud ning korralikust sõnastikust aitab ära hoida selle pingutuse uuesti tegemist.

Slide 13

Page 14: Designing and developing vocabularies in rdf et

DATASUPPORTOPEN

Võite leida taaskasutatavaid RDF sõnastikke...

Slide 14

http://joinup.ec.europa.eu/

http://lov.okfn.org/

Page 15: Designing and developing vocabularies in rdf et

DATASUPPORTOPEN

Alamklasside ja alamomaduste loomine

• RDF skeemid ja sõnastikud hõlmavad tihti termineid, mis on väga üldised.

• Luues alamklasside ja alamomaduste seosed, võivad süsteemid, mis saavad aru superomadustest ja superklassidest tõlgendada andmeid isegi kui spetsiifilisemad terminid on tundmatud.

• Ärge looge alamklasse ja alamomadusi lihtsalt selleks, et kasutada teie oma terminit millekski, mis tegelikult juba eksisteerib.

Slide 15

3

Page 16: Designing and developing vocabularies in rdf et

DATASUPPORTOPEN

Alamomaduste loomine – näide

The Registered Organization vocabulary defineerib kolm alamomadust järgnevalt: companyType, companyStatus and companyActivity.

Slide 16

Page 17: Designing and developing vocabularies in rdf et

DATASUPPORTOPEN

Alamomaduste defineerimine RDF-is

<rdf:Property rdf:about="rov:companyType">

<rdfs:label xml:lang="en">company type</rdfs:label>

<rdfs:comment xml:lang="en" rdf:parseType="Literal">

This property records the type of company. Familiar types are SA, PLC, LLC, GmbH etc. Each jurisdiction will have a limited set of recognised company types and these should be used in a consistent manner using a skos:Concept as described in the <a href="#skos:Concept">Code</a> Class.

</rdfs:comment>

<rdfs:isDefinedBy rdf:resource="http://www.w3.org/ns/regorg#"/> <rdfs:range rdf:resource="skos:Concept"/>

<rdfs:subPropertyOf rdf:resource="org:classification" /> <dcterms:identifier>legal:companyType</dcterms:identifier>

</rdf:Property>

Slide 17

Page 18: Designing and developing vocabularies in rdf et

DATASUPPORTOPEN

Kui uued terminid on vajalikud, looge need kokkulepitud parimaid praktikaid jälgides

Klassid algavad alati suure tähega ning on alati ainsuses: näiteks skos:Concept.

Omadused algavad väikese tähega, näiteks rdfs:label.

Objekt-tüüpi omadused peaksid olema tegusõnad, näiteksorg:hasSite.

Andme-tüüpi omadused peaksid olema nimisõnad, näiteksdcterms:description.

Kasuta uute sõnade alguses suuri tähti kui terminil on rohkem kui üks sõna (camel case), näiteks foaf:isPrimaryTopicOf.

Slide 18

4

Page 19: Designing and developing vocabularies in rdf et

DATASUPPORTOPEN

Uue klassi defineerimine - Organisation

<rdf:RDF

xmlns:rdfs=“http://www.w3.org/2000/01/rdf-schema#”

xmlns:org=“htpp://example.org/organisation-schema”>

<rdf:Class rdf:about=“org:Organisation">

<rdfs:label xml:lang="en">Organisation</rdfs:label>

<rdfs:comment xml:lang:”en”>

Legal entity that is registered in an official national or regional register.

</rdfs:comment>

</rdf:Class>

Slide 19

Page 20: Designing and developing vocabularies in rdf et

DATASUPPORTOPEN

Uue omaduse defineerimine - registrationNumber

<rdf:RDF

xmlns:rdfs=“http://www.w3.org/2000/01/rdf-schema#”

xmlns:org=“htpp://example.org/organisation-schema”>

<rdf:Property rdf:about=“org:registrationNumber">

<rdfs:label xml:lang="en">registrationNumber</rdfs:label>

<rdfs:comment xml:lang:”en”>

The number that a registered organisation receives upon registration in the official register.

</rdfs:comment>

</rdf:Class>

Slide 20

Page 21: Designing and developing vocabularies in rdf et

DATASUPPORTOPEN

Domeeni ja vahemiku piirangute defineerimine

<rdf:RDF

xmlns:rdfs=“http://www.w3.org/2000/01/rdf-schema#”

xmlns:org=“htpp://example.org/organisation-schema”

xmlns:locn=“http://www.w3.org/ns/locn#”>

<rdf:Property rdf:about=“org:isLocated">

<rdfs:label xml:lang="en">isLocated</rdfs:label>

<rdfs:comment xml:lang:”en”>

The official address of the registered organisation’s headquarters.

</rdfs:comment>

<rdfs:domain rdf:resource=“org:Organisation”/>

<rdfs:range rdf:resource=“locn:Address”>

</rdf:Class>

Slide 21

http://example.org/org/1234 org:isLocated http://dbpedia.org/page/Brussels

Page 22: Designing and developing vocabularies in rdf et

DATASUPPORTOPEN

Avaldage väga stabiilses keskkonnas, mis on püsivana loodud

• Valige oma RDF skeemi jaoks stabiilne nimi, näiteks (W3C, Purl...)

• Kasutage parimaid praktikaid püsivate Uniform Resource Identifiers (URI) komplektide loomiseks, nii vormingu kui ka disaini ja halduse mõttes.

• Examples:

http://www.w3.org/ns/adms

http://purl.org/dc/elements/1.1

Slide 22

5

Vaata ka:https://joinup.ec.europa.eu/community/semic/document/cookbook-translating-data-models-rdf-schemashttp://www.slideshare.net/OpenDataSupport/design-and-manage-persitent-uris

Page 23: Designing and developing vocabularies in rdf et

DATASUPPORTOPEN

Reklaamige RDF skeemi registreerides selle asjakohaste teenustega.

Kui su RDF skeem on avalikustatud, siis on vajalik, et võimalikult palju inimesi selle kohta teaksid. Suurema vaatajaskonna saavutamiseks registreerige see Joinup-is ja Linked Open Vocabularies.

Slide 23

6

Refine the search results via the faceted search filters.

2

1

3

http://joinup.ec.europa.eu

http://lov.okfn.org

Page 24: Designing and developing vocabularies in rdf et

DATASUPPORTOPEN

Kokkuvõte

Slide 24

Alustage domeeni mudeli arendusega jälgides struktureeritud protsessi ja metodoloogiat.

Analüüsige olemasolevaid termineid ja nende kasutamist, et maksimeerida nende taaskasutamine.

Kui uusi termineid on võimalik vaadelda olemasolevate terminite täpsustustena, looge alamklassid ja alamomadused.

Kui uute terminite loomine on vajalik, looge need jälgides kokkulepitud parimaid praktikaid kasutades.

Avaldage väga stabiilses keskkonnas, mis on püsivana loodud.

Reklaamige RDF skeemi registreerides selle asjakohaste teenustega.

Analüüsi

Modelleeri

Avalda

Page 25: Designing and developing vocabularies in rdf et

DATASUPPORTOPEN

Grupiharjutus ja diskussioon

Slide 25

Moodustage kahestes gruppides RDF-i sõnastiku kirjeldus, mis esindab elanikku.

Mis on teie arvates peamised barjäärid, mis takistavad olemasolevat RDF sõnastiku taaskasutamist?

http://www.visualpharm.com

http://www.visualpharm.com

Internetiküsitluse leiad siit!

Page 26: Designing and developing vocabularies in rdf et

DATASUPPORTOPEN

Tänan kuulamast...küsimusi?

Slide 26

Page 27: Designing and developing vocabularies in rdf et

DATASUPPORTOPEN

Viited

Slaid 9:

• Linked Data Cookbook. W3C. http://www.w3.org/2011/gld/wiki/Linked_Data_Cookbook

Slaidid 10-23:

• ISA Programme. Cookbook for translating Data Models to RDF Schemas. https://joinup.ec.europa.eu/community/semic/document/cookbook-translating-data-models-rdf-schemas

Slaidid 16, 18,-21:

• W3C. An organization ontology. http://www.w3.org/TR/vocab-org/

Slaid 23:

• ADMS Brochure. ISA Programme. https://joinup.ec.europa.eu/elibrary/document/adms-brochure

Slide 27

Page 28: Designing and developing vocabularies in rdf et

DATASUPPORTOPEN

Täiendavat lugemist

Linked Data Cookbook, W3C Government Linked Data Working Group,

http://www.w3.org/2011/gld/wiki/Linked_Data_Cookbook

EC, ISA Process and methodology for developing semantic agreements, https://joinup.ec.europa.eu/community/core_vocabularies/document/process-and-methodology-developing-semantic-agreements

EC ISA, Cookbook for translating Data Models to RDF Schemas https://joinup.ec.europa.eu/community/semic/document/cookbook-translating-data-models-rdf-schemas

Slide 28

Page 29: Designing and developing vocabularies in rdf et

DATASUPPORTOPEN

Seotud projektid ja algatused

Joinup, http://joinup.ec.europa.eu

Linked Open Vocabularies (LOV), http://lov.okfn.org/

EC ISA, e-Government Core Vocabularies,https://joinup.ec.europa.eu/community/core_vocabularies/home

W3C Schools – Learn RDF http://www.w3schools.com/rdf/default.asp

EUCLID, http://euclid-project.eu/

XML Summer School http://xmlsummerschool.com/

Slide 29

Page 30: Designing and developing vocabularies in rdf et

DATASUPPORTOPEN

Ole osa meie meeskonnast...

Leia meid

Kontakt

Liitu meiega

Jälgi meid

Open Data Supporthttp://www.slideshare.net/OpenDataSupport

http://www.opendatasupport.euOpen Data Supporthttp://goo.gl/y9ZZI

@OpenDataSupport [email protected]

Slide 30