de câte stele sunt datele d-voastră?

75

Upload: sabin-buraga

Post on 22-Jun-2015

1.782 views

Category:

Technology


5 download

DESCRIPTION

A presentation – available in Romanian language – regarding the open data and 5-star access & publishing approaches. Also, several details about the linked data initiative are provided.

TRANSCRIPT

Page 1: De câte stele sunt datele d-voastră?
Page 2: De câte stele sunt datele d-voastră?
Page 3: De câte stele sunt datele d-voastră?

Procesare de la algoritmi optimi la software comercial

1945—1970

adaptare după Daconta et al. (2003)

Page 4: De câte stele sunt datele d-voastră?

Procesare de la algoritmi optimi la software comercial

1945—1970

“datele sunt mai puțin importante decât codul”

adaptare după Daconta et al. (2003)

Page 5: De câte stele sunt datele d-voastră?

Date proprietare baze de date & suite de birou proprietare

1970—1994

adaptare după Daconta et al. (2003)

Page 6: De câte stele sunt datele d-voastră?

Date proprietare baze de date & suite de birou proprietare

1970—1994

“datele sunt la fel de importante ca și programele”

adaptare după Daconta et al. (2003)

Page 7: De câte stele sunt datele d-voastră?

Publicarea datelor pe Web Web-ul clasic – standarde: HTML & CSS

1994—2004

adaptare după Daconta et al. (2003)

Page 8: De câte stele sunt datele d-voastră?

Publicarea datelor pe Web Web-ul clasic – standarde: HTML & CSS

1994—2004

“datele sunt la fel de importante ca și programele”

adaptare după Daconta et al. (2003)

Page 9: De câte stele sunt datele d-voastră?

Partajarea & reutilizarea documentelor Web-ul social – modele de date: XML, JSON,…

2004—prezent

adaptare după Daconta et al. (2003)

Page 10: De câte stele sunt datele d-voastră?

Partajarea & reutilizarea documentelor Web-ul social – modele de date: XML, JSON,…

2004—prezent

“datele sunt mai importante decât codul”

adaptare după Daconta et al. (2003)

Page 11: De câte stele sunt datele d-voastră?
Page 12: De câte stele sunt datele d-voastră?

Accesarea resurselor disponibile pe Web

Unicode DNS TCP/IP

URI HTTP

bine-cunoscute standarde Internet & Web

Page 13: De câte stele sunt datele d-voastră?

Accesarea resurselor disponibile pe Web

“dacă nu ai asociat un URL, nu exiști”

Page 14: De câte stele sunt datele d-voastră?

Accesarea resurselor disponibile pe Web

“dacă nu ai asociat un URL, nu exiști”

Uniform Resource Locator

Page 15: De câte stele sunt datele d-voastră?

Accesarea resurselor disponibile pe Web

identificarea oricărei (reprezentări de) resurse

via localizatori uniformi de resurse – URL-uri

Tom Heath & Christian Bizer (2011)

Page 16: De câte stele sunt datele d-voastră?

Accesarea resurselor disponibile pe Web

autoritatea care stabilește URL-ul (domeniul) deține

reprezentarea resursei desemnate de acel URL

Page 17: De câte stele sunt datele d-voastră?

Accesarea resurselor disponibile pe Web

procesarea marcajelor HTML – Web scrapping

versus interfețe de programare

(API – Application Programming Interface)

Page 18: De câte stele sunt datele d-voastră?
Page 19: De câte stele sunt datele d-voastră?

Reutilizarea datelor disponibile pe Web

preluarea datelor via servicii Web

eventual, pe baza API-urilor

Page 20: De câte stele sunt datele d-voastră?

lista API-urilor publice (aici, privind domeniul educațional)

www.programmableweb.com

Page 21: De câte stele sunt datele d-voastră?

Reutilizarea datelor disponibile pe Web

preluarea datelor via servicii Web

aplicații Web hibride (mash-up-uri)

Page 22: De câte stele sunt datele d-voastră?

instrumentul Web Zemanta – sistem de recomandare

mash-up “inteligent” folosind resurse disponibile liber pe Web

(exemplu: îmbogățirea conținutului unui articol de blog WordPress)

Page 23: De câte stele sunt datele d-voastră?

Reutilizarea datelor disponibile pe Web

necesitatea adoptării unei licențe de (re)utilizare

Page 24: De câte stele sunt datele d-voastră?

Reutilizarea datelor disponibile pe Web

utilizare onestă (fair use)

folosire limitată, dar gratuită, a unei lucrări

protejate de drepturi de autor – e.g., pentru uz educațional

Page 25: De câte stele sunt datele d-voastră?

Reutilizarea datelor disponibile pe Web

domeniul public (public domain)

a expirat copyright-ul, proprietarul deliberat plasează

resursa în domeniul public sau legile nu pot proteja

resursa respectivă

Page 26: De câte stele sunt datele d-voastră?

Reutilizarea datelor disponibile pe Web

copyleft

autorul oferă resursa să fie utilizată

cu anumite restricții

uzual: some rights reserved

Page 27: De câte stele sunt datele d-voastră?

Reutilizarea datelor disponibile pe Web

Creative Commons

oferă licențe de tip copyleft pentru creații disponibile pe Web

reasonable, flexible copyright

Page 28: De câte stele sunt datele d-voastră?

valori de bază: deschidere, transparență, respect

https://creativecommons.org/

Page 29: De câte stele sunt datele d-voastră?

Reutilizarea datelor disponibile pe Web

Creative Commons

vizează maniera de atribuire, caracterul non-comercial,

politica derivării conținutului și modul de partajare

Page 30: De câte stele sunt datele d-voastră?

creativecommons.org/about/licenses/

Page 31: De câte stele sunt datele d-voastră?

stabilirea unei licențe de (re)utilizare

a însemnărilor publicate pe Twitter – www.tweetcc.com

Page 32: De câte stele sunt datele d-voastră?

căutarea de resurse respectând licențele Creative Commons

http://search.creativecommons.org/

Page 33: De câte stele sunt datele d-voastră?

acces la resurse multimedia prin inițiativa Wikimedia Commons

https://commons.wikimedia.org/

Page 34: De câte stele sunt datele d-voastră?
Page 35: De câte stele sunt datele d-voastră?

Disponibilitatea datelor disponibile pe Web

a fi stocat pe Web

(“on the Web”)

ca document “opac”

– disponibil într-un format proprietar sau nu –

fără a referi, pe baza standardelor Web,

alte resurse de interes

Tom Health (2007)

Page 36: De câte stele sunt datele d-voastră?

Disponibilitatea datelor disponibile pe Web

a fi descoperibil pe baza standardelor Web

(“in the Web”)

folosind modele/formate de date deschise

(e.g., HTML, XML, JSON, RDF etc.)

aliniate principiilor hipertextului/hipermedia,

procesabile independent de platformă

Tom Health (2007)

Page 37: De câte stele sunt datele d-voastră?
Page 38: De câte stele sunt datele d-voastră?

“A piece of content or data is open if anyone is free to use, reuse, and redistribute it.”

http://opendefinition.org/

Page 39: De câte stele sunt datele d-voastră?

Caracterul deschis al datelor e dat de…

disponibilitate & acces

reutilizare & redistribuire

participare universală

opendatahandbook.org

Page 40: De câte stele sunt datele d-voastră?

Caracterul deschis al datelor e dat de…

disponibilitate & acces

reutilizare & redistribuire

participare universală

opendatahandbook.org

inter-operabilitate

Page 41: De câte stele sunt datele d-voastră?

deși pretind a avea (uneori) un caracter deschis,

“castelele” aplicațiilor Web actuale țin “ostatice” datele

Page 42: De câte stele sunt datele d-voastră?

deși pretind a avea (uneori) un caracter deschis,

“castelele” aplicațiilor Web actuale țin “ostatice” datele

acces (limitat, eventual pe baza

unei subscripții – e.g., taxe) via API

Page 43: De câte stele sunt datele d-voastră?

Cum putem evalua caracterul deschis

al resurselor Web?

Page 44: De câte stele sunt datele d-voastră?

Date de 5 stele (5 ★ Open Data)

Tim Berners-Lee (2009)

Page 45: De câte stele sunt datele d-voastră?

date de 1 stea

Page 46: De câte stele sunt datele d-voastră?

date de 1 stea

conținutul e disponibil pe Web – indiferent de

format – conform unei licențe deschise

Page 47: De câte stele sunt datele d-voastră?

utilizatorii pot vizualiza, lista,

stoca local și, eventual, modifica documentul

documentul în sine poate fi partajat via Internet

Page 48: De câte stele sunt datele d-voastră?

documentul poate fi publicat rapid & facil pe Web

pentru a refolosi datele incluse în document

sunt necesare uneori procesări suplimentare

Page 49: De câte stele sunt datele d-voastră?

★ ★

date de 2 stele

Page 50: De câte stele sunt datele d-voastră?

date de 2 stele

suplimentar, conținutul este disponibil pe Web

într-un format structurat

Page 51: De câte stele sunt datele d-voastră?

utilizatorii pot procesa documentul

– folosind, uzual, software proprietar

documentul poate fi exportat în alt format

(structurat sau nu)

Page 52: De câte stele sunt datele d-voastră?

documentul poate fi încă publicat facil pe Web

datele sunt în continuare “încuiate” în document,

procesarea depinzând de un anumit program

Page 53: De câte stele sunt datele d-voastră?

★ ★ ★

date deschise de 3 stele

Page 54: De câte stele sunt datele d-voastră?

date deschise de 3 stele

recurgerea la un format deschis

pentru a pune la dispoziție pe Web date

Page 55: De câte stele sunt datele d-voastră?

datele pot fi gestionate (vizualizate, filtrate, procesate,

convertite, refolosite etc.) în orice manieră

asigurarea independenței de platforma software

Page 56: De câte stele sunt datele d-voastră?

în continuare, documentul poate fi publicat facil pe Web

exportarea datelor într-un format proprietar

ar putea fi problematică

Page 57: De câte stele sunt datele d-voastră?

★ ★ ★ ★

date deschise de 4 stele

Page 58: De câte stele sunt datele d-voastră?

date deschise de 4 stele

adoptarea identificatorilor de resurse (URI-uri)

pentru a desemna “lucruri” de interes

Page 59: De câte stele sunt datele d-voastră?

datele, informațiile și cunoștințele se identifică via URI-uri

pentru a putea fi ulterior referite și (re)utilizate

uzual, se recurge la modelul RDF

(Resource Description Framework)

Page 60: De câte stele sunt datele d-voastră?

publicarea poate fi relativ mai dificilă,

necesitând de obicei adoptarea de instrumente și

metodologii specifice tehnologiilor Web-ului semantic

“data in the Web”implicații pe termen lung

Page 61: De câte stele sunt datele d-voastră?

★ ★ ★ ★ ★

date deschise de 5 stele

Page 62: De câte stele sunt datele d-voastră?

date deschise de 5 stele

în plus, datele sunt inter-relaționate

conform principiilor inițiativei linked data

Page 63: De câte stele sunt datele d-voastră?

posibilitatea descoperirii altor date de interes (înrudite)

direct la momentul procesării

se oferă premisele efectuării de raționamente automate

direct la nivel de Web pe baza modelelor conceptuale

exprimate standardizat via SKOS, OWL,…

Page 64: De câte stele sunt datele d-voastră?

dificultăți:

consistența & reconcilierea datelor și cunoștințelor

probleme legate de adopția lentă de către industrie

Page 65: De câte stele sunt datele d-voastră?

5stardata.info

Michael Hausenblas (2012)

Page 66: De câte stele sunt datele d-voastră?
Page 67: De câte stele sunt datele d-voastră?

interogări vizuale asupra datelor deschise (conform modelului RDF)

oferite de DBpedia – varianta procesabilă a Wikipedia

Page 68: De câte stele sunt datele d-voastră?

“Norul” datelor interconectate

reducerea redundanței

facilitarea reutilizării

permiterea descoperirii

maximizarea inter-conectivității dintre “lucruri” înrudite

adoptarea unei viziuni pragmatice

Tom Heath & Christian Bizer (2011)

Page 69: De câte stele sunt datele d-voastră?

martie 2009

http://lod-cloud.net/

Page 70: De câte stele sunt datele d-voastră?

sept. 2011

http://lod-cloud.net/

Page 71: De câte stele sunt datele d-voastră?

http://thedatahub.org/

Page 72: De câte stele sunt datele d-voastră?

http://ckan.org/

Page 73: De câte stele sunt datele d-voastră?

http://opengovernmentdata.org/

Page 74: De câte stele sunt datele d-voastră?

S. Buraga, Prezentările aferente cursului

“Dezvoltarea aplicațiilor Web”, UAIC, 2012

http://profs.info.uaic.ro/~busaco/teach/courses/wade/web-film.html

D. Dietrich et al., The Open Data Handbook, Open Knowledge Foundation, 2012

http://opendatahandbook.org/

T. Heath & C. Bizer, Linked Data: Evolving the Web into a Global Data Space, Morgan & Claypool, 2011

http://linkeddatabook.com/book

D. Allemang & J. Hendler, Semantic Web for the Working Ontologist (2nd Ed.), Morgan Kaufmann, 2011

de studiat

Page 75: De câte stele sunt datele d-voastră?

fotografii realizate de 3brian, bjaglin, ecatoncheires, Hervé Boulben, Ralph Hockens, jjjj56cp,

micmol, mynameisharsha, Daniel Petzold, scot2342, striatic, ToSaveOnPostage

Dr. Sabin Buraga www.purl.org/net/busaco

Facultatea de Informatică, Universitatea “A. I. Cuza” Iași