כמקרה מבחן dbpedia פרסום אונטולוגיות ונתונים מקושרים

25
מהן דרכי הפרסום של אונטולוגיות ו נתונים מקושרים ברשת כמקרה מבחןDBpedia

Upload: olga-gilshtein

Post on 12-Jul-2015

86 views

Category:

Internet


1 download

TRANSCRIPT

Page 1: כמקרה מבחן DBpedia פרסום אונטולוגיות ונתונים מקושרים

DBPEDIA

and how to publish

ontologies and linked data

on the web

שלדרכי הפרסום מהן

נתונים מקושריםואונטולוגיות

ברשת

כמקרה מבחן DBpedia

Page 2: כמקרה מבחן DBpedia פרסום אונטולוגיות ונתונים מקושרים

וובארכיטקטורת

בוובפרסום

שלההפרסוםודרכיאונטולוגיה

שלהםפרסוםודרכימקושריםנתונים

DBpedia

ראשי פרקים

Page 3: כמקרה מבחן DBpedia פרסום אונטולוגיות ונתונים מקושרים

ארכיטקטורת ווב

Page 4: כמקרה מבחן DBpedia פרסום אונטולוגיות ונתונים מקושרים

ווב קלאסי שואף להיותווב סמנטי

HTTP

URI

HTML XMLRDF

RDFSOWL

שפה טבעית

מבניות ברמה

של מסמך

מבניות ברמה

של פריט מידע

מושגים

מוגדרים

לכל פריט

נתונים

לכל /לכל מסמך

קבוצת מסמכים

מידע העשיר

סמנטית

קישוריות בין

מסמכים

קישוריות בין

פריטי נתונים

גם אלה

הממוקמים

בשרתי ווב

שונים

גם אלה

הממוקמים

במערכי

נתונים שונים

Page 5: כמקרה מבחן DBpedia פרסום אונטולוגיות ונתונים מקושרים

פרסום בווב

Page 6: כמקרה מבחן DBpedia פרסום אונטולוגיות ונתונים מקושרים

"פרסום בווב"אין הגדרה אחידה למושג •

אך יש מספר פעילויות שניתן לראות אותן כפירסום •

:אחת מהן, או כהפצה במובן המשפטי

אם,קובץמארחשרת–(Hosting',אירוח')איחסון

הקובץאתיוצראובדיסקאותומאחסןהוא

.מאחסןשהואמהנתונים

Publishing and Linking on the Web: מתוך

?מה זה

Page 7: כמקרה מבחן DBpedia פרסום אונטולוגיות ונתונים מקושרים

:הגישה לעמודים המאוחסנים בשרת

דפדפן שולח בקשה לשרת המארח לקבל את הקובץ

שהדפדפן מציג למשתמש, השרת מגיב עם התוכן של הקובץ

Publishing and Linking on the Web: מתוך

Page 8: כמקרה מבחן DBpedia פרסום אונטולוגיות ונתונים מקושרים

:סמנטילפרסוםשונותגישות2לפחותיש

מיוחדנתוניםמודללפי,נתוניםכאובייקטיומידעמסמכיםפרסום1.

.הסמנטיהוובשל(בשפותקידוד)הפורמטובאמצעות

.יקרהיותרגישה.אונטולוגיותפיתוחגםמצריך

שלבפורמט,קיימיםנתוניםלבסיסיאולמסמכיםהערותהוספת2.

,RDFa,microdata)הסמנטיהוובשלדטאמטא

microformats).

Pollock, J. T. (2009).Semantic web for dummies: מתוך

פרסום סמנטי

Page 9: כמקרה מבחן DBpedia פרסום אונטולוגיות ונתונים מקושרים

אונטולוגיה ודרכי הפרסום שלה

Page 10: כמקרה מבחן DBpedia פרסום אונטולוגיות ונתונים מקושרים

מרכיבי האונטולוגיה

OWL <----- RDFS <----- RDF/XML <----- RDF

:שרעיונותעלשמתבססנתוניםמודל

(URI)ייחודיוובמזההלהיותצריךנתוניםפריטלכל-

ניתןעצמולקשרכאשר,אחרנתוניםפריטלכלמקושרלהיותיכולנתוניםפריטכל-

(URI)ייחודיוובמזהה

לקובץיRDF-ההגרףמרכיבילכתיבתביותרהנפוץתחביר

אונטולוגיהלתיאורהבסיסייםהאלמנטיםאתמספקת

יותררבהההבעהיכולתבעלתשפה .Pollock, J. T. (2009): מתוךSemantic web for dummies

מרכיביה אלה בעצם

מאפשרים את

פירסומה הסמנטי

Page 11: כמקרה מבחן DBpedia פרסום אונטולוגיות ונתונים מקושרים

עלדטאמטאשלוגם,האונטולוגיהשלמבנהותוכןלבטאיש•

.RDFנתוניםמודלידיעל,האונטולוגיה

המושגיםביןקשרלכלוגםבאונטולוגיהמושגלכללתתיש•

.URI–ייחודימזהה

כלשהוRDFתחבירלפיתוויםשלכסדרהRDFגרףלקודדיש•

(לקובץהגרףכתיבת)

שרתדרך,באתראלהקבציםפירסוםHTTPהגדרותמצריך)רגיל

(השרתבצדישירותאואונטולוגיהקבצילתקייתוהוספתוhtaccess.קובץכתיבת–השרתעבורמיוחדות

שרתידרךאלהקבציםפירסוםRDFמיוחדים(Virtuoso)

לאונטולוגיותבספריותפירסום(BioPortal)

Quick Guide to Publishing a Thesaurus on the Semantic Web: מתוך (2005)

הדרך לפרסום האונטולוגיה וסוגי פרסום שונים

לאדםהקריאתוכןלספקלשרתאומרותאלההגדרות

דפדפן/תוכנהלדרישתבהתאם,למחשבהקריאתוכןאו

אליוהפונים

Page 12: כמקרה מבחן DBpedia פרסום אונטולוגיות ונתונים מקושרים

(PURL-בלהיעזר)יציבURI-בפרסום1.

דטאומטא(בונכוןלשימושודוגמאותמושגלכלמדוייקותהגדרותלספק)תיעוד2.

דוגמא.אנושילמשתמשהקריאים

אנושילמשתמשהקריאכקובץוהןלמחשבהקריאכקובץזמינות3.

contentמנגוןידיעלהמתאפשרת negotiationבמפרטהמוגדרHTTP.

להמציאבמקום,בהןשהוגדרובמושגיםשימושידיעלאחרותלאונטולוגיותקישור4.

מחדש

(יוצריםזכויות)רצוייםרשיוןפרטיציון5.

Daniel Garijo. How to (properly) publish a vocabulary or ontology in the web (2013): מתוך

:מצריך גם עמידה בתנאים הבאים, פרסום אונטולוגיה כהלכה

Persistent uniform resource locator.

Registered user can get persistent URI

.כלשהונתוןURIלבקשתבתגובהמשאבתיאורשלשונותגרסאותלהגישמאפשרהמנגנון

(htaccess.קובץבהגדרותתלויהרגילHTTPבשרתפעילותו)

Page 13: כמקרה מבחן DBpedia פרסום אונטולוגיות ונתונים מקושרים

Dereference the vocabulary URI, requesting HTML content(Redirect the client to current HTML documentation for the vocabulary.)

Dereference the vocabulary URI (hash namespace)(Serve the RDF description of the vocabulary, encoded as RDF/XML.)

Best Practice Recipes for Publishing RDF Vocabularies (2008): מתוך

חזור לשקף קודם

של אונטולוגיה' RDFהגשת תיאור

של האונטולוגיה' HTMLהפניית דפדפן לתיעוד

content negotiationהמחשת פעילות המנגנון

Page 14: כמקרה מבחן DBpedia פרסום אונטולוגיות ונתונים מקושרים

נתונים מקושרים ודרכי פרסום שלהם

Page 15: כמקרה מבחן DBpedia פרסום אונטולוגיות ונתונים מקושרים

שיטה לפרסום נתונים מובנים–? מה זה נתונים מקושרים

,מקושריםנתוניםשלפרטימקרהבעצםהיא,כהלכההמפורסמתאונטולוגיה

:הםשעיקרונותיהם

אובייקטים/מושגיםשלכשמותURI-בשימוש1)

,משאבתיאורלאחזרהמאפשר,HTTPפרוטוקולדרךURI-בשימוש2)

(dereferention)זהURIידיעלהמזוהה

contentבעזרתתיאוריםמספראו negotiation

וקישוריותהנתוניםמבניותלהסדרת(האפשרויותכאחת)RDF/XML-וRDF-בשימוש3)

נתוןנתוניםמערךבתוךשלהם

למערכי נתונים אחרים בוובRDF-קביעת קישורי4)

קישורי יחסים

קישורי זהות

כולל מיפוי מונחים, קישורי אוצר מלים

Heath , T., Bizer , C. (2011).Linked Data: Evolving the Web into a Global Data Space: מתוך

אחד הקריא למחשבים*

אחד הקריא לבני אדם*

Page 16: כמקרה מבחן DBpedia פרסום אונטולוגיות ונתונים מקושרים

במערכישנמצאים,קשוריםנתוניםפרטיעלמצביעים–יחסיםקישורי•

.אחריםנתונים

ניתן,מישהושללידהמקום:הואנתוןבמערךנתוניםפריטכאשרלמשל

רקעמידעישבואחרנתוניםלמערך,יחסיקישורשיהיה,קישורלעשות

.זהמקוםעל

נתוניםבמערכיהמגדיריםתוכןספקימספרלהיותיכולים–זהותקישורי•

.היישויותאותןאתהמזהיםURIישכלומר–היישויותאותןאתשלהם

מערכיישנםכיהיודעספק.שוניםיהיויישותאותהלגביהמידע/ההגדרות

ידיעלבינהןלקשריכול,היישותאותהאתהמגדיריםנוספיםנתונים

owl#sameAs,שניכילצייןובכךURIהמשאבלאותומתייחסים.

מונחיםשללהגדרותנתוניםמפריטימצביעים–מליםאוצרקישורי•

.נתוניםפרטיאותםלייצוגהמשמשים(אונטולוגיה/מיליםבאוצר)

Heath , T., Bizer , C. (2011).Linked Data: Evolving the Web into a Global Data Space: מתוך

קצת יותר על סוגי הקישורים

Page 17: כמקרה מבחן DBpedia פרסום אונטולוגיות ונתונים מקושרים

נתונים סטאטיים

בפורמטים

שונים

המרה לפורמט RDF

-איחסון בRDF STORE

ממשק נתונים

מקושרים

(Virtuoso)

נתונים סטאטיים

בפורמט

RDF

-איחסון בRDF STORE

ממשק נתונים

מקושרים

(Virtuoso)

קבצי

סטאטיים RDF

שרת ווב קלאסי

(Apache)

מסד נתונים

יחסיים

שרת היוצר

מעטפת

ומפרסם תצוגת

נתונים מקושרים

מעל מסד

נתונים יחסיים

)D2R(

הכנת נתונים

אחסון נתונים

פרסום נתונים

סוג נתונים

נתונים מובנים

Heath , T., Bizer , C. (2011).Linked Data: Evolving the Web into a Global Data Space: מתוך

מספר אפשרויות פרסום של נתונים מקושרים

Page 18: כמקרה מבחן DBpedia פרסום אונטולוגיות ונתונים מקושרים

(LOD graph)גרף נתונים מקושרים

Page 19: כמקרה מבחן DBpedia פרסום אונטולוגיות ונתונים מקושרים

DBpedia

Page 20: כמקרה מבחן DBpedia פרסום אונטולוגיות ונתונים מקושרים

?Dbpediaמה היא

(crowdsourcing)קהילתיכמאמץומתוחזקשנוצרפרוייקט•

בוובאותוולפרסםWikipediaמתוךמובנהמידעלאחזר–מטרתו•

DBpediaכןועל,המקושריםהנתוניםעקרונותלפיהואהפירסום•

מערכישלמערכתנכוןיותר)מקושרנתוניםמערךבעצםהיא

.(במספר69מעל,מקושריםנתונים

,מושגיםמיליוניעבורמקושריםנתוניםשלURIמגדירהוהיאמאחר•

,אליהשלהםנתוניםממערכיRDFקישורייצרושוניםמידעספקי

.נתוניםוובבתוךהמרכזייםהמוקדיםלאחדאותההפכוובכך

Page 21: כמקרה מבחן DBpedia פרסום אונטולוגיות ונתונים מקושרים

DBpediaקצת נתונים על תוכן מערכי נתונים של

מזההיURI(יחדהשפותבכל)יישויותמיליון24.9עבור

נוספותשפות119+אנגלית

4נתוניםמערךשלהאנגליתבגרסהמתואריםמליוןDBpedia

,Dbpediaאונטולוגייתידיעלמסווגיםמיליון3.2מתוכם•

מקומות639,000-ואנשים832,000כולל•

מידעפרטימיליארד2.46כ"בסה(שלשותRDF)

24.6לתמונותקישוריםמיליון

27.6חיצונייםרלוונטייםוובלדפיקישוריםמיליון

45חיצונייםנתוניםלמערכיקישוריםמיליון

קטגוריזציות

67ויקיפדיהלקטגוריותקישוריםמיליון

41.2לקטגוריותקישוריםמיליוןYAGO(לקטגוריותויקיפדיהנתוניאיחודwordnet)

529באונטולוגייתמאפיינים2333ידיעלהמתוארותמחלקותDbpedia

Page 22: כמקרה מבחן DBpedia פרסום אונטולוגיות ונתונים מקושרים

מצבורי ויקיפדיה

איחזור נתונים בשיטות שונות

RDFשלשות

אונטולוגיה בהם , מערכי נתונים

ליישות יש דף ויקיפדיה

תואם באנגלית

בהם , מערכי נתונים

ליישות אין דף ויקיפדיה

תואם באנגלית

ה

מ

ר

ה

Virtuoso (RDF STORE)

העלאה ואיחסון

http://dbpedia.org/data/Name

http://dbpedia.org/page/NameSPARQL

endpoint

RDFתיאורהמשאבשל

HTMLתיאורהמשאבשל

RDFקבצי של מערכי הנתונים

Page 23: כמקרה מבחן DBpedia פרסום אונטולוגיות ונתונים מקושרים

Berlinשל המשאב HTMLתיאור (http://dbpedia.org/resource/ Berlin )

abstract:מאפייןDBpediaבאונטולוגייתשהוגדר

URI שניתן לתיאורHTMLי זה

קישורי זהות

Dbpediaעם מערכי נתונים של בשפות אחרות

עם מערכי נתונים חיצוניים

Page 24: כמקרה מבחן DBpedia פרסום אונטולוגיות ונתונים מקושרים

Berlinשל המשאב RDFתיאור (http://dbpedia.org/resource/ Berlin )

,http://dbpedia.org/data/Berlin,זהמשאבשליRDFלתיאורשניתןURIהקלדת1.

<? "xml:<?xml version="1.0" encoding="utf-8קובץלהורדתמביאההקלאסיבדפדפן<rdf:RDFxmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"xmlns:owl="http://www.w3.org/2002/07/owl#"xmlns:dbpprop="http://dbpedia.org/property/"xmlns:dcterms="http://purl.org/dc/terms/"xmlns:ns5="http://dbpedia.org/ontology/PopulatedPlace/"xmlns:dbpedia-owl="http://dbpedia.org/ontology/"xmlns:foaf="http://xmlns.com/foaf/0.1/"xmlns:geo="http://www.w3.org/2003/01/geo/wgs84_pos#"xmlns:ns9="http://www.w3.org/ns/prov#"xmlns:grs="http://www.georss.org/georss/" >

<rdf:Description rdf:about="http://dbpedia.org/resource/1906_German_football_championship"><dbpprop:location rdf:resource="http://dbpedia.org/resource/Berlin" />

</rdf:Description><rdf:Description rdf:about="http://dbpedia.org/resource/1959_German_football_championship">

<dbpedia-owl:city rdf:resource="http://dbpedia.org/resource/Berlin" /><dbpprop:city rdf:resource="http://dbpedia.org/resource/Berlin" />

</rdf:Description>...<owl:sameAs rdf:resource="http://pl.dbpedia.org/resource/Berlin" /><owl:sameAs rdf:resource="http://el.dbpedia.org/resource/Βερολίνο" /><owl:sameAs rdf:resource="http://it.dbpedia.org/resource/Berlino" /><owl:sameAs rdf:resource="http://yago-knowledge.org/resource/Berlin" /><owl:sameAs rdf:resource="http://es.dbpedia.org/resource/Berlín" />

Page 25: כמקרה מבחן DBpedia פרסום אונטולוגיות ונתונים מקושרים

Berlinשל המשאב RDFתיאור (http://dbpedia.org/resource/ Berlin )

,http://dbpedia.org/data/Berlin,זהמשאבשליRDFלתיאורשניתןURIהקלדת.2

:שלשותשלזוובינהן,שונותתצוגותלקבלמאפשר,למשל,Virtuosoשלהסמנטיהוובבדפדפן