semantic web and library

86
เทคโนโลยีเว็บเช งความหมายกับ การประยุกต์ใช งานทางด ้านห ้องสมุด Semantic Web Technology for Library Applications ดร.มารุต บูรณรัช หน่วยปฏิบัติการวิจัยวิทยาการมนุษยภาษา ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์ แห่งชาติ (NECTEC) [email protected] การประชุมวิชาการประจาปี 2554 ฝ่ายบริการความรู ้ทางวิทยาศาสตร์และเทคโนโลยี (STKS) วันที 21 กรกฎาคม 2554

Upload: boonlert-aroonpiboon

Post on 18-Dec-2014

2.927 views

Category:

Education


1 download

DESCRIPTION

เทคโนโลยีเว็บเชิงความหมายกับการประยุกต์ใช้งานทางด้านห้องสมุด

TRANSCRIPT

Page 1: Semantic web and library

เทคโนโลยเวบเชงความหมายกบ การประยกตใชงานทางดานหองสมด

Semantic Web Technology for Library Applications

ดร.มารต บรณรช

หนวยปฏบตการวจยวทยาการมนษยภาษา

ศนยเทคโนโลยอเลกทรอนกสและคอมพวเตอรแหงชาต (NECTEC)

[email protected]

การประชมวชาการประจ าป 2554 ฝายบรการความรทางวทยาศาสตรและเทคโนโลย (STKS) วนท 21 กรกฎาคม 2554

Page 2: Semantic web and library

หวขอบรรยาย

แนวโนมการพฒนาเทคโนโลยส าหรบหองสมด (Evolution of Libraries)

แนะน าเทคโนโลยเวบเชงความหมาย (Semantic Web Technology)

มาตรฐานขอมล RDF, RDFS, OWL, SPARQL

การประยกตเทคโนโลยเวบเชงความหมายกบงานดานหองสมด

การบรณาการขอมล RDF ในแบบขอมลทมการเชอมโยง (Linked Data)

การสบคนขอมล RDF ในแบบการคนหาตามมต (Faceted Search)

2

Page 3: Semantic web and library

แนวโนมการพฒนาเทคโนโลยส าหรบหองสมด (Evolution of Libraries)

Page 4: Semantic web and library

หองสมด (Libraries)

หองสมดดจตอล (Digital Libraries)

Page 5: Semantic web and library

หองสมด (Library)

สถานทเกบ: หองเกบหนงสอและเอกสาร

การลงรายการ: บตรรายการหนงสอ (Catalog Card)

ผชวยคนหา: บรรณารกษ

5

Page 6: Semantic web and library

หองสมด (Library) (2)

จดเดน

สามารถปรกษาบรรณารกษได หากมขอสงสย หาหนงสอไมพบ

หองสมดมสภาพแวดลอมทด สามารถพบปะผอน

จดดอย

ตองใชสถานทและพนทในการจดเกบหนงสอ และเอกสารตางๆ

หองสมดหลายแหงมไดเชอมโยงกน บางครงผใชตองเดนทางไปยงหองสมดหลายแหงเพอใหไดขอมลทตองการ

6

Page 7: Semantic web and library

หองสมดดจตอล (Digital Library)

สถานทเกบ: หนงสอและเอกสารจดเกบในฐานขอมล

การลงรายการ: เมตาดาตา (Metadata)

ผชวยคนหา: ระบบสบคนขอมล (Full-text search)

7

Page 8: Semantic web and library

หองสมดดจตอล (Digital Library) (2)

จดเดน

สามารถเขาถงไดแบบออนไลน (Online Access) ผานอนเทอรเนต

ประหยดเนอทในการจดเกบ ประหยดเวลาเดนทาง

จดดอย

ผใชโดดเดยว ไมสามารถสอบถามบรรณารกษไดหากคนหาเรองทตองการไมพบ (เชน ใส keyword ในการคนหาไมถกตอง)

ยงขาดการเชอมโยงระหวางระบบหองสมดดจตอลตางระบบ (Library interconnections)

8

Page 9: Semantic web and library

หองสมดดจตอลในยคตอไป (Next-generation Digital Library)

สถานทเกบ: หนงสอและเอกสารจดเกบในฐานขอมล บนเวบ

การลงรายการ:

เมตาดาตาทมการบรณาการ (Integrated Metadata)

เมตาดาตาทผใชเปนผปอนขอมล (Social Metadata)

ผชวยคนหา: ระบบการคนหาทชาญฉลาด (Smart Search and Browsing)

9

Page 10: Semantic web and library

หองสมดดจตอลในยคตอไป (Next-generation Digital Library) (2)

จดเดน

การบรณาการขอมลเมตาดาตาตางมาตรฐาน เพอการเชอมโยงระบบหองสมดดจตอลตางระบบ (Library Interoperability)

การสบคนขอมลทใชขอมลอนๆ มาชวยในการเพมประสทธภาพในการคนหาขอมล เชน ขอมลปจเจกวธาน (folksonomy), ขอมลสวนตวของผใช (user profiles/ preferences), ออนโทโลย (ontology) เปนตน

10

Page 11: Semantic web and library

เทคโนโลยเวบเชงความหมาย (Semantic Web Technology)

เทคโนโลยเวบเชงความหมาย เปนกลมมาตรฐานขอมลเพอการจดการขอมลในแบบเมตาเดตา (Metadata) ส าหรบเวบ

RDF (Resource Description Framework)

OWL (Web Ontology Language)

SPARQL (An RDF query language)

SKOS (Simple Knowledge Organization System)

ตวอยางการประยกตใชงานในปจจบน:

วกเชงความหมาย (Semantic Wikis)

การบรณาการขอมลโดยใชมาตรฐาน RDF (Linked Data)

ระบบหองสมดดจตอล (Digital Libraries)

11

Page 12: Semantic web and library

เทคโนโลยเวบเชงความหมายส าหรบหองสมดดจตอล

ชวยในการบรณาการขอมลทใชมาตรฐานแตกตางกนจากตางระบบ

บรณาการขอมลเมตาดาตาตางมาตรฐาน (เชน Dublin Core, Marc21) โดยใชมาตรฐาน RDF

บรณาการขอมลทมาจากระบบหองสมดดจตอลตางระบบ รวมทงขอมลจากแหลงขอมลอนๆ บนอนเทอรเนตดวยมาตรฐาน RDF

ชวยเพมประสทธภาพการสบคนขอมลดวยเทคนคการสบคนแบบใหมๆ เชน

การสบคนขอมลตามออนโทโลย (Ontology-based search) หรอการสบคนขอมลตามมต (Faceted search)

การน าขอมลเฉพาะบคคลของผใช รวมทงขอมลจากผใชคนอนๆ มาชวยในการสบคน เชน User Profile/ Preference, Folksonomy, Bookmark เปนตน

12

Page 13: Semantic web and library

หองสมดดจตอล vs. เทคโนโลยเวบเชงความหมาย

หองสมดดจตอล เทคโนโลยเวบเชงความหมาย

• มขอมลเมตาเดตาอยแลว • เมตาเดตามหลากหลาย

มาตรฐาน เชน Dublin Core, Marc21, FRBR เปนตน

• ก าหนดกรอบการบรณาการขอมลเมตาเดตาตางมาตรฐานโดยใชมาตรฐาน RDF

13

Page 14: Semantic web and library

หองสมดดจตอล vs. เทคโนโลยเวบเชงความหมาย (2)

หองสมดดจตอล เทคโนโลยเวบเชงความหมาย

• มค าศพทควบคม (Controlled Vocabulary) ทงในแบบของอนกรมวธาน (Taxonomy) หรอ อรรถาภธาน (Thesaurus) ใชงานอยแลว เชน Library of Congress Classification (LCC), Dewey Decimal Classification (DDC), Medical Subject Headings (MeSH)

• ท าใหชดค าศพทควบคมอยในแบบทประมวลผลไดโดยโปรแกรมคอมพวเตอร (machine understandable) และสามารถบรณาการกนได

• ก าหนดมาตรฐานขอมลออนโทโลย ไดแก RDF Schema, OWL, SKOS

14

Page 15: Semantic web and library

แนะน าเทคโนโลยเวบเชงความหมาย (Semantic Web technology)

Peter Haase and Denny Vrandečić, AIFB, Universität Karlsruhe (TH) Asian School for the Semantic Web ASSW2008, Bangkok, Thailand – December 2008

Page 16: Semantic web and library

Slide 16

Universal Access to All Knowledge

Page 17: Semantic web and library

17

Page 18: Semantic web and library

18

Page 19: Semantic web and library

19

Page 20: Semantic web and library

20

Page 21: Semantic web and library

21

Angola

Africa

Zambia

Country Continent

Page 22: Semantic web and library

22

Angola

Africa

Zambia

Country Continent

type

Country

Continent

Page 23: Semantic web and library

23

Angola

Africa

Zambia

Country Continent

Page 24: Semantic web and library

24

Angola

Africa

Zambia

Country

Continent

type

Page 25: Semantic web and library

Slide 25

RDF

A set of triples

Triples are Subject, Predicate, Object

Page 26: Semantic web and library

26

Page 27: Semantic web and library

http://semanticweb.org/id/Denny_Vrandecic

URIs / IRIs

URIs are “Uniform Resource Identifiers”

– IRI: Unicode-based “Internationalized Resource Identifiers”

Every URI identifies one entity

Semantic Web URIs usually use HTTP

– HyperText Transfer Protocol

– Can be resolved to get more data (ideally)

– Linked data

QName as abbreviation (Qualified Name)

Protocol Domain Local name

thing:Denny_Vrandecic Prefix

Namespace

Page 28: Semantic web and library

28

Angola

Africa

Zambia

Country

Continent

type

Page 29: Semantic web and library

29

http://ontoworld.org/id/Angola

http://ontoworld.org/id/Africa

http://ontoworld.org/id/Zambia

Angola

http://www.w3.org/2000/01/rdf-schema#label

Africa

Located in

Zambia

Country

Borders

Continent http://ontoworld.org/id/Category:Country

http://ontoworld.org/id/Category:Continent

http://www.w3.org/1999/02/22/rdf-syntax-ns#type

Page 30: Semantic web and library

30

http://ontoworld.org/id/Angola

http://ontoworld.org/id/Africa

http://ontoworld.org/id/Zambia

ประเทศแองโกลา

http://www.w3.org/2000/01/rdf-schema#label

ทวปแอฟรกา

แหง

ประเทศแซมเบย

ประเทศ

ชายแดน

ทวป http://ontoworld.org/id/Category:Country

http://ontoworld.org/id/Category:Continent

http://www.w3.org/1999/02/22/rdf-syntax-ns#type

Page 31: Semantic web and library

31

ประเทศแองโกลา

ทวปแอฟรกา

ประเทศแซมเบย

ประเทศ

ทวป

Page 32: Semantic web and library

32

Angola

Africa

Zambia

Country Continent

Page 33: Semantic web and library

Slide 33

RDF

A set of triples

Triples are Subject, Predicate, Object

Subjects and Predicates are URIs

Objects are URIs or Literals

– Literals are concrete data values

– e.g. the integer 27 or the date Dec 1, 2008

Page 34: Semantic web and library

34

http://ontoworld.org/id/Angola

http://ontoworld.org/id/Africa

http://ontoworld.org/id/Zambia

Angola

http://www.w3.org/2000/01/rdf-schema#label

Africa

Located in

Zambia

Country

Borders

Continent http://ontoworld.org/id/Category:Country

http://ontoworld.org/id/Category:Continent

http://www.w3.org/1999/02/22/rdf-syntax-ns#type

Page 35: Semantic web and library

Slide 35

Page 36: Semantic web and library

Slide 36

RDF

A set of triples

Triples are Subject, Predicate, Object

Subjects and Predicates are URIs

Objects are URIs or Literals

– Literals are concrete data values

– e.g. the integer 27 or the date Dec 1, 2008

Several serialization formats like RDF/XML, N3, etc.

Page 37: Semantic web and library

37

Page 38: Semantic web and library

Slide 38

SPARQL : RDF Query Language

PREFIX rdfs:

<http://www.w3.org/2000/01/rdf-schema#>

PREFIX thing:

<http://ontoworld.org/id/>

PREFIX relation:

<http://ontoworld.org/id/Relation:>

SELECT ?label

WHERE {

thing:Angola relation:Located_in ?c.

?c rdfs:label ?label

}

Page 39: Semantic web and library

39

http://ontoworld.org/id/Angola

http://ontoworld.org/id/Africa

http://ontoworld.org/id/Zambia

Angola

http://www.w3.org/2000/01/rdf-schema#label

Africa

Located in

Zambia

Country

Borders

Continent http://ontoworld.org/id/Category:Country

http://ontoworld.org/id/Category:Continent

http://www.w3.org/1999/02/22/rdf-syntax-ns#type

Page 40: Semantic web and library

40

Page 41: Semantic web and library

RDF Schema

Define relations between terms to give formal semantics

In RDF(S): – subClassOf

– subPropertyOf

– And others (domain, range, list, collection, etc.)

Example: – Country subClassOf Location

– Continent subClassOf Location

Allows inferences – Angola type Country

– Country subClassOf Location

– -> Angola type Location

Page 42: Semantic web and library

42

Angola

Africa

Zambia

Country Continent

Location

Page 43: Semantic web and library

43

http://ontoworld.org/id/Angola

http://ontoworld.org/id/Africa

http://ontoworld.org/id/Zambia

Angola

http://www.w3.org/2000/01/rdf-schema#label

Africa

Located in

Zambia

Country

Borders

Continent http://ontoworld.org/id/Category:Country

http://ontoworld.org/id/Category:Continent

http://ontoworld.org/id/Category:Location

Location

http://www.w3.org/2000/01/rdf-schemas#subClassOf

http://www.w3.org/1999/02/22/rdf-syntax-ns#type

Page 44: Semantic web and library

Slide 44

RDF Schema

Define relations between terms to give formal semantics

In RDF(S): – subClassOf

– subPropertyOf

– And others (domain, range, list, collection, etc.)

Example: – Country subClassOf Location

– Continent subClassOf Location

Allows inferences – Angola type Country

– Country subClassOf Location

– -> Angola type Location

Page 45: Semantic web and library

45

http://ontoworld.org/id/Angola

http://ontoworld.org/id/Africa

http://ontoworld.org/id/Zambia

Angola

http://www.w3.org/2000/01/rdf-schema#label

Africa

Located in

Zambia

Country

Borders

Continent http://ontoworld.org/id/Category:Country

http://ontoworld.org/id/Category:Continent

http://ontoworld.org/id/Category:Location

Location

http://www.w3.org/2000/01/rdf-schemas#subClassOf

http://www.w3.org/1999/02/22/rdf-syntax-ns#type

Page 46: Semantic web and library

46

Angola

Africa

Zambia

Country Continent

Location

Page 47: Semantic web and library

Slide 47

Semantic Web

Angola

Zambia

Africa

Continent

African Elephant

Indian

Elephant

Mammal

Animal

Gorilla

Egypt

Pig

Alexandria

Memphis

Alexander the Great

China

Ceylon

India

Airline

Asia

Hotel Restaurant

Enterprise

Airport Vacation

Plant Vegeterian restaurant

Europe

Earth

Inchineon

Mumbay Airport

Mumbay

Cell

DNA

Genom

Lao Tse Aristotle

Philosophy

Page 48: Semantic web and library

48

Page 49: Semantic web and library

49

Page 50: Semantic web and library

50

Universal Access to All Knowledge

Page 51: Semantic web and library

การประยกตเทคโนโลยเวบเชงความหมาย กบงานดานหองสมด Semantic Web Applications for Libraries

Page 52: Semantic web and library

การประยกตเทคโนโลยเวบเชงความหมาย กบงานดานหองสมด

การบรณาการขอมล RDF ในแบบขอมลทมการเชอมโยง (Linked Data)

การสบคนขอมล RDF ในแบบการคนหาตามมต (Faceted Search)

52

Page 53: Semantic web and library

การบรณาการขอมล RDF ในแบบ Linked Data

เวบในปจจบน

เวบในปจจบนเปนการเชอมโยงหนาเวบโดยใช Hypertext links หรอ เวบของเอกสาร (Web of Documents)

ขอมลถกน าเสนอในแบบทใหผใชอานและน าไปใชประโยชนโดยตรง

โปรแกรมคอมพวเตอรน าขอมลไปใชประโยชนไดยาก

53

Page 54: Semantic web and library

การบรณาการขอมล RDF ในแบบ Linked Data (2)

Linked Data (http://linkeddata.org/)

น าขอมลทมอยในฐานขอมลอยเผยแพรในแบบขอมลตามแบบมาตรฐานขอมล RDF

ขอมลสามารถอางองไปยงขอมล RDF จากแหลงขอมลอนๆ ได

เพอใหสะดวกตอโปรแกรมคอมพวเตอรน าไปใชงาน

Slides from Tim Berners-Lee’s Linked Data Talk at TED 2009 54

Page 55: Semantic web and library

Documents vs. Linked Data

สรางหนาเวบ (Web documents) จากฐานขอมล (Database)

55

Page 56: Semantic web and library

Documents vs. Linked Data (2)

สรางหนาเวบ (Web documents) และขอมล RDF ในแบบ Linked Data จากฐานขอมล (Database)

56

Page 57: Semantic web and library

Linked Data ม 5 ระดบ

★ ขอมลเขาถงไดผานเวบในรปแบบใดกตาม ในแบบไมมลขสทธ (open license)

★★ ขอมลอยในแบบทมโครงสราง (structured data) เชน ในแบบไฟล MS Excel เปนตน

★★★ ขอมลอยในแบบทมโครงสราง และใชมาตรฐานเปด เชน ในแบบไฟล CSV เปนตน

★★★★ ขอมลในแบบทมโครงสราง และใชมาตรฐานเปดของ W3C ไดแก ขอมลแบบ RDF ซงตองใช URI ในการอางองถงสงตางๆ ในฐานขอมล

★★★★★ ขอมลในแบบเดยวกบระดบท 4 และมการเชอมโยง (linked) โดยอางถงขอมลจากแหลงขอมล RDF อนๆ ดวย

http://www.w3.org/DesignIssues/LinkedData.html 57

Page 58: Semantic web and library

ตวอยางหนวยงานทเผยแพรขอมล ในแบบ Linked Data

UK Government

US Government

BBC

Open Calais – Thomson Reuters

Freebase

NY Times

Best Buy

CNET

Dbpedia

58

Page 59: Semantic web and library

Data.gov.uk – Opening up government

http://data.gov.uk/linked-data/

Page 60: Semantic web and library

BBC Ontologies

http://www.bbc.co.uk/ontologies

60

Page 61: Semantic web and library

http://www.bbc.co.uk/nature/life

Page 62: Semantic web and library

62

Page 63: Semantic web and library

63

Page 64: Semantic web and library

64

Page 65: Semantic web and library

การเตบโตของ Linked Data

เรมตนป 2007

65

Page 66: Semantic web and library

ป 2010

66

Page 67: Semantic web and library

Library Linked Data (LLD)

http://ckan.net/group/lld

67

Page 68: Semantic web and library

Library Linked Data (LLD) (2)

1. AGROVOC

2. BibBase

3. Calames

4. Chronicling America

5. Gemeinsame Normdatei (GND)

6. Europeana Linked Open Data

7. Freebase

8. TheSoz Thesaurus for the Social Sciences (GESIS)

9. Hungarian National Library (NSZL) catalog

10. IdRef: Sudoc authority data

11. Library of Congress Subject Headings

12. LCSubjects.org Library of Congress Subject Headings

13. LIBRIS

14. LinkedLCCN

15. Linked Periodicals Database

16. lobid. Index of libraries and related organisations

17. lobid. Bibliographic Resources

68

Page 69: Semantic web and library

Library Linked Data (LLD) (3)

18. medline

19. Web NDL Authorities - National Diet Library of Japan

20. National Diet Library of Japan subject headings

21. Norwegian Medical Subject Headings (MeSH)

22. Norsk inndeling av vitenskapsdisipliner

23. The Open Library

24. Polythematic Structured Subject Heading System

25. Rådata nå!

26. RAMEAU subject headings (STITCH)

27. Sudoc bibliographic data

28. Thesaurus for Graphic Materials (t4gm.info)

29. Open Library data mirror in the Talis Platform

30. TEKORD

31. Thesaurus W for Local Archives

32. theses.fr

33. Linked Data Service der Universitätsbibliothek Mannheim

34. VIAF: The Virtual International Authority File

35. Yleinen suomalainen asiasanasto - YSA

36. 20th Century Press Archives

69

Page 70: Semantic web and library

The British National Bibliography

http://www.bl.uk/bibliographic/datafree.html

70

Page 71: Semantic web and library

The British National Bibliography (2)

71

Page 72: Semantic web and library

Library of Congress Authorities and Vocabularies

72

http://id.loc.gov/

Page 73: Semantic web and library

Library of Congress Authorities and Vocabularies (2)

RDF Data (adopting SKOS, Dublin Core) 73

Page 74: Semantic web and library

Dewey Summaries

http://dewey.info

74

Page 75: Semantic web and library

LOD-LAM Summit at Linked Data and Libraries 2011

http://lod-lam.net 75

Page 76: Semantic web and library

ปญหาของการสบคนขอมลในระบบหองสมดดจตอล

การบราวสขอมล (Browse) ในระบบหองสมดดจตอล มการออกแบบสวนตดตอกบผใชทแตกตางกนในแตละแหลงขอมล (collection)

ระบบหองสมดดจตอล เชน DSpace ชวยใหการจดการทรพยากรเนอหา และการคนหาขอมลของผใชท าได สะดวกยงขน ทงในสวนของการคนหาแบบ full-text และ การบราวส

ขอมลตามเมตาดาตา

http://dspace.org/

76

Page 77: Semantic web and library

การสบคนขอมล RDF ในแบบ Faceted Search

การคนหาตามมต (Faceted Search)

เปนเทคนคการ Browse ขอมลโดยกรองผลลพธการคนหาขอมลตามมตตางๆ

กลนกรองขอมล (Filter) ตามฟลดของเมตาดาตาทก าหนดไวใหเปนมตของขอมล (Facet)

รปแบบการบราวส และคนหาขอมลในระบบหองสมดดจตอลตางระบบทเปนรปแบบเดยวกน

เปนเทคนคการคนหาขอมลทสามารถประยกตใชงานกบขอมลแบบ RDF ไดโดยตรง

77

Page 78: Semantic web and library

ตวอยางระบบหองสมดดจตอลทประยกตใช เทคโนโลยเวบเชงความหมาย

SIMILE (http://simile.mit.edu/)

FedoraCommons (http://fedora-

commons.org/)

JeromeDL (http://www.jeromedl.org/)

78

Page 79: Semantic web and library

SIMILE

โครงการ SIMILE ของ MIT เปนการพฒนาเทคโนโลยเพอเพมประสทธภาพของระบบหองสมดดจตอล โดยใชเทคโนโลยเวบเชงความหมาย

ตวอยางโปรแกรมเครองมอทชวยในการพฒนาระบบสบคนขอมลแบบ Faceted Search

Longwell

Exhibit

79

Page 80: Semantic web and library

SIMILE’s Longwell

80

Page 81: Semantic web and library

SIMILE’s Exhibit

http://simile-widgets.org/exhibit/

81

Page 82: Semantic web and library

SIMILE’s Exhibit (2)

82

Page 83: Semantic web and library

Fedora Commons

ซอฟแวรระบบหองสมดดจตอลทเรมการพฒนาตงแตป 1997 ทมหาวทยาลย Cornell

เนนใหรองรบการรองรบ Digital Objects หลากหลายชนด ปรมาณมหาศาล (> 10,000,000 objects)

จดเกบความสมพนธระหวาง object ตางๆ ใน collection โดยใชมาตรฐาน RDF

สบคนขอมล RDF ในแบบ faceted search (โดยใชภาษา SPARQL)

83

Page 84: Semantic web and library

Fedora Commons (2)

DuraSpace = Fedora Commons + DSpace

http://duraspace.org/

Islandora = Fedora Commons + Drupal

http://islandora.ca/

84

Page 85: Semantic web and library

Fedora Commons (3)

http://digital.lib.umd.edu/ 85

Page 86: Semantic web and library

สรป

เทคโนโลยเวบเชงความหมาย (Semantic Web Technology) จะเขามามบทบาทส าคญเพมมากยงขนตอไปในระบบหองสมดดจตอล

ชวยสงเสรมการสราง และแบงปนขอมลเมตาเดตาในแบบมาตรฐาน RDF

ชวยการบรณาการเชอมโยงขอมลเมตาเดตาจากตางระบบในแบบ Linked Data

ชวยการสบคนขอมลตามเมตาดาตาในแบบของ Faceted Search

86