iodd2015osaka kameda-slideshare

28
Web アアアアアアアア アアアア アアアアアアア ― LOD, RDF, アアアアアアアアアアアア― アア アア アアアア アアアアアアアアアアアア アア LOD Initiative

Upload: akihiro-kameda

Post on 06-Aug-2015

456 views

Category:

Internet


1 download

TRANSCRIPT

Page 1: Iodd2015osaka kameda-slideshare

Web アーキテクチャーとしての

オープンデータ 

― LOD, RDF, 五つ星データの本当の意味―

亀田 尭宙  京都大学 地域研究統合情報センター 助教  LOD Initiative

Page 2: Iodd2015osaka kameda-slideshare
Page 3: Iodd2015osaka kameda-slideshare

http://5stardata.info/ja/

Page 4: Iodd2015osaka kameda-slideshare

★( どんな形式でも良いので ) データをオープンライセンスで Web 上に公開しましょう消費者として ...• ✔ 見ることができます.• ✔ 印刷することができます.• ✔ ローカル ( ハードディスクや USB メモリ上 ) に保存できます.• ✔ データを他のシステムに入力できます.• ✔ 望むようにデータを変更できます.• ✔ 好きなように他人とデータを共有できます.公開者として ...• ✔ 簡単に公開できます.• ✔ あなたのデータが使用可能であるということを

  消費者に繰り返し説明する必要がありません.

Page 5: Iodd2015osaka kameda-slideshare

★ ★ データを構造化データとして公開しよう ( 例 : 表のスキャン画像よりも Excel)消費者として,★ でできることは全て可能です.それに加えて,• ✔ 独占的なソフトウェアを使うことで,データの集約,計算,

可視化等を直接処理できます.• ✔ 他の ( 構造化 ) 形式として書き出せます.公開者として ...• ✔ まだ簡単に公開できます.

Page 6: Iodd2015osaka kameda-slideshare

★ ★ ★ 非独占の形式を使おう ( 例 : Excel よりも CSV)消費者として,★★ でできることは全て可能です.それに加えて :• ✔ 特定のソフトウェアの機能に限定されることなく,あなた

の好きな方法でデータを操作できます.公開者として ...• ⚠ 独占的な形式からデータを書き出すためには,コンバー

ターやプラグインが必要になるかもしれません.• ✔ まだまだ公開するのは簡単です.

Page 7: Iodd2015osaka kameda-slideshare

★ ★ ★ ★ 物事を示すのに URI を使おう消費者として★★★ でできることは全て可能です.それに加えて,• ✔ (Web 上やローカルの ) 他の場所からデータにリンクすることができます.• ✔ ブックマークできます.• ✔ データの一部を再利用できます.• ✔ 公開者が使用しているパターンの一部を理解するだけで,既存のツールや

ライブラリを再利用できるかもしれません.• ⚠ データの RDF " グラフ " 構造を理解するのは,表データ (Excel/CSV) や木構

造データ (XML/JSON) よりも多くの努力が必要でしょう.• ✔ 他のデータと安全に組み合わせることができます. URI はグローバルなス

キームなので,もし 2 つの事物に同じ URI が存在する場合は,それは故意です.もしそうなっているのであれば,それは適切な 5 つ星データへの道です!

Page 8: Iodd2015osaka kameda-slideshare

★ ★ ★ ★ 物事を示すのに URI を使おう公開者として ...• ✔ データ項目へのきめ細かい制御で消費者のアクセスを最適化で

きます ( ロード・バランシング,キャッシング等 ) .• ✔ 他のデータ公開者があなたのデータにリンクすることができま

す.それを 5 つ星に昇格してください!• ⚠ 通常は,データを細切れにして分析するために時間を費やします.• ⚠ データ項目に URI を割り当てたり,データの表現方法について考

える必要があるでしょう.• ⚠ 再利用するための既存パターンを見つけるか,あるいは自分なり

の方法を作る必要があります.

Page 9: Iodd2015osaka kameda-slideshare

★ ★ ★ ★ ★ 他のデータへリンクしよう消費者として,★★★★ でできることは全部できます.それに加えて,• ✔ データを消費する時により多くの ( 関係ある ) データを発見

できます.• ✔ データスキーマについて直接学べます.• ⚠Web ページでの 404 エラーのように,これからは壊れた

データリンクを取り扱わなければなりません.• ⚠ 実際,任意のリンクからのデータを表示するのは,あなた

のページでいかなるウェブサイトからのコンテンツを含ませるのと同様に危険です.注意,信頼,常識が依然として必要とされます.

Page 10: Iodd2015osaka kameda-slideshare

★ ★ ★ ★ ★ 他のデータへリンクしよう公開者は ...• ✔ あなたのデータを発見可能にできます.• ✔ あなたのデータの価値が増大します.• ✔ あなたの組織は消費者と同様にリンクから利益を得ます.• ⚠ あなたのデータを Web 上の他のデータにリンクするために

リソースを投資する必要があるでしょう.• ⚠ 壊れた,あるいは正しくないリンクを修正する必要があるか

もしれません.

Page 11: Iodd2015osaka kameda-slideshare

Linked Data Principle

http://www.w3.org/DesignIssues/LinkedData.html

Page 12: Iodd2015osaka kameda-slideshare

Linked Data の原則1. 物事の名前に URI を使う

2. 人々がその名前について探せるように HTTP URI を使う

3. URI にアクセスしたら有用な情報を標準的な形式で返す (RDF*, SPARQL)

4. 他の URI へのリンクを提供し、更なる情報を得られるようにする

Page 13: Iodd2015osaka kameda-slideshare

誤解1  ★ から順番に実現しなきゃ?• 他のデータへのリンクを記述した( ★ ★ ★ ★ ★)

Excel ファイル( not ★ ★ ★? )を、非商用に限るなど再利用に制限を付けたライセンスで( not

★ )提供する。

• もちろん ★ や ★ ★ ★ を満たしていた方が良いことがあるが、これでも公開に意義がある。

Page 14: Iodd2015osaka kameda-slideshare

誤解2  RDF は XML の一種である?• RDF はあくまで知識のモデル

友人

在住作品

作品

さまざまなシリアライゼーション

[Turtle]dbpedia-ja:坊っちゃん dcterms:creator dbpedia-ja:夏目漱石 .

[RDF/XML] <rdf:Description rdf:about="http://ja.dbpedia.org/resource/坊っちゃん "> <dcterms:creator rdf:resource="http://ja.dbpedia.org/resource/夏目漱石 " /> </rdf:Description>

Page 15: Iodd2015osaka kameda-slideshare

誤解3 SPARQL 使えれば Linked Open Data?• SPARQL が使えるとアプリを作るのには便利だけど、

単に標準的な形式のひとつにすぎない

参考: LOD連続講義 第 5回「 LOD の作り方・使い方」 from Fuyuko Matsumurahttps://www.slideshare.net/fuyukoitomatsumura/lod5lod

Page 16: Iodd2015osaka kameda-slideshare

Linked Data の原則1. 物事の名前に URI を使う

2. 人々がその名前について探せるように HTTP URI を使う

3. URI にアクセスしたら有用な情報を標準的な形式で返す (RDF*, SPARQL)

4. 他の URI へのリンクを提供し、更なる情報を得られるようにする

この原則の思想は??

Page 17: Iodd2015osaka kameda-slideshare

Linked Open Data &

World Wide WEB

Page 18: Iodd2015osaka kameda-slideshare

Dereferenceable (参照解決可能)

人間が使える 機械が処理できる

Page 19: Iodd2015osaka kameda-slideshare

参照解決可能にする方法• コンテントネゴシエーション

HTML

http://lod.ac/species/Hirasea_profundispira

Page 20: Iodd2015osaka kameda-slideshare

参照解決可能にする方法コンテントネゴシエーション

HTML RDF/XML

http://lod.ac/species/Hirasea_profundispira

Page 21: Iodd2015osaka kameda-slideshare

参照解決可能にする方法• コンテントネゴシエーション

HTML RDF/XML

http://lod.ac/species/Hirasea_profundispira .rdf

Page 22: Iodd2015osaka kameda-slideshare

http://ja.dbpedia.org/resource/ 大阪市• http://ja.dbpedia.org/data/大阪市.ttl

• http://ja.dbpedia.org/data/大阪市.json

• http://ja.dbpedia.org/data/大阪市.rdf• http://ja.dbpedia.org/page/ 大阪市

Page 23: Iodd2015osaka kameda-slideshare

http://ja.dbpedia.org/data/大阪市.ttl

Page 24: Iodd2015osaka kameda-slideshare

http://ja.dbpedia.org/data/大阪市.json

Page 25: Iodd2015osaka kameda-slideshare

http://ja.dbpedia.org/data/大阪市.rdf

Page 26: Iodd2015osaka kameda-slideshare

http://ja.dbpedia.org/page/ 大阪市

Page 27: Iodd2015osaka kameda-slideshare

Dereferenceable 参照解決可能 のメリット• SPARQL知らなくてもプログラムでデータにアクセスできる• KML などドメイン固有のフォーマットのデータもつなげられる• LOD サーフィンやクローリングができる “World wide-” “Global

graph”•「有用な情報」が得られる!

Page 28: Iodd2015osaka kameda-slideshare

世界とつながろう!

http://lod-cloud.net/ CC-BY-SA "Linking Open Data cloud diagram 2014, by Max Schmachtenberg, Christian Bizer, Anja Jentzsch and Richard Cyganiak. http://lod-cloud.net/"