iodd2015osaka kameda-slideshare
TRANSCRIPT
Web アーキテクチャーとしての
オープンデータ
― LOD, RDF, 五つ星データの本当の意味―
亀田 尭宙 京都大学 地域研究統合情報センター 助教 LOD Initiative
http://5stardata.info/ja/
★( どんな形式でも良いので ) データをオープンライセンスで Web 上に公開しましょう消費者として ...• ✔ 見ることができます.• ✔ 印刷することができます.• ✔ ローカル ( ハードディスクや USB メモリ上 ) に保存できます.• ✔ データを他のシステムに入力できます.• ✔ 望むようにデータを変更できます.• ✔ 好きなように他人とデータを共有できます.公開者として ...• ✔ 簡単に公開できます.• ✔ あなたのデータが使用可能であるということを
消費者に繰り返し説明する必要がありません.
★ ★ データを構造化データとして公開しよう ( 例 : 表のスキャン画像よりも Excel)消費者として,★ でできることは全て可能です.それに加えて,• ✔ 独占的なソフトウェアを使うことで,データの集約,計算,
可視化等を直接処理できます.• ✔ 他の ( 構造化 ) 形式として書き出せます.公開者として ...• ✔ まだ簡単に公開できます.
★ ★ ★ 非独占の形式を使おう ( 例 : Excel よりも CSV)消費者として,★★ でできることは全て可能です.それに加えて :• ✔ 特定のソフトウェアの機能に限定されることなく,あなた
の好きな方法でデータを操作できます.公開者として ...• ⚠ 独占的な形式からデータを書き出すためには,コンバー
ターやプラグインが必要になるかもしれません.• ✔ まだまだ公開するのは簡単です.
★ ★ ★ ★ 物事を示すのに URI を使おう消費者として★★★ でできることは全て可能です.それに加えて,• ✔ (Web 上やローカルの ) 他の場所からデータにリンクすることができます.• ✔ ブックマークできます.• ✔ データの一部を再利用できます.• ✔ 公開者が使用しているパターンの一部を理解するだけで,既存のツールや
ライブラリを再利用できるかもしれません.• ⚠ データの RDF " グラフ " 構造を理解するのは,表データ (Excel/CSV) や木構
造データ (XML/JSON) よりも多くの努力が必要でしょう.• ✔ 他のデータと安全に組み合わせることができます. URI はグローバルなス
キームなので,もし 2 つの事物に同じ URI が存在する場合は,それは故意です.もしそうなっているのであれば,それは適切な 5 つ星データへの道です!
★ ★ ★ ★ 物事を示すのに URI を使おう公開者として ...• ✔ データ項目へのきめ細かい制御で消費者のアクセスを最適化で
きます ( ロード・バランシング,キャッシング等 ) .• ✔ 他のデータ公開者があなたのデータにリンクすることができま
す.それを 5 つ星に昇格してください!• ⚠ 通常は,データを細切れにして分析するために時間を費やします.• ⚠ データ項目に URI を割り当てたり,データの表現方法について考
える必要があるでしょう.• ⚠ 再利用するための既存パターンを見つけるか,あるいは自分なり
の方法を作る必要があります.
★ ★ ★ ★ ★ 他のデータへリンクしよう消費者として,★★★★ でできることは全部できます.それに加えて,• ✔ データを消費する時により多くの ( 関係ある ) データを発見
できます.• ✔ データスキーマについて直接学べます.• ⚠Web ページでの 404 エラーのように,これからは壊れた
データリンクを取り扱わなければなりません.• ⚠ 実際,任意のリンクからのデータを表示するのは,あなた
のページでいかなるウェブサイトからのコンテンツを含ませるのと同様に危険です.注意,信頼,常識が依然として必要とされます.
★ ★ ★ ★ ★ 他のデータへリンクしよう公開者は ...• ✔ あなたのデータを発見可能にできます.• ✔ あなたのデータの価値が増大します.• ✔ あなたの組織は消費者と同様にリンクから利益を得ます.• ⚠ あなたのデータを Web 上の他のデータにリンクするために
リソースを投資する必要があるでしょう.• ⚠ 壊れた,あるいは正しくないリンクを修正する必要があるか
もしれません.
Linked Data Principle
http://www.w3.org/DesignIssues/LinkedData.html
Linked Data の原則1. 物事の名前に URI を使う
2. 人々がその名前について探せるように HTTP URI を使う
3. URI にアクセスしたら有用な情報を標準的な形式で返す (RDF*, SPARQL)
4. 他の URI へのリンクを提供し、更なる情報を得られるようにする
誤解1 ★ から順番に実現しなきゃ?• 他のデータへのリンクを記述した( ★ ★ ★ ★ ★)
Excel ファイル( not ★ ★ ★? )を、非商用に限るなど再利用に制限を付けたライセンスで( not
★ )提供する。
• もちろん ★ や ★ ★ ★ を満たしていた方が良いことがあるが、これでも公開に意義がある。
誤解2 RDF は XML の一種である?• RDF はあくまで知識のモデル
友人
在住作品
作品
さまざまなシリアライゼーション
[Turtle]dbpedia-ja:坊っちゃん dcterms:creator dbpedia-ja:夏目漱石 .
[RDF/XML] <rdf:Description rdf:about="http://ja.dbpedia.org/resource/坊っちゃん "> <dcterms:creator rdf:resource="http://ja.dbpedia.org/resource/夏目漱石 " /> </rdf:Description>
誤解3 SPARQL 使えれば Linked Open Data?• SPARQL が使えるとアプリを作るのには便利だけど、
単に標準的な形式のひとつにすぎない
参考: LOD連続講義 第 5回「 LOD の作り方・使い方」 from Fuyuko Matsumurahttps://www.slideshare.net/fuyukoitomatsumura/lod5lod
Linked Data の原則1. 物事の名前に URI を使う
2. 人々がその名前について探せるように HTTP URI を使う
3. URI にアクセスしたら有用な情報を標準的な形式で返す (RDF*, SPARQL)
4. 他の URI へのリンクを提供し、更なる情報を得られるようにする
この原則の思想は??
Linked Open Data &
World Wide WEB
Dereferenceable (参照解決可能)
人間が使える 機械が処理できる
参照解決可能にする方法• コンテントネゴシエーション
HTML
http://lod.ac/species/Hirasea_profundispira
参照解決可能にする方法コンテントネゴシエーション
HTML RDF/XML
http://lod.ac/species/Hirasea_profundispira
参照解決可能にする方法• コンテントネゴシエーション
HTML RDF/XML
http://lod.ac/species/Hirasea_profundispira .rdf
http://ja.dbpedia.org/resource/ 大阪市• http://ja.dbpedia.org/data/大阪市.ttl
• http://ja.dbpedia.org/data/大阪市.json
• http://ja.dbpedia.org/data/大阪市.rdf• http://ja.dbpedia.org/page/ 大阪市
http://ja.dbpedia.org/data/大阪市.ttl
http://ja.dbpedia.org/data/大阪市.json
http://ja.dbpedia.org/data/大阪市.rdf
http://ja.dbpedia.org/page/ 大阪市
Dereferenceable 参照解決可能 のメリット• SPARQL知らなくてもプログラムでデータにアクセスできる• KML などドメイン固有のフォーマットのデータもつなげられる• LOD サーフィンやクローリングができる “World wide-” “Global
graph”•「有用な情報」が得られる!
世界とつながろう!
http://lod-cloud.net/ CC-BY-SA "Linking Open Data cloud diagram 2014, by Max Schmachtenberg, Christian Bizer, Anja Jentzsch and Richard Cyganiak. http://lod-cloud.net/"