lodスキーマ設計の方法論 -社会課題編-

9
LOD スススス スススススス - ススススス - スススス 1 スススス 1,2 スススス 3 ススススス 1 1 スススススス 2 スススススススス 3 スススス 1 LOD チチチチチ 2016 チチチチチチチチチチ

Upload: shusaku-egami

Post on 14-Apr-2017

189 views

Category:

Technology


2 download

TRANSCRIPT

LOD スキーマ設計の方法論

- 社会課題編 -江上周作 1 ,川村隆浩 1,2 ,古崎晃司 3 ,大須賀昭彦 1

1 電気通信大学 2 科学技術振興機構 3 大阪大学

1

LODチャレンジ 2016 アイデア部門応募資料

2

アイデア• Linked Data, Linked Open Data (LOD)を構築する際に,データ構造(スキーマ)をどのように設計するかは重要な要素である• 特にデータの統一化や知識処理などの観点から,オントロジーに基づいたスキーマになっていることが望ましい• LODスキーマを既存オントロジーに基いて設計する方法を方法論としてまとめることで,誰でもこの手順で LODスキーマを設計できるようにする(今回は社会課題編)

3

LOD スキーマ設計の方法論1. 既存オントロジーの選択2. キーワード抽出3. グルーピング4. クラス設計5. インスタンス設計

4

1. 既存オントロジーの選択対象課題をモデル化するために使用するオントロジーが決定していない場合に行う1. LODの利用目的から選択する場合

• 地理的分析・可視化⇒GeoNames Ontology等• 時間的分析・可視化⇒ Time Ontology等• 因果関係分析・可視化⇒ Event Ontology等• (課題:利用目的と対応オントロジーの表を作る)

2. 使用単語から選択する場合• LOV[1]から LOD中に使用する単語で検索• 検索結果から使用するオントロジーを選択する

今回は社会課題の中でも放置自転車を例に説明Event Ontologyを選択

[1] Linked Open Vocabularies: http://lov.okfn.org/dataset/lov/[2] Event Ontology: http://motools.sourceforge.net/event/event.html

5

2. キーワード抽出1. 選択したオントロジーの中で,対象とする課題の中心クラスに対応するクラスを決める

• 例:放置自転車⇒ event:Event2. 1で選択したクラスと直接関係するプロパティ名を基に日本語WordNetで日本語意味を複数取得

• この時プロパティの値が不明なもののみを対象とする (例:event:factor)

3. 「課題名 (スペース )プロパティの日本語意味」で検索エンジンを用いて記事を検索する• 例:「放置自転車 原因」

4. マッチした記事からプロパティの値に相当する単語 or文を抽出する

6

3. グルーピング1. 取得した単語を基に J-Global Knowledge[3]のシソーラスからクラス,上位クラスを取得2. クラスごとに単語,文を表形式にまとめる.グループが互いに素であるようにする.3. 既存オントロジーに無い新たなプロパティを追加してもよいプロパティ グループ (クラ

ス )単語 文

P1 G1 K1 S1

… … … …Pn Gn Kn Sn

[3] J-Global Knowledge: https://stirdf.jglobal.jst.go.jp/

4. クラス設計

Gi中心クラス Pi

中心クラスから(抽出に使った)プロパティを使用してグループを値に指定

プロパティ グループ (クラス )

単語 文P1 G1 K1 S1

… … … …Pn Gn Kn Sn

5. インスタンス設計 (1)

Gi中心クラス

PiKi

中心インスタンスtype type

1. 単語をグループのインスタンスとして中心インスタンスからリンクさせる2. 必要であればインスタンス (Ki)同士の関係も追加する

プロパティ グループ (クラス )

単語 文P1 G1 K1 S1

… … … …Pn Gn Kn Sn

9

5. インスタンス設計 (2)

中心インスタンス SiPi

Ki,subject Ki,predicate Ki,object

rdf:subject

rdf:predicaterdf:object

rdf:Statement

type

原因など、単語だけでは説明が難しいものに関しては文をプロパティの値とする