lodスキーマ設計の方法論 -社会課題編-
TRANSCRIPT
LOD スキーマ設計の方法論
- 社会課題編 -江上周作 1 ,川村隆浩 1,2 ,古崎晃司 3 ,大須賀昭彦 1
1 電気通信大学 2 科学技術振興機構 3 大阪大学
1
LODチャレンジ 2016 アイデア部門応募資料
2
アイデア• Linked Data, Linked Open Data (LOD)を構築する際に,データ構造(スキーマ)をどのように設計するかは重要な要素である• 特にデータの統一化や知識処理などの観点から,オントロジーに基づいたスキーマになっていることが望ましい• LODスキーマを既存オントロジーに基いて設計する方法を方法論としてまとめることで,誰でもこの手順で LODスキーマを設計できるようにする(今回は社会課題編)
4
1. 既存オントロジーの選択対象課題をモデル化するために使用するオントロジーが決定していない場合に行う1. LODの利用目的から選択する場合
• 地理的分析・可視化⇒GeoNames Ontology等• 時間的分析・可視化⇒ Time Ontology等• 因果関係分析・可視化⇒ Event Ontology等• (課題:利用目的と対応オントロジーの表を作る)
2. 使用単語から選択する場合• LOV[1]から LOD中に使用する単語で検索• 検索結果から使用するオントロジーを選択する
今回は社会課題の中でも放置自転車を例に説明Event Ontologyを選択
[1] Linked Open Vocabularies: http://lov.okfn.org/dataset/lov/[2] Event Ontology: http://motools.sourceforge.net/event/event.html
5
2. キーワード抽出1. 選択したオントロジーの中で,対象とする課題の中心クラスに対応するクラスを決める
• 例:放置自転車⇒ event:Event2. 1で選択したクラスと直接関係するプロパティ名を基に日本語WordNetで日本語意味を複数取得
• この時プロパティの値が不明なもののみを対象とする (例:event:factor)
3. 「課題名 (スペース )プロパティの日本語意味」で検索エンジンを用いて記事を検索する• 例:「放置自転車 原因」
4. マッチした記事からプロパティの値に相当する単語 or文を抽出する
6
3. グルーピング1. 取得した単語を基に J-Global Knowledge[3]のシソーラスからクラス,上位クラスを取得2. クラスごとに単語,文を表形式にまとめる.グループが互いに素であるようにする.3. 既存オントロジーに無い新たなプロパティを追加してもよいプロパティ グループ (クラ
ス )単語 文
P1 G1 K1 S1
… … … …Pn Gn Kn Sn
[3] J-Global Knowledge: https://stirdf.jglobal.jst.go.jp/
4. クラス設計
Gi中心クラス Pi
中心クラスから(抽出に使った)プロパティを使用してグループを値に指定
プロパティ グループ (クラス )
単語 文P1 G1 K1 S1
… … … …Pn Gn Kn Sn
5. インスタンス設計 (1)
Gi中心クラス
PiKi
中心インスタンスtype type
1. 単語をグループのインスタンスとして中心インスタンスからリンクさせる2. 必要であればインスタンス (Ki)同士の関係も追加する
プロパティ グループ (クラス )
単語 文P1 G1 K1 S1
… … … …Pn Gn Kn Sn