じんもんこん2011「芸術・文化情報のlinked open...

45
芸術・文化情報のLinked Open Data 普及に向けた現状と課題 ‒ LODAC Museum を例に 嘉村 哲郎 : 東京藝術大学総合芸術アーカイブセンター/芸術情報センター 加藤 文彦 : 情報・システム研究機構 新領域融合研究センター 松村 冬子 : 国立情報学研究所 上田 洋  : 株式会社ATR-Promotions 高橋 徹  : 株式会社ATR-Promotions 大向 一輝 : 国立情報学研究所,総合研究大学院大学 武田 英明 : 国立情報学研究所,総合研究大学院大学 発表者 : 嘉村 哲郎 総合研究大学院大学 複合科学研究科

Upload: kamura

Post on 13-Jun-2015

1.062 views

Category:

Documents


2 download

DESCRIPTION

じんもんこん2011発表資料「芸術・文化情報のLinked Open Data普及に向けた現状と課題 ‒ LODAC Museum を例に」嘉村 哲郎 : 総合研究大学院大学 複合科学研究科 / 東京藝術大学総合芸術アーカイブセンター/芸術情報センター加藤 文彦 : 情報・システム研究機構 新領域融合研究センター松村 冬子 : 国立情報学研究所上田 洋  : 株式会社ATR-Promotions高橋 徹  : 株式会社ATR-Promotions大向 一輝 : 国立情報学研究所,総合研究大学院大学武田 英明 : 国立情報学研究所,総合研究大学院大学

TRANSCRIPT

Page 1: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

芸術・文化情報のLinked Open Data普及に向けた現状と課題 ‒ LODAC Museum を例に

嘉村 哲郎 : 東京藝術大学総合芸術アーカイブセンター/芸術情報センター加藤 文彦 : 情報・システム研究機構 新領域融合研究センター松村 冬子 : 国立情報学研究所上田 洋  : 株式会社ATR-Promotions高橋 徹  : 株式会社ATR-Promotions大向 一輝 : 国立情報学研究所,総合研究大学院大学武田 英明 : 国立情報学研究所,総合研究大学院大学

発表者 : 嘉村 哲郎総合研究大学院大学 複合科学研究科

Page 2: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

2

大目標

さまざまな分野,多くの人にふれてもらうために

ツールとしてのWebとデジタルデータを使用

すなわち,芸術・文化をキーにさまざまな分野に活性化をもたらすこと

日本の芸術・文化をより多くの人に,より多くふれられる仕組みを作りたい

伝統芸能・芸術 (High Culture)から

 若者・ポップ(Youth Subculture)まで

Page 3: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

「仮説(興味)」1.芸術・文化情報にあらゆる分野の情報と組合せると,面白いものができるかもしれない

2.特定の人だけでなく,Web上で自由に情報が使えると新しい発見や創作があるかもしれない

3.新しい発見や創作を基に,さらなるコンテンツの進化が見られるかもしれない

「仮説を検証するためには…」

Web上でデータとして使える芸術・文化情報が必要

 → 文化施設と研究機関には多くの伝統的な芸術・文化情報が存在する

 しかし,情報は分散しており,どこにどのような情報があるのか,把握が困難な状態

Page 4: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

43

1.分散する情報をデータとして使えるようにする

2.どのような情報があるのか,関連情報を含めて把握する

3.把握した情報から,芸術・文化情報の現状と問題点を整理し,

4.問題の解決を試みる

5.インターネット利用者が公開された情報を使い,利用者側の視点で自由に情報を活用できる仕組みを構築する

6.構築した仕組みを使って情報をアプリケーションに実装し,仕組みが機能することを実証する

本研究の目的・フェーズ

その上で

Page 5: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

1.Linked Open Data(LOD)

2. RDFデータとメタデータについて

3. 芸術・文化情報LODの普及に向けて

Linked Open Data for ACademiaLODAC Project

Page 6: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

現在のWeb = 文書として使えるWeb情報ex) DB検索,PDF, HTML, 画像形式で公開される情報

公開のため,ある形式に変換された情報

Page 7: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

現在のWeb = 文書として使えるWeb情報ex) DB検索,PDF, HTML, 画像形式で公開される情報

公開のため,ある形式に変換された情報

例えば,各美術館が公開する作品に何種類の技法があるかを調査したい時.

分散するサイトと作品情報

検索

検索

検索

検索コピー&ペースト EXCELへのデータ

貼り付け作業

コピー&ペースト

作品情報の検索とテキストのコピー&ペーストの作業

美術館ADB

美術館BHTML

美術館CPDF

Page 8: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

7

これからのWeb = データとして使えるWebの情報ex) RDFデータ,SPARQL検索システム

1つのRDFデータ内容から,リンクする複数のRDFデータの情報を抽出・整形し,結果をそのままデータとして使うことができる

(XMLやCSVは単一のファイルが利用できる)

リンクでつながるRDFデータから情報を検索・抽出

検索クエリ

1回の検索から複数のRDFデータを精査して,結果を整形して出力.出力したデータは直接アプリケーションに利用可

自動的に結果を整理

直接プログラムで利用

Page 9: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

RDF: Web上のリソースを記述するための標準化規格

8

Page 10: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

RDF: Web上のリソースを記述するための標準化規格

8

http://lod.ac./○○

何らかの情報(リソース)が存在するインターネットのアドレス(URL)

Page 11: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

RDF: Web上のリソースを記述するための標準化規格

8

http://lod.ac./○○

何らかの情報(リソース)が存在するインターネットのアドレス(URL)

URLにアクセスすると,このような文字列を見ることができた

?????

Page 12: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

RDF: Web上のリソースを記述するための標準化規格

8

http://lod.ac./○○

何らかの情報(リソース)が存在するインターネットのアドレス(URL)

URLにアクセスすると,このような文字列を見ることができた

ex:動物

リソース “http://lod.ac/○○” には “動物” の “ُحوٌت”(くじら) に関する情報がある

Page 13: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

RDF: Web上のリソースを記述するための標準化規格

8

http://lod.ac./○○

何らかの情報(リソース)が存在するインターネットのアドレス(URL)

URLにアクセスすると,このような文字列を見ることができた

ex:動物

主語

述語(項目名)

目的語

RDFでは,主語・述語・目的語の3つ組の情報項目でデータを作る

アドレスにアクセスすると,他のRDFへのリンクや文字列がデータとして格納される

リソース “http://lod.ac/○○” には “動物” の “ُحوٌت”(くじら) に関する情報がある

Page 14: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

9

RDF形式で作成した情報 = リソース

Page 15: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

9

RDF形式で作成した情報 = リソース

Page 16: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

10

各リソースにはインターネットでアクセスできる重複のない識別子(URI)を付ける

Page 17: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

10

各リソースにはインターネットでアクセスできる重複のない識別子(URI)を付ける

http://lod.ac/123

http://lod.ac/2312

http://lod.ac/32

http://lod.ac/5

http://geidai.ac.jp/9832

http://lod.ac/2132

http://example.jp/abc

http://lod.ac/7391

http://lod.ac/12

http://lod.ac/725http://lod.ac/345

http://lod.ac/83

http://lod.ac/6413

http://lod.ac/7712

http://lod.ac/62

http://geidai.ac.jp/21

http://geidai.ac.jp/217

http://geidai.ac.jp/632

http://example.jp/vh3a

http://example.jp/cvs

http://example.jp/dhw

http://example.jp/few

Page 18: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

11

関係があるリソースをリンクでつなげた機械処理可能なデータLinked Open Data(LOD)

http://lod.ac/123

http://lod.ac/2312

http://lod.ac/32

http://lod.ac/5

http://geidai.ac.jp/9832

http://lod.ac/2132

http://example.jp/abc

http://lod.ac/7391

http://lod.ac/12

http://lod.ac/725http://lod.ac/345

http://lod.ac/83

http://lod.ac/6413

http://lod.ac/7712

http://lod.ac/62

http://geidai.ac.jp/21

http://geidai.ac.jp/217

http://geidai.ac.jp/632

http://example.jp/vh3a

http://example.jp/cvs

http://example.jp/dhw

http://example.jp/few

自由に使える情報が,リンクとリンクでつながるデータ 「リンクトオープンデータ」

Page 19: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

11

関係があるリソースをリンクでつなげた機械処理可能なデータLinked Open Data(LOD)

http://lod.ac/123

http://lod.ac/2312

http://lod.ac/32

http://lod.ac/5

http://geidai.ac.jp/9832

http://lod.ac/2132

http://example.jp/abc

http://lod.ac/7391

http://lod.ac/12

http://lod.ac/725http://lod.ac/345

http://lod.ac/83

http://lod.ac/6413

http://lod.ac/7712

http://lod.ac/62

http://geidai.ac.jp/21

http://geidai.ac.jp/217

http://geidai.ac.jp/632

http://example.jp/vh3a

http://example.jp/cvs

http://example.jp/dhw

http://example.jp/few

自由に使える情報が,リンクとリンクでつながるデータ 「リンクトオープンデータ」

Page 20: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

12

RDF作成におけるメタデータ(述語)の重要性RDFデータの情報を使う場合,SPARQL機能を使用する.検索は,主語と述語を使用し,述語の値を結果として返す

dc:creator

dc:title

藤田嗣治 @ja

カフェにて @ja

主語 述語 目的語

http://exam.ple/123

絵画作品リソースのタイトルを取得する場合は…「http://exam.ple/123 の dc:title にある目的語の値を取得せよ」

Page 21: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

12

RDF作成におけるメタデータ(述語)の重要性RDFデータの情報を使う場合,SPARQL機能を使用する.検索は,主語と述語を使用し,述語の値を結果として返す

dc:creator

dc:title

藤田嗣治 @ja

カフェにて @ja

主語 述語 目的語

http://exam.ple/123

絵画作品リソースのタイトルを取得する場合は…「http://exam.ple/123 の dc:title にある目的語の値を取得せよ」

利用者やコンピュータはメタデータから,目的語がどのような情報であるかを理解する.広く認知されているメタデータを使うことで,より多くの利用者に使ってもらえる可能性がある

独自に定義したメタデータの場合,利用者はメタデータの説明書を見て意味を理解する必要がある= 手間がかかる

Page 22: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

13

メタデータ設計方針

•可能な限り既存のメタデータを使用•メタデータスキーマに定義範囲がある場合は字面のみを利用•既存のもので対応出来ない場合はメタデータは独自の語彙を定義した

Webから収集した情報に対し,LODAC独自の視点でメタデータを再適用した.

ただし,

RDFが特定の分野で中心的な情報として使われるものと考えた場合,必ずしもLODACの手法が最適とは限らない

LODAC Museumの基本方針

Page 23: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

14

3つのメタデータ設計方針1. 全て独自のメタデータとスキーマを定義して使う

限定範囲内での利用目的(組織内のみ等)

2.分野内で合意して作られたスキーマを使う.スキーマで補えない部分は独自に定義する.

領域・組織間情報の相互運用,専門性を重視した利用目的

3.全て汎用性の高い既存のスキーマを使う

一般性,情報の利用効率性を重視した目的

Page 24: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

15

相互運用性を考慮したメタデータ設計案情報に専門性・独自性のあるメタデータを記述し,さらに一般的な利用者を考慮した汎用性の高いメタデータを定義する設計.

タイトル作者名材質技法

受入形態購入価格

専門的または独自のメタデータで作られた資料情報

タイトル作者名材質技法

受入形態購入価格

公開する部分に別途一般的なメタデータを記述して公開

org: kaigaNameorg: sakushaorg: zaishitsuorg: gihouorg: ukeireorg: kakaku

dc: titledc: creatordc: mediumdc: medium

org: kaigaNameorg: sakushaorg: zaishitsu

LODAC Museumは1つの項目に複数のメタデータを多重表記

公開情報(多重表記)

Page 25: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

15

相互運用性を考慮したメタデータ設計案情報に専門性・独自性のあるメタデータを記述し,さらに一般的な利用者を考慮した汎用性の高いメタデータを定義する設計.

タイトル作者名材質技法

受入形態購入価格

専門的または独自のメタデータで作られた資料情報

タイトル作者名材質技法

受入形態購入価格

公開する部分に別途一般的なメタデータを記述して公開

org: kaigaNameorg: sakushaorg: zaishitsuorg: gihouorg: ukeireorg: kakaku

dc: titledc: creatordc: mediumdc: medium

org: kaigaNameorg: sakushaorg: zaishitsu

LODAC Museumは1つの項目に複数のメタデータを多重表記

公開情報(多重表記)

<!-- 1.1.2 タイトルに関する語彙 --><rdf:Description rdf:about="http://ndl.go.jp/dcndl/terms/alternative">・・・省略<rdfs:subPropertyOf rdf:resource="http://purl.org/dc/elements/1.1/title"/><dcterms:created>2011-12-01</dcterms:created></rdf:Description>

独自定義のメタデータ

上位属性にダブリンコアを持つ

国立国会図書館は独自に定義したメタデータ(DC-NDL)に上位属性として汎用的なメタデータを階層的に持つ

※2011年12月1日にDC-NDL 語彙アップデート版が公開

Page 26: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

16

RDFデータ抽出機能 SPARQL

SPARQLは, リンクでつながるRDFデータを操作して情報を抽出するツール.

例: 全資料情報から同じ作品名がついた資料はどのくらいあるか.

全てのRDFデータから作品の内容が記述された作品RDFデータを抽出

作品RDFデータから,作品名のみを抽出

重複する作品名数を計算し,結果を返す

Page 27: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

16

RDFデータ抽出機能 SPARQL

SPARQLは, リンクでつながるRDFデータを操作して情報を抽出するツール.

例: 全資料情報から同じ作品名がついた資料はどのくらいあるか.

全てのRDFデータから作品の内容が記述された作品RDFデータを抽出

作品RDFデータから,作品名のみを抽出

重複する作品名数を計算し,結果を返す

上位20件の重複タイトル

作品名の傾向がわかる

Page 28: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

17

16万件の情報から技法・材質を抽出リトグラフを含む表記,282種類を発見

Page 29: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

18

LODは分野を越えてあらゆる情報をつなげて使える情報基盤

統合リソース

dc:references(参照情報)

dc:references(参照情報)

dc:references(参照情報)

dc:references(参照情報)

dc:references(参照情報)

ウィキペディアのフジタの情報

博物館・美術館フジタの作品情報

シソーラスにあるフジタの情報

フジタに関する本・論文

国立国会国会図書館フジタ著の書籍

dc:title(タイトル)

dc:creator(作家名)

dc:medium(素材)

dc:title(タイトル)

rda2:(dateofbirth(生年)

crm:P100I_died_in(没年)

owl:sameAs(同定)

dc11:title(タイトル)

foaf:name(所蔵館)

dcterms:title(タイトル)

dcterms:creator(作者名)

dcndl:price(価格)

foaf:name(出版社)

LODAC参照リソース

LODAC参照リソース

DBpediaの参照リソース

CiNiiの参照リソース

NDLサーチの参照リソース

作者に関する情報をLODAC視点で統合

統合リソース

作品に関する情報をLODACの視点で統合

lodac:creates(作品)

LODAC MuseumはLODで芸術・文化をキーにあらゆる分野とのリンクを試みる試験システム

Page 30: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

18

LODは分野を越えてあらゆる情報をつなげて使える情報基盤

統合リソース

dc:references(参照情報)

dc:references(参照情報)

dc:references(参照情報)

dc:references(参照情報)

dc:references(参照情報)

ウィキペディアのフジタの情報

博物館・美術館フジタの作品情報

シソーラスにあるフジタの情報

フジタに関する本・論文

国立国会国会図書館フジタ著の書籍

dc:title(タイトル)

dc:creator(作家名)

dc:medium(素材)

dc:title(タイトル)

rda2:(dateofbirth(生年)

crm:P100I_died_in(没年)

owl:sameAs(同定)

dc11:title(タイトル)

foaf:name(所蔵館)

dcterms:title(タイトル)

dcterms:creator(作者名)

dcndl:price(価格)

foaf:name(出版社)

LODAC参照リソース

LODAC参照リソース

DBpediaの参照リソース

CiNiiの参照リソース

NDLサーチの参照リソース

作者に関する情報をLODAC視点で統合

統合リソース

作品に関する情報をLODACの視点で統合

lodac:creates(作品)

目的語

主語

述語主語述語目的語

述語

目的語

LODAC MuseumはLODで芸術・文化をキーにあらゆる分野とのリンクを試みる試験システム

Page 31: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

18

LODは分野を越えてあらゆる情報をつなげて使える情報基盤

統合リソース

dc:references(参照情報)

dc:references(参照情報)

dc:references(参照情報)

dc:references(参照情報)

dc:references(参照情報)

ウィキペディアのフジタの情報

博物館・美術館フジタの作品情報

シソーラスにあるフジタの情報

フジタに関する本・論文

国立国会国会図書館フジタ著の書籍

dc:title(タイトル)

dc:creator(作家名)

dc:medium(素材)

dc:title(タイトル)

rda2:(dateofbirth(生年)

crm:P100I_died_in(没年)

owl:sameAs(同定)

dc11:title(タイトル)

foaf:name(所蔵館)

dcterms:title(タイトル)

dcterms:creator(作者名)

dcndl:price(価格)

foaf:name(出版社)

LODAC参照リソース

LODAC参照リソース

DBpediaの参照リソース

CiNiiの参照リソース

NDLサーチの参照リソース

作者に関する情報をLODAC視点で統合

統合リソース

作品に関する情報をLODACの視点で統合

lodac:creates(作品)

目的語

主語

述語主語述語目的語

述語

目的語

LODAC MuseumはLODで芸術・文化をキーにあらゆる分野とのリンクを試みる試験システム

主語 述語 主語目的語述語

目的語

Page 32: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

19

次世代の情報流通基盤 = Linked Open Dataユーザーが自由に情報を参照し,

それぞれの視点で新たな価値与え,それを流通させることができる

オープンなプラットフォーム

情報をLODで公開することで既存の範囲を超えた情報活用に期待できる

すでに大量の情報を蓄積するサイトは

Page 33: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

20

LODの普及による文化・芸術分野への貢献

博物館A 博物館B 博物館C 美術館A 美術館B 美術館C

作者情報をLODで出します!

作品情報をLODで公開

名前と生没年

のみでもOK?

作者と展覧会情報のLOD

作者情報のLOD

作品名と作者名のLOD

RDFデータの公開

各館固有の所蔵資料情報

Page 34: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

20

LODの普及による文化・芸術分野への貢献

博物館A 博物館B 博物館C 美術館A 美術館B 美術館C

作者情報をLODで出します!

作品情報をLODで公開

名前と生没年

のみでもOK?

作者と展覧会情報のLOD

作者情報のLOD

作品名と作者名のLOD

RDFデータの公開

各館固有の所蔵資料情報

研究者X

作者名と生没年を集めて統

合しよう

作品情報を集めてみよう

学芸員A

Page 35: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

20

LODの普及による文化・芸術分野への貢献

博物館A 博物館B 博物館C 美術館A 美術館B 美術館C

作者情報をLODで出します!

作品情報をLODで公開

名前と生没年

のみでもOK?

作者と展覧会情報のLOD

作者情報のLOD

作品名と作者名のLOD

RDFデータの公開

各館固有の所蔵資料情報

研究者X

作者名と生没年を集めて統

合しよう

作品情報を集めてみよう

学芸員A

研究者Y

作品情報と作者情報を統合

美術館・博物館が公開したRDFから作った作者名典拠情報

博物館・美術館は各館が情報をLODで公開するだけで

典拠情報を使える

美術館・博物館の公式な情報から作った人物名LOD

美術館・博物館の公式な情報から作った作品情報LOD

Page 36: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

直接情報を参照する

タイトル カフェにて @ja技法 http://○×.jp/123作者名 http://▲■.jp/abc・・・ …

タイトル カフェにて技法 油彩作者名 藤田嗣治生年月日 1886年

主語

述語メタデータ

目的語

21

LODの普及による芸術・文化分野への貢献

美術館・博物館が公開したRDFから作った作者名典拠

美術館・博物館が公開したRDFから作った専門用語辞書http://○×.jp/

インターネット

資料情報データベース

http://▲■.jp/

管理データベース上は典拠になる用語や作者名のアドレスを指定する

Webで見せるときは必要な項目を人が見られる形で公開

Page 37: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

直接情報を参照する

タイトル カフェにて @ja技法 http://○×.jp/123作者名 http://▲■.jp/abc・・・ …

タイトル カフェにて技法 油彩作者名 藤田嗣治生年月日 1886年

主語

述語メタデータ

目的語

21

LODの普及による芸術・文化分野への貢献

美術館・博物館が公開したRDFから作った作者名典拠

美術館・博物館が公開したRDFから作った専門用語辞書http://○×.jp/

インターネット

資料情報データベース

http://▲■.jp/

管理データベース上は典拠になる用語や作者名のアドレスを指定する

Webで見せるときは必要な項目を人が見られる形で公開

LODとして,自由使える典拠情報の存在は…

・館ごとに異なる表記をひとつの形式に合わせることができる・自前で情報を作らなくてすむ・作者をキーに作品がどこにあるか横断的に探せる = 展覧会で借りる作品の所蔵館がすぐわかる = 関連情報から文献や書籍など見つけることができる・一般ユーザも情報が使える. = 未知の使い方により分野に活性化をもたらす起爆剤の可能性も.

Page 38: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

直接情報を参照する

タイトル カフェにて @ja技法 http://○×.jp/123作者名 http://▲■.jp/abc・・・ …

タイトル カフェにて技法 油彩作者名 藤田嗣治生年月日 1886年

主語

述語メタデータ

目的語

21

LODの普及による芸術・文化分野への貢献

美術館・博物館が公開したRDFから作った作者名典拠

美術館・博物館が公開したRDFから作った専門用語辞書http://○×.jp/

インターネット

資料情報データベース

http://▲■.jp/

管理データベース上は典拠になる用語や作者名のアドレスを指定する

Webで見せるときは必要な項目を人が見られる形で公開

LODとして,自由使える典拠情報の存在は…

・館ごとに異なる表記をひとつの形式に合わせることができる・自前で情報を作らなくてすむ・作者をキーに作品がどこにあるか横断的に探せる = 展覧会で借りる作品の所蔵館がすぐわかる = 関連情報から文献や書籍など見つけることができる・一般ユーザも情報が使える. = 未知の使い方により分野に活性化をもたらす起爆剤の可能性も.

LODAC Museumでは作者名の人物名や作品情報を名寄せしたしかし

根拠となる情報を持つ文化施設・機関が主体に基盤情報の整備を進めることが最適

書籍や記録などの関連情報も整備することで自然にMLAがリンクする

Page 39: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

22

1.分散する情報をデータとして使えるようにするまとめ

・2011年は80館から情報を収集し,39館の情報をRDF化,LODで公開

・Web上の情報の収集からデータ化までのプロセスを見直した

課題

・RDFデータ作成時に使用したメタデータを容易に把握,修正出来る,

 メタデータ管理の方法とそのシステム部分を考えていく必要がある

地方自治体の博物館・美術館: 39館 (計53館)資料データ数 : 60,629件 (計 16,3725件)

Think!

1.ウェブサイト 2.データ収集 3.機械処理変換 4.JSONファイル 5.メタデータマッピング

6.RDF作成 7.RDFストアに格納・蓄積

8.LOD公開

Page 40: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

23

2.どのような情報があるのか,関連情報を含めて把握する

・LODAC Museumでは5種類の情報を統合,「作品・資料」,「作者」,「書誌」,「所蔵館」,「地理・地名」

・SPARQLを使う事で,作品・資料の特定の技法表記抽出や,  統計的に情報を把握できるようになった

課題・現在のLODAC Museumにある関連情報の大半は,LODACが作成したLODであることから,他で作成されたLODとのリンク,統合を試みる.

Page 41: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

24

3.把握した情報から,芸術・文化情報の現状と問題点を整理し,

4.問題の解決を試みる

問題提起・博物館・美術館資料には,作品・資料記述における表記ゆれ,異なる記法が多くみられ,LODを利用した芸術・文化の基盤情報整備が必要.

・作者名典拠の整備などは複数の文化施設・機関の協力が必要 (LODACの情報はWebから収集しているため専門分野での利用には難しい)

・LODで情報を公開したくなるための具体的なモデルケースを増やす

Page 42: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

25

5.インターネット利用者が公開された情報を使い,利用者側の視点で自由に情報を活用できる仕組みを構築する

・LODでユーザーが自由に情報を活用できる試験システム,LODAC Museumを構築した.

課題・LODとして使える情報を集約したサイトなど,自由に使える情報が何かを整備していく必要がある

・ユーザが手軽に情報をつなぎ合わせてコンテンツを作れるなど, 新しいWebの使い方や提案を検討

Page 43: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

26

6.構築した仕組みを使って情報をアプリケーションに実装し, 仕組みが機能することを実証する

Linked Open Dataによる博物館情報および地域情報の連携活用

Page 44: じんもんこん2011「芸術・文化情報のLinked Open Data普及に向けた現状と課題」

LODAC Project