33rd mtg in nibio

26
2014/6/19 33回統合DBミーティング Integrated MTG in NIBIO 2014/6/19 1

Upload: maori-ito

Post on 14-Jul-2015

109 views

Category:

Science


4 download

TRANSCRIPT

2014/6/19

第33回統合DBミーティングIntegrated MTG in NIBIO

2014/6/19 1

本日の予定

• Sagace

– アンケート解析結果

– 追加するDBについて

– 新規ファセット分類と項目について

– UI修正について

– 日本国外のDB導入の是非について

– 進捗報告

• 医薬基盤研内のデータのRDF化

– 進捗報告

2

アンケート解析結果

• 下記のユーザーに着目して解析

• Sagaceを知っていた vs知らない

• リピーター vs使用0回

3

知っていた vs知らない所属

0

5

10

15

20

25

30

研究機関 大学 企業 その他:

知っていた

知らなかった

4

知っていた vs知らない分野

0

2

4

6

8

10

12

14

16

18

20

医学系 薬学系 工学系 情報系 理学系 農学系 その他:

知っていた

知らなかった

5

知っていた vs知らないWET : DRY

0

2

4

6

8

10

12

14

16

18

20

0 : 10 1 : 9 2 : 8 3 : 7 4 : 6 5 : 5 6 : 4 7 : 3 8 : 2 9 : 1 10 : 0

知っていた

知らなかった

WETDRY

6

知っていた vs知らない生物種

0

5

10

15

20

25

30

知っていた

知らなかった

7

リピーター vs検索0回サービスを知った理由

0

2

4

6

8

10

12

リピーター

検索0回

8

今後の宣伝方針

• 特に大学で医学系,実験系の方にもっと使って頂けるように宣伝する。

• 知名度を上げるために,学会等での宣伝は効果的だが,実際に使ってもらうためには関係者が直接宣伝するのが効果的。

9

リピーター vs検索0回各評価項目の平均値

0

0.5

1

1.5

2

2.5

3

3.5

4

リピーター

リピーター以外

10

リピーター vs検索0回考察

• 全般的にリピーターの方が評価が低い。

• リピーターの傾向–平均ではファセットが低い

–個々のデータでは,速度とファセットは中央に分布が偏り,精度については評価がわかれている。

11

追加候補のDBについて

ファセット分類/データベース名

FANTOM5 伝統医薬データベース

データベースの種類

その他のデータベース

その他のデータベース

生物種 ヒト,動物(ヒト以外) 植物

生体の階層 ゲノム・遺伝子 ゲノム,遺伝子,化合物,個体

分類 B A

12

新規ファセット分類とその項目について

• データベースの分類に移動,追加–生体の階層から移動

• 化合物

• 細胞・組織

–新規追加

• レギュレーション・ガイドライン

• 研究者

13

データベースの分類に全て追加すると…

• 研究者→ Pending

• 生物資源

• 細胞・組織

• 化合物

• 特許

• 実験プロトコル

• 文献・用語集・辞書

• レギュレーション・ガイドライン

14

• 分類を生体の階層から医薬品に変更

• 含まれる項目の是非–化合物

–漢方薬

–薬効・効能

–副作用・有害情報

–臨床試験

新規ファセット分類とその項目について

15

UIの修正について

16

日本国外のデータベース導入の是非

• 背景–これまで国内の研究者と国内のデータベースのマッチングを重視するために,国内DBを検索対象

–これまで実施したアンケートで度々国外のDB

の追加の希望が寄せられていた。

17

国外DB追加のPros

• ユーザーの要望に応えられる。

• ファセットと上手く組み合わせれば,国内と国外のDBのエントリ内容を比較できる。

• メタデータが導入されたDBの内容を反映できる。

18

国外DB追加のCons

• 現状,NBDCでクローリングしている国外DBは22個のみで,カタログの網羅性が確保されるまでは増える可能性は低い。

• 国外DBにおいて,創薬疾患関連のDBのインデックスは,NIBIOで作成してその意義を示すことが必要か。

19

提案

• 方針1–これまで通り,国内のみ

• 方針2–現状,NBDCがインデックスしているDBのう

ち有用そうなもののみ追加をして,様子を見る。

–国内と国外で比較したいDBが見つかった場合にインデックスの作成&追加を検討する。

20

進捗報告

• NBDCと共同で新規検索エンジンの調査をすることに–テスト項目の作成

• NBDC生命科学データベース横断検索のUIが更新(SagaceのUIがベース)

• NCBNカタログデータベースにDB追加の依頼

21

Schema.orgの進捗

• RDFa, JSON-LDを正式にサポート開始。

• Googleはリッチスニペットを手動でつける場合には,microdata, microformats, RDFaのみのサポート

• 構造化データマークアップ支援ツールでは

JSON-LDを使っているらしい。– https://support.google.com/webmasters/answer/3069

489?hl=ja

22

JSON-LD

23

提案

• SagaceのJSON-LDへの対応

• Sagace用,構造化データマークアップ支援ツールの作成

24

実験動物研究資源バンクのRDF化

• MTG @ 疾患モデル小動物研究室–普段の研究では,MGI (Mouse Genome

Informatics) で完結する。

– OMIM,OMIAへのリンク,実際に創薬に使用

された例や特許へのリンクへの需要はありそう。

– OMIM,MGIとも,SPARQL endpointはある。

• →Endpointがbio2rdfなので,ライセンスの問題が解決しているか確認が必要

25

今後の予定

• トーゴーの日– 10月5日(日)?

• BioHackathon 2014

– 11月9日(日)〜14日(金)

• 分子生物学会– 11月25日(火)〜27日(木)

26