Download - 33rd MTG In NIBIO
本日の予定
• Sagace
– アンケート解析結果
– 追加するDBについて
– 新規ファセット分類と項目について
– UI修正について
– 日本国外のDB導入の是非について
– 進捗報告
• 医薬基盤研内のデータのRDF化
– 進捗報告
2
知っていた vs知らないWET : DRY
0
2
4
6
8
10
12
14
16
18
20
0 : 10 1 : 9 2 : 8 3 : 7 4 : 6 5 : 5 6 : 4 7 : 3 8 : 2 9 : 1 10 : 0
知っていた
知らなかった
WETDRY
6
今後の宣伝方針
• 特に大学で医学系,実験系の方にもっと使って頂けるように宣伝する。
• 知名度を上げるために,学会等での宣伝は効果的だが,実際に使ってもらうためには関係者が直接宣伝するのが効果的。
9
リピーター vs検索0回考察
• 全般的にリピーターの方が評価が低い。
• リピーターの傾向–平均ではファセットが低い
–個々のデータでは,速度とファセットは中央に分布が偏り,精度については評価がわかれている。
11
追加候補のDBについて
ファセット分類/データベース名
FANTOM5 伝統医薬データベース
データベースの種類
その他のデータベース
その他のデータベース
生物種 ヒト,動物(ヒト以外) 植物
生体の階層 ゲノム・遺伝子 ゲノム,遺伝子,化合物,個体
分類 B A
12
データベースの分類に全て追加すると…
• 研究者→ Pending
• 生物資源
• 細胞・組織
• 化合物
• 特許
• 実験プロトコル
• 文献・用語集・辞書
• レギュレーション・ガイドライン
14
日本国外のデータベース導入の是非
• 背景–これまで国内の研究者と国内のデータベースのマッチングを重視するために,国内DBを検索対象
–これまで実施したアンケートで度々国外のDB
の追加の希望が寄せられていた。
17
国外DB追加のCons
• 現状,NBDCでクローリングしている国外DBは22個のみで,カタログの網羅性が確保されるまでは増える可能性は低い。
• 国外DBにおいて,創薬疾患関連のDBのインデックスは,NIBIOで作成してその意義を示すことが必要か。
19
提案
• 方針1–これまで通り,国内のみ
• 方針2–現状,NBDCがインデックスしているDBのう
ち有用そうなもののみ追加をして,様子を見る。
–国内と国外で比較したいDBが見つかった場合にインデックスの作成&追加を検討する。
20
進捗報告
• NBDCと共同で新規検索エンジンの調査をすることに–テスト項目の作成
• NBDC生命科学データベース横断検索のUIが更新(SagaceのUIがベース)
• NCBNカタログデータベースにDB追加の依頼
21
Schema.orgの進捗
• RDFa, JSON-LDを正式にサポート開始。
• Googleはリッチスニペットを手動でつける場合には,microdata, microformats, RDFaのみのサポート
• 構造化データマークアップ支援ツールでは
JSON-LDを使っているらしい。– https://support.google.com/webmasters/answer/3069
489?hl=ja
22
実験動物研究資源バンクのRDF化
• MTG @ 疾患モデル小動物研究室–普段の研究では,MGI (Mouse Genome
Informatics) で完結する。
– OMIM,OMIAへのリンク,実際に創薬に使用
された例や特許へのリンクへの需要はありそう。
– OMIM,MGIとも,SPARQL endpointはある。
• →Endpointがbio2rdfなので,ライセンスの問題が解決しているか確認が必要
25