ipt2の基本操作ガイド · 2017. 6. 23. · •ipt2とは何か •ipt2の導入...
TRANSCRIPT
-
IPT2の基本操作ガイド導入と個人利用
GBIF日本ノードJBIF
大澤剛士・戸津久美子
更新日:2017/4/4
http://www.gbif.jp/v2/
-
生物多様性データメタデータ IPT2(データ管理システム)
DwC / DwC-A
IPT2を使って生物多様性データをDarwin Core Arhiveに再整備する
z
オープンデータ化データペーパー執筆
この資料の目的
-
• IPT2とは何か
• IPT2の導入
•基本的な使い方
•Darwin Core Archiveの作り方
•データ公開(publish)とデータペーパー化
•付属資料
目次
-
• IPT2とは何か
• IPT2の導入
•基本的な使い方
•Darwin Core Archiveの作り方
•データ公開(publish)とデータペーパー化
•付属資料
-
‣ 生物多様性データをDarwin Coreに対応させる
‣ データとメタデータを一括管理する
‣ 世界中のIPT2とデータを共有する
‣ データペーパー作成の補助を行う
Integrated Publication Toolkit ver.2
GBIF公式のデータ管理システム
IPT2とは何か
主な機能:
⇒ここでは扱わない
-
‣ OS非依存で利用可能
‣ オープンソースソフトウェア
‣ 様々な拡張機能が用意されている
IPT2とは何か
Integrated Publication Toolkit ver.2
ソフトとしての特長:
-
生物多様性データ・標本等・種名リスト・観察情報
そのデータの説明(メタデータ)
Darwin Core
(DwC)
Ecological Metadata
Language (EML)
•テキスト形式•項目が標準化•拡張項目も多数
• XML形式•拡張性が極めて高い
生物多様性データの標準形式
-
データとメタデータをまとめてzipで圧縮⇒Darwin Core Archive(DwC-A)
Darwin Core Archive
生物多様性データの標準形式
生物多様性データ・標本等・種名リスト・観察情報
そのデータの説明(メタデータ)
-
‣ IPT2を使えば、誰でも簡単にDarwin
Core Archiveを作ることができます
IPT2とは何か
Integrated Publication Toolkit ver.2
-
IPT2とは何か
Integrated Publication Toolkit ver.2
使いどころ:
‣ ファイルサイズの大きいデータを
管理したい
‣ データとメタデータを一体で管理
したい(DwC-Aにしたい)
たとえばエクセル
IPT2に移行
-
• IPT2とは何か
• IPT2の導入
•基本的な使い方
•Darwin Core Archiveの作り方
•データ公開(publish)とデータペーパー化
•付属資料
-
• IPT2の簡単な説明や関連文書が集まっている
• 現行バージョンがダウンロードできる
• リリース情報と、過去バージョンも入手可
etc…
GBIF webからダウンロード(http://www.gbif.org/ipt)
IPT2の導入
-
• 開発情報が集まっている
• 最新版も過去版もβ版もダウンロードできる
• オープンソースなので、ソースコードも入手できる
• バグ等の報告もできる
etc…
Githubにあるプロジェクトページ(https://github.com/gbif/ipt)
IPT2の導入
知識のあるあなたは
-
• ネットへの接続(厳しいファイアウォール等はないほうがいいかも)
• 256MB以上のメモリ
•本体20MB+データ分のディスク容量
• Javaプラットフォーム (最新版がよいが、version 5以降なら問題なく動作する)
•サーブレットコンテナ (TomcatとかJettyとか)
PCへ導入する際の要件
IPT2の導入
-
• Javaサイト側で利用可能なバージョン、タイプを判定してくれるので、従うのが簡単
• あとはガイドに従って導入する
1. Java プラットフォームの導入(https://java.com/ja/)
IPT2の導入
-
•バージョン6以降をダウンロード (8.x以上を推奨)
• Tomcatをインストール (設定は全てデフォルトで問題なし)
• Tomcat serverを立ち上げる
2. サーブレット環境の設定(例:Tomcat) (http://tomcat.apache.org/)
IPT2の導入
-
Tomcatのインストール画面
Next Next Next…
IPT2の導入
-
Tomcat Serverの立ち上げ
Tomcatを開始するにはStartボタンをクリック(Configure Tomcat)
IPT2の導入
Tomcatを停止するにはStopボタンをクリック(IPT2の再インストール
・アップグレード時に必要な操作 後述)
-
•先のwebページから最新版をダウンロードipt-x.x.war (x.x.はバージョン情報)
• ダウンロードしたwar ファイルの名前を変える(例えばipt.warとかが使いやすい)
•名前を変えたwarファイルを Tomcatディレクトリにデプロイする
3. IPT2 のインストール
IPT2の導入
-
•先のwebページから最新版をダウンロードipt-x.x.war (x.x.はバージョン情報)
IPT2の導入
インストール手順
-
ファイル名を適当なものに変更
インストール手順
IPT2の導入
• ダウンロードしたwar ファイルの名前を変える(例えばipt.warとかが使いやすい)
-
Tomcatの“webapps” ディレクトリに名前を変えたwarファイルをコピーする
インストール手順
IPT2の導入
•名前を変えたwarファイルを Tomcatディレクトリにデプロイする
ex) C:/Program Files (x86)/Apache Software Foundation/Tomcat 8.0/webapps
-
インストール手順
IPT2の導入
•名前を変えたwarファイルを Tomcatディレクトリにデプロイする
Tomcatの“webapps”ディレクトリ内にファイル名と同じディレクトリ(例.ipt)が出来ていれば成功!
-
•適当なブラウザ(firefoxとか)を立ち上げ、URLに次を入れる(http://localhost:8080/ipt)
この画面が出たら無事に動作しています
IPT2の導入
IPT2の立ち上げ
-
1. 入れ替えたいバージョンのiptファイルを入手し、名前を変更する(導入時と同じファイル名)
2. Tomcatを停止する
3. 先ほどデプロイしたwebappsディレクトリからwarファイルとディレクトリを削除する
4. Webappsディレクトリに新しいiptファイルをコピーする(デプロイ)
5. Tomcatを開始する
IPT2の導入
IPT2の再インストール/アップグレード手順
※ ipt2を入れ替えてもデータはそのまま引き継がれますが念のためデータディレクトリのバックアップをとりましょう
-
• IPT2とは何か
• IPT2の導入
•基本的な使い方
•Darwin Core Archiveの作り方
•データ公開(publish)とデータペーパー化
•付属資料
-
License agreement
(チェック必須)
データディレクトリの設定(任意のディレクトリを指定)
ex) C:/ipt2data
基本的な使い方
初期セットアップ
-
個人設定を入力(グループ利用なら個人が特定できるように。完全な個人利用なら適当でよい)
“Test” モードを選択
Save!
基本的な使い方
初期セットアップ
-
これでセットアップは完了です。
Continueを選んで利用画面に
基本的な使い方
初期セットアップ
-
基本的な使い方
4つの基本画面
※ Test modeで設定したので赤いマークが出ていますが、利用上は全く問題ありません。
-
基本的な使い方
ログイン、ログアウト、言語の選択
※日本語も選択できますが、全ての画面で翻訳が済んでいるわけではないので、以降の解説も英語画面で行います。
-
• IPT2とは何か
• IPT2の導入
•基本的な使い方
•Darwin Core Archiveの作り方
•データ公開(publish)とデータペーパー化
•付属資料
-
Darwin Core Archiveの作り方
扱えるデータ
•生物種の在のみデータを想定
• csv(テキスト)ファイルになっている
•日本語は含めず、英語で統一
•文字コードはUTF-8で統一
• ヘッダの項目は任意
データのイメージ
-
Manage Resources画面
DwC-Aの作成は、Manage Resource画面から行う
Darwin Core Archiveの作り方
-
Shortname
(任意で自分がわかるもの)
Type: Occurrence(在データ)
Create!
Darwin Core Archiveの作り方
-
準備した実験データを選択Addボタンを押す
Darwin Core Archiveの作り方
-
データの基本項目をチェック“Character Encoding”は UTF-8
Save!
Darwin Core Archiveの作り方
-
Darwin Core Archiveの作り方
正しく読み込まれているか確認(レコード数「● rows」)
問題なかったらMappingsへDarwin Core Occurrenceを選択して Add
-
手元データの項目をDwCに対応させること
Darwin Core項目
genus
family
scientificName
手元データの項目
Genus name
Family name
Species name
MappingMappingとは?
-
今回のデータは在データなので“occurrence”で問題ない“Save”
Darwin Core Archiveの作り方
-
Darwin Core
項目
ここで手元データの項目を選択し、DwCに対応させる
Darwin Core Archiveの作り方
※必須項目以外は、全て対応させる必要はない
-
画面の最下部には、まだMappingされていない項目が表示されている。
Darwin Core Archiveの作り方
事前にデータ項目をDwCと同じにしておくとオートマッピングしてくれるので楽
-
必要な項目のMappingが終わったら “Save” して “Back”
Darwin Core Archiveの作り方
-
Darwin Core Archiveの作り方
Mappingされた項目数が表示される「● items mapped to…」→間違いないか確認問題なければ、生物データのDwC化は完了
-
ここからメタデータ作成Metadataの“Edit” を押す
Darwin Core Archiveの作り方
-
Darwin Core Archiveの作り方
様々なメタデータ項目これを順次入力していく
-
例:メタデータ項目の地理情報地図上で調査地を設定できる
Darwin Core Archiveの作り方
必要なメタデータを全て入力したら上のManage Resourcesボタンを押す
-
メタデータで入力したデータタイトル
Darwin Core Archiveの作り方
Manage Resourceトップ画面で入力したデータセットが表示される
データセットを選択すると再び編集画面に入れる
-
生物データのDwC化とメタデータの作成が完了!
Darwin Core Archiveの作り方
-
その下にある “Preview”を押す
Darwin Core Archiveの作り方
-
データセット(生物データ+メタデータ)の全体像を見ることができる
Darwin Core Archiveの作り方
※ Downloadというボタンがあるが、この時点では使えない
-
• IPT2とは何か
• IPT2の導入
•基本的な使い方
•Darwin Core Archiveの作り方•データ公開(publish)とデータペーパー化
•付属資料
-
Manage Resourcesの編集画面Metadataの下にあるPublishボタン
これを押すことで、データセットが完成してデータがインターネット上に公開される(注意:今回は個人利用なので、Publishしてもデータはインターネット上に公開されない。データセットの完成だけ)
データ公開(publish)とデータペーパー化
-
データセットの完成以後、編集をした場合はバージョン番号が付与され、別バージョン扱いになる
データ公開(publish)とデータペーパー化
-
完成したデータ( DwC-Aファイルやメタデータ)はプレビュー画面からダウンロードできる
データ公開(publish)とデータペーパー化
-
メタデータ(EML) を開いた例
データ公開(publish)とデータペーパー化
-
RTFというボタンを押すと、メタデータをデータペーパーっぽい形式に整理したRTFファイルが取得できる
⇒データペーパーはこれをベースに準備
データ公開(publish)とデータペーパー化
-
• IPT2とは何か
• IPT2の導入
•基本的な使い方
•Darwin Core Archiveの作り方
データをDarwin Core & Darwin Core Archiveに整理する
•データ公開(Publish)とデータペーパー化
•付属資料
-
今回は標本等の「在」データを扱ったが、種名リストや生態学データも扱うことができる
付属資料
-
ここから様々なDarwin Coreの拡張項目(遺伝子、画像等)を追加できる
付属資料
-
GBIF日本ノードJBIF
http://www.gbif.jp/v2/
・各種GBIF発行ドキュメントの和訳版・DwC項目の概説、フォーマットチェッカー・IPT2マニュアルの和訳版など
付属資料
-
その他役立ちそうな情報
・GBIF community site, IPT interest group(http://community.gbif.org/pg/groups/3529/gbif-ipt-interest-group/)
・Video: How to install the GBIF IPT(https://vimeo.com/116142276)
・Paper from PLOS ONE【The GBIF Integrated Publishing Toolkit: Facilitating the Efficient Publishing of Biodiversity Data on the Internet】(http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0102623)
付属資料