塩基配列解析のための データベース・ウェブツール - github...2015/09/25 ·...
TRANSCRIPT
![Page 1: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/1.jpg)
ライフサイエンス統合データベースセンター (DBCLS) 内 藤 雄 樹
塩基配列解析のための データベース・ウェブツール
Tweet OK 統合データベース講習会 AJACS伊予
![Page 2: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/2.jpg)
自己紹介■ 内藤 雄樹(ないとう ゆうき) @meso_cacase ■ ライフサイエンス統合データベース センター(DBCLS) 特任助教 ■ 過去に RNAi メカニズム等の研究 siRNA設計サイト: siDirect 公開
活性が高く、オフターゲット 効果の少ないsiRNAを設計
![Page 3: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/3.jpg)
siRNA設計 : siDirect検索
![Page 4: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/4.jpg)
![Page 5: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/5.jpg)
遺伝子に関する データベースの基礎
■ 遺伝子名などキーワードで探す■ 遺伝子のさまざまなIDとは?■ 塩基配列から遺伝子を探す
![Page 6: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/6.jpg)
遺伝子をさがす 基礎・NCBI Entrez http://www.ncbi.nlm.nih.gov/ (または NCBI でググる)
![Page 7: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/7.jpg)
絞り込み・検索窓にキーワードを追加していく ... AND “Homo sapiens”[Organism] ... AND Vimentin[Gene Name] ... AND patent[Title] ・または、Advanced searchに行く
![Page 8: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/8.jpg)
遺伝子の ID とは?
■ Accession Number ■ RefSeq ID ■ Gene ID ■ Symbol (遺伝子名)
![Page 9: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/9.jpg)
Accession Number・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID ・A12345 や AB123456 の形をしている ・A12345.1 のようにバージョンを表示。 UTRが延長されたりエラーが修正されて A12345.2 のようにアップデートされる ・GenBankのAccessionと呼ばれることも...
![Page 10: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/10.jpg)
RefSeq ID・三大データバンクの配列を元にtranscript ごとに1個登録 → RefSeq データベース (遺伝子の百科事典のようなもの) ・選択的スプライシングで生じるvariant には別々のIDが付与されている ・NM_012345.6 の形式をしている。 広義には(実用上は)Accession番号の一種
![Page 11: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/11.jpg)
Symbol, Gene ID・遺伝子ごとに付与される遺伝子名と番号
慣用名 Symbol Gene IDヒトcadherin CDH1 999マウスcadherin Cdh1 12550ラットcadherin Cdh1 83502
・Symbolは慣用名と一致しないこともあり (ヒトp53 → TP53)種でダブる可能性も ・Gene ID は生物種と遺伝子を特定できる
![Page 12: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/12.jpg)
それぞれの関係
NM_001190326NM_022720
RefSeq ID:
Gene ID: 54487Symbol: DGCR8
ヒト Chr22 (q11)
transcriptごと
遺伝子(locus)ごと(塩基配列ごと)
![Page 13: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/13.jpg)
配列から遺伝子をさがす ・NCBI BLAST http://www.ncbi.nlm.nih.gov/BLAST/ (または BLAST でググる)
・UCSC BLAT http://genome.ucsc.edu/ → BLATへ (または BLAT でググる)
![Page 14: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/14.jpg)
Reference RNA sequence (refseq_rna)
![Page 15: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/15.jpg)
生物種を選択
![Page 16: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/16.jpg)
遺伝子データベースの検索■ 検索ワードが多様(遺伝子名, ID, 遺伝子機能, タンパクのドメイン名, 疾患, 塩基配列, アミノ酸配列, ....) → 入口が異なる。知らないと探せない ■ BLAST 等による塩基配列の検索 → 検索が遅い
![Page 17: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/17.jpg)
Googleのように探せれば...
![Page 18: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/18.jpg)
統合遺伝子検索GGRNA検索
ぐ ぐ る な
![Page 19: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/19.jpg)
遺伝子名で検索
RefSeqの転写産物・mRNA (NM_, XM_)・ncRNA (NR_, XR_)
![Page 20: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/20.jpg)
遺伝子名で検索
![Page 21: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/21.jpg)
Accession番号で検索
![Page 22: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/22.jpg)
塩基配列で検索
![Page 23: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/23.jpg)
塩基配列で検索
![Page 24: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/24.jpg)
塩基配列で検索
![Page 25: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/25.jpg)
アミノ酸配列で検索
Schaefer et al. (1999) IV. Wilson’s disease and Menkes disease.Am. J. Physiol. Gastrointest. Liver Physiol. 276, G311-G314
←何?
![Page 26: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/26.jpg)
PCRのプライマー
M cDNA
RT(-)
ヒトのある遺伝子に対してRT-PCRをかけようとしたらなぜかバンドが2本・・・
増幅遺伝子は何か?予想されるバンドのサイズは?
primer-F: agctcattactttatcagtgca
primer-R: tgacgtattcactcttctggtt
585
955
341258
※架空のデータです
![Page 27: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/27.jpg)
マイクロアレイのプローブID
...CCCGGGACAGAAGTGCGGCACCAGGGCAGGAGCTGCAGTAG... AGAAGTGCGGCACCAGGGCAGGAGC AGAAGTGCGGCAGCAGGGCAGGAGC
Affymetrix社GeneChipマイクロアレイ 1遺伝子につき25塩基 × 11箇所のプローブ →「プローブセット」例) 1552311_a_at
mRNA5′ 3′
× × × × × × ×× × × ×
← PM probe ← MM probe
これをまとめて 1つの値にする
![Page 28: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/28.jpg)
マイクロアレイのプローブID
![Page 29: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/29.jpg)
統合遺伝子検索GGRNA■ 遺伝子をGoogleのように検索 ■ 検索対象はRefSeqの転写産物 (mRNA, ncRNA) ■ さまざまなキーワードに対応 ■ 塩基配列、アミノ酸配列も素早く検索 (とくに短い配列の検索が得意)
Naito & Bono, GGRNA: an ultrafast, transcript-oriented search engine for genes and transcripts. Nucleic Acids Res. 40, W592-6 (2012)
ぐ ぐ る な
![Page 30: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/30.jpg)
高速配列検索GGGenomeげ げ げ
検索
![Page 31: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/31.jpg)
高速配列検索GGGenomeげ げ げ
![Page 32: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/32.jpg)
GGRNA REST API
GGGenome REST APIhttp://GGGenome.dbcls.jp/db/k/sequence[.format][.download]
http://GGRNA.dbcls.jp/spe/query+string[.format][.download]
■ 検索結果とURLとが1対1対応 ■ テキスト形式やJSON形式でも出力
![Page 33: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/33.jpg)
GGGenome REST API
![Page 34: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/34.jpg)
表計算ソフトでGGGenome
■ 検索結果とURLとが1対1対応 ■ テキスト形式やJSON形式でも出力
![Page 35: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/35.jpg)
ヒットをゲノムブラウザ上に表示
![Page 36: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/36.jpg)
高速配列検索GGGenome■ 塩基配列の検索に特化 (1kb 以下、短い配列が得意) ■ 約200種のゲノムおよび転写産物 ■ ミスマッチ・ギャップに対応 ■ REST API が便利 R, Ruby, Galaxy でゲゲゲノム検索
げ げ げ
![Page 37: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/37.jpg)
CRISPRターゲット配列設計■ NGGに隣接する20塩基を選択 ■ オフターゲットの少ない配列を選択 → CRISPRdirect を公開
Naito, Hino, Bono & Ui-Tei, CRISPRdirect: software for designing CRISPR/Cas guide RNA with reduced off-target sites. Bioinformatics, 31, 1120-1123 (2015)
![Page 38: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/38.jpg)
CRISPRdirect
+マーモセット、 ブタ、カイコ、 ソルガム
![Page 39: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/39.jpg)
CRISPRdirect
![Page 40: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/40.jpg)
■ NGGに隣接する20塩基を選択 ■ ゲノムのほかの領域とは塩基配列が 一致せず、標的とする部位とだけ 完全一致する配列を選択 ■ とくにPAM近傍の12merまたは 8merの特異性を重視
CRISPRdirect
Naito, Hino, Bono & Ui-Tei, CRISPRdirect: software for designing CRISPR/Cas guide RNA with reduced off-target sites. Bioinformatics, 31, 1120-1123 (2015)
![Page 41: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/41.jpg)
One more thing ...
![Page 42: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/42.jpg)
テキスト比較ツール difff《デュフフ》ver.6
“ 下の枠に比較したい文章を入れてくだちい。差分 (diff) を表示します ”
■ difff《デュフフ》とは?→ DEMO ■ 開発の経緯 ・論文執筆(推敲)を効率化したい ・とくに共著者の修正をすばやく確認したい ・(はじめての)ウェブツールを書いてみたい ■ difff《デュフフ》のしくみ ・UNIXのdiffコマンドを利用
![Page 43: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/43.jpg)
Is this a pen?!??!
■ difff《デュフフ》のしくみ ・UNIXのdiffコマンド(行ごとに比較)を利用
・改行を挿入 → diffコマンド ・ただし一時ファイルは作成しない ・クエリのログも取らない
テキスト比較ツール difff《デュフフ》ver.6
“ 下の枠に比較したい文章を入れてくだちい。差分 (diff) を表示します ”
![Page 44: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/44.jpg)
■ なんで《デュフフ》と読むの? ・diff file → difff(ディフ・エフ)→ デュフフw
テキスト比較ツール difff《デュフフ》ver.6
“ 下の枠に比較したい文章を入れてくだちい。差分 (diff) を表示します ”
![Page 45: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/45.jpg)
■ difff《デュフフ》の便利機能 ・文字数・単語数のカウント ・モノクロ印刷モード ・ひとつのHTMLに保存。再開も可能 ・結果を公開(3日間限定)
テキスト比較ツール difff《デュフフ》ver.6
“ 下の枠に比較したい文章を入れてくだちい。差分 (diff) を表示します ”
![Page 46: 塩基配列解析のための データベース・ウェブツール - GitHub...2015/09/25 · Accession Number ・GenBank/EMBL/DDBJ 国際塩基配列 データベースに登録された塩基配列のID](https://reader036.vdocuments.net/reader036/viewer/2022071218/604f6ee14838855fe00c7888/html5/thumbnails/46.jpg)
ありがとうございました
← 昨年12月発行 生命科学研究を支える 便利なデータベースやツール 約100個を簡潔に紹介