バイオインフォマティックス概論授業予定 · web view2019...

47
2019 バババババババババババババババババババ 授授授授授授授授授授授授授授授授授授授授授授授 () ババ授授授授授授授授 、。 授授授授授授授授授授授授授授授授授授授授授授授授 授授授授授授授授 授1授 10授1授 授授授授授授 Bioinformatics 授授 授授授 - 授授授 -mRNA- 授授授授授授授授授 授授(DVD) 授授授授授授授授授授授 授授授授授授授授授授授授授授授 授2授 10授8授 ババババババババ 授授授授授授授 ババババババババ 授授授 ババババ バババババ 授授授授授授 バババババババ 授授授 ババババババババババ 授授授授授授授授授授授授授 授3授 10授15授 バババババババ BLAST ババ 授授授授授授授 BLAST 授授授授授1/2 )( BLASTP 授授授授授 授授授授授-1 授授 バババババババババババババババババババババババババババ授授授授授授授 授授授授授授授授授授授授授授 授授 授授授授授授授 BAC授授授授授授授授授 授授授 BAC授授授授授授授 バババババババババババ 授授授 ババババババ 授授授授授授授授授 、( バババババババ授授 授授 (1): 授4授 10授29授 BLAST授授授授授(2 /2)( BLASTN, BLASTX, TBLASTX授授授授授-2 Whole genome shotgun sequence 授授授授授授 一: Plasmid vector授Fosmid vector 授授授授授授授授授授授授授授授授 ババババババババババババババババ 授授授授授授授授授授 de novo授授授授授ババババババババ授授授授授授授 ババババババババ 授授授授授授授授授授 () 1

Upload: others

Post on 27-Jan-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

2019 バ イ オ イ ン フ ォ マ テ ィ ッ ク ス 概 論 授 業 予 定

( 授 業 の 進 み 具 合 に よ っ て 変 更 の 可 能 性 が あ り ま す )

黒 字 は 、 講 義 に よ る 解 説 。 青 字 は ウ ェ ブ を 使 っ た 実 習 を 示 し ま す 。 黄 色 の 網 掛 け は 、 重 要 な

キ ー ワ ー ド

第 1 回 10 月 1 日 授 業 概 要 説 明

Bioinformatics と は ?

ゲ ノ ム - 遺 伝 子 -mRNA- タ ン パ ク 質 の 関 係 の 復 習 ( D V D )

さ ま ざ ま な デ ー タ ベ ー ス ・ ゲ ノ ム デ ー タ ベ ー ス に 触 れ て み る

第 2 回 10 月 8 日 配 列 デ ー タ ベ ー ス に つ い て の 解 説

配 列 デ ー タ ベ ー ス か ら の 塩 基 配 列 と ア ミ ノ 酸 配 列 の 取 り 出 し 方

配 列 エ ン ト リ ー の 見 方

次 世 代 シ ー ケ ン ス 解 析

次 世 代 シ ー ケ ン シ ン グ の 原 理

第 3 回 10 月 15日

ホ モ ロ ジ ー 検 索 ( BLAST 検 索 ) に つ い て の 解 説

BLAST 検 索 の 実 習 ( 1/2 ) ( BLASTP )結 果 の 見 方

ゲ ノ ム 解 読 - 1

「 ヒ ト 全 ゲ ノ ム 解 読 プ ロ ジ ェ ク ト ( 階 層 的 シ ョ ッ ト ガ ン シ ー ケ ン ス

法 ) 」 に つ い て の 解 説

ヒ ト ゲ ノ ム プ ロ ジ ェ ク ト の 歴 史 ・ 戦 術

連 鎖 地 図 の 作 製

BAC ラ イ ブ ラ リ ー の 作 製 、 整 列 化

BAC ラ イ ブ ラ リ ー の シ ョ ッ ト ガ ン シ ー ケ ン ス

配 列 の ア セ ン ブ リ ー 、 コ ー ド 配 列 の 予 測 ( ア ノ テ ー シ ョ ン )

宿 題 ( 1 ) : 配 布

第 4 回 10 月 29日

BLAST 検 索 の 実 習 ( 2 /2 ) ( BLASTN, BLASTX, TBLASTX )

ゲ ノ ム 解 読 - 2

Whole genome shotgun sequence一 昔 前 の 方 法 : Plasmid vector と Fosmid vector 、 蛍 光 シ ー ケ ン

サ ー を 使 っ た 配 列 解 読

次 世 代 シ ー ケ ン ス 解 析 を 使 っ た 方 法

( 配 列 情 報 の な い 生 物 の de novo シ ー ケ ン ス )

1

Page 2: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

次 世 代 シ ー ケ ン ス で 読 み 取 ら れ た リ ー ド の 情 報 処 理 ( 遺 伝 研 パ

イ プ ラ イ ン )

第 5 回 11 月 5 日 配 列 解 読 で 明 ら か に な っ た 各 種 生 物 の 遺 伝 子 レ パ ー ト リ ー

特 定 の 生 物 種 の 配 列 デ ー タ ベ ー ス を 使 っ た BLAST 検 索 ( NCBI, BLASTの ペ ー ジ か ら )

ゲ ノ ム ブ ラ ウ ザ Ensembl Genome Browser の 利 用

ゲ ノ ム 塩 基 配 列 を ゲ ノ ム デ ー タ ベ ー ス か ら 取 り 出 す

取 り 出 し た プ ロ モ ー タ ー 配 列 か ら 転 写 因 子 が 結 合 す る

Consensus配 列 を 予 測 す る

宿 題 ( 2 ) : 配 布

第 6 回 11 月 12日

タ ン パ ク 質 の 構 造 に つ い て の 解 説 ( シ グ ナ ル ペ プ チ ド 、 疎 水 ・ 親 水

性 プ ロ ッ ト 、 ド メ イ ン 構 造 )

塩 基 配 列 か ら ア ミ ノ 酸 配 列 へ の 変 換

デ ー タ ベ ー ス ( UniProt) を 使 っ て タ ン パ ク 質 の 機 能 を 調 べ る

ウ ェ ブ サ イ ト を 使 っ た タ ン パ ク 質 の 構 造 解 析 -1分 子 量 と 等 電 点 の 予 測

シ グ ナ ル ペ プ チ ド の 予 測

“ 宿 題 ( 1 ) : 提 出 ”

第 7 回 11 月 19日

ウ ェ ブ サ イ ト を 使 っ た タ ン パ ク 質 の 構 造 解 析 -2糖 鎖 結 合 部 位 の 予 測

ド メ イ ン 構 造 の 予 測

配 列 ア ラ イ メ ン ト に つ い て の 解 説

ペ ア ワ イ ズ ア ラ イ メ ン ト の 実 際

宿 題 ( 3 ) 配 布

第 8 回 11 月 26日

分 子 系 統 樹 に つ い て

多 重 配 列 ア ラ イ メ ン ト の 実 習 と 見 方 ( CLUSTALW )

分 子 系 統 樹 の 作 製

分 子 系 統 樹 か ら 分 か る こ と

ゲ ノ ム 構 造 の 変 化 と 生 物 進 化

2

Page 3: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

全 ゲ ノ ム の 重 複 、 遺 伝 子 の 重 複 と 遺 伝 子 レ パ ー ト リ ー の 増 加

オ ル ソ ロ グ と パ ラ ロ グ の 発 生

第 9 回 12 月 3 日 代 謝 経 路 デ ー タ ベ ー ス ( KEGG ) の 利 用 - 1

KEGG を 使 っ た 演 習

デ ー タ ベ ー ス を 使 っ て 、 insulin の パ ス ウ ェ ー 、 hedgehogの 細 胞 内 シ グ ナ ル 伝 達 、 dopamine の 合 成 経 路 、 合 成 部

位 、 作 用 機 序

宿 題 ( 2 ) 提 出

第 10回

12 月 10日

代 謝 経 路 デ ー タ ベ ー ス ( KEGG ) の 利 用 - 2

KEGG を 使 っ た 演 習

薬 剤 の 構 造 、 副 作 用 等 に つ い て 情 報 収 集 す る

論 文 の 構 成 、 総 説 の 内 容

研 究 計 画 立 案 、 レ ポ ー ト ・ 論 文 作 成 に必要 な 文献情 報 収 集

文献検 索 ( PubMed, 大学図書館On line journals )

EndNote に つ い て ( 文献管理 ・ 論 文 作 成 用 ソ フ ト )

第 11回

12 月 17日

ポ ス ト ゲ ノ ム 研 究 - 1 : ゲ ノ ム編集 ( 遺 伝 子編集 )技術

CRISPR/Cas9 に よ る ゲ ノ ム編集 の 原 理 (動画 を 使 っ た 説 明 )

ゲ ノ ム編集 の農学、医療へ の応用

プ ロ グ ラ ム を 使 っ て オ フ タ ー ゲ ッ ト の な い タ ー ゲ ッ ト 配 列 を設

計 す る

宿 題 (4) 配 布

“ 宿 題 (3) 提 出 ”

第 12回

12 月 2 4日

酒井先生

Blast 検 索 、 ClustalW 、 分 子 系 統 樹 の ア ルゴリ ズ ム と 原 理

第 13回

1 月 7 日 ポ ス ト ゲ ノ ム 研 究 - 2 :比較ゲ ノ ム ( Comparative Genomics )

進 化 に伴う染色体構 造 の 変 化 ( 繰り返し 配 列 の 発 生 、 シ ン テ

ニー領域)

プ ロ グ ラ ム を 使 っ て シ ン テニー を 調 べ る

3

Page 4: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

第 14回

1 月 14 日 次世代シーケンス解析-応用 1ト ラ ン ス ク リ プ ト ー ム 解 析 ( RNA-seq ) の 生 物 研 究 へ の応用

バ イ オ デ ー タ ベ ー ス の 利 用 ( 遺 伝 子 の 機 能 、 発現、 遺 伝 性疾患)

OMIM (Online Menderian Inheritance in Man)MGI (Mouse Genome Informatics)ZFIN (The Zebrafish Model Organism Database)

第 1 5

最終回

1 月 21 日 次世代シーケンス解析-応用2Exome 解 析 : エ ク ソ ン の み に絞っ て 配 列 を比較す る こ と に よ

る 、 遺 伝形質 の 原 因 遺 伝 子 の同定 ( 一 遺 伝 子 の 変異で メ ン デ ル

遺 伝 す る 遺 伝 子疾患に有効 )Genome Wide Association Study (GWAS) : SNP マーカー を

使 っ た 遺 伝形質 の責任遺 伝 子 の同定 ( 複数遺 伝 子 が 関与し 、 こ

れ ま で 解 析困難で あ っ た 遺 伝形質 にも有効 )ヒ ト GWAS デ ー タ ベ ー ス の 利 用

“ 宿 題 (4) 提 出 ”

授 業評価

4

Page 5: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

10 月 1 日 ( 第 1 回 )

講 義

1 ) 授 業 の 予 定 と 進め方 (評価方 法 : 4 回 の 宿 題 で評価)

2 ) 遺 伝 子 の 構 造 に つ い て の 復 習 : パ ワ ー ポ イ ン ト の ファイ ル を参照

3) 遺 伝 子 、 転 写 、翻訳の 復 習 ( DVD を 使 っ て )

4) 「 バ イ オ イ ン フ ォ マ テ ィ ッ ク ス 」 と は ?

5) ゲ ノ ム デ ー タ ベ ー ス (動物 、植物 、菌類、 バ ク テ リ ア ) を開け て み る

6) そのほか 、 代表的 な デ ー タ ベ ー ス を開け て み る

使 用 す る DVD : 講談社ブ ル ー バ ッ ク ス B1582 「 見 てわか る DNA の しくみ 」

今日 は 第 一 回目の 授 業 で す の で 、最初に今年の 授 業 予 定 を紹介し ま す 。 こ の 授 業 は 、 「 講

義 」 と 「 コ ンピュー タ ー を 使 っ た 実 習 」 で 進めま す 。 実 習 で は 、 ウ ェ ブ上で公開さ れ て い る

デ ー タ ベ ー スや配 列 解 析 プ ロ グ ラ ム を 使 い ま す 。

現在で は 、 多様な 生 物 の ゲ ノ ム 配 列 が 解 読 さ れ 、 配 列 は 一般にも利 用 できる ように 整備さ れ

て い ま す 。どの ような 生 物 で ゲ ノ ム 解 読 が行われ て い る の か 、今日 は 、 ウ ェ ブ サ イ ト ( NCBI, Ensembl ) を 使 っ て少し のぞい て み ま しょう。詳し い 使 い 方 は 、 こ れ か ら の 授 業 で教えま す 。

ま た 生 物学、 分 子 生 物学、農学研 究 に 利 用 できる デ ー タ ベ ー ス にどの ようなもの が あ る かも、

概 要 を紹介し ま す 。

なおこ の テ キ ス ト で は 、その 日 の 授 業 で行う講 義 内 容 と コ ンピュー タ ー を 使 っ た 実 習 に つ い

て 、操作 方 法 を含めて簡単に 説 明 し て あ り ま す 。必要 に応じて 、 コピー 、 プ リ ン ト ア ウ ト し て

下さ い 。 講 義 で 使うパ ワ ー ポ イ ン ト の 図 は 、 プ リ ン ト し たもの を資料と し て 配 布 し ま す (単行

書やウ ェ ブ を コピー し た ペ ー ジ が あ る ため、版権の問題 が 発 生 す る かもし れ な い の で 、 pdf は

配 布 し ません) 。毎回 、翌週の プ リ ン ト を 配 り ま す の で 、 こ の テ キ ス ト と 配 布資料を 使 っ て 、

予 習 ・ 復 習 し て下さ い 。

参考に な る本を こ の ファイ ル の最後に紹介し て あ り ま す 。おそらく農学部 の 図書館にほとん

どあ る と思い ま す 。

————————————————————————————————

実 習

2 つ の ウ ェ ブ サ イ ト を開い て 、どの ような 生 物 で ゲ ノ ム 情 報 が 利 用 できる か 調 べ て み よう

1. NCBI (National Center for Biotechnology): http://www.ncbi.nlm.nih.gov/Genome Data Viewer

2. Ensembl Genome Browser: http://asia.ensembl.org/index.html 3. GenomeNet, UniProt, CISPRdirect

5

Page 6: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

6

Page 7: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

10 月 8 日 ( 第 2 回 )

今日 の 授 業 内 容

1. 実 習 : デ ー タ ベ ー ス か ら の ア ミ ノ 酸 配 列 、 塩 基 配 列 の 取 り 出 し 方

2. 実 習 : 配 列 エ ン ト リ ー に 示 さ れ て い る 情 報 に つ い て

3. 講 義 : 次 世 代 シ ー ケ ン サ ー の 原 理

実 習

塩 基 配 列 ・ ア ミ ノ 酸 配 列 の 収 集

配 列 デ ー タ ベ ー ス か ら必要 な タ ン パ ク 質 の ア ミ ノ 酸 配 列 、 遺 伝 子 の cDNA 塩 基 配 列 の 取 り 出 し

方 を 実 習 し ま す .

ア ミ ノ 酸 配 列 の 取 り 出 し 方

使 用 す る ウ ェ ブ サ イ ト : NCBI.先頭ペ ー ジ右側に あ る Popular Resources の中の 「 Protein 」 を 使 用 す る .あ る い は左上( All databases ) か ら選ぶこ とも可 能 .

キ ー ワ ー ド に よ る 検 索

例: cow, prion で キ ー ワ ー ド 検 索 し て み よう

cow, prion と 関 連 す る タ ン パ ク 質 が 多数リ ス ト さ れ る が 、先頭の 2 つ が目的 の

配 列

タ ン パ ク 質名( 青 字 ) を ク リ ッ ク す る と 配 列 エ ン ト リ ー が表示 さ れ る ( 見 方 は

配付資料を参照)

FASTA を ク リ ッ ク す る と 配 列 が FASTA format で表示 さ れ る

配 列 は 、別の ファイ ル に コピー できる .Graphics で は 、 タ ン パ ク の 構 造 が表示 さ れ る

Identical Proteins で は 、別の名前 が付け ら れ て い る同一 タ ン パ ク 質 が表示 さ

れ る

Related Sequences で は 、 関 連 す る タ ン パ ク 質 が表示 さ れ る

FASTA format 塩 基 配 列 と ア ミ ノ 酸 配 列 の ファイ ル フ ォ ー ム

「 > 」 で始ま る 1行が コ メ ン ト ( 遺 伝 子名や任意の番号やコ メ ン ト ) を記述す る た

めに 用意さ れ ており 、続く2行目か ら 塩 基 配 列 あ る い は ア ミ ノ 酸 配 列 を記述す る 。

最後に改行し て 「 // 」 を記載し 、 1 つ の 配 列 の記述が完了す る ( 記号「 // 」 は なく

てもよ い;普通、付け な い ) .

ホ モ ロ ジ ー 検 索 、 多 重 ア ラ イ メ ン ト 、 分 子 系 統 樹 作 成 等 で 使うフ ォ ー ム .7

Page 8: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

デ ー タ ベ ー ス をその ま ま コピー し たもの

>NP_001258555.1 major prion protein preproprotein [Bos taurus]MVKSHIGSWILVLFVAMWSDVGLCKKRPKPGGGWNTGGSRYPGQGSPGGNRYPPQGGGGWGQPHGGGWGQPHGGGWGQPHGGGWGQPHGGGWGQPHGGGGWGQGGTHGQWNKPSKPKTNMKHVAGAAAAGAVVGGLGGYMLGSAMSRPLIHFGSDYEDRYYRENMHRYPNQVYYRPVDQYSNQNNFVHDCVNITVKEHTVTTTTKGENFTETDIKMMERVVEQMCITQYQRESQAYYQRGASVILFSSPPVILLISFLIFLIVG//1 行 目 は 、 必 要 に 応 じ た ネ ー ミ ン グ に す る こ と が 可 能 . 例 え ば 、

>cow_prion_protein .文 字間の ス ペ ー ス は 、空にせず _ と す る 方 が よ い.空きス

ペ ー ス が あ る と 、 配 列 を認識し な い プ ロ グ ラ ム が あ る の で.

>cow_prion_proteinMVKSHIGSWILVLFVAMWSDVGLCKKRPKPGGGWNTGGSRYPGQGSPGGNRYPPQGGGGWGQPHGGGWGQPHGGGWGQPHGGGWGQPHGGGWGQPHGGGGWGQGGTHGQWNKPSKPKTNMKHVAGAAAAGAVVGGLGGYMLGSAMSRPLIHFGSDYEDRYYRENMHRYPNQVYYRPVDQYSNQNNFVHDCVNITVKEHTVTTTTKGENFTETDIKMMERVVEQMCITQYQRESQAYYQRGASVILFSSPPVILLISFLIFLIVG

塩 基 配 列 の 取 り 出 し 方

使 用 す る ウ ェ ブ サ イ ト : NCBI. Popular Resources の中の 「 Nucleotide」 を 使 用 す る

1. キ ー ワ ー ド に よ る 検 索

例: cow, prion で キ ー ワ ー ド 検 索 し て み よう

cow, prion の 配 列だけ で なく、 関 連 遺 伝 子も多数検 索 さ れ てくる ため、必要 な

配 列 を 見 つ け る必要 が あ る .Bos taurus prion (PRNP), transcript variant 1, mRNA が

今回 、欲し い 配 列 で あ る .上の 遺 伝 子 質名を ク リ ッ ク す る と 配 列 エ ン ト リ ー が表示 さ れ る ( デ ー タ の 見 方

は 配付資料を参照の こ と )

FASTA を ク リ ッ ク す る と 配 列 が FASTA format で表示 さ れ る

配 列 は 、別の ファイ ル に コピー できる .Graphic で は 、 ゲ ノ ム上の 位置が表示 さ れ る

2.ア ク セ ッ シ ョ ン番号に よ る 検 索

accession number=DDBJ/EMBL/GenBank 国際 塩 基 配 列 デ ー タ ベ ー ス におい て 各登録

単 位 ( エ ン ト リ ー ; 各 遺 伝 子 ) に 発 行 さ れ る エ ン ト リ ー 識 別 子 ( entry identification, ID ) を指す 。

例: NM_001271626 ( entry identification, ID ) で 検 索 し て み よう

なお表示 結 果 の詳細 な 説 明 は 、 次 の サ イ ト で閲覧できま す 。

http://hinv.ddbj.nig.ac.jp/manual_cdna-j.html

配 列 エ ン ト リ ー に 示 さ れ て い る デ ー タ

遺 伝 子名、 生 物名、学名、 遺 伝 子座、 遺 伝 子 ク ロ ーニン グ を行っ た 論 文 リ ス ト 、翻訳

8

Page 9: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

開始・終了点 、 ド メ イ ン 構 造 、 塩 基 配 列 、 ア ミ ノ 酸 配 列 ( 配付資料で は 、 zebrafish, prion (NM_205586) を 使 っ て 説 明 し て あ り ま す )

講 義

次 世 代 シ ー ケ ン ス 解 析 の 原 理

次 世 代 シ ー ケ ン ス 解 析 の 利 用 に つ い て は 、 配付し た 日本分 子 生 物学会に よ る資料も参考に

し て下さ い 。

次 世 代 シ ー ケ ン ス 解 析 に つ い て

 次 世 代 シ ー ケ ン ス 解 析 は 、 こ の数年で 実 用 化 さ れ た DNA シ ー ク エ ン ス 解 析技術 で 、

その 原 理 は従来の サ ン ガ ー 法 に 基づい た 蛍 光 シ ー ク エ ン サ ー と は異な り 、 ガ ラ ス 基盤

( フ ロ ー セ ル ) に固着し た プ ラ イ マ ー を鋳型に し て ( ブ リ ッ ジ PCR ) 、 基板上で 1 塩

基 の伸長反応ごと に 結 合 し た 塩 基 を 蛍 光 検 出 し ま す ( Sequence by synthesis ) 。 ナ ノ

技術 に よ り 、 1mm 四方 で万単位 の シ ー ク エ ン ス 解 析 が 可 能 で す 。最も汎用 さ れ て い

る Illumina 社の HiSeq2500 で は 、 1 リ ー ド の リ ー ド長は 125bp と短い で す が 、 シ ー ケ

ン サ ー を 一度動か す と ( 1 ラ ン ) で 80 億リ ー ド が 読 ま れ ま す 。 つ ま り 1 ラ ン で 、

1000 Gbp (ギガ =10 億) の 配 列 が得ら れ る こ と に な り ま す 。 ヒ ト の ゲ ノ ム サ イ ズ は

約 3 Gbp な の で 、その x300 が 読 ま れ る こ と に な り ま す 。現在で は 、個人の ゲ ノ ム 解

読も可 能 で す 。

従来の 蛍 光 シ ー ケ ン サ ー で は 、 1 ラ ン で 700bp の リ ー ド が 96 、 総 計約 67kb の 塩

基 配 列 が得ら れ る の に比べ る と 、 オ ーダー が千万単位違い ま す 。 つ ま り 次 世 代 シ ー ケ

ン サ ー が 1 台 で 、 蛍 光 シ ー ケ ン サ ー の 千 万 台 分 の 解 析 能 力 が あ る わ け で す 。

HiSeq2500 で は 、 ペ ア エ ン ド の シ ー ク エ ン ス 解 析 (約 300bp の断片を両側か ら 125bp読む) が 可 能 で す.シ ン グ ル エ ン ド の シ ー ケ ン ス 解 析 に比べ 、 ペ ア 情 報 は 配 列 を コ ン

テ ィ グ に繋ぐ時に非常に有用 に な り ま す 。従っ て 、 de novo genome sequencing, de novo transcriptome 解 析 に は ペ ア エ ン ド の シ ー ク エ ン ス 解 析 が必須で す 。

 世 代 シ ー ケ ン サ ー は 1 台が数億円す る ため、 研 究室で購入す る こ と は非現実 的 で す

が 、依頼解 析 が随分廉価と な り 、 す で に農学研 究 でも汎用 さ れ て い ま す 。農学が対象

と す る 生 物も、ほぼ全 て の 種 の ゲ ノ ム 解 読 が終わっ て い ま す 。今後は 系 統間の 塩 基 配

列 の違い を 調 べ 、 遺 伝形質 と 配 列 と の 関 係 を 解 析 す る こ と が 重 要 に な る と思われ ま す 。

 こ こ で注意し な け ればな ら な い こ と は 、 1 レ ー ン あ た り 125bp の 配 列断片が約 7 億個得ら れ る と言うこ と で 、その 解 析 は とうて い人の手に負える はずは なく、 コ ン

ピュー タ ー 解 析技術 が必須で す 。 ゲ ノ ム に し ても cDNA の 配 列 を 読むに し ても、最初

に 125bp の 配 列断片か ら 重 な り 合う部 分 を探し て 、 配 列 を コ ン テ ィ グ に つ なげる必要

が あ り ま す 。 配 列 解 析 の バ イ オ イ ン フ ォ マ テ ィ ッ ク ス は現在非常に 重 要 に な っ ており 、

まだ人材不足の状況で す 。 と り あえずは 、 遺 伝 研 の パ イ プ ラ イ ン 等 を 使えば、普通に

必要 な 解 析 は誰に でもできま す 。

 実験区毎に 複数サ ン プ ル (例えば、 3 サ ン プ ル ) を 解 析 し て 、 実験区間で 発現が 統

計 的 に有意に異な る 遺 伝 子 を探し た り す る に は 、 統 計 処 理 を行っ てくれ る プ ロ グ ラ ム

を 使 用 す る必要 が あ り ま す 。 こ の 関 連 の プ ロ グ ラ ム は R 言語で動くもの た開発 さ れ て

9

Page 10: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

おり 、無料でダウ ン ロ ー ド し て 解 析 を 進める こ と が 可 能 で す 。是非、勉強し て 利 用 し

て み て下さ い 。

 授 業 で は 、 ( 1 ) 次 世 代 シ ー ケ ン サ ー の 塩 基 配 列 解 読 原 理 、 ( 2 ) 次 世 代 シ ー ケ ン

ス 解 析 の 利 用 方 法 に つ い て 講 義 し ま す 。

次 世 代 シ ー ケ ン サ ー の 解 析 原 理 等 は 、国立 遺 伝学研 究所 先端ゲ ノ ミ ク ス推進 セ ン

タ ー の ホ ー ム ペ ー ジ が参考に な る

http://genome.nig.ac.jp/glossary/glossary11.html

10

Page 11: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

10 月 15 日 ( 第 3 回 )

今日 の 授 業 内 容

1. 実 習 : ホ モ ロ ジ ー 検 索 BLASTP2. 実 習 : 検 索 結 果 の 見 方

3. 講 義 : ヒ ト ゲ ノ ム 解 読 プ ロ ジ ェ ク ト ( 階 層 的 シ ョ ッ ト ガ ン 法 )

実 習

ホ モ ロ ジ ー 検 索 ( BLAST検 索 ) 1/3 遺 伝 子やゲ ノ ム を扱う研 究 で 使 用 す る 機会が最も多 い プ ロ グ ラ ム が 、 塩 基 配 列やア ミ ノ 酸

配 列 の ホ モ ロ ジ ー (相同性 ) 検 索 プ ロ グ ラ ム で す.実験で新し い 塩 基 配 列 が得ら れ た時に 、

遺 伝 子 を同定 す る ために 、最初に行う操作 が相同性 検 索 でだか ら で す.相同性 検 索 に よ り 、

ク ロ ーニン グ し た 遺 伝 子 が 、 デ ー タ ベ ー ス に登録さ れ て い るどの 遺 伝 子 と類似し て い る か を

知る こ と が できま す.

次 世 代 シ ー ク エ ン ス 解 析 で得ら れ た 配 列 を ゲ ノ ム 配 列 に マ ッ プ す る 際 にもBLAST 検 索 が 用

い ら れ ま す.ゲ ノ ム 解 読 さ れ て い る 生 物 で あ れば、 100bp の短い 配 列 ( 次 世 代 シ ー ケ ン サ ー

の 解 析 で は 、 1 リ ー ド は 100-120bp ) でもゲ ノ ム のどの 位置に あ る か を 調 べ る こ ともできま

す.ま た 次 世 代 シ ー ク エ ン ス 解 析 を 使 っ た ト ラ ン ス ク リ プ ト ー ム 解 析 (組織に 発現す る 遺 伝

子 を 網羅的 に 配 列 解 読 と 遺 伝 子 の 特 定 、 発現量 の 解 析 が できる ) で は 、 解 読 し た 配 列 は ホ モ

ロ ジ ー (相同性 ) 検 索 の BLASTX で 遺 伝 子 の 種類を判別さ れ ま す.

 授 業 で は 、 BLAST (Basic Local Alignment Search Tool) プ ロ グ ラ ム を 用 い ま す 。今日 は 、

塩 基 配 列 ・ ア ミ ノ 酸 配 列 の デ ー タ ベ ー ス 、問い 合わせ配 列 と デ ー タ ベ ー ス の組合せ、 各組合

せで 使う BLAST プ ロ グ ラ ム に つ い て 説 明 し ま す.その あ と テ ス ト 配 列 ( ア ミ ノ 酸 配 列 ) を

使 っ て 、 実 際 に BLAST 検 索 を行い ま す.

ホ モ ロ ジ ー ( homology ) 検 索 、 と は ?

問い 合わせ配 列 (query sequence) に対し 、類似し た 配 列 を デ ー タ ベ ー ス か ら探し 出 す

操作.最も高頻度に 利 用 さ れ る バ イ オ イ ン フ ォ マ テ ィ ッ ク ス の手法 のひと つ.

検 索 内 容 :

例) 実験で ク ロ ーニン グ し た 遺 伝 子 の 種類を 特 定 す る 。それ が コ ー ド す る ア ミ ノ 酸 配

列 が デ ー タ ベ ー ス に登録さ れ て い る 遺 伝 子 、蛋白質 のどれ と 、 ま たどの程度類似す る

か ?

遺 伝 子 配 列 デ ー タ ベ ー ス : GenBank, DDBJ, EMBL

最 も広 く 利 用 さ れ ており 、 検 索 が高 速 な プ ロ グ ラ ム が BLAST(Basic Local Alignment Search Tool) で す ( 昔 、 FASTと言うプ ロ グ ラ ムも使われ て い た が 、現在はほとんど見

か け な い )

--------------------------------------------------------――――――――――――――――――-------------11

Page 12: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

検 索 の組合せ          問い 合わせ配 列 対 デ ー タ ベ ー ス

----------------------------------------------------――――――――――――――――――-----------------BLASTN           塩 基 配 列 対 塩 基 配 列 デ ー タ ベ ー ス

BLASTP           ア ミ ノ 酸 配 列 対 ア ミ ノ 酸 配 列 デ ー タ ベ ー ス

BLASTX  塩 基 配 列 ( ア ミ ノ 酸 配 列 に置換 ) 対 ア ミ ノ 酸 配 列 デ ー タ ベ ー ス

TBLASTN           ア ミ ノ 酸 配 列 対 塩 基 配 列 デ ー タ ベ ー ス ( ア ミ ノ 酸

配 列 に置換 )

TBLASTX 塩 基 配 列 ( ア ミ ノ 酸 配 列 に置換 ) 対 塩 基 配 列 デ ー タ ベ ー ス 塩 基 配 列 ( ア ミ ノ

酸 配 列 に置換 )

----------------------------------------------------――――――――――――――――――-----------------

配 列 の 種間変異の激し い 遺 伝 子 の場合 ( サ イ トカイ ン 等 ) 、 塩 基 配 列 を BLASTN 検 索 し て

も相同遺 伝 子 が デ ー タ ベ ー ス か ら 検 出 さ れ な い こ と が あ る.その場合 でも、 BLASTX な ら

相同遺 伝 子 が ヒ ッ ト す る こ と が 多 い.その ため、 塩基配列を 問い 合わ せ 配列に相同検索す る 場合、通常、BLASTX が 用い ら れ る .

**************************************************************************

BLAST 検 索 の 原 理 1. ホ モ ロ ジ ー が観察さ れ る 配 列間の局所ア ラ イ メ ン ト に は 、 多くの場合 、ギャッ プ を含ま

な い保存領域が存在す る 。 BLAST で は 、その ような局所保存領域( ワ ー ド ) を まず高速

に 検 索 す る 。

2. 一致し た ワ ー ド か ら ア ラ イ メ ン ト を 配 列 に沿っ てそれぞれ の 方向に拡張し て いき、 ス コ

ア が 増 加 す る ま で続け る 。拡張処 理 は 、 ス コ ア の 増 加 が止ま り 、伸ばす 前 の ベ ス ト ス コ

ア よ り減少し始めた時に終了す る 。 こ の時点 で 、 HSP (high-scoring segment pair) と呼ば

れ る 、大きな 配 列領域が 見 つ か る 。 こ の時点 でギャッ プ が あ る とそこ か ら先に は伸長し

て い な い 。

3. 一般に 、 ア ミ ノ 酸 配 列 と 塩 基 配 列 に はギャッ プ が 生じて い る ため、 HSP の み で は類似領

域の 検 索 と し て不十分 で あ る 。そこ で 、 BLAST で は 、 HSP におい て対応す る 位置に存在

す る 1 組の記号の ペ ア を適切に選び、類似度の高い領域は こ の ペ ア を含むもの と仮定 し

て 、動的 計 画 法 と呼ばれ る 方 法 を 用 い て類似領域を探索 す る 。 HSP か ら選んだペ ア を起

点 と し て探索範囲を狭く取 る こ と に よ っ て 、類似度の最適性 は保証さ れ な いもの の 、従

来の動的 計 画 法 と比較し て高速な類似領域の探索 を 実現し て い る 。

ス コ アア ミ ノ 酸 配 列 の場合 : BLOSUM62 ス コ ア ( ア ミ ノ 酸 の組合せに よ っ て値が決めら れ て い る )

塩 基 配 列 の場合 :値は同じ塩 基 、異な る 塩 基 の組合せで の み決めら れ て い る

     ————————————————————————————————

BLASTP 実 習

下記の 2 つ の ア ミ ノ 酸 配 列 は 、当研 究室で行われ た 次 世 代 シ ー ケ ン サ ー を 使 っ た De novo transcriptome 解 析 で得ら れ た 塩 基 配 列 か ら推定 さ れ た ア ミ ノ 酸 配 列 で す 。 サ サ ウ シ ノ シ タ

と言う非モ デ ル 生 物 の 配 列 で 、 まだデ ー タ ベ ー ス に登録さ れ て い ません。

12

Page 13: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

BLASTP の操作手順

1.NCBI 先頭ペ ー ジ右上 Popular Resources か ら BLASTを選択す る 。 Basic BLASTに上記 5 種類の BLAST プ ロ グ ラ ム の ア イ コ ン が あ る.

2. protein blastを ク リ ッ ク す る 。 ア ミ ノ 酸 配 列 (FASTA format) を枠内 に コピー す

る 。 Database (non-redundant protein sequences (nr) ), Algorithm (blastp; protein-protein BLAST) は 、 デ フ ォ ル ト の ま ま で よ い.

3.BLASTのボタ ン を押し て 、 検 索 を開始す る 。

>bamboo_sole_Pcna_protein

MFEARLVQGSILKKVLEALKDLITEACWDVSSSGISLQSMDSSHVSLVQLTLRHDGFDSYRCDRNLAMGVNLSSMSKILKCAGNE

DIITLRAEDNADTLALVFETINQEKVSDYEMKLMDLDVEQLGIPEQEYSCVVKMPSGEFARICRDLSQIGDAVMISCAKDGVKFS

ATGELGTGNVKLSQTSNVDKEEEAVTIEMNEPVQLIFALNYLNFFTKATPLSKTVTLSMSADIPLVVEYKIADMGHVKYYLAPKI

DEEAS

>bamboo_sole_Shh_protein

MLLWTRIALVALMCLSLVSSGMGCGPGRGYGRRRHPKKLTPLAYKQFIPNVAEKTLGASGRYEGKITRNSERFKELTPNYNTDII

FKDEENTGADRLMTQRCKDKLNSLAISVMNQWPGVKLRVTEGWDEDGHHFEESLHYEGRAVDITTSDRDKSKYGTLSRLAVEAGF

DWVYYESKAHIHCSVKAENSVAAKSGGCFPGSSTVTLEDGTRKAVRDLQTGDKVLAADTRGQLIYTDFIMFIDQDSTTRRLFHVI

ETDSGQKITLTAAHLLFVGHNGTSAETQGGRMSAIFASQVRPGQRVFVFDTERSELQPVTVKRIYTQEHEGSFAPVTVQGTVVVD

QVLASCYAVIEDHELAHWALAPVRLAHWVSSLLFSSQHQSRAQSDGVHWYSKVLYQLGTWILDSHSIHPLGMSVYPS

>ACC_oxydase_orange_protein

MENFPVISLENINGAERAAILEKINEACEKWGFFELVNHGIEPEFMDTVERLTKAHYRKCMEQRFKELVASRALEGI

QTEVNDMDWESTFYVRHLPQSTINEVPDLDEEYRKVMKEFALKLEKLAEELLDLLCENLGIEKGYLKKVFHGANGPT

FGTKVSNYPPCPKPDLIKGLRAHTDAGGIILLFQDDKVSGLQLLKDGQWIDVPPLRHSIVVNLGDQIEVITNGKYKS

VEHRVVSQTDGEGRMSLASFYNPGSDAVIYPAPALLEKEAEKKQVYPKFVFEDYMKLYVPLKFQAKEPRFEAMKAVE

TNVNLGPIATA

( 1-aminocyclopropane-1-carboxylate oxidase 、エ チ レ ン 合 成酵素)

PSI-BLASTP, PHI-BLAST: 比較的最近開発 さ れ た プ ロ グ ラ ム で 、 系 統 的 に離れ た 生 物 あ

る い は 関 連 遺 伝 子 を 検 索 す る場合 に 利 用 す る . 種間の保存性 が低い 遺 伝 子 の場合 に

利 用価値が高い .

検 索 結 果 の 見 方 :

グ ラ フ ィ ッ ク の 次 に 示 さ れ て い る数値の 説 明

E-value : 検 索 結 果 は 、 Query 配 列 と相同性 を 示 す 配 列 の ア ラ イ メ ン ト 結 果 が表示

さ れ る 。 e-value は 、 検 索 に 使 っ た デ ー タ ベ ー ス の な か で 、 Query の局所配 列 と

検 索 配 列 の組合わせが 、偶然に み つ か る個数を 示 す 。相同性 が高いほど、値は 0に近づく(最も重 要 な デ ー タ :蛋白質 の場合 、 e-3あ た り が 関 連 遺 伝 子 か ? 、そう

で な い か を判断す る 基準と な る;実 際 に は ア ラ イ メ ン ト の デ ー タも参考に し て判

定 す る必要 が あ る ) 。 検 索 結 果 の数値のうち、最も重 要 で あ る.

13

Page 14: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

Total score (bits): 検 索 さ れ てきた局所配 列 の長さ をビッ ト形式で 示 し たもの 。値

が大きいほど、相同性 を 示 す領域が長い 。

Query cover: 問合せ配 列 の 全長のうち、 検 索 配 列 と 配 列 が 一致し て い る領域の%

Identities: ア ミ ノ 酸 配 列 で 、相同領域の な か で 一致し て い る ア ミ ノ 酸 の比率

ア ラ イ メ ン ト の添えら れ て い る数字

Identities: ア ミ ノ 酸 配 列 で 、相同領域の な か で 一致し て い る ア ミ ノ 酸 の比率

Positives: ア ミ ノ 酸 配 列 の場合 に 、 一致し て い る ア ミ ノ 酸+化学的 に類似す る ア ミ

ノ 酸 の比率

Gaps: ア ラ イ メ ン ト さ れ た 配 列 で 、片一 方 で欠損し て い る 塩 基 あ る い は ア ミ ノ 酸 の

総 計

最近で は 、 デ ー タ ベ ー ス に納めら れ て い る 生 物 種 、 配 列 情 報 が大きくな り すぎた ため、 BLASTの 検 索 結 果 の 画面が 、 解 析 し た 配 列 の由来生 物 の近縁種 の 配 列だけ で ペ ー ジ が埋め尽くさ れ 、

進 化 的 に離 れ た 生 物 で相 同 遺 伝 子 が存 在 す る の か を判 定 できません. その ため、 BLASTP, BLASTX で は 、 Databaseを Model organisms (landmark) に指定 し て 解 析 す る こ と で 、 進 化 的 な 解

析 を行うこ と が 可 能 に な っ て い ま す.Model organisms (landmark) に は 、 ヒ ト 、 マ ウ ス 、ゼブ ラ

フ ィ ッ シ ュ 、 シ ョ ウ ジ ョ ウ バ エ 、 線 虫 (Caenorhabditis elegans) 、 粘 菌 (Dictyostelium discoideurm) 、 シ ロ イヌナ ズ ナ,大豆 (Glycine max) 、酵母と 細菌の 一 部 の デ ー タ が含ま れ て

い ま す 。 Model organisms (landmark) を選択し て 、 BLASTP 検 索 を行っ て み ま しょう.

講 義

ヒ ト ゲ ノ ム 解 読 プ ロ ジ ェ ク ト

国際 研 究 プ ロ ジ ェ ク ト に よ る ヒ ト ゲ ノ ム 計 画 (Human Genome Project) は 1990 年に着手

さ れ 、 13 年後の 2003 年に 解 読完了が宣言さ れ ま し た.ヒ ト ゲ ノ ム 計 画 は 、 階 層 的 シ ョ ッ ト

ガ ン 法 と呼ばれ る手法 で行われ ま し た 。 す なわち連 鎖 地 図 の 作 成 か ら BAC ク ロ ー ン の 整 列 化 の

過程を 経 た のち、染色体上に マ ッ プ さ れ た BAC ク ロ ー ン を シ ョ ッ ト ガ ン 法 で 解 読 し 、染色体レ

ベ ル に ま で 塩 基 配 列 を繋ぐと いう過程を 経 て 、 ゲ ノ ム 塩 基 配 列 の完全 解 読 に ま で到達 し ま し た 。

こ の プ ロ ジ ェ ク ト の間に 塩 基 配 列 の 解 析 能力( DNA シ ー ク エ ン サ ー ) は大幅に ア ッ プ し 、同

時に 塩 基 配 列 を つ なぎ合わせる コ ンピュー タ ー の 処 理 能力も著しく進歩し た こ と に よ り 、 連 鎖

地 図 作 製 を省略し て 、 全 ゲ ノ ム を いきな り シ ョ ッ ト ガ ン 法 で 読むこ と が 可 能 と な り ま し た.民

間企業 の シ エ ラ社は 、数年の あ いだに 全 ゲ ノ ム シ ョ ッ ト ガ ン 法 に よ り ヒ ト ゲ ノ ム を 解 読 す る こ

と に 成功し ま し た 。最終的 に は 、国際 研 究 プ ロ ジ ェ ク ト と シ エ ラ社の間で協議の 結 果 、 解 読 成

果 が同時に公表さ れ ま し た.ヒ ト ゲ ノ ム 計 画 の終了と 前後し て 、 全 ゲ ノ ム シ ョ ッ ト ガ ン 法 の登

場に よ り 、 多くの 生 物 で 全 ゲ ノ ム 解 読 プ ロ ジ ェ ク ト が始めら れ ま し た.

前記の旧バ ー ジ ョ ン の 全 ゲ ノ ム シ ョ ッ ト ガ ン 法 で は 、 ゲ ノ ム を断片化後に 、 全 て の断片を プ

ラ ス ミ ド ベ ク タ ー に ク ロ ーニン グ す る必要 が あ り ま し た が 、 次 世 代 シ ー ケ ン サ ー の登場に よ り 、

14

Page 15: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

状況は激変 し ま し た 。 次 世 代 シ ー ケ ン サ ー で は 、 ゲ ノ ム の断片を ク ロ ー ン 化 す る必要 が なく、

か つ大量 の 配 列 情 報 を 一度に 解 読 できま す 。 全 ゲ ノ ム シ ョ ッ ト ガ ン を 使えば、数ヶ月 で ゲ ノ ム

解 読 が 可 能 と な り ま し た.その ため、既に数百種 の動物 で 全 ゲ ノ ム 配 列 の 解 読 が終了し 、現在

も新し い 生 物 の ゲ ノ ム 解 読 が 次々に完了し て い ま す.こ の 授 業 で は 、 次 世 代 シ ー ケ ン サ ー の 原

理 と 、それ を 使 っ た ゲ ノ ム 解 読 の 概 要 を紹介し ま す 。

全 ゲ ノ ム 塩 基 配 列 が 利 用 できる と いう条件のもと で 、 進めら れ る 遺 伝 子 機 能やゲ ノ ム 研 究 が

ポ ス ト ゲ ノ ム 研 究 で す.ゲ ノ ム 情 報 は 、 遺 伝 子 の 機 能 解 析 の有力なツー ル に な る こ と は言うま

でもあ り ませんが 、 生 物間で ゲ ノ ム 構 造 を比較す る こ と に よ り 、無脊椎動物 か ら脊椎動物 の 進

化 の過程で起こ っ た ゲ ノ ム 構 造 の 変 化 等も明 ら か に な り ま し た.ま た哺乳類の中でも単孔類

(カモ ノハシ ) 、有袋類( オ ポ ッ サ ム ) か ら有胎盤類に至る 進 化 の過程や、 ま た チ ン パ ン ジ ー

と ヒ ト で の知能 の差を ゲ ノ ム 構 造 の 進 化 の観点 か ら議論 さ れ て い ま す.

既に家畜や野菜や穀物植物 の ゲ ノ ムもほとんどの 種 で 解 読 さ れ て い ま す 。農学でも新し い 研

究 分野を開拓す る ために は 、 ゲ ノ ム 情 報 を有効に 利 用 できる がどうか が 、極めて 重 要 な素養と

な り ま す.

**********************************************************************ゲ ノ ム 解 読 プ ロ ジ ェ ク ト で 解 析 さ れ た ゲ ノ ム DNA 配 列 情 報 は 、 NCBI と Ensemblで 一般に

利 用 できる よう整備さ れ て い ま す 。 遺 伝 子 の染色体上の 位置や類似遺 伝 子 の 検 索 に は NCBIが便利 で す 。 ゲ ノ ム の 塩 基 配 列 を デ ー タ ベ ー ス か ら 取 り 出 す場合 に は 、 Ensemblが便利 で

す 。 NCBI と Ensemblの 使 い 方 は 、 授 業 で 実 習 し ま す 。 ゲ ノ ム 情 報 が い か に強力なツー ル

に な る か を体験し 、 実感し てもらおうと考えて い ま す 。

————————————————————————————————ゲ ノ ム 解 読 の 歴 史 的 な背景と 、 ゲ ノ ム 解 読 の 方 法 論 を 理 解 し てもらうために 、 授 業 で は 階 層

的 シ ョ ッ ト ガ ン 法 で 解 読 さ れ た ヒ ト ゲ ノ ム プ ロ ジ ェ ク ト を例に し て ゲ ノ ム 解 読 の道筋を 解 説 し

ま す.もはや、 歴 史 を振り返る ような感もあ り ま す が 、 ゲ ノ ム を 理 解 す る の にもよ い の で 解 説

し ま す 。

ヒ ト 全 ゲ ノ ム 塩 基 配 列 解 読 の行程

1 ) 連 鎖 地 図

2 ) BAC ラ イ ブ ラ リ ー 作 製

3 ) BAC ラ イ ブ ラ リ ー 整 列 化 ( 物 理 地 図 )

4) シ ョ ッ ト ガ ン シ ー ク エ ン ス

5) ア セ ン ブ ル

6) ア ノ テ ー シ ョ ン

15

Page 16: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

10 月 29 日 ( 第 4 回 )

今日 の 授 業 内 容

1. 実 習 : BLAST検 索 ( BLASTN, BLASTX, TBLASTX )

2. 講 義 : ゲ ノ ム 解 読 プ ロ ジ ェ ク ト ( 全 ゲ ノ ム シ ョ ッ ト ガ ン シ ー ケ ン ス )

実 習ホ モ ロ ジ ー 検 索 ( BLAST検 索 ) 2/2

BLASTN 実 習

下記は 、私達 の 研 究 グ ル ー プ 20 年あ ま り 前 に ヒ ラ メ か ら ク ロ ーニン グ し た 遺 伝 子 の 塩 基

配 列 と ア ミ ノ 酸 配 列 で す.こ れ ら の 配 列 を 使 っ て 実 習 し ま す 。

>hirame_test_cDNA_sequence

ACCCACGCGTCCGATTTGGAACCTTGAACCACAAAACCAGACAACTTCTTGTGCAACTTTTCTCTTGTTT

TTTCAGTATTTGACTTCATTTATCTAGTCATCGATTCATCTTCAAGCAGAATCTCTCTGTGTCAAACTAT

GACTTCCTTCATCAGCCTCGTAATTTTTTCAAGCTGGATGACTCTGGCTTTTACTTTTCCTCATAACACG

TTTGAGAACATTTTGAAAAGGTCACGGGTCGATGTTGAATCCTCTGGCAGCGGACCAGATGAACCTATCC

AAGGAATAGTCCGGGTTGTTCAGCTGGACCATCGCGCTCTGGCCCAGTCAGGGTTCTTCAGAAAGGGAAT

GACCGCCAGGAGAGCCCCCTCACTCAGCTCAAGGTTGCCCTTCCCTGCCTTCTTGTCTCAGGGGCGTCCA

GGTCCGGCCCCGGCCTCCAAGGCTCCAGTGAGTCCCCTGCACCACCTGCAAACTAAAGGCCCCACTGAAA

TGGAACTGAAGAAGAGACAGGGGCTGCAGATGTGGCAAAGAGCCATGGATAAAGGAGGCAAGTTGTCCCT

GCCGGTCAACCTGACACAGGACACGAAACAGACGTGCACTGCGGTGCCTTTCACTCAGCGTGTGACCGCA

GACGGATGCGAGACAGTGACGGTGCACAACAAGCTGTGTTTCGGTCAGTGCAGCTCTCTGTTCGTGCCGT

CCGAAGGAGAGTTTGCCGGGTTGAGCACCGGGACAGGGGCCCTTCCCCGCCGGGCCCCCTGCTCACGCTG

CGCTCCATCCAAAGCCCACACCGTGACTGTGCCCCTGCGCTGTCGGGGAGAGGTCCGGGAAAAGCGAGTG

ATGGTGGTGGAGGAGTGCAAGTGTGAGACGGGCATCGAGGAGAGAAGTGCAGAGGCTGCGGCGTCCATGC

TGTACAAGCTGTTGTAACAAAAACACATGACGTGACTGCTGTGATTATTCACTGACAGTTGAAATAGAGG

AATGAGGAGACGTGAACTTTTCATTTTAATTGACACCTTTAATTCTCTCTAAGTTCCCTTTGTATAAGTA

ACTATGTGTGAATTTTATTTGTATATATGAGTCTGAATGTGATTTTCAGAGTAAAATAACTTGGTGGTGT

ATTCCACCTCTTGATTGTTGACAAAATGACCAGTATCCTCTTGGTCATGCAGTTTTCTGTTGCAACAAAT

GAAGCTGTCCATACTGGATGTGTGTAAATGTACAAAACCGTGTTTAGATCCATTAAACTGAAATATTGTG

ATGACTTTCATTAAAAATGTCCCATTTGTTCAAAAAAAAAAAAAAA

>hirame_test_protein_sequence

MTSFISLVIFSSWMTLAFTFPHNTFENILKRSRVDVESSGSGPDEPIQGIVRVVQLDHRALAQSGFFRKG

MTARRAPSLSSRLPFPAFLSQGRPGPAPASKAPVSPLHHLQTKGPTEMELKKRQGLQMWQRAMDKGGKLS

LPVNLTQDTKQTCTAVPFTQRVTADGCETVTVHNKLCFGQCSSLFVPSEGEFAGLSTGTGALPRRAPCSR

CAPSKAHTVTVPLRCRGEVREKRVMVVEECKCETGIEERSAEAAASMLYKLL

blastn を 使 っ て 、 > flounder_test_cDNA_sequence の コ ー ド す る 遺 伝 子 を同定 し て み よう

相同遺 伝 子 を 検 索 し て み よう

16

Page 17: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

BLASTN の 検 索手順

1.NCBI 、 Popular Resources の中か ら BLASTを選択す る 。 Basic BLAST に上記

5 種類の BLAST プ ロ グ ラ ム の ア イ コ ン が あ る 。

2 .nucleotide blast を ク リ ッ ク す る 。

「 Database」 が 、 デ フ ォ ル ト で は nucleotide collection (nr/nt) で 、通常こ

の ま ま で よ い 。 nucleotide collection の デ ー タ に は 、登録さ れ て い る 全 て

の cDNA の 配 列 が含ま れ て い る 。

注 意 : Program selection で somewhat similar sequences (blastn) を 選 択 す る 。

3 . 塩 基 配 列 (FASTA format) を枠内 に コピー す る 。

4 .BLAST のボタ ン を押し て 、 検 索 を開始す る 。

Blastn の 利 用例:

と り あえず調 べ た い 遺 伝 子 が 、既知のどの 遺 伝 子 に類似す る か ? を 調 べ る時等 に

使う。 ただし 、 生 物間で 変異の激し い 遺 伝 子 ( 実 習 で 使う charon が 一例) の場合

に は 、 Blastn で は相同遺 伝 子 が十分 に 検 索 さ れ て こ な い こ と が あ る の で 、 遺 伝 子

を 特 定 す る ために は 、 次 の Blastx を 使う方 が よ い 。

次 世 代 シ ー ケ ン ス 解 析 で得ら れ た断片( 100bp ) を ゲ ノ ム に マ ッ プ す る時は

Blastn を 用 い る 。

BLASTX 実 習

ヒ ト の ゲ ノ ム デ ー タ ベ ー ス に 対 し て 、 >

flounder_test_cDNA_sequence 配 列 を 問 合 せ 配 列 に し て 、blastx_blastn 検 索 を 行 い 、 得 ら れ る デ ー タ の 違 いを 理 解 し よ う .

BLASTの先頭ペ ー ジ で デ ー タ ベ ー ス を [human] に設定

blastnを 使 っ て 、 flounder_test_cDNA_sequence の相同遺 伝 子 を 検 索

Dababase の RefSeq RNA ( ヒ ト cDNA 配 列 の デ ー タ ベ ー ス ) を選択

Somewhat similar sequence (blastn)を選択

BLAST を開始

blastpを 使 っ て 、 flounder_test_protein_sequence で 検 索

17

Page 18: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

Dababase の RefSeq protein ( ヒ ト の タ ン パ ク 質 配 列 デ ー タ ベ ー ス,デ フ ォ ル ト )を選択

BLASP を開始

blastXを 使 っ て 、 flounder_test_cDNA_sequence の相同遺 伝 子 を 検 索

Dababase の RefSeq protein ( ヒ ト の タ ン パ ク 質 配 列 デ ー タ ベ ー ス,デ フ ォ ル ト )を選択

blastx の 特 性 :

こ の プ ロ グ ラ ム で は 、 遺 伝 子 が コ ー ド す る ア ミ ノ 酸 配 列 と相同性 の高い蛋白質 を

探す 。問い 合わせ塩 基 配 列 は 、 一度 6 フ レ ー ム で翻訳さ れ 、翻訳さ れ た 配 列 が 6通り の ア ミ ノ 酸 配 列 デ ー タ ベ ー ス に対し て 検 索 に か け ら れ て い る 。 --- タ ン パ ク

の 配 列 で BLASTP 検 索 し た時と同じ検 索 結 果 が得ら れ て い る

 ア ミ ノ 酸置換 の激し い 遺 伝 子 の相同性 検 索 に非常に有効

 進 化 的 に離れ た 生 物 か ら相同遺 伝 子 を探す場合 にも有効

次 世 代 シ ー ケ ン サ ー を 使 っ た de novo ト ラ ン ス ク リ プ ト ー ム 解 析 で得ら れ た 配

列 を同定 す る場合 、 BLASTX が 使 用 さ れ る

同じ遺 伝 子 の 配 列 zflounder_test_cDNA_sequence の に 、 blastx と blastnで 検 索 さ れ てくる 遺

伝 子 の数が違うこ と に注意!(その 理由を 理 解 し て下さ い )

TBLASTN 実 習

tblastx を 使 っ て 、 flounder_test_cDNA_sequence の相同性 検 索 を試し て み よう

Dababase の RefSeq RNA ( ヒ ト cDNA 配 列 の デ ー タ ベ ー ス ) を選択

配 列 を ペ ー ス ト し て 検 索

tblastx の 特 性 :

問い 合わせの 塩 基 配 列 、 デ ー タ ベ ー ス の 塩 基 配 列 とも3フ レ ー ム で翻訳さ れ 、 検

索 に か け ら れ て い る 。

Tblastx の 利 用例:

単離し た 遺 伝 子 が コ ー ド す る ア ミ ノ 酸 配 列 と相同性 の高い ア ミ ノ 酸 配 列 を コ ー ド

す る 塩 基 配 列 を探す 。 配 列 の 変異が激し い 遺 伝 子 種 の場合 に有効。

講 義

全 ゲ ノ ム シ ョ ッ ト ガ ン (whole genome shotgun sequence)18

Page 19: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

1. プ ラ ス ミ ド ベ ク タ ー と 蛍 光 シ ー ケ ン サ ー を 使 っ た Whole genome shotgun sequence( 次 世 代 シ ー ケ ン サ ー の 解 析 が開発 さ れ る 前 に 使われ て い た 方 法 )

2. 次 世 代 シ ー ケ ン サ ー を 使 っ た Whole genome shotgun sequence(現在、 一般に 使われ て い る )

19

Page 20: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

11 月 5 日 ( 第5回 )

今日 の 授 業 内 容

1. 実 習 : NCBI の ゲ ノ ム デ ー タ ベ ー ス で 生 物 種 を選択し て BLAST検 索

2. 講 義 : プ ラ ス ミ ド ベ ク タ ー と 蛍 光 シ ー ケ ン サ ー を 使 っ た Whole genome shotgun sequence

3. 講 義 : 次 世 代 シ ー ケ ン サ ー の 解 析 原 理 と

実 習NCBIの BLAST 検 索 シ ス テ ム で は 、 生 物 種 を選択し て BLAST 検 索 を行うこ と が できま す 。 授 業 で

は 、 生 物毎の デ ー タ ベ ー ス を 使 っ て 、3つ の 使 用 法 を 実 習 し ま す 。

— さ ま ざ ま な 生 物 の ゲ ノ ム デ ー タ ベ ー ス の 利 用—

  BLAST の先頭ペ ー ジ で 、 BLAST Genomes の枠内 に 生 物 の 一般名(もちろん英語) あ る い は学

名を入力し て 検 索 す る と 、 デ ー タ ベ ー ス に ゲ ノ ム 配 列 が納めら れ て い る 生 物 で あ れば、その 生

物 の 検 索 ペ ー ジ が表示 さ れ ま す 。 バ ク テ リ ア か ら植物 、哺乳類に至る ま で 多様な 生 物 の ゲ ノ ム

情 報 が 利 用 できま す 。 ヒ ト が持っ て い る 遺 伝 子 の相同遺 伝 子 を 進 化 的 に たどっ て 、どの 生 物 に

ま で存在し て い る か と言う疑問に つ い ても、 BLAST 検 索 に よ っ て 調 べ る こ と が できま す 。

練習 : ヒ ト の 増殖細 胞核抗原 ( PCNA: proliferating nuclear antigen ) の相同遺 伝 子 を イネゲ ノ ム

( Oryza sativa (japonica cultivar-group) ) 、 パ ン 酵 母 ( Baker’s yeast; Saccharomyces

cerevisiae ) 、大腸菌( Escherichia coli ) か ら探し て み よう。

  マ ウ ス ビ タ ミ ン D 受 容 体 の 相 同 遺 伝 子 が 、 シ ョ ウ ジ ョ ウ バ エ ( Fruit fly; Drosophila

melanogaster ) 、 線 虫 ( nematode; Caenorhabditis elegans ) 、 イ ネ ( Oryza sativa (japonica cultivar-group) ) に存在す る かどうかも試し て み よう。

>human_pcna

MFEGRLVQGSILKKVLEALKDLINEACWDISSSGVNLQSMDSSHVSLVQLTLRSEGFDTYRCDRNLAMGVNLTSMSKILKCAGNE

DIITLRAEDNADTLALVFEAPNQEKVSDYEMKLMDLDVEQLGIPEQEYSCVVKMPSGEFARICRDLSHIGDAVVISCAKDGVKFS

ASGELGNGNIKLSQTSNVDKEEEAVTIEMNEPVQLTFALRYLNFFTKATPLSSTVTLSMSADVPLVVEYKIADMGHLKYNLAPKI

EDEEGS

>mouse_vitamin_D_receptor

MEAMAASTSLPDPGDFDRNVPRICGVCGDRATGFHFNAMTCEGCKGFFRRSMKRKALFTCPFNGDCRITKDNRRHCQACRLKRCV

DIGMMKEFILTDEEVQRKREMIMKRKEEEALKDSLRPKLSEEQQHIIAILLDAHHKTYDPTYADFRDFRPPIRADVSTGSYSPRP

20

Page 21: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

TLSFSGDSSSNSDLYTPSLDMMEPASFSTMDLNEEGSDDPSVTLDLSPLSMLPHLADLVSYSIQKVIGFAKMIPGFRDLTSDDQI

VLLKSSAIEVIMLRSNQSFTLDDMSWDCGSQDYKYDITDVSRAGHTLELIEPLIKFQVGLKKLNLHEEEHVLLMAICIVSPDRPG

VQDAKLVEAIQDRLSNTLQTYIRCRHPPPGSHQLYAKMIQKLADLRSLNEEHSKQYRSLSFQPENSMKLTPLVLEVFGNEIS

練習 : シ ロ イヌナ ズ ナ : efe; ethylene forming enzyme で 、どの範囲の 生 物 に 関 連 遺 伝 子 が存在

し て い る の か 検 索 し て み よう

> Arabidopsis_ethylene-forming_enzyme_proteinMESFPIINLEKLNGEERAITMEKIKDACENWGFFECVNHGISLELLDKVEKMTKEHYKKCMEERFKESIK

NRGLDSLRSEVNDVDWESTFYLKHLPVSNISDVPDLDDDYRTLMKDFAGKIEKLSEELLDLLCENLGLEK

GYLKKVFYGSKRPTFGTKVSNYPPCPNPDLVKGLRAHTDAGGIILLFQDDKVSGLQLLKDGEWVDVPPVK

HSIVVNLGDQLEVITNGKYKSVEHRVLSQTDGEGRMSIASFYNPGSDSVIFPAPELIGKEAEKEKKENYP

RFVFEDYMKLYSAVKFQAKEPRFEAMKAMETTVANNVGPLATA

— 特 定 の 生 物 の ゲ ノ ム に存在す る 遺 伝 子 ファミ リ ー の メ ン バ ー の 検 索—

 多くの 遺 伝 子 に は 、 生 物 進 化 の過程で共通の 遺 伝 子 か ら派生 し た姉妹遺 伝 子 が存在し ま す 。

ま たその メ ン バ ー は 進 化 に伴っ て 増える傾向に あ り ま す 。 マ ウ ス な ら マ ウ ス の ゲ ノ ム に対し て 、

あ る メ ン バ ー で ゲ ノ ム を 検 索 す る こ と に よ り 、 進 化 的 に 関 連 し て 部 分 的 に でも共通の 配 列 を持

つ メ ン バ ー を 全 て 検 索 す る こ と が できま す 。今回 は 、 マ ウ ス ゲ ノ ム に存在す る核レ セ プ タ ー

ファミ リ ー の メ ン バ ー 、及びG タ ン パ ク共役受容体の メ ン バ ー を探す操作 を 実 習 し ま す 。

練習 : マ ウ ス に核受容体ファミ リ ー の メ ン バ ー が幾つ存在す る か ?

G-protein coupled receptor の メ ン バ ー で試し て み よう。

>human_MC4R

MVNSTHRGMHTSLHLWNRSSYRLHSNASESLGKGYSDGGCYEQLFVSPEVFVTLGVISLLENILVIVAIAK

NKNLHSPMYFFICSLAVADMLVSVSNGSETIVITLLNSTDTDAQSFTVNIDNVIDSVICSSLLASICSLLS

IAVDRYFTIFYALQYHNIMTVKRVGIIISCIWAACTVSGILFIIYSDSSAVIICLITMFFTMLALMASLYV

HMFLMARLHIKRIAVLPGTGAIRQGANMKGAITLTILIGVFVVCWAPFFLHLIFYISCPQNPYCVCFMSHF

NLYLILIMCNSIIDPLIYALRSQELRKTFKEIICCYPLGGLCDLSSRY

 —次 世 代 シ ー ケ ン ス 解 析 で得ら れ た 配 列 の染色体へ の マ ッピン グ—

 最も汎用 さ れ て い る 次 世 代 シ ー ケ ン サ ー で あ る Illumina2000 で は 、 一度の 解 析 で 100bの断片配 列 が約 4000 万個得ら れ ま す 。 ゲ ノ ム 解 析 が行われ て い る 生 物 で は 、 こ の ような

短い断片でも染色体に マ ッピン グ できま す 。 さ ら に参照ゲ ノ ム と 塩 基 配 列 の違い が あ る か

どうか 、 遺 伝 子疾患の 原 因 が 解 析 さ れ た個人の ゲ ノ ム に存在し て い る かどうかも判定 可 能

で す 。

練習 :

BLAST 検 索 で human を選択し て 、 次 の 配 列 を ゲ ノ ム に マ ッピン グ し て み よう。

>human_100bp_fragment

21

Page 22: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

CCAAATTTAATTGATAATGGAAGCTGGCCAGCCACCACCATACAGAATTCTGTAGCTTTGAAGAATGCAGGTTTAATATCC

ACTTTGAAAAAGAAAACAA

講 義

22

Page 23: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

11 月 12 日 ( 第6回 )

今日 の 授 業 内 容

1. 実 習 : 配 列 ア ラ イ メ ン ト

2. 講 義 : 分 子 系 統 樹 に つ い て

4. 講 義 : ゲ ノ ム 解 読 で 分 か っ た ヒ ト ゲ ノ ム の 特 性

講 義

  2 つ以上の 塩 基 配 列 あ る い は ア ミ ノ 酸 配 列 の 一致度を 調 べ る場合 、 ア ラ イ メ ン ト プ ロ グ ラ ム

を 使 い ま す 。 タ ン パ ク 質 の場合 、異な る 生 物間で ア ミ ノ 酸 配 列 を ア ラ イ メ ン ト す る こ と に よ り 、

保存性 の高い領域を 特 定 す る こ と が できま す 。 系 統 的 に隔た っ た 生 物間(例えば、 マ ウ ス とゼ

ブ ラ フ ィ ッ シュ、 あ る い は マ ウ ス と酵母の 関 係 等 ) で保存性 が高い領域は 、 タ ン パ ク 質 の 機 能

で 重 要 な役割を持っ た領域で あ る と考えら れ ま す 。 ま た シ ス テ イ ン残基 は 、 タ ン パ ク 質 の高次

構 造 に深く関わる ジ ス ル フ ィ ド ( S-S ) 結 合 を 作 る場合 が 多 い ため、保存さ れ て い る こ と が 多

く、異な る 生 物 の タ ン パ ク 質 を ア ラ イ メ ン ト す る こ と で 重 要 で保存さ れ た ジ ス ル フ ィ ド 結 合 の

位置を 予 測 できま す 。

  ClustalW プ ロ グ ラ ム を 使うと 、 多 重 ( マ ル チ プ ル ) ア ラ イ メ ン ト の 結 果 か ら 分 子 系 統 樹 を 作

成 できま す 。 分 子 系 統 樹 で は 、 遺 伝 子 の 種間あ る い は同種間におけ る 進 化 的 関 係 を 予 測 す る こ

と が できま す 。 種間の 進 化 的 関 係 で は 、異な る 生 物間におけ る相同遺 伝 子 ( オ ー ソ ロ グ ) を同

定 す る こ と が 可 能 で す 。同種間で 関 連 遺 伝 子 の 系 統 樹 を 作 成 す る と 、 遺 伝 子 ファミ リ ー の メ ン

バ ー の 進 化 的 関 係 が 分 か り ま す 。 ま た モ デ ル 生 物 ( マ ウ ス 、ゼブ ラ フ ィ ッ シュ) の 配 列 を 分 子

系 統 樹 に 加える こ と で 、 研 究対象の 遺 伝 子 に対す る モ デ ル 生 物 の オ ー ソ ロ グ を 検 索 し 、 モ デ ル

生 物 の 情 報 か ら か ら 、 研 究対象の 遺 伝 子 の 機 能 に つ い ておおよその 情 報 を得る こ と が できま す 。

 授 業 で は 、 ペ ア ワ イ ズ ア ラ イ メ ン ト ( 2 つ の 配 列 を比較) 、 マ ル チ プ ル ア ラ イ メ ン ト (3つ

以上の 配 列 を比較)および分 子 系 統 樹 の 作 成 (来週) を 実 習 し ま す 。

配 列 ア ラ イ ン メ ン ト

配 列 ア ラ イ ン メ ン ト と は 、 配 列中で同じ並び方 を し て い る 文 字 列 を探す こ と で あ る 。同一

もしくは似た 文 字 は同じ列 に置き、同一 で な い 文 字 は同じ列 に不一致と し て置くか 、

ギャッ プ を入れ る 。

ペ ア ワ イ ズ ア ラ イ ン メ ン ト (pairwise alignment) : 2 つ の 配 列 の比較

大域的 ア ラ イ ン メ ン ト (global pairwise alignment)局所的 ア ラ イ ン メ ン ト (local pairwise alignment)

多 重 配 列 ア ラ イ ン メ ン ト (multiple alignment) :3つ以上の 配 列 の比較

************************************************************************

23

Page 24: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

実 習

AlignmentPairwise alignment

1 ) 使 用 す る ウ ェ ブ サ イ ト : The European Bioinformatics Institute (EBI )http://www.ebi.ac.uk/Information/ ( Internet explorerを 使 っ て EBI で 検 索 )

2 ) Services の中 か ら Proteins を選 択。 →左 下の See all toolsを開 け 、 リ ス ト の中か ら

EMBOSS を選択

Local alignment → Matcher (protein)2 つ の枠内 に 配 列 を ペ ー ス ト し て Submit練習 :

下の gnrh ( gonadotropin-releasing hormone; 生腺腺刺激ホ ル モ ン ) か ら ヒ ト とゼブ ラ フ ィ

シュを選んで ア ラ イ ン メ ン ト を 実行し て み よう。

次 に 、 ヒ ト と ホヤ( Ciona ) で 実行し て み よう

Global alignment → Needle (protein)Needle, Protein を選択し 2 つ の枠内 に 配 列 を ペ ー ス ト し て Submit練習 :上と同じ入力を行い 、 結 果 の違い を 理 解 し よう

>human_GNRH1

MKPIQKLLAGLILLTSCVEGCSS

QHWSYGLRPGGKRDAENLIDSFQEIVKEVGQLAETQRFECTTHQPRSPLRDLKGALESLIEEETGQKKI

>mouse_Gnrh

MILKLMAGILLLTVCLEGCSSQHWSYGLRPGGKRNTEHLVESFQEMGKEVDQMAEPQHFECTVHWPRSPLRDLRGALESLIEEEA

RQKKM

>chicken_Gnrh1

MEKSRKILVGVLLFTASVAICLAQHWSYGLQPGGKRNAENLVESFQEIANEMESLGEGQKAECPGSYQHPRLSDLKETMASLIEG

EARRKEI

>xenopus_GnRH1

MKAFPTFALLFLVLLFSAHVSDAQHWSYGLRPGGKRDTESLQDMYHETPNEVALFPELERLECSVPQSRLNVLRGALMNWLEGEN

RKKI

>zebrafish_gnrh2

MVLVCRLLLVVGLMLCLSAQLSSAQHWSHGWYPGGKREIDLYDTSEVSEEVKLCEAGKCSYLRPQGRNILKTILLDALIRDFQKR

K

>ciona_gnrh1

MLDIEKDELAALLQRENSAFRDLLYHKNAGNFEKSDSGKFGSLKPQNNFPHLDLGLGVDLDAVDQWNRYKQANAQRMQDLGVPVN

ARQHWSYEFMPGGRRAAWENANVGVPVSRQHWSYEYMPGGRRSAGRHAMTKRQHWSKGYSPGGKRSVDLSEFDDQGRRITKHEGM

PEEPFKVEQPRPRNGIHGPAGLDQNEPDWKNWMNEQPAVSSDDKGSDVE

GNRH: 生腺刺激ホ ル モ ン放出 ホ ル モ ン . 視床下部 で 合 成 さ れ 、下垂体門脈経 路 を介し て下垂体

前葉に運ばれ 、 生腺刺激ホ ル モ ン で あ る 黄体形成 ホ ル モ ン (LH) と濾法刺激ホ ル モ ン (FS

24

Page 25: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

H) の産生 と放出 を促進 す る神経 性 ペ プ チ ド ホ ル モ ン . ホ ル モ ン 前駆体と し て 合 成 さ れ た あ と

酵素に よ り切断さ れ 、 ヒ ト で は HWSYGLRPG ペ プ チ ド が ホ ル モ ン と し て 機 能 す る 。

Ciona: カタユレ イボヤ( ホヤの仲間で 日本の 研 究 グ ル ー プ に よ っ て ゲ ノ ム シ ー ク エ ン ス が 解 読

さ れ た )

講 義分 子 系 統 樹 : Phylogenetic tree, Evolutionary tree

分 子 系 統 樹 ( 進 化 系 統 樹 ) (molecular phylogenetic tree, evolutionary tree)塩 基 配 列やア ミ ノ 酸 配 列 を 基 に 分岐位置と 分岐時間を推定 し 、 構築さ れ た 系 統 樹

近接接合 法 (neighbor-joining method): 距離行列 法 で 作 成 す る 分 子 系 統 樹 の 作 成 方

法 で 、 生 物 分野で最も一般的 に 利 用 さ れ る 。

キ ー ワ ー ド

節、枝、 ク ラ ス タ ー (cluster) あ る い は ク レ ー ド (clade)Outgroup 、 Bootstrap value ( ブ ーツス ト ラ ッ プ値) 、 Evolutionary distance

分 子 系 統 樹 の 利 用

( 1 ) 遺 伝 子 の同種間、異種間で の 系 統 関 係 の 解 析

( 2 ) 遺 伝 子 ファミ リ ー に属す る メ ン バ ー の 系 統 関 係 の 解 析

(3) 重 複 遺 伝 子 の 重 複時期と 進 化 的 関 係 の 解 析

(4) 種や系 統 の 進 化 的 関 係 の推定

 分 子 系 統 樹 か ら 、様々な 情 報 を 読 み 取 る こ と が できま す 。異な る 生 物 達 の 関 連 ( ホ モ ロ グ )

遺 伝 子 で 分 子 系 統 樹 を 作 製 す る と 、 遺 伝 子 の 進 化 的 関 係 を 予 測 す る こ と が できま す 。 ま た ミ ト

コ ン ド リ ア DNA の 配 列 を 使うと 、人種 の類縁関 係や進 化 的 関 係 を 解 析 す る こ と が 可 能 で す 。 授

業 で は 、 分 子 系 統 樹 の 作 製 方 法 と デ ー タ の 見 方 を 講 義 し ま す 。

実 習

分 子 系 統 樹 の 作 製

ClustalW を 使 っ た Multiple alignmen と 分 子 系 統 の 作 成 1 ) 使 用 す る ウ ェ ブ サ イ ト ClustalW     http://clustalw.genome.jp/2 ) Fasta format で並べ た 配 列 を枠内 に ペ ー ス ト し 、 execute multiple alignment を押

す ( 各 種ボタ ン は デ フ ォ ル ト で よ い )

練 習 : 下 の gnrh (gonadotropin-releasing hormone) のうち、 >ciona_gnrh1 ( ホ

ヤ) を除く配 列 で ア ラ イ ン メ ン ト を 実行し て み よう。 次 に 、 >ciona_gnrh1 を入

れ て ア ラ イ ン メ ン ト を 実行し 、 結 果 を比べ て み よう。

25

Page 26: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

上に Multiple sequence alignments の 結 果 が表示 さ れ る 。

その下に あ る select tree menu で表示形式を選択し て 、 Exec を ク リ ッ ク す る

表示形式、 N-J tree branch length と Unrooted dendrogram の 結 果 を比較

し て み よう

>human_GNRH1

MKPIQKLLAGLILLTSCVEGCSS

QHWSYGLRPGGKRDAENLIDSFQEIVKEVGQLAETQRFECTTHQPRSPLRDLKGALESLIEEETGQKKI

>mouse_Gnrh

MILKLMAGILLLTVCLEGCSSQHWSYGLRPGGKRNTEHLVESFQEMGKEVDQMAEPQHFECTVHWPRSPLRDLRGALESLIEEEA

RQKKM

>chicken_Gnrh1

MEKSRKILVGVLLFTASVAICLAQHWSYGLQPGGKRNAENLVESFQEIANEMESLGEGQKAECPGSYQHPRLSDLKETMASLIEG

EARRKEI

>xenopus_GnRH1

MKAFPTFALLFLVLLFSAHVSDAQHWSYGLRPGGKRDTESLQDMYHETPNEVALFPELERLECSVPQSRLNVLRGALMNWLEGEN

RKKI

>zebrafish_gnrh2

MVLVCRLLLVVGLMLCLSAQLSSAQHWSHGWYPGGKREIDLYDTSEVSEEVKLCEAGKCSYLRPQGRNILKTILLDALIRDFQKR

K

>ciona_gnrh1

MLDIEKDELAALLQRENSAFRDLLYHKNAGNFEKSDSGKFGSLKPQNNFPHLDLGLGVDLDAVDQWNRYKQANAQRMQDLGVPVN

ARQHWSYEFMPGGRRAAWENANVGVPVSRQHWSYEYMPGGRRSAGRHAMTKRQHWSKGYSPGGKRSVDLSEFDDQGRRITKHEGM

PEEPFKVEQPRPRNGIHGPAGLDQNEPDWKNWMNEQPAVSSDDKGSDVE

こ の サ イ ト で の 検索結果で は 、 Bootstrap value, evolutionary distance の 値は 表示さ れ な い 。DDBJ の ClustalWを 使え ば 、こ れ ら の 値が 求め ら れ る 。た だ し 、ま た 結果の 図形を 表示す る た め に 、Tree View と言う 無料ソ フ ト を ダ ウ ン ロ ード す る 必要が あ る 。教室の コ ン ピ ュ ータ ーで は 、ソ フ ト ウ ェ ア の ダ ウ ンロ ード は た め ら わ れ る の で 、各自の パ ソ コ ン でDDBJ を 試し て 下さ い 。あ る い は 、ClustalX の プ ロ グ ラ ム を ダ ウ ン ロ ードし て 解析す る (下記URL)。http://www.cbs.dtu.dk/courses/humanbio/2010/exercises/ExMulPhyl/Ex_Phylo.php

NCBI を 使 っ た Multiple alignment と 系 統 樹 の 作 成

1 . NCB→BLAST→ 下に あ る Multiple Alignment を選択

2. 枠内 に 配 列 を Fasta format で コピー

3 . Align を ク リ ッ ク し て 検 索

26

Page 27: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

4. 検 索 画面上の Phylogenetic Tree を ク リ ッ ク

5 . Evolutionary distance を反映し た 系 統 樹 が表示 さ れ る

6 . Tools か ら Layout 、 Radial tree を選択す る と無根系 統 樹 が表示 さ れ る

プ ロ グ ラ ム に は 、 2007 年に開発 さ れ た 、 COBALT: constraint-based alignment tool for multiple protein sequences が 使われ て い る

27

Page 28: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

11 月 19 日 ( 第 7 回 )

実 習

分 子 系 統 樹 の 作 成シ ョ ウ ジ ョ ウ バ エ ( Drosophila ) の hedgehog タ ン パク 質 に 対 す る 、 マ ウ ス ( Mus musculus ) と ツ メ ガエ ル ( Xenopus tropicalis) の 類 似 遺 伝 子 を 検 索 し て分 子 系 統 樹 を 作 成 す る 。配 列 は Word あ る い は メ モ 帳 ( Text フ ァ イ ル ) にコ ピ ー す る 。

手順は以下の ように行う

1. シ ョ ウ ジ ョ ウ バ エ ( Drosophila ) の hedgehog タ ン パ ク 質 の ア ミ ノ 酸 配 列

を 取 り 出 す

NCBIを 使 っ て 、 proteinデ ー タ ベ ー ス で Drosophila と hedgehog で キ ー ワ ー ド 検 索

す る (Accession number: AAF56102) 。 FASTA ボタ ン を押す と 、 FASTA フ ォ ー ム の 配

列 が表示 さ れ る 。 ア ミ ノ 酸 配 列 を Word に コピー す る 。 > 名前 を付け て 、 Fasta format と す る ( ス ペ ー ス と数字 は 、 検 索時に削除さ れ て 計算さ れ る の で 、その ま

ま に し てもか まわな い ) 。

2. マ ウ ス の Drosophila hedgehog に対す る ホ モ ロ グ を 検 索 し て 、 配 列 を 取 り

出 す

BLAST の先頭ペ ー ジ で 、 mouse を ク リ ッ ク し 、 Bastp を選択し て 検 索 す る ( マ ウ

ス ゲ ノ ム に コ ー ド さ れ る 全 て の タ ン パ ク 質 ア ミ ノ 酸 情 報 に対し て 検 索 ) 。

 検 索 に よ り表示 さ れ た3種類の hedgehog の 配 列 を 取 り 出 す 。 取 り 出 し 方 は 、

Accession 番号を ク リ ッ ク し 、表示 さ れ た 配 列 情 報 ペ ー ジ の上に あ る FASTA ボタ

ン を押す 。 FASTA フ ォ ー ム の 配 列 が表示 さ れ る で 、 コピー す る 。

3.Xenopusの Drosophila hedgehog に対す る ホ モ ロ グ を 検 索 し て 、 配 列 を 取 り 出 す

BLAST の先頭ペ ー ジ で 、 Xenopus tropicalis を指定 す る 。以下、 2 の操作 と同じ。

3 . ClustalW で 解 析

こ の 授 業 で は 、 ClustalW ( http://clustalw.genome.jp/ ) を 使う。枠内 に7つ の 遺 伝

子 の 全 配 列 を コピー し 、 マ ル チ プ ル ア ラ イ メ ン ト を 実施す る 。

マ ウ ス と Xenopus の間で 配 列 の保存性 を注意深くみ て 、保存性 の 特徴を 理 解 す る 。

4. 分 子 系 統 樹 を得る

検 索 結 果 の 一番下で 分 子 系 統 樹 を 出力。

N-J tree branch length と Unrooted dendrogram の 結 果 を比較

4の 結 果 と あわせて 、 Outgroup, Paralog, Ortholog の 関 係 を 理 解 す る 。 ヒ ト 遺 伝 子間の パ

ラ ロ グ よ りも、 ヒ ト と Xenopus の オ ル ソ ロ グ間の 方 が保存性 の高い こ と に注意 。 こ れ は

28

Page 29: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

祖先遺 伝 子 が 重 複 し て 2 つ の 遺 伝 子 ( パ ラ ロ グ と な る ) を形成 し 、その あ と に 種 分 化 が

起こ っ た ためで あ る 。

講 義

オ ル ソ ロ グ と パ ラ ロ グ 、 ホ モ ロ グ の 関 係 に つ い て

 無 脊椎 動 物 か ら脊椎 動 物 へ の 進 化 の過 程で 、 全 ゲ ノ ム ( 全 て の染 色体 ) の 重 複 ( whole genome duplication: WGD ) が 2 回起こ っ て い ま す 。その ため原 索動物 ( ナ メ ク ジ ウ オ ・ ホヤ等

が含ま れ 、脊索 を形成 す る 。無脊椎動物 の な か で脊椎動物 に 進 化 的 に最も近い ) で 1 種類で

あ っ た 遺 伝 子 は 、 一度 4 つ に数が 増えて い ま す ( 遺 伝 子 に よ っ て は 4 つ に 増えた あ と 、 4 つ と

も残っ て い るもの 、 1 つ消失し て 3 つ が残っ て い るもの 、 2 つ消失し て 2 つ が残っ て い るもの 、

3 つ が消失し て 1 種類だけ残っ て い るものもあ り ま す ) 。 一 つ の 遺 伝 子 か ら 、 ゲ ノ ム 重 複 に よ

り誕生 し た 重 複産物 の 種 内 で の 関 係 は パ ラ ロ グ ( Paralog ) と呼ばれ ま す 。

一 方 、 生 物 種間で相同な 遺 伝 子 は 、 オ ル ソ ロ グ ( Ortholog ) と呼ばれ ま す 。脊椎動物 (円口

類を除く: 1 回 の み 重 複 、 2 度目の 重 複 の 前 に 分岐) で は 、 進 化 の初期段階 で 2 回 の ゲ ノ ム の

重 複 が起こ り 、その後で 、 多様な 種 に 分岐し て い ま す 。その ため、 多くの 遺 伝 子 が 種 を超えて

重 複 し た状態で ゲ ノ ム中に存在し て い ま す 。それ ら の組み 合わせの中で 、 生 物 種間で相同な 重

複 遺 伝 子 ( 配 列 が最も近似) が オ ル ソ ロ グ ( Ortholog ) と な り ま す 。 パ ラ ロ グ に相当す る 遺 伝

子 は通常、それ ら の 機 能 は大きく変 化 し て い る の に対し 、 オ ル ソ ロ グ の 関 係 に あ る 遺 伝 子 は 、

種 が異な っ ても(例えば哺乳類と魚類) 機 能 が良く保存さ れ て い ま す 。その ため、ゼブ ラ

フ ィ ッ シュでもヒ ト の モ デ ル 生 物 と し て十分 な役割を は た す こ と が できるわけ で す 。 オ ル ソ ロ

グ と パ ラ ロ グ と の 関 係 は 、 分 子 系 統 樹 を 作 製 す る こ と に よ り 理 解 できま す 。 ホ モ ロ グ ( 関 連 遺

伝 子 ) は 、共通祖先か ら 発 生 し た 遺 伝 子 の 総称で 、 ホ モ ロ グ に は オ ル ソ ロ グ と パ ラ ロ グ とも含

ま れ ま す 。

 オ ル ソ ロ グ と パ ラ ロ グ の 関 係 を 理 解 す る ために 、 生 物 の 進 化 の 歴 史 、 遺 伝 子 重 複 の 歴 史 に つ

い て 解 説 し ま す 。 ま た hedgehog 遺 伝 子 を モ デ ル と し て 、 分 子 系 統 樹 を 作 製 し 、 ホ モ ロ グ と パ

ラ ロ グ の 関 係 を 説 明 し ま す 。

 無脊椎動物 か ら脊椎動物 に 進 化 す る過程で 発 生 し た ゲ ノ ム 重 複 に つ い て少し詳しく説 明 し ま

す 。 hox 遺 伝 子 、核内受容体遺 伝 子 を例に し て 、 ゲ ノ ム に刻ま れ た 遺 伝 子 重 複 の 歴 史 を 解 説 し

ま す ( こ こ で は 、 配付資料を参考に し て 説 明 し ま す ) 。

>zebrafish_dand5

MTFQVGFFVLLSVTTIGAFPRNAFQREFHRHVAKDFESSGNGPDEPVRGSVRIVKLNPHFLRRAAVSHVP

FRNSPSRGAFPAFLALGRPGPAILTHSKPAPQVSSSADRRKQGLEMWKKVVHKSERKKEAVALRINPKDM

NKQSCAAVPFTQRITEEGCETVTVHNNLCYGQCSSMFVPSSGGSHGQQKAQCMRCGPSRARSVLLHLRRG

SEVRERRVLIVEECKCETSSEEAKVQNTDMFNL

>zebrafish_gremlin-2

MFWKLAIPAILAWTLFASTETKKQRPQGSIPSPYKLKGNDLSSPSHALASLPQHTASARRQKGKHDMLSS

SREALVVTERKYLKSDWCKTQPLRQTVSLEGCISRTVINRFCYGQCNSFYIPRHLTSQSSHRSRKTASTP

DHTTSFQSCAFCRPSRITTVTVRLHCPGLQPPYRQRKVQRIKQCKCVSVNVNAAY

>zebrafish_gremlin-1

MGRFTDRFFSKISPGRSSSTLTVMPASCASSSGWILCAVLLSSALLWCPTESKRNRGAIPHPDKNTPNES

29

Page 30: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

SRSPQQQESASGSRARSRGSEEVLESSQEALHVTERRYLKRDWCKTQPLKQTIHEEGCISRTIINRFCYG

QCNSFYIPRHVRREEGAFQSCSFCKPKRFTTMSFTLSCPDQQPPTRKKRVQRVKQCRCISIELD

>Human_gremlin-1

MSRTAYTVGALLLLLGTLLPAAEGKKKGSQGAIPPPDKAQHNDSEQTQSPQQPGSRNRGRGQGRGTAMPG

EEVLESSQEALHVTERKYLKRDWCKTQPLKQTIHEEGCNSRTIINRFCYGQCNSFYIPRHIRKEEGSFQS

CSFCKPKKFTTMMVTLNCPELQPPTKKKRVTRVKQCRCISIDLD

>Human_gremlin-2

MFWKLSLSLFLVAVLVKVAEARKNRPAGAIPSPYKDGSSNNSERWQHQIKEVLASSQEALVVTERKYLKS

DWCKTQPLRQTVSEEGCRSRTILNRFCYGQCNSFYIPRHVKKEEESFQSCAFCKPQRVTSVLVELECPGL

DPPFRLKKIQKVKQCRCMSVNLSDSDKQ

>Hman_cerberus

MHLLLFQLLVLLPLGKTTRHQDGRQNQSSLSPVLLPRNQRELPTGNHEEAEEKPDLFVAVPHLVATSPAG

EGQRQREKMLSRFGRFWKKPEREMHPSRDSDSEPFPPGTQSLIQPIDGMKMEKSPLREEAKKFWHHFMFR

KTPASQGVILPIKSHEVHWETCRTVPFSQTITHEGCEKVVVQNNLCFGKCGSVHFPGAAQHSHTSCSHCL

PAKFTTMHLPLNCTELSSVIKVVMLVEECQCKVKTEHEDGHILHAGSQDSFIPGVSA

>Human_dand5

MLLGQLSTLLCLLSGALPTGSGRPEPQSPRPQSWAAANQTWALGPGALPPLVPASALGSWKAFLGLQKAR

QLGMGRLQRGQDEVAAVTLPLNPQEVIQGMCKAVPFVQVFSRPGCSAIRLRNHLCFGHCSSLYIPGSDPT

PLVLCNSCMPARKRWAPVVLWCLTGSSASRRRVKISTMLIEGCHCSPKA

30

Page 31: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

>drosophila_hh

MDNHSSVPWASAASVTCLSLDAKCHSSSSSSSSKSAASSISAIPQEETQTMRHIAHTQRCLSRLTSLVALLLIVLPMVFSPAHSCGPGRGLGRHRA

RNLYPLVLKQTIPNLSEYTNSASGPLEGVIRRDSPKFKDLVPNYNRDILFRDEEGTGADRLMSKRCKEKLNVLAYSVMNEWPGIRLLVTESWDEDY

HHGQESLHYEGRAVTIATSDRDQSKYGMLARLAVEAGFDWVSYVSRRHIYCSVKSDSSISSHVHGCFTPESTALLESGVRKPLGELSIGDRVLSMT

ANGQAVYSEVILFMDRNLEQMQNFVQLHTDGGAVLTVTPAHLVSVWQPESQKLTFVFADRIEEKNQVLVRDVETGELRPQRVVKVGSVRSKGVVAP

LTREGTIVVNSVAASCYAVINSQSLAHWGLAPMRLLSTLEAWLPAKEQLHSSPKVVSSAQQQNGIHWYANALYKVKDYVLPQSWRHD

>mouse_dhh

MALPASLLPLCCLALLALSAQSCGPGRGPVGRRRYVRKQLVPLLYKQFVPSMPERTLGASGPAEGRVTRGSERFRDLVPNYNPDIIFKDEENSGAD

RLMTERCKERVNALAIAVMNMWPGVRLRVTEGWDEDGHHAQDSLHYEGRALDITTSDRDRNKYGLLARLAVEAGFDWVYYESRNHIHVSVKADNSL

AVRAGGCFPGNATVRLRSGERKGLRELHRGDWVLAADAAGRVVPTPVLLFLDRDLQRRASFVAVETERPPRKLLLTPWHLVFAARGPAPAPGDFAP

VFARRLRAGDSVLAPGGDALQPARVARVAREEAVGVFAPLTAHGTLLVNDVLASCYAVLESHQWAHRAFAPLRLLHALGALLPGGAVQPTGMHWYS

RLLYRLAEELMG

>mouse_ishh

MSPAWLRPRLRFCLFLLLLLLVPAARGCGPGRVVGSRRRPPRKLVPLAYKQFSPNVPEKTLGASGRYEGKIARSSERFKELTPNYNPDIIFKDEEN

TGADRLMTQRCKDRLNSLAISVMNQWPGVKLRVTEGWDEDGHHSEESLHYEGRAVDITTSDRDRNKYGLLARLAVEAGFDWVYYESKAHVHCSVKS

EHSAAAKTGGCFPAGAQVRLENGERVALSAVKPGDRVLAMGEDGTPTFSDVLIFLDREPNRLRAFQVIETQDPPRRLALTPAHLLFIADNHTEPAA

HFRATFASHVQPGQYVLVSGVPGLQPARVAAVSTHVALGSYAPLTRHGTLVVEDVVASCFAAVADHHLAQLAFWPLRLFPSLAWGSWTPSEGVHWY

PQMLYRLGRLLLEESTFHPLGMSGAGS

>mouse_shh

MLLLLARCFLVILASSLLVCPGLACGPGRGFGKRRHPKKLTPLAYKQFIPNVAEKTLGASGRYEGKITRNSERFKELTPNYNPDIIFKDEENTGAD

RLMTQRCKDKLNALAISVMNQWPGVKLRVTEGWDEDGHHSEESLHYEGRAVDITTSDRDRSKYGMLARLAVEAGFDWVYYESKAHIHCSVKAENSV

AAKSGGCFPGSATVHLEQGGTKLVKDLRPGDRVLAADDQGRLLYSDFLTFLDRDEGAKKVFYVIETLEPRERLLLTAAHLLFVAPHNDSGPTPGPS

ALFASRVRPGQRVYVVAERGGDRRLLPAAVHSVTLREEEAGAYAPLTAHGTILINRVLASCYAVIEEHSWAHRAFAPFRLAHALLAALAPARTDGG

GGGSIPAAQSATEARGAEPTAGIHWYSQLLYHIGTWLLDSETMHPLGMAVKSS

>xenopus_shh

MLVATQSLLLLSFICTLVTPPGLACGPGRGIGKRRHPKKLTPLAYKQFIPNVAEKTLGASGRYEGKITRNSDCFKELTPNYNPDIMFKDEESTGAD

RLMTQRCKDKLNALAISVMNQWPGVKLRVTEGWDEDGHHLEESLHYEGRAVDITTSDRDRSKYGMLGRLAVEAGFDWVYYESKAHIHCSVKAENSV

AAKSGGCFPAGARVMVEFGGTKAVKDLRPGDRVLSSDPQGNLLYSDFLMFIDQERDVKKLFYVIETSQRKIRLTAAHLLFVAQTKVNGTRSFKSVF

ASNIQPGDLIYTADPKTMTLKAVKVEKVDLEEDTGAYAPLTAHGTVVIDQVLASCYAVIEEHTWAHLAFAPLRFGMSLSSYIYPRDSSPPSGLQPH

HQVDLQSHHQVDLQSHHQVDLQSHHQLEGIHWYSQLLYQIGTWLLDSNSLHPLGMATKSS

>xenopus_dhh

MPAVRIVILAICCGLLLVPVRCCGPGRGPVGRRRYMRKLVPLHYKQFVPNVPEKTLGASGKSEGKIHRGSERFIELVPNYNPDIIFKDEEKTGADR

LMTERCKDRVNALAISVMNMWPGVKLRVTEGWDEDGHHAHDSLHYEGRALDITTSDRDRNKYGMLARLAVEAGFDWVYYESKAHIHVSVKADNSLG

VRSGGCFPGTAMVMMGTGERKPLSELKIGDTVYTTDETGQLITSVVLLFLHRNPYKTATFVLIEAEGHPSKLLVTPNHLLFIQSSSSAGFLPFAYR

VQIGDLVQIYVNGTQVQSSKVVRVSLEEQTGVYAPMTEHGTLLVDGVLTSCYATVESHTLAHVSLAPLRLFQGIASMLPDLDMSDGVHWYCHILYV

LAKYVLWWDMP

>xenopus_ihh

MQLPKVVLLLCAAALLLSGAVRGCGPGRVVGRRRRPTKLSPLSYKQFSPNVPEKTLGASGRYEGKISRNSERFKELTPNYNPDIIFKDEEITGADR

LMTQRCKDRLNSLAISVMNQWPGVKLRVTEGWDEDGHHFEESLHYEGRAVDITTSDRDRNKYGMLARLAVEAGFDWVYYESKAHIHCSVKSEHSAA

AKTGGCFPGEALATLESGEKIPVSQLSPGLRVLAMDNSGRPTYSDFLSFLDHSPKEEHMFQVIKTQDPHRRLFLTPAHLIFVSDNYSTPASEFQAV

FASSVRPGQYILVSNVVGLIPAKVRSVNTQTNYGAYAPLTQHGTLVVDDVVVSCFALVQKQRLAQIVYWPLRVLYNLGIIAGTQPSQQMGIHWYSK

ALYHLGRLILHGNEFHPLGIVQLES

>c_elegance

31

Page 32: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

MRAVLLTILILFKEVTGTSFLQTAAHAVRDFKLPAFSDTNGHACFSTDSWMTTPSGKKRMDQVGIGDLVLTGNLTAT

YYTPIITWMHREPENRYNFYTIMTEYGKMLAVSAKHLIYRNLCDENYAEYVKYLPKGRNVVYAEELKVGDCLVLLYK

GKFRQQRVMRISITERKGIYAPITKNGRIIVNDIVASVFSGIKHTRLQSDYYSTIAYAQSWLWIFGETVFHKATIPI

GSALASDVLRLVIP

>C_elegance_2

MIFLLFTLSILSHVEAGSFKNIGLSTDNKHQSPCIWNQTHAWSHPYQSLIVECCDESLKDLLQNFIRQGK

AGSLGDLAKVIQRKAQLEFHASFEAIICKSNFAISTHYHGSQACKVHVENQYFLIYETPVQYDPFNMHME

NYLSSIDSSDPLGSTKPQGLRGGFKDHRDDVTAGENLSVQPDADNILQYPNRWSQQDAKEEIFTTEASIE

NAFVLGTNMSHLPDIAEIDLVGPVPVPKNFTNLRIRDRLPENTHCEKERRDGNKCCSGPLASTMRDAMSQ

MASSPDFGPGGEGIIANRIQHSVQHRFKSSYEVIVSRSDFMISTRSGEKICKFQSKGFYILAYATPKQYD

IEKVEEERKLADISILDPLGSMESNFPHEAPQNVQLLLESSGDRVGFPVGSHCLEEVRTGSKCCSIDMFN

AMNAAYNTHMASSYFNAYDIRNISKVVQWNVEEVFQHSAEVIVALDDFVYASHYNDSFTCKYRVDRYHIL

AYLTPDHNLDKRISEVEIPNQITPSPYWITPVPMTVHQQPMFNLQQNLLPYQLPTHFSSPFTYAFGRMKR

QIGTSPYPIHLSIFHDIGYAIPIFCPSTLTGLFGSIICDGGVAYDMIRIVEETRQQPGFDKHNSRAMAKM

ITRTMERRFDTTFDSIAAEADFAWKTQKFNGRVSKLYLGGYSALSFQSSPDPPPASDFVDVANDPTVDGP

VYTDREQEDDDNDDDDGGDDMSSTSTTTTTTIPPPFFALPVPPPPPVPPPPPPPFLTCFSRDTWVTTPSG

KKRMDEIEIGDYVLTADLKTALFSAITLWIHREPETVQEFLEIKTDNGKTLQLTAGHFIYATECRYLPSK

NSSLLNSTPERYRHLIDTLPDDSETKLASQLKIGECLLIHNGDQFRMQKIDSISKTVSTGIYSPLTENGR

ILVNDVLASCYSEVQQNVLQTTFFWAFDRLRNLIVQYFGDLYLDEIELPTGTSLYKEVLTLVIPIRK

32

Page 33: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

11 月 26 日 ( 第 8 回 )

実 習

代 謝 経 路 デ ー タ ベ ー ス の 利 用

 無料で公開さ れ て い る 代 謝 経 路 の デ ー タ ベ ー ス と し て最も充実 し て い る の が 、京都大学化学

研 究所が 統括し て い る KEGG (Kyoto Encyclopedia of Genes and Genomics) で あ る 。 代 謝 経 路

の マ ッ プ を 調 べ る こ と が できるだけ で なく、 遺 伝 子 の 機 能 、 配 列 、 タ ン パ ク 質 の 立体構 造も検

索 できる 。 ク ロ ーニン グ し た 遺 伝 子 がどの ような 代 謝 経 路 で 機 能 し て い る か 、 あ る い は 代 謝異

常の メカニズ ム なども調 べ る こ と が できる 。

 ま た さ ま ざ ま な 化 合 物 (抗生 物 質 等 )や市販の医薬品の 構 造 、 薬 理 作 用 、 副 作 用 を 検 索 す る

こ ともできる 。 遺 伝 子や化 合 物 の 機 能や相互作 用 を 調 べ る場合 、 ま た レ ポ ー ト 作 成 等 にも役立

つ 。 日本語表記の サ イ トも利 用 できる 。

 KEGG MEDICUS と名付け ら れ た 、医薬品・疾患・ パ ス ウ ェ ー の 統 合 デ ー タ ベ ー スも公開さ

れ て い る 。疾患・医薬品・環境物 質 など社会的ニー ズ の高い デ ー タ を 、 ゲ ノ ム 情 報 を 基盤と し

た 生体シ ス テ ム 情 報 と い て 統 合 し た リ ソ ー ス で 、 研 究者だけ で なく、医療従事者や一般の人に

も情 報 を 提供し て い る 。

KEGG ブ ラ ウ ザ : http://www.genome.jp/kegg/pathway.html

KEGG Pathway を開け て み よう。 パ ス ウ ェ ー の項目は 、以下ように 分類さ れ て い る 。

1. Metabolism ;代 謝 経 路 (ビタ ミ ン A, retinol metabolism, の 代 謝 経 路 を 調 べ て み よ

う。 代 謝産物 を 示 す が ア ク テ ィ ブ で 構 造 等 が表示 さ れ る 。 ま た 代 謝 を司る酵素名も◯ア ク テ ィ ブ で 、 配 列 情 報 等 が表示 さ れ る )

2. Genetic Information Processing ;遺 伝 子 か ら蛋白質 合 成 経 路 ・蛋白の修飾と 分

解 ・ ゲ ノ ム の修復 等 ( homologous recombination と non-homologous end-joining の 経 路

を比較し て み よう)

3. Environmental Information Processing ;細 胞 内 シ グ ナ ル 伝 達 経 路 ・ 分泌性 シ グ ナ

ル 因 子 を介し た 細 胞間相互作 用 ( TGF-beta の 細 胞 内 伝 達 系 を 調 べ て み よう。 発現の促

進 と抑制( アゴニス ト ) の 関 係 が 分 か る )

4. Cellular Processes : 細 胞 の活動、 細 胞 分裂サ イ ク ル 等 ( Oocyte meiosis (卵母細

胞減数分裂) を 調 べ て み よう)

5. Organismal system;免疫系 ・ 内 分泌制御経 路 等 ( GnRH 、 生殖腺刺激ホ ル モ ン放

出 ホ ル モ ン 、 の 内 分泌経 路 を 調 べ て み よう)

6. Human Deseases : 発 ガ ン 経 路 ・ 代 謝異常等 ( Melanoma, プ リ オ ン病 , diabetes( 1型糖尿病、 2 型糖尿病) の 発症経 路 を 調 べ て み よう)

7. Drug Development :抗生 物 質 ・ 薬 剤 の 化学構 造 ( penicillin, antidepressants を 調 べ

て み よう。 合 成 経 路 、 薬 剤 の 分 解酵素等も表示 さ れ る )

33

Page 34: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

遺 伝 子 の キ ー ワ ー ド で パ ス ウ ェ ー を 検 索 す る時の操作 は下記の通り ( 遺 伝 子名か ら パ ス

ウ ェ ー に入る )

練習 に hh; hedgehog の シ グ ナ ル パ ス ウ ェ ー を 見 よう

1. 先頭ペ ー ジ で KEGG PATHWAT を ク リ ッ ク

2. 枠に hedgehog を入力し て GO3 . hedgehog が 関与す る パ ス ウ ェ ー ( Entry ) が 複数表示 さ れ る

4. 試し に map04340 を選択し て み よう。

5. パ ス ウ ェ ー が拡大さ れ る 。 各 遺 伝 子 が ア ク テ ィ ブ で 、 配 列 ・ 機 能 情 報 に リ

ン ク し て い る 。

6. 上の HEDGEHOG SIGNALLING PATHWAY を選択す る と 、 こ の シ グ ナ ル の 説 明

を 見 る こ と が できる 。

練習 に estradiol の 合 成 経 路 を 調 べ て み よう

1. 先頭ペ ー ジ で KEGG PATHWAT を ク リ ッ ク

2. 枠に estradiol を入力し て GO3 . estradiol が 関与す る パ ス ウ ェ ー ( Entry ) が 複数表示 さ れ る

4 . Steroid hormone biosynthesis を あ け る と cholesterol か ら の 合 成 経 路 を 見 ら

れ る

5. 反応を 触媒す る酵素名が ア ク テ ィ ブ で反応系 、 配 列 等 の 情 報 を 見 る こ と が

できる

6. ま た 各 代 謝産物 の 化学構 造も表示 できる

遺 伝 子 の 化 合 物 の 構 造 を 検 索 す る時の操作 は下記の通り

練習 に ampicillin の 構 造 を 調 べ て み よう

1. 先頭ペ ー ジ で KEGG DRUG を ク リ ッ ク

2. 枠に ampicillinを入力し て GO3 . Entry を選択す る と 構 造 等 が 見 ら れ る

12 月 3 日 ( 第 9 回 )

KEGG の BLAST検 索 を 使 っ て 、 調 べ た い 遺 伝 子 ・ タ ン パ ク 質 が乗っ て い る パ ス ウ ェ ー を 検

索 す る こ ともできる .1. KEGG2 先頭ペ ー ジ上段の GENES を ク リ ッ ク 。 BLAST を開け る 。

2 . 例と し て 、下の 塩 基 配 列 (私達 の 研 究 グ ル ー プ が ウ ナギか ら ク ロ ーニン グ し

た 遺 伝 子 で まだデ ー タ ベ ー ス に は登録し て い な い ) で BLASTX 検 索 し て み よ

>test_DNA_sequence-2

ATCACTGCGTCTTGTGTCCTATCGGTCTAGCCTAGCCACTGTCTANAAGCTATAGGAAGGTTTCAGTATTGGGAGCCATGTTTGGGAGC

CTGCTGTTCACTGTGCTGTGTGAGGCAGCAGTGGCCCTCATCAACCCAAATCTAAGCCTCCATTGGGAGATGTGGAAGGAGGGACATGA

CAAGACCTACCTGTTTAAGGCTGAAGAGTTTGCACGCCGCCAGATCTGGGAGAAGAACCTGAAGCTGATAACTCTGCATAATTTGGAGG

CGTCCATGGGAATGCACACCTATGATCTGGGCATGAACCACCTAGGAGACTTGACTACCGAGGAGATTCTTGACGTGCTAGCTGTAACT

CGTGTGCCTCCAAACTTCAGCAGGGGTCCTTCTCCCTTTGTGGGGGTATCCAGGGCCCCTGTGCCTCACAATGTTGATTGGCGAAGAAA

34

Page 35: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

GGGCTATGTCACAGAAGTCAAGAGTCAGGGGCGTTGTGGCTCCTGCTGGGCCTTCAGTGCTGCAGGTGCCCTGGAGGGCCAGCTGATGA

AGACTCAGGGAACACTTGTATCCCTCAGCCCTCAGAACCTGGTTGACTGCTCCTACAAATATGGCAACGAGGGCTGTCATGGAGGGTTC

ATGACTCAAGCCTTCCAGTATGTCATTGAGAACGGGGGCATTGAGTCTGACTTTTCATACCCTTACACTGGCATGGAAGAACAATGCAG

ATATGATTCAGAACTCCGTGTTGCCAACTGTTCCAGCTACAGGTTTCTTCCTGAAGGTGATGAGGTTGCATTAAAATGGGCTCTGGCCA

CTGTTGGACCAATCTCTGTGGCTATTGATGCTGCTCGACCTAATTTCCACTTCTACCGGAGTGGTGTGTACCATGACCCTACCTGTACC

CAAGAAGTAAACCATGGTGTTCTAGCAGTTGGCTATGGTACGCTCAATGGTGAGGACTACTGGCTTGTGAAGAACAGCTGGGGACAGCC

TTTTGGGGAACAGGGCTACATTCGCATGGCACGAAACAAGAACAACCAGTGTGGCGTTGCCTTGTATGCCTGCTACCCCATTATGTGAC

GACCTGAAGCAAAGGATTGATTTCTAACTTGAAACATTTTAAAATTTTTATTTTGATTTGCACCTGTGCATGTTACTGATTTGTAAAGA

ATACTGTTAAAATGATTTGTATTAAAAAAATATATATTTTTAGATGTGGAATTTTAGTTGAACCTAAATAAATAAATGTAAAAAAAAA

1. ゼブ ラ フ ィ ッ シュDre の エ ン ト リ ー を開け て み よう

2 . Pathway を開け て み よう。 検 索 し た 遺 伝 子 の パ ス ウ ェ ー上の 位置が 分 か る

KEGG MEDICUS利 用 できる サ ービス

・ KEGG MEDICUS  医薬品情 報

・ KEGG MEDICUS  疾患情 報

・ KEGG MEDICUS  医薬品相互作 用

・ KEGG BRITE 医薬品分類

・ KEGG お薬 情 報

・ KEGG 先頭ペ ー ジ上段で 、 MEDICUS を選択

・ Imatinib と言う医薬品で キ ー ワ ー ド 検 索 し て み よう

・効果 、 製 造会社、 化学構 造 等 を知る こ と が できる :

講 義 : 論 文 の 構 成 、 文献デ ー タ ベ ー ス

1. 実 習 : 文献検 索 ( PubMed )

講 義

配 列 情 報 と 文献の 検 索

 研 究 計 画 を 立 て る場合 、その 研 究 に 関 連 し た過去の 論 文 を リ ス ト ア ッ プ し て 、既に 報告さ れ

て い る 成 果 を 調 べ ておくこ と が大変 重 要 で す 。 こ の操作 に よ り 、 こ れ か ら 進める 研 究 テ ー マ に

つ い て 、 研 究 がどこ ま で 進んで い る の か 、何が 分 か っ て い な い の か を 調 べ る訳で す 。そし て未

知の 生 物現象を 解 明 す る の に 、最も有効な 計 画 を 立 案 し ま す 。もちろん研 究 で 遺 伝 子 を扱う場

合 、その 遺 伝 子 の 配 列 、 こ れ ま で に 分 か っ て い る 性 質 を 調 べ ておくこ とも重 要 で す 。 こ の 検 索

操作 をちゃんと し ておか な い と 、 「せっ かく得ら れ た 実験成 果 が既に 報告さ れ て い た 」 と言う

ような悲惨な こ とも起きかねません。

 ま た卒業 論 文や投稿用 論 文 の 作 成時に は 、緒言に 研 究 の 歴 史 と背景、 研 究 内 容 の意義 を述べ 、

35

Page 36: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

考察で は 実験結 果 と既知の 成 果 を比較検討し 、 研 究 で得ら れ た新し い知見 に つ い て議論 し ま す 。

論 文 を仕上げる時にも、 関 連 論 文 を 収 集 し て精査す る必要 が あ り ま す 。 文献以外にも、 ク ロ ー

ニン グ し た 遺 伝 子 と 関 連 遺 伝 子 と の ア ラ イ メ ン ト を行うこ とや、 分 子 系 統 樹 を 作 成 す る の に 関

連 遺 伝 子 を デ ー タ ベ ー ス か ら引き出 し てくる こ と が必要 と な る こ と が あ り ま す 。

 例えば、自分 の 研 究 で ウ シやブ タ などの家畜、 あ る い は 作 物 で 遺 伝 子 を ク ロ ーニン グ し た と

し ま す 。 遺 伝 子 機 能 に 関 す る 研 究 が 進んだ現在で は 、 モ デ ル 生 物 ( マ ウ ス 、ニワ ト リ 、ゼブ ラ

フ ィ シュ、 シ ョ ウ ジ ョ ウ バ エ 、線虫、酵母、 シ ロ イ ズ ナ ズ ナ 等 ) のどれ か で相同遺 伝 子 の 機 能

が 解 析 さ れ 、 論 文 の形で 出版さ れ て い る こ と が 多 い と言えま す 。その 論 文 を 読めば、 ク ロ ーニ

ン グ し た 遺 伝 子 の持つ 機 能 の 概 要 を知る こ と が できま す 。 デ ー タ ベ ー ス を 利 用 す れば、 こ の様

な 情 報も簡単に 収 集 できま す 。 遺 伝 子 を BLAST 検 索 し 、 モ デ ル 生 物 の相同性 の高い 遺 伝 子 配 列

を探し 、そこ か ら 文献情 報 を探す こ と が 可 能 で す 。

 今日 は 、 研 究 計 画 を 立 て る時や論 文 を書く際 、 ク ロ ーニン グ さ れ た 遺 伝 子 に 関 連 す る 論 文 の

検 索 、 研 究や論 文 作 成 で必要 な 論 文 の 検 索 方 法 を 実 習 し ま す 。

文献の 検 索 に は 、 ( 1 ) NCBIの PuBMed 、 ( 2 )大学の 図書館の オ ン ラ イ ン ジャー ナ ル 、

( 3 ) Scopus( Elsevier 社の有料検 索 シ ス テ ム ) が 利 用 できま す 。 PuBMed の 使 い勝手が最近

非常に よくな っ た の で 、ほとんどの こ と は PuBMed で す み ま す 。従っ て 、 PuBMed の 使 い 方 を

中心に 演 習 し 、大学の 図書館の オ ン ラ イ ン ジャー ナ ル に つ い て少し 解 説 を 加えま す 。

文献検 索 を 使う目的 に は 、下記の ように幾つ か の シ チュエ ー シ ョ ン に 分 か れ ま す 。 いずれも

PuBMed で 可 能 で す 。

1. 特 定 の 論 文 をダウ ン ロ ー ド し た い 。

2. あ る 研 究者がどの ような 論 文 を 出版し て い る か知り た い

3. あ る 生 物現象に 関 す る 論 文 をもれ なく調 べ た い 。

4. 作 成中の 論 文 の考察に必要 な 論 文 を探し た い

5. 扱う遺 伝 子 に 関 連 す る 論 文 を 調 べ た い 。

実 習

文献の 検 索

使 用 す る ウ ェ ブ サ イ ト : NCBI使 用 す る ア イ テ ム : PubMed 上の枠の下に あ る Advanced ボタ ン を 使う。

左の All Fields ボタ ン を ク リ ッ ク す る と 、 著者名、 出版年度 、 タ イ ト ル中の ワ ー ド 、

Abstract中の ワ ー ド 、 Journal (雑誌)名で 検 索 できる シ ス テ ム に な っ て い る 。 こ れ

ら をうまく使うと必要 な 文献をうまく検 索 す る こ と が 可 能 で あ る 。それぞれ に つ い て

授 業 で は 実 習 し ま す 。東北大学図書館が購読契約し て い る雑誌、 あ る は Plos One の よ

うな on-line journal で あ れば、 検 索 結 果 の ペ ー ジ か ら 論 文 の pdf ファイ ル を と りだし て 、

36

Page 37: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

プ リ ン トやダウ ン ロ ー ド が できま す 。

1. 特 定 の 論 文 をダウ ン ロ ー ド し た い 。

例えば、山中先生 が ノ ー ベ ル賞をもらうこ と に な っ た iPS 細 胞 の 論 文 を探し て み よ

う。

Author: Yamanaka ShinyaJournal: Cell

2. あ る 研 究者がどの ような 論 文 を 出版し て い る か知り た い

例えば、私と 研 究室の助教の横井さんの共著論 文 を探し て み よう。

Author: Suzuki TohruAuthor: Yokoi Hayato

3. あ る 生 物現象に 関 す る 論 文 をもれ なく調 べ た い 。 論 文 の考察に 関 連 す る 論 文 を探し た い 。

例えば、魚類の iPS 細 胞 に 関 す る 論 文 が 出版さ れ て い る か ?

Title/Abstract: FishTitle/Abstract: iPS cell

成長ホ ル モ ン の 日周リ ズ ム に 関 す る 論 文 を知り た い

Title/Abstract: growth hormoneTitle/Abstract: circadian rhythm

4. 扱う遺 伝 子 に 関 連 す る 論 文 を 調 べ た い 。

例えば、癌遺 伝 子 Brca2 に 関 す る 論 文 を 調 べ た い 。

Title/Abstract: Brca2Title/Abstract: human or mouse or zebrafish

BLAST 検 索 結 果 か ら 、 検 索 し た 遺 伝 子 に 関 す る 文献情 報 を 収 集 す る こ ともできま す 。 リ ス ト

ア ッ プ さ れ てきた 遺 伝 子 の名称が ア ク テ ィ ブ で 、それ を ク リ ッ ク す る と 配 列 情 報 に 加えて 、

PUBMED の番号を添えた形で 関 連 の 論 文もリ ス ト ア ッ プ さ れ て い ま す 。 PUBMED 番号を ク リ ッ

ク す る と 文献情 報 に入る こ と が できま す 。

test_sequence-1 で試し て み よう。

>test_sequence-1(zebrafish_charon)_peptide

MTFQVGFFVLLSVTTIGAFPRNAFQREFHRHVAKDFESSGNGPDEPVRGSVRIVKLNPHFLRRAAVSHVPFRNSPSRGAFP

AFLALGRPGPAILTHSKPAPQVSSSADRRKQGLEMWKKVVHKSERKKEAVALRINPKDMNKQSCAAVPFTQRITEEGCETV

TVHNNLCYGQCSSMFVPSSGGSHGQQKAQCMRCGPSRARSVLLHLRRGSEVRERRVLI

「 電 子 ジャー ナ ル 」 へ の ア ク セ ス の 方 法

東北大学ホ ー ム ペ ー ジ→東北大学付属図書館→電 子 ジャー ナ ル リ ス ト (学内者限定 )→

雑誌名の キ ー ワ ー ド 検 索 OR ア ル ファベ ッ ト順で 検 索→ volume, page 入力・ 検 索

37

Page 38: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

EndNote文献の ラ イ ブ ラ リ ー の 作 成 、 論 文 へ の 文献の引用 、 文献リ ス ト の 作 成 に は 、 EndNote が

広く使われ て い ま す 。市販品は 6 万円程度で か な り高価で す が 、 論 文 を書く人に は必携

で す 。

短期間で あ れば、試供品が 使えま す 。 ま た 機 能 は か な り 製 薬 さ れ て い ま す が 、無料版も

公開さ れ て い ま す 。

Impact factor科学分野毎に 、 複数の Journal が 出版さ れ て い ま す 。どれだけ Journal 内 の 論 文 が 、他の 論

文 に よ っ て引用 さ れ て い る か 、 す なわち引用 回数に よ っ て 、 Journal の評価が 分 か れ ま す 。

それ ら を数値化 し たもの に Impact factor が あ り ま す 。 Impact factor は 、 「大学図書館」

の 「 デ ー タ ベ ー ス 」 に あ る 「 InCites Journal Citation Reports (JSR) 」 で 、 調 べ る こ と が

できま す 。

38

Page 39: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

12 月 10 日 ( 第 10 回 )

講 義

タ ン パ ク 質 の 構 造 に つ い て の 解 説各 種 プ ロ グ ラ ム を 使うこ と に よ り 、 タ ン パ ク 質 の 構 造 的 特徴を 予 測 す る こ と が できま す 。今日

の 授 業 で は 、 シ グ ナ ル ペ プ チ ド 、 ド メ イ ン 構 造 に つ い て 解 説 し た あ と 、 テ ス ト 配 列 を 使 っ て 実

際 に こ れ ら 構 造 の 検 索 ( 分 子 量 、 等 電 点 、 シ グ ナ ル ペ プ チ ド 、 疎 水 性 ・ 親 水 性領域、 ド メ イ ン

構 造 ) を行い ま す 。

 代表的 な ド メ イ ン 構 造 ( モ チ ー フ ) 検 索 サ イ ト に は 、 イギリ ス の サ ン ガ ー 研 究所が公開し て

い る Pfam が あ り ま す 。

シ グ ナ ル ペ プ チ ド

分泌性 の蛋白質 の N 末端に存在す る 、 15-30 残基 の 疎 水 性 ア ミ ノ 酸 か ら 構 成 さ れ た シ グ ナ ル 配

列 。 分泌前 に 、 シ グ ナ ル ペ プ チダーゼに よ っ て切断さ れ る 。

タ ン パ ク 質 の ド メ イ ン ( モ チ ー フ ) 構 造

ド メ イ ン 構 造 ( = モ チ ー フ ) : タ ン パ ク 質 の ア ミ ノ 酸 配 列 の な か で 、 特有な 性 質 を持っ た領域。

分 子 の 構 造上あ る い は 機 能上一 つ の ま と ま り を持つ領域。

ド メ イ ン 構 造 の例

細 胞膜レ セ プ タ ー : リ ガ ン ド 結 合 ド メ イ ン 、 細 胞膜貫通ド メ イ ン 、 チ ロ シ ン キ ナ ーゼ

ド メ イ ン 、 リ ン 酸 化 ド メ イ ン

核レ セ プ タ ー : リ ガ ン ド 結 合 ド メ イ ン 、 DNA 結 合 ド メ イ ン

実 習

塩 基 配 列 の ア ミ ノ 酸 配 列 へ の 変 換

塩 基 配 列 を ア ミ ノ 酸 配 列 に 変 換 できる サ イ ト : NCBI/Open Reading Finder, ExPasy/Tranlate

NCBI/Open Reading Finder を 使 っ て 塩 基 配 列 ( >test_DNA_sequence-1 ) を ア ミ ノ 酸 配

列 に 変 換 し て み よう

1 ) 利 用 す る ウ ェ ブ サ イ ト : NCBI (National Center for Biotechnology Center) http://www.ncbi.nlm.nih.gov/

2 ) 使 用 す る ア イ コ ン : Open Reading Frame Finder (ORF finder )open reading frame =  蛋白質 を コ ー ド す る 塩 基 配 列 の 読 み 取 り枠

39

Page 40: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

ORF finder に よ る 検 索 手 順1 . NCBIの ウ ェ ブ サ イ ト を開き、左上Resource List (A-Z) を ク リ ッ ク

2 . Open reading frame finder(ORF finder)を開け る

3.ア ミ ノ 酸 配 列 に 変 換 す る

配 列 (FASTA format) を枠内 に 配 列 を コピー す る

OrfFind ボタ ン を押す

青 で 示 さ れ た 部 分 が 、 予想さ れ る ア ミ ノ 酸 配 列

( セ ン ス 、 ア ン チ セ ン ス 鎖 の3フ レ ー ム で の翻訳結 果 が 示 さ れ る )

通常、 一番長い フ レ ー ム が タ ン パ ク 質 の コ ー ド 配 列 で あ る

青 の バ ー を ク リ ッ ク す る = 塩 基 配 列 と ア ミ ノ 酸 配 列 が表示 さ れ る

4.推定 さ れ た ア ミ ノ 酸 配 列 を 取 り 出 す に は

Acceptボタ ン を押す

Viewボタ ン を押す : ア ミ ノ 酸 配 列 デ ー タ と諸情 報 が 示 さ れ て い る

ア ミ ノ 酸 配 列 を テ キ ス ト ファイ ル 等 に コピー す る

>test_DNA_sequence-1(zebrafish_charon)

AACGAAACCTTGAACCGCAAGATTTTTCAACAAATAATCGACTATATGTATTTTTAGAGAGAAATAAATTCCCTCTCTTTT

CTTTTTTGTAAAATTCTATAATTTAGCTAAAATGACTTTTCAGGTCGGCTTTTTTGTGCTGTTGTCAGTCACAACAATTGG

CGCTTTCCCGCGCAATGCATTTCAGCGGGAATTTCACCGACACGTGGCGAAAGACTTTGAATCCTCCGGGAATGGACCAGA

CGAACCTGTTCGGGGATCTGTCCGAATTGTCAAACTAAACCCTCATTTTCTGCGCCGGGCCGCCGTTAGTCATGTGCCGTT

CAGAAATTCACCAAGTCGAGGCGCGTTTCCCGCGTTCTTGGCCCTCGGACGTCCGGGCCCCGCAATCCTGACCCATAGCAA

ACCTGCGCCTCAGGTGAGCAGCAGTGCAGACAGGAGGAAACAAGGGCTCGAGATGTGGAAGAAAGTGGTGCACAAAAGCGA

GCGAAAAAAAGAGGCAGTGGCTCTGCGCATCAATCCCAAAGACATGAACAAACAGAGCTGTGCCGCAGTTCCCTTTACACA

GCGCATAACGGAGGAGGGCTGTGAGACGGTGACCGTTCACAATAATCTCTGCTACGGTCAGTGCAGCTCCATGTTCGTGCC

CTCCAGCGGAGGCTCTCACGGACAACAGAAAGCGCAGTGCATGCGCTGCGGCCCCTCTAGAGCGCGCTCCGTGCTCCTGCA

CCTGCGCCGCGGGTCTGAGGTGCGGGAGAGGCGCGTACTGATCGTTGAGGAGTGCAAGTGTGAAACCAGCAGCGAAGAGGC

CAAAGTTCAGAACACAGATATGTTTAATTTATAACAGTCATTTTAAAGTTTATAAAAATCGTAA

//

Expasyの Translate に よ る 検 索 手 順

タ ン パ ク 質 の 構 造 解 析 で は 、ヨー ロ ッ パ の 研 究 機 関 の ウ ェ ブ サ イ ト が充実 し て い る 。 特 に

Swiss Institute of Bioinformatics 、 Sanger研 究所( イギリ ス ) の サ イ ト は 、 利 用価値が高い 。 前

者は 、 ExPASy (Bioinformatics Resource Portal) 、後者は Pfam ( ド メ イ ン 解 析 ) を公開し て い る 。

ま た European Bioinformatics Institute (EBI)でも、 タ ン パ ク 質 の 構 造 解 析 プ ロ グ ラ ム を公開し て い

る 。

1 . Expasy を あ け る

2. 左の Resource A..Z を選択

3 . Translate を選択

4. 枠内 に 塩 基 配 列 の み コピー し 、 Translate sequenceを ク リ ッ ク し て 検 索

40

Page 41: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

41

Page 42: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

12 月 17 日 ( 第 11 回 )

基 本 構 造 の 解 析

タ ン パ ク 質 の 分子量・等電点の 予 測 :

1 ) ExPASy (http://ca.expasy.org/)を開け る 。

2 ) 左の Resource A..Z を選択

3 ) Compute PI/Mw を選択

4) 下記の > zebrafish_Charon で 検 索 し て み よう。 ア ミ ノ 酸 配 列 を枠内 に コピー す る

( 配 列 の み : こ の プ ロ グ ラ ム で は > で 始 ま る 行 は コ ピ ー し な い ) 。 Click here to computepI/Mw ボタ ン を ク リ ッ ク す る 。

5) 検 索 結 果 : Theoretical pI/Mw: 10.00 ( 等 電 点 ) / 27073.04( 分 子 量 )

>zebrafish_CharonMTFQVGFFVLLSVTTIGAFPRNAFQREFHRHVAKDFESSGNGPDEPVRGSVRIVKLNPHFLRRAAVSHVPFRN

SPSRGAFPAFLALGRPGPAILTHSKPAPQVSSSADRRKQGLEMWKKVVHKSERKKEAVALRINPKDMNKQSCA

AVPFTQRITEEGCETVTVHNNLCYGQCSSMFVPSSGGSHGQQKAQCMRCGPSRARSVLLHLRRGSEVRERRVL

IVEECKCETSSEEAKVQNTDMFNL

//

(ゼブ ラ フ ィ ッ シュCharon: 分泌型の シ グ ナ ル タ ン パ ク 質 )

疎水性・親水性領域の 解 析 :

1 ) ExPASy Proteomics tools (http://ca.expasy.org/) を開け る 2 )左の Resource A..Z を選択

3) Prot Scale を選択

4) ア ミ ノ 酸 配 列 を枠内 に コピー す る 。 Hphob. / Kyte &Doolittle ( デ フ ォ ル ト状態:

疎 水 性 / 親 水 性 解 析 で最も利 用 さ れ て い る プ ロ グ ラ ム ) を選択す る 。

5) >zebrafish_fgfr1 で試し て み よう

6) Submit ボタ ン を押す

7) 結 果 : グ ラ フ の プ ラ ス が 疎 水 性 、 マ イ ナ ス が 親 水 性 を 示 す . fgfr1 で は 、 ア ミ ノ末端

側の 疎 水領域は シ グ ナ ル ペ プ チ ド の 部 分 。中央の 疎 水領域は 、 細 胞膜貫通ド メ イ ン で

あ る 。

>zebrafish_fgfr1

MIMKTTLLLISVLLTQALQSQGRPAIQDEAPAEPTSYTLDSGEKLELSCKAKEDTQKVTWTKDLVPLVDGEHTRLRN

DQMEIEKVEPADSGLYACFAQGLNSNHTEYFNISVTDEEDEVDSSSEEAKLSNDQNLPMAPVWAQPDKMEKKLHAVP

ASKTVKFRCQANGNPTPTLKWLKNGKEFKRDQRIGGFKVREHMWTIIMESVVPSDRGNYTCLVENRHGSINHTYQLD

VVERSPHRPILQAGLPANRTAVVGSDVEFECKVFSDPQPHIQWLKHIEVNGSRYGPDGLPYVRALKTAGVNTTDKEM

EVLQIRNVSLEDAGEYTCLAGNSIGHSHHSAWLTVYKAVPPTQLPNQTYLEVLIYCVGFFLICVMVGTAVLAKMHSS

AKKSDFNSQLAVHKLAKSIPLRRQVTVSVDSSSSMHSGGMLVRPSRLSSSGSPMLSGVSEYELPQDPRWEVQRDRLV

LGKPLGEGCFGQVMMAEAMGMDKEKPNRITKVAVKMLKSDATEKDLSDLISEMEMMKIIGKHKNIINLLGACTQDGP

LYVIVEFAAKGNLREYLRVRRPPGMEYCYNPDQVPVENMSIKDLVSCAYQVARGMEYLASKKCIHRDLAARNVLVTE

42

Page 43: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

DNVMKIADFGLARDIHHIDYYKKTTNGRLPVKWMAPEALFDRIYTHQSDVWSFGVLLWEIFTLGGSPYPGVPVEELF

KLLKEGHRMDRPSTCTHELYMMMRDCWHAVPSQRPTFKQLVEDLDRTLSMTSNQEYLDLSVSLDQFSPNFPDTRSST

CSSGEDSVFSHDAGADEPCLPKFPPHPNRGVAFKKR

( FGF 受容体: 細 胞 内 に チ ロ シ ン キ ナ ーゼド メ イ ン を持っ た膜貫通型細 胞膜受容体・

FGF=fibroblast growth factor/ 繊維芽細 胞 増殖因 子 :創傷治癒、培養条件下で繊維芽細

胞 の 分裂を促進 す る 。胚発 生 で は中胚葉誘導に 関与す る )

シ グ ナ ル ペ プ チ ド の 検 索

タ ン パ ク 質 の シ グ ナ ル ペ プ チ ド の 予 測 :

1 ) SignalP 3.0 Server ( http://www.cbs.dtu.dk/services/SignalP/ ) を開け る ( デ ン マ ー

ク の Technical University が公開)

2 ) >zebrafish_Charon で 検 索 し て み よう。 ア ミ ノ 酸 配 列 を枠内 に コピー す る 。 Submitボタ ン を ク リ ッ ク す る 。

練習 :下の ア ミ ノ 酸 配 列 でも検 索 し て み よう

>mouse_vitamin_D_receptor

MEAMAASTSLPDPGDFDRNVPRICGVCGDRATGFHFNAMTCEGCKGFFRRSMKRKALFTCPFNGDCRITKDNR

RHCQACRLKRCVDIGMMKEFILTDEEVQRKREMIMKRKEEEALKDSLRPKLSEEQQHIIAILLDAHHKTYDPT

YADFRDFRPPIRADVSTGSYSPRPTLSFSGDSSSNSDLYTPSLDMMEPASFSTMDLNEEGSDDPSVTLDLSPL

SMLPHLADLVSYSIQKVIGFAKMIPGFRDLTSDDQIVLLKSSAIEVIMLRSNQSFTLDDMSWDCGSQDYKYDI

TDVSRAGHTLELIEPLIKFQVGLKKLNLHEEEHVLLMAICIVSPDRPGVQDAKLVEAIQDRLSNTLQTYIRCR

HPPPGSHQLYAKMIQKLADLRSLNEEHSKQYRSLSFQPENSMKLTPLVLEVFGNEIS

(ビタ ミ ン D受容体は 、核に移行す る蛋白質 な の で シ グ ナ ル ペ プ チ ド は な い )

ド メ イ ン 構 造 の 検 索

タ ン パ ク 質 の ド メ イ ン 構造の 予 測 -1: Pfam を 使う( ド メ イ ン 検 索 で最も利 用 さ れ て

い る : 機 能 ド メ イ ン を探す の に便利 )

今日 は 、下の マ ウ ス のビタ ミ ン D受容体で 検 索 し ま す 。

1 ) Pfam ( http://pfam.sanger.ac.uk/ ) ( イギリ ス の サ ン ガ ー 研 究所) を開け る

2 ) SEQUENCE SEARCH ボタ ン を押す

3) 枠内 に ア ミ ノ 酸 配 列 (試し に >mouse_vitamin_D_receptor ) を コピー し 、 Go を押す

4) み つ か っ た ド メ イ ン 構 造 が グ ラ フ ィ ッ ク で上に 図 示 さ れ る 。

5) 下に は 各 ド メ イ ン の 説 明 が表示 さ れ る 。

6) 一番右の Show/hide alignment を押す と 、 デ ー タ ベ ー ス に納めら れ て い る ド メ イ ン

配 列 と問い 合わせ配 列 の ア ラ イ メ ン ト が表示 さ れ る

7) ド メ イ ンネー ム (上の グ ラ フ ィ ッ クも同様) が ア ク テ ィ ブ で 、それ を押す と 、 ド メ

43

Page 44: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

イ ン の 説 明 、 立体構 図 が表示 さ れ る

8) 右上の グ ラ フ ィ ッ クツー ル のうち、 crystallographic structuresを押す と 、 み つ か っ た

タ ン パ ク 質 の高次 構 造 が グ ラ フ ィ ッ ク で 示 さ れ 、詳細 な 構 造 の 説 明も表示 さ れ る 。

PBD ID を押す と 、 タ ン パ ク 質 の高次 構 造 ( ア ル ファへ リ ッ ク ス 構 造 等 ) が表示 さ れ

る 。

>mouse_vitamin_D_receptor

MEAMAASTSLPDPGDFDRN

VPRICGVCGDRATGFHFNAMTCEGCKGFFRRSMKRKALFTCPFNGDCRITKDNRRHCQACRLKRCVDIGMMKEFILT

DEEVQRKREMIMKRKEEEALKDSLRPKLSEEQQHIIAILLDAHHKTYDPTYADFRDFRPPIRADVSTGSYSPRPTLS

FSGDSSSNSDLYTPSLDMMEPASFSTMDLNEEGSDDPSVTLDLSPLSMLPHLADLVSYSIQKVIGFAKMIPGFRDLT

SDDQIVLLKSSAIEVIMLRSNQSFTLDDMSWDCGSQDYKYDITDVSRAGHTLELIEPLIKFQVGLKKLNLHEEEHVL

LMAICIVSPDRPGVQDAKLVEAIQDRLSNTLQTYIRCRHPPPGSHQLYAKMIQKLADLRSLNEEHSKQYRSLSFQPE

NSMKLTPLVLEVFGNEIS

(ビタ ミ ン D受容体;核タ ン パ ク 質受容体ファミ リ ー の メ ン バ ー で 、骨形成 等 に 関与

す る )

終わっ た人は 、 次 の タ ン パ ク 質 で 検 索 し て み よう:

ゼブ ラ フ ィ ッ シュ・ FGF レ セ プ タ ー

等 鎖 結 合 部 位 の 予 測

Asn-Xaa-Ser/Thr タ イ プ の 等 鎖 結 合 部 位 の 予 測 プ ロ グ ラ ム

http://www.cbs.dtu.dk/services/NetNGlyc/

3D 構 造 デ ー タ ベ ー ス の閲覧

NCBI の 利 用

NCBIの Resource List の中に あ る Structure (Molecular Modelling Database) を 使うと 、 タ ン パ ク 質

構 造 デ ー タ ベ ー ス に納めら れ て い る 3D 構 造 を閲覧す る こ と が できま す 。

↓NCBI homepage↓Resource List か ら Structure (Molecular Modelling Database) を選択

↓ 左カラ ム の Search を選択

↓Search の枠に タ ン パ ク 質 明 を入力し て 検 索 (試し に prion, VDR で 検 索 し て み よう)

PDB (Protein Data Bank) の 利 用

www.pdb.org 上の ア イ コ ン か ら macromolecule を指定 し て キ ー ワ ー ド 検 索 (試し に prion, VDR で 検 索 し て み

よう)

3D 構 造だけ で なく、 遺 伝 子 の 機 能 の 解 説も添えら れ て い る

NCBI blastp に よ る 検 索

44

Page 45: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

Blastp で デ ー タ ベ ー ス を Protein Data Bank を選択し て 検 索 す る (上の Protein Data Bankに登録さ れ て い る高次 構 造 の 分 か っ て い る タ ン パ ク 質 に対し て blastp検 索 が行われ る )

配 列類似遺 伝 子 で高次 構 造 の 解 析 さ れ て い る タ ン パ ク 質 が表示 さ れ る 。右の Accession ボ

タ ン を押す と 、 デ ー タ が表示 さ れ る 。右に 3D 構 造 が 図 示 さ れ る 。

12 月 24 日 ( 第 12 回 )

酒井先生 が下記の 内 容 で 授 業 を行い ま す 。

配 列 の ア ラ イ ン メ ン ト手法 とBLAST検 索 の 原 理

・ 配 列 の ア ラ イ ン メ ン ト と は

・ 全域ア ラ イ ン メ ン ト と局所ア ラ イ ン メ ン ト

・ ア ミ ノ 酸置換行列

・動的 計 画 法 に 基づく局所ア ラ イ ン メ ン ト の求め方

・BLASTはどの ように 検 索 を行っ て い る の か

(動的 計 画 法 と の違い と 、それ に ともなう利 点 、問題 点 )

進 化 系 統 樹 とCLASTAL Wで 用 い ら れ て い る近隣結 合 法 の 原 理

・ 種 の 進 化 モ デ ル

・ 分 子時計仮説

・ ウ ル ト ラ メ ト リ ッ ク木と 加 法木

・UPGMA法

・近隣結 合 法

以上に つ い て 概 説 す る 。

講 義 と 実 習

21 世紀の 分 子 生 物学で革新的 な新技術

こ の 5 年間で 実 用 化 さ れ た ゲ ノ ム編集技術 ( Genome editing ) と 次 世 代 シ ー ケ ン ス 解

析 ( New generation sequencing: NGS ) の 2 つ の技術 は 、おそらく分 生 生 物学におけ る

今世紀最大の技術革新で あろうと思われ ま す 。 前者は 生 物 の ゲ ノ ム 配 列 を人為的 か つ簡便

に書き換える こ と を 可 能 に し た技術 で 、後者は ヒ ト の ゲ ノ ム でも 1 回 の 解 析 で シ ー ケ ン ス

できる ナ ノ技術 で す 。 2 つ の技術 の 重 要 な 点 と し て 、 基礎生 物学に 加えて 、農学を含め応

用 研 究 に無限の 可 能 性 を秘めて い る こ と を強調 し ておく必要 が あ り ま す 。 ゲ ノ ム編集 で は 、

農林水産の新品種開発 が活発 に推進 さ れ て い ま す 。 NGS は 、既に品種 の ゲ ノ ム育種や形質

の責任遺 伝 子 の同定 に有効利 用 さ れ て い ま す 。

45

Page 46: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

ゲ ノ ム編集技術 の 原 理

ゲ ノ ム編集広く使われ て い る CRISPR/Cas9 法 は 、簡単に ま とめる と 、 ファー ジ ウ ィ ル

ス に対す る 細菌の獲得免疫シ ス テ ム を 遺 伝 子工学の技術 に展開す る こ と で 、 ゲ ノ ム に

配 列 特異的 に 2 本鎖切断を誘起す る こ と を 可 能 に し た技術 と いえま す 。 ゲ ノ ム編集 は 、

CRISPR/Cas9 法 を 用 い て 遺 伝 子 の ノ ッ ク ア ウ ト 、 あ る い は 配 列 の ノ ッ ク イ ン を行う技

術 と な り ま す 。 ノ ッ ク ア ウ ト で は 、 2 本鎖切断の修復 で起こ る 塩 基 の欠損や挿入に よ

る フ レ ー ム シ フ ト を 利 用 し て い ま す 。 あ る い は 、 2 本鎖切断を 遺 伝 子 内 に 2 カ所誘起し て 、その間の 配 列 を削除す る こ と でもノ ッ ク ア ウ ト が 可 能 で す 。受精卵に Cas9 と

複数の 遺 伝 子 の ガ イ ド RNA を導入す る こ と で 、同時に 複数個の 遺 伝 子 を ノ ッ ク ア ウ ト

す る こ とも可 能 で す 。

ノ ッ ク イ ン で は 、 2 本鎖切断部 位 に ド ナ ー 配 列 を設計 す る こ と で 、相同組換えに よ る

遺 伝 子導入が高効率と な り 、 ES 細 胞 を 用 いずに 、直接受精卵内 で ノ ッ ク イ ン す る こ

と が 可 能 で す 。

CRISPR/Cas9 で の標的 配 列 の設計

  CRISPR/Cas9 の標的 配 列 は 20 塩 基程度で極めて短い ために 、同じ配 列 あ る い は 1塩 基違う配 列 が標的 配 列以外にも存在す る 可 能 性 は大い に あ り ま す 。標的 配 列 に 加え

て 、 こ の ような 配 列 は CRISPR/Cas9 で切断さ れ る ために オ フ タ ー ゲ ッ ト と呼ばれ 、正

確な ゲ ノ ム編集 に は オ フ タ ー ゲ ッ ト の無い 配 列 を標的 に す る必要 が あ り ま す 。 全 ゲ ノ

ム の 配 列 が決定 さ れ て い る 生 物 で あ れば、 オ フ タ ー ゲ ッ ト の無い 配 列 を選択す る こ と

が 可 能 で す 。 ま た CRISPR/Cas9 で は 、標的 配 列 の設定 部 位 は 、 Pam配 列 ( NGG ) に

よ り制限さ れ ま す 。 CRISPRdirect を 使うと 、 Pam 配 列 の上流に 特異性 の高い標的 配

列 が設計 す る こ と が できま す 。 授 業 で は 、 CRISPR/Cas9 法 の 原 理 を簡単に 説 明 し たう

えで 、 CRISPRdirect の 使 い 方 を 実 習 し ま す 。

46

Page 47: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

1 月 7 日 ( 第 13 回 )

実 習

— ゲ ノ ム 塩 基 配 列 を デ ー タ ベ ー ス か ら 取 り 出す —

Ensembl Genome Brower

Ensembl Genome Brower ( ゲ ノ ム デ ー タ の 統括サ イ ト ) は 、 Sanger研 究所・ EBI が管理 す る

ゲ ノ ム デ ー タ ベ ー ス で す 。最大の 特徴は 、必要 な 遺 伝 子 、 あ る い は染色体領域の ゲ ノ ム 塩 基

配 列 の デ ー タ を 取 り 出 す こ と が できる こ と に あ り ま す 。 cDNA を 特異的 に 増幅す る PCR プ ラ

イ マ ー の設計 、 CRIPR-Cas9 を 使 っ た ゲ ノ ム編集 、 ノ ッ ク ア ウ ト マ ウ ス の相同組換えに 用 い る

配 列 、 GFP を 使 っ た レ ポ ー タ ー 遺 伝 子 作 製 用 の プ ロ モ ー タ ー 配 列 が 必 要 な 場 合 などで 、

Ensembl を 使 っ て ゲ ノ ム 配 列 を 取 り 出 す こ と に な り ま す 。 実 習 で は 、 Ensembl の 説 明 と 実 際

の 配 列 の 取 り 出 し 方 を教えま す 。

ま た 、 ゲ ノ ム 配 列 、 全 遺 伝 子 の コ ー ド 配 列 、 、 全 遺 伝 子 の cDNA 塩 基 配 列 、 全蛋白質 の ア ミ

ノ 酸 配 列もダウ ン ロ ー ド す る こ と が 可 能 で 、それ ら を 使 っ て自前 で バ イ オ イ ン フ ォ マ テ ィ ッ

ク ス 解 析 を行うこ と が できま す 。

「 使 用 法 - 1 」

Ensemblを 使 っ て 、試し にゼブ ラ フ ィ ッ シュの sonic   hedgehog a ( shha) の ゲ ノ ム 配 列 を 取

り 出 し て み ま す 。

1.下記の ウ ェ ブ サ イ ト を開け る

http://www.ensembl.org/index.html (ensembl で キ ー ワ ー ド 検 索 )2.生 物 種 を指定 す る

zebraish を選択

3.検 索項目か ら gene を選び、 遺 伝 子名 (shh) をボッ ク ス に入れ て 検 索

4.リ ス ト ア ッ プ さ れ てきた 複数の 遺 伝 子 か ら 、 shha( ENSDARG00000068567 ) を ク リ ッ ク す

染色体上の 地 図 が表示 さ れ る

5.左側のツー ルボッ ク ス の中か ら Sequence を選択し て ク リ ッ ク

6.配 列 が表示 さ れ る ( エ ク ソ ン は赤字 で肌色 の背景、 エ ク ソ ン間の 黒 字 の 部 分 は イ ン ト ロ ン 、

第 一 エ ク ソ ン よ り上流は プ ロ モ ー タ ー領域の 一 部 で あ る )

7.戻っ て 、 Location か らもゲ ノ ム 構 造 を 検 索 す る こ と が できる

8.左側に あ る Export data で 、範囲を選択し て 配 列 を 取 り 出 す こ と が できる (範囲を指定 し て 、

よ り長い プ ロ モ ー タ ー 配 列 を 取 り で す こ と が できる )

「 使 用 法 - 2 」

ゲ ノ ム 配 列 、 全 遺 伝 子 の コ ー ド 配 列 、 全蛋白質 の ア ミ ノ 酸 配 列 をダウ ン ロ ー ド す る

Gene annotation --- Download genes, cDNAs, ncRNA, proteins (FASTA) か らダウ ン ロ ー ド 可 能

47

Page 48: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

転 写 調 節 領 域 の コ ン セ ン サ ス 結 合 配 列 の 予 測 -

講 義遺 伝 子 の 発現調節機 構

 それぞれ の 遺 伝 子 の 発現は 、 特 定 の 細 胞 ま た時期に必要 量だけ 発現す る ように 調節さ れ て い

ま す 。例えば、 ペ プ シ ノ ー ゲ ン の 発現は胃に限定 さ れ ており 、筋肉や脳で は決し て 発現し な い

ように制御さ れ て い ま す 。 発 生 に 関 係 す る 遺 伝 子 の な か に は 、魚類の孵化酵素の ように 一 生 の

うち孵化時に 一度だけ 発現す る 遺 伝 子もあ り ま す 。 こ の ような 発現調節に 関 す る 情 報 は 、 ゲ ノ

ム の コ ー ド領域で は なく、その近辺に存在す る 転 写 調節領域( エ ンハン サ ー領域) に コ ー ド さ

れ て い ま す ( 5’上流に あ る場合 が 多 い が 、 3’下流に あ るものやイ ン ト ロ ン に あ る 遺 伝 子も存在

す る ) 。 具体的 に は 、 転 写 因 子 が 結 合 す る コ ン セ ン サ ス 結 合 配 列 がその 情 報 と言うこ と に な り

ま す 。それぞれ の 転 写 因 子 は 、 ゲ ノ ム の決ま っ た 配 列 を認識し て 結 合 し ま す 。その 配 列 が コ ン

セ ン サ ス 結 合 配 列 で す 。 コ ン セ ン サ ス 結 合 配 列 は 、 6-20 塩 基ほどの短い 配 列 で す 。 転 写 調節領

域に は 、 複数個の コ ン セ ン サ ス 配 列 が存在し 、 複数の 転 写 因 子 が 結 合 ・ 解離す る こ と に よ り 、

遺 伝 子 の 転 写 を精密に 調節し て い ま す 。 講 義 で は 転 写 調節の メカニズ ム に つ い て 解 説 し 、 実 習

で 転 写 調節領域の コ ン セ ン サ ス 配 列 を 検 索 し ま す 。

実 習ゼブ ラ フ ィ ッ シュの sonic hedghog遺 伝 子 の 5’上流域の 転 写 調節領域の 配 列 ( 2000 bp ) を ゲ ノ

ム デ ベ ー ス か ら 取 り 出 し 、 コ ン セ ン サ ス 結 合 配 列 を 予 測 し て み ま す 。

コ ン セ ン サ ス 結 合 配 列 の 検 索 に は幾つ か の プ ロ グ ラ ム が あ り ま す が 、 実 習 で は LASAGNA-Search 2.0を 用 い ま す 。

http://biogrid-lasagna.engr.uconn.edu/lasagna_search/

問題 :ゼブ ラ フ ィ ッ シュの sonic hedghog ( shh ) 遺 伝 子 の 転 写 調節領域の 配 列 を ゲ ノ ム デ ー

タ ベ ー ス か ら 取 り 出 し 、 コ ン セ ン サ ス 結 合 配 列 を 予 測 す る 。

( 1 )最初にゼブ ラ フ ィ ッ シュの sonic hedghog遺 伝 子 の 5’上流域の 転 写 調節領域の 配 列 を ゲ

ノ ム デ ベ ー ス か ら 取 り 出 し ま す 。

1 ) Emsembl (http://www.ensembl.org/index.html) を開け ま す

2 ) 対象性 物 か ら zebrafish を選択

3) 検 索項目か ら gene を選び、 shh で 検 索

4) 検 索 結 果 の ペ ー ジ に あ る shh の ア ク セ ッ シ ョ ン を ク リ ッ ク

5) 左側ボタ ン の Sequence を ク リ ッ ク す る と 、 ゲ ノ ム 配 列 が表示 さ れ る

6 ) Download sequence を ク リ ッ ク し 、 5’-franking sequence を 2000 に 指 定 し 、

Preview を ク リ ッ ク

7) 全 配 列 ( 転 写 調節領域) を ワ ー ド に コピー し 、上流 2000 bp をそこ か ら コピー す る

( 2 ) 次 に 、 LASAGNA-Search 2.0 を開け る

48

Page 49: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

( http://biogrid-lasagna.engr.uconn.edu/lasagna_search/ l )8) プ ロ モ ー タ ー 配 列 に コ ン セ ン ス 配 列 が存在す る か を 調 べ た い 転 写 因 子 を選択す る 。

Matrix-Derived Models か ら 、 Use TRANSFAC matrices を選択す る と 、 転 写 因 子 の リ ス ト が

表示 さ れ る の で 、 調 べ た い 転 写 因 子 を選択( 転 写 因 子 にカー ソ ル を持っ て行くと 、 転 写

因 子 の コ ン セ ン サ ス 配 列 を 見 る こ と が 可 能 ) 。今回 は All を選択

9 ) Promoter sequences in FASTA を染タ ッ ク紙、枠に 塩 基 配 列 を コピー 、 検 索

注意: コ ン セ ン サ ス 配 列 は 、ほとんどの場合 6-10b 程の短い 配 列 で あ り 、 加えて あ る程度の 配

列 の バ リ エ ー シ ョ ン を許容 し ま す 。その ため予想さ れ た 配 列 に は 、 実 際 に は 転 写 因 子 と相互作

用 し な い 配 列 が高い確率で含ま れ ま す 。 検 索 結 果 は 、目安程度に考えて下さ い 。 実 際 の コ ン セ

ン サ ス 配 列 を同定 す る ために は 、 分 子 生 物学の技術 ( ゲ ル シ フ ト ア ッ セ イ 、 ル シ フ ェ ラ ーゼを

レ ポ ー タ ー に し た プ ロ モ ー タ ー 解 析 等 ) を 使 っ て 実験的 に 検証す る必要 が あ り ま す 。

バ イ オ デ ー タ ベ ー ス の 利 用

 遺 伝 子 の 機 能 を知り た い場合 に は 、 ポ ス ト ゲ ノ ム の モ デ ル 生 物 ( マ ウ ス 、ゼブ ラ フ ィ ッ シュ、

シ ロ イ ズ ナ ズ ナ 等 ) の 検 索 サ イ ト が 重宝し ま す 。 こ れ ら は 、 バ イ オ デ ー タ ベ ー ス と呼ばれ ま す 。

モ デ ル 生 物 の な か でも、 特 に マ ウ ス とゼブ ラ フ ィ ッ シュの デ ー タ ベ ー ス が充実 し ており 、 遺 伝

子 の 機 能だけ で なく発現パ タ ー ン ( 遺 伝 子 が何時、どの組織で 、どれだけ の 量 が 発現す る か ) 、

遺 伝 子 ノ ッ ク ア ウ トやノ ッ クダウ ン の表現型もデ ー タ ベ ー ス 化 さ れ ており 、 遺 伝 子名の キ ー

ワ ー ド 検 索 で デ ー タ を入手す る こ と が 可 能 で す 。

  ヒ ト の 遺 伝 子 機 能 と 遺 伝 子 疾 患 の デ ー タ ベ ー ス と し て NCBIに OMIM ( Online Menderian Inheritance in Man ) が公開さ れ て い ま す 。 遺 伝 子名で キ ー ワ ー ド 検 索 す る と 、 遺 伝 子 の 機 能 、

遺 伝 子疾患が存在す る場合 に は 、 配 列 変異と疾患の表現型を知る こ と が 可 能 で す 。

 マ ウ ス の デ ー タ ベ ー ス ( MGI: mouse genome informatics ) の 特徴と し て 、 遺 伝 子ごと に ノ ッ

ク ア ウ ト マ ウ ス の表現型が デ ー タ ベ ー ス 化 さ れ ており 、表現型か ら 遺 伝 子 の 機 能 を 調 べ る こ と

が できま す 。 マ ウ ス の デ ー タ ベ ー ス で は 、 遺 伝 子 の正確な マ ッ プ ポ ジ シ ョ ン ( 連 鎖 地 図 、 ゲ ノ

ム 配 列上) 等も示 さ れ て い ま す 。

 ゼブ ラ フ ィ ッ シュの デ ー タ ベ ー ス ( ZFIN: zebrafish Organism Data Base ) に は 、 in situ ハイ

ブ リダイゼー シ ョ ン に よ る 発現解 析 の デ ー タ が 写真で掲載さ れ ており 、 遺 伝 子 発現に 関 す る組

織レ ベ ル の 情 報 を得る こ と が できる 特徴が あ り ま す 。脊椎動物中で あ ればオ ル ソ ロ グ 遺 伝 子

(異な る 生 物 の同一 遺 伝 子 ) の 発現パ タ ー ン は類似し て い る こ と が 多 い の で 、 マ ウ ス 、 ウ シや

ニワ ト リ を 研 究対象に す る場合 でも参考と な り ま す 。

論 文や単行書を 読んで 機 能 が 分 か ら な い 遺 伝 子 ( タ ン パ ク 質 ) が で てきた時に は 、それ ら の

遺 伝 子 の 機 能 を 調 べ る 必 要 が あ り ま す 。 こ の よ う な と き に は NCBI の OMIM (Online Mendelian Inheritance in Man) と マ ウ ス ・ゼブ ラ フ ィ ッ シュの ウ ェ ブ サ イ ト を 使うと 情 報 を

得る こ と が できま す 。 授 業 で は 、 こ れ ら の サ イ ト の 使 い 方 と 特徴に つ い て 説 明 し ま す 。

OMIM の 使 い 方

49

Page 50: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

ヒ ト で 分 か っ て い る 遺 伝 子 の 機 能 を詳細 に記述し て い る 。 関 連 文献もリ ス と さ れ て い る 。

1. NCBIを開け 、左上の All List (A-Z)か ら Online Menderian Inheritance in Man (OMIM) を選択

す る 。

2 . 枠内 に 遺 伝 子名を入力し て 検 索

練習 に growth hormone ( 成長ホ ル モ ン ) を 検 索 し て み よう

growth hormone 遺 伝 子および関 連 遺 伝 子 の 配 列 変異に よ っ て起こ る症候群の リ ス ト が表

記さ れ る 。 遺 伝 子 の 機 能 、 変異に伴う疾患、 タ ン パ ク 質 の 構 造 、 関 連 論 文 を 調 べ る こ と

が できる 。

MGI, ZFIN の 使 い 方

ポ ス ト ゲ ノ ム 研 究 の モ デ ル 生 物 の ウ ェ ブ サ イ ト を 利 用 し て み よう。 こ れ ま で の 研 究 に よ っ て 明

ら か に さ れ て い る 遺 伝 子 の 機 能 が 検 索 できる 。

マ ウ ス ( MGI )

mouse genome informatics :  http://www.informatics.jax.org/ 1 . 先頭ペ ー ジ の QuickSearch の枠内 に 遺 伝 子名を入力す る

2 . 入力し た 遺 伝 子 の 情 報 、 遺 伝 子改変 マ ウ ス が リ ス ト さ れ る

試し に Pax6 (眼の 発 生 の上流に あ る 転 写 因 子 ) を入力し て み よう

Pax6と言うワ ー ド を含む遺 伝 子 リ ス ト が表示 さ れ る 。 Pax6 を選択す る

得ら れ る 情 報

Symbol/Name/ID : 遺 伝 子 の正式名称、略記

Synonyms :同義語(別名)

Genetic map : 遺 伝 子 の 連 鎖 地 図上の 位置

Sequence Map : 遺 伝 子 の 物 理 地 図上の 位置

Mammalian Homology :哺乳類の相同・類似遺 伝 子

Sequences : ゲ ノ ム 塩 基 配 列 ・ cDNA 塩 基 配 列 ・ ア ミ ノ 酸 配 列 情 報

Phenotypes; ノ ッ ク ア ウ ト マ ウ ス の表現型。 遺 伝 子 の 生 物 機 能 が 分 か る

Polymorphism: 系 統間で 見 ら れ る 配 列 多型。 SNPs ( 1 塩 基 多型) 等

Gene Ontology (GO) : 遺 伝 子 の 機 能 、 構 造

Expression : 発現す る組織の リ ス ト

Protein Domains : 転 写産物 が持つ ド メ イ ン 構 造 の リ ス ト

References : 関 連 文献

ゼブ ラ フ ィ ッ シュ( ZFIN)

The Zebrafish Model Organism Database : http://zfin.org/ 1 . Genes/Makers/Clones を開け る

2 . Name/Symbol に 遺 伝 子名を入力し て 検 索

試し に pax6 と入力し て 検 索 し て み よう。

魚類で単独に起こ っ た ゲ ノ ム 重 複 の ため pax6a と pax6b が あ る

50

Page 51: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

Symbol-name で は 遺 伝 子 の 各 種 情 報 が表記さ れ る

Expression で は 、 遺 伝 子 発現の デ ー タ が表記さ れ る

Phenotypeで は 、 ノ ッ クダウ ン と ノ ッ ク ア ウ ト の表現型が表記さ れ る

Locationで は 、染色体上の 位置が表記さ れ る

51

Page 52: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

1 月 14 日 ( 第 14 回 )

講 義

次 世 代 シ ー ケ ン ス で 読 み 取 ら れ た リ ー ド の 情 報 処 理

ト ラ ン ス ク リ プ ト ー ム 解 析 ( RNA配 列 の 解 析 )

ゲ ノ ム シ ー ケ ン ス

HiSeq2000 だと 一 つ の リ ー ド長は 100bp 、 HiSeq2500 だと 125bp で 、依頼解 析 に 出 す と 、 1サ ン プ ル あ た りギガ オ ーダー の リ ー ド が USB に コピー さ れ て送ら れ てきま す 。 日本で は 、 次 世

代 シ ー ケ ン ス 解 析 を広く普及す る ために 、 遺 伝学研 究所に よ り 、 次 世 代 シ ー ケ ン ス の リ ー ド を

情 報 処 理 す る プ ロ グ ラ ム (Pipeline) が 、 ウ ェ ブ上で無料で 利 用 できる ように 整備さ れ て い ま す 。

有料の プ ロ グ ラ ム の場合 、半年契約で 50 万円あ ま り と高額で す 。 解 析 は 、大型コ ンピュー

タ ー が必要 な の で 、 ク ラ ウ ド シ ス テ ム で 、 配 列 を Pipeline で送り 、 遺 伝 研 の コ ンピュー タ ー で

情 報 処 理 さ れ 、数日後に 解 析 デ ー タ が送ら れ てくる シ ス テ ム に な っ て い ま す 。

シ ー ケ ン ス の サ ン プ ル は 、 ゲ ノ ム DNA の場合 と組織・ 細 胞 に 発現す る mRNA(cDNA) に大別さ

れ ま す 。 ま た 、 解 析 の対象生 物 は 、参照ゲ ノ ム の あ る 生 物 、新規に シ ー ク エ ン ス す る 生 物 に 分

か れ ま す 。参照ゲ ノ ム の あ る 生 物 で は 、 ゲ ノ ム 配 列 の デ ー タ ベ ー ス とcDNA の デ ー タ ベ ー ス が

準備さ れ て い る の で 、 ゲ ノ ム DNA 、 RNA の リ ー ド ともに参照配 列 に直接マ ッ プ す る こ と が でき

ま す 。 ゲ ノ ム DNA で あ れば、 サ ン プ ル間で 、 SNP や配 列 の挿入・欠損を 見 いだす こ と が 可 能 で

す ( ゲ ノ ム リ シ ー ケ ン ス ) 。 RNA で あ れば、 各cDNA に マ ッ プ さ れ る リ ー ド数をカウ ン ト と し

て 、 サ ン プ ル間で比較す る こ と に よ り 、組織に 発現す る 全 遺 伝 子 を同定 す る と ともに 、 サ ン プ

ル間で現量 を比較す る こ と が 可 能 で す ( ト ラ ン ス ク リ プ ト ー ム 解 析 ) 。

参照ゲ ノ ム の な い 生 物 の場合 、 リ ー ド を 一度、 ア セ ン ブ ル す る必要 が あ り ま す 。 こ れも遺 伝

研 の Pipeline で 実行できま す 。 ゲ ノ ム の場合 、現在だと HiSeq2500 の リ ー ド を繋いだ

Contig に 、 PacBio の 次 世 代 シ ー ケ ン ス 解 析 の リ ー ド ( 約 10kb) を併用 す る こ と で か な り長い

Scaffold に ま で つ なぎ合わす こ と が 可 能 で す (de novo ゲ ノ ム シ ー ケ ン ス ) 。 RNA の場合 、 リ ー

ド を ア セ ン ブ ル し て得ら れ る Contig が コ ー ド す る 遺 伝 子 を BLASTX に よ り同定 し ま す が 、 こ の

操作も Pipeline の Maser が 解 析 し てくれ ま す 。 さ ら に KEGG の 代 謝 パ ス ウ ェ ー へ の GO(gene ontology)ア ノ テ ー シ ョ ンも同時に 実行し てくれ ま す 。

次 世 代 シ ー ケ ン ス を 使 っ た ゲ ノ ム シ ー ク エ ン ス に よ り 、 こ れ ま で の 連 鎖 解 析 で は同定困難で

あ っ た疾患や形質 の 原 因 遺 伝 子 を 見 つ け 出 す こ と が 可 能 と な っ て い ま す 。最近の 報告例を 使 っ

て 、紹介し ま す 。

Whole genome association study (WGAS)コ ン ト ロ ー ル群と 実験群(表現形質 :例えば左利き) で 、 全 ゲ ノ ム にわた っ て SNP の

出現頻度を比較す る 。表現型の責任遺 伝 子近傍の SNP で は表現型集団で 一致度が高くな

る の で 、それ を 検 出 す る こ と で責任遺 伝 子 の ゲ ノ ム上の 位置を 特 定 す る 。

Exome 解 析

 メ ン デ ル 遺 伝 す る 1 遺 伝 子 に よ る レ ア な 遺 伝 子疾患の場合 、 コ ー ド領域の 変異に よ り

52

Page 53: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

ア ミ ノ 酸 の置換 が起こ っ て い る こ と が 多 い 。 こ の技術 で は 、 ゲ ノ ム の エ ク ソ ン の み 配 列

を 解 読 す る こ と で 、患者に 特異的 な 塩 基置換 、 InDelを 検 出 す る こ と で 、 遺 伝 子疾患の

責任遺 伝 子 を 特 定 す る 。 総 エ ク ソ ン の 塩 基 配 列 は 、 ゲ ノ ム の 1 %程度な の で 、 解 析 量 が

少なくて すむ。場合 に よ っ て は 、 5 名程度の患者を 解 析 す るだけ で 、 原 遺 伝 子 が 特 定 さ

れ る例もあ る 。

Rad-Seq ゲ ノ ム を 特 定 の制限酵素で消化 し 、消化断片の末端を 次 世 代 シ ー ケ ン ス で 解 析 し 、

SNAP を 検 出 す る 。通常の NGS ゲ ノ ム 解 読 で は ラ ンダム に断片化 す る の で 、 集団間で

リ ー ド を直接比較す る こ と は不可 能 で あ る の に対し 、 Rad-Seq の場合 に は 、制限酵素の

切り口がそろっ て い る の で 、 ゲ ノ ム 全体にわた っ て リ ー ド を高速か つ間便に 系 統間で す

る こ と が 可 能 で あ る 。農林水産で の品種 の 解 析 に有効だと思われ る 。

講 義ポ ス ト ゲ ノ ム 研 究

様々な 生 物 の ゲ ノ ム 配 列 が 解 読 さ れ る ように な り 、 ゲ ノ ム 配 列 を 使 っ た新し い 研 究 が ス タ ー

ト し て い ま す 。 ゲ ノ ム 配 列 が 利 用 できる と言う前 提 のもと に始ま る 研 究 が ポ ス ト ゲ ノ ム 研 究 で

す 。その 内 容 は 、 遺 伝 子 の 機 能 解 析 、 生 物 進 化 、 遺 伝 子疾患の 原 因 遺 伝 子 の探索 など多岐にわ

た り ま す 。 こ の 授 業 で は 、時間の 関 係 か ら 「 生 物 進 化 と ゲ ノ ム 」 の トピッ ク ス に つ い てだけ紹

介し ま す 。

ポ ス ト ゲ ノ ム 研 究 - 1

比較ゲ ノ ム学: 進 化 に伴うゲ ノ ム 構 造 の 変 化

 進 化 的 に隔た っ た 多様な 生 物 で ゲ ノ ム 解 読 が行われ た こ と に よ り 、 種 内 の パ ラ ロ グ の 検

索 、 ま た異な る 生 物間で オ ル ソ ロ グ を比較す る こ と 、 遺 伝 子 ファミ リ ー の メ ン バ ー を比較

す る こ と が 可 能 に な り ま し た 。 ま た染色体上の 遺 伝 子 の 配 列 を 系 統 的 に離れ た 生 物間で比

較す る こ と に よ り 、それ ら の共通祖先生 物 の染色体構 造 を推定 す る こ と が 可 能 と な っ て い

ま す 。比較ゲ ノ ム は 、 こ の ように 生 物間で ゲ ノ ム を比較し て 、 進 化 を 論じる 研 究 分野で す 。

授 業 で は 、哺乳類と魚類の比較ゲ ノ ム を紹介し ま す 。

 フ グ と ヒ ト は 、 進 化 的観点 か ら 見 る と脊椎動物 系 統 樹 の両端に 位置し ま す 。脊椎動物 は 、

大部 分 の魚類を含む条鰭類、それ と シ ー ラカン ス ・肺魚および四肢動物 を含む総鰭類の 2

つ の グ ル ー プ に大別さ れ ま す 。条鰭類と 総鰭類は4億5千年前 に 分岐し ま し た 。 フ グ と ヒ

ト の ゲ ノ ム 構 造 を比較す る こ と に よ り 、4億 5 千年前 に 生きて い た 総鰭類と条鰭類の共通

祖先(もちろん現存し な い ) の ゲ ノ ム 構 造 が 明 ら か と な り 、その後の ゲ ノ ム 構 造 の 変 化 が

解 明 さ れ ま し た 。 解 析 の 結 果 、脊椎動物 の ゲ ノ ム の 進 化 に つ い て 、 次 の ような 予想もさ れ

て い な か っ た 結 果 が得ら れ ま し た 。

( 1 ) 4億 5 千年前 に 生きて い た 総鰭類と条鰭類の共通祖先は 1 2組の染色体を

持っ て い た 。

( 2 ) 総鰭類で は条鰭類と 分 か れ た直後に 、 ゲ ノ ム に大量 の レ ト ロ ウ ィ ル ス が挿

入さ れ 、 ゲ ノ ム サ イ ズ が大きくな っ た 。その後染色体間の 転移と融合 ( ミ キ シ ン

53

Page 54: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

グ ) が頻繁に起こ っ た 。

(3) 条鰭類で は 総鰭類と 分 か れ た直後に 、 ゲ ノ ム の倍化 (脊椎動物 の誕生 か ら

数える と3度目) が起こ っ た 。 重 複 し た 遺 伝 子 の大部 分 は片方 が ゲ ノ ム か ら脱落し

た が 、約 20 %の 遺 伝 子 は倍加 し た ま ま現在でも機 能 遺 伝 子 と し て働い て い る 。そ

の ため、 ゲ ノ ム上の 遺 伝 子数は条鰭類の 方 が 総鰭類よ りも 20 %程多 い 。 こ の よう

な 遺 伝 子数の 増 加 が 、魚類に形態や環境適応の 多様性 をもた ら し た の で は な い か と

考えら れ て い る 。 ま た条鰭類で は染色体へ の レ ト ロ ウ ィ ル ス の挿入はわずか で あ り 、

染色体の ミ キ シ ン グもわずか で あ る 。

 ま た 、無脊椎動物 でも進 化 的 に 重 要 な 位置に あ る ホヤやナ メ ク ジ ウ オ の ゲ ノ ム 解 読 が行

われ 、哺乳類でも多数の 生 物 の ゲ ノ ム が 解 読 さ れ て い ま す 。 生 物間で ゲ ノ ム を比較す る こ

と に よ り 、臭覚受容 遺 伝 子 が無脊椎動物 か ら脊椎動物 の 進 化 の過程で 遺 伝 子数を 増 加 し て

きた こ と が 、 明 ら か に な っ て い ま す 。 ま た胎盤の 進 化 で は 、 レ ト ロ ト ラ ン ス ポゾン由来の

遺 伝 子 が 重 要 な役割を 果 た し て い る と いう、意外な事実も示唆さ れ て い ま す 。 ま た ヒ ト と

チ ン パ ン ジ ー で は 、 塩 基 の置換率は た っ た 1.23%で す が 、反復 配 列 の挿入が ヒ ト の 方 が か

な り 多 い こ と が 分 か り ま し た 。 こ の ように挿入配 列 は 、以前考えら れ て い た ような たんな

る ガ ラ ク タ で は な い こ と が 分 か っ てきま し た 。

シ ン テ ニ ー

 異な る脊椎動物 (例えば、 ヒ ト - マ ウ ス 、 ヒ ト - フ グ ) を過去に遡る と 、共通祖先が存在し

ま す 。共通祖先か ら 分岐し た あ と 、それぞれ の 系 で 転座と融合 が起こ っ て い る が 、小さ な ブ

ロ ッ ク単位 で 見 る と 遺 伝 子 の並びが 一致す る領域が あ り ま す 。染色体上で 遺 伝 子 の並びが 一致

し て い る状態は 、 シ ン テニー と呼ばれ ま す 。 全 ゲ ノ ム が 解 読 さ れ る と ゲ ノ ム 全体を 生 物間で比

較す る こ と が 可 能 と な り 、 シ ン テニー の様子 が 明 ら か と な り ま す 。

 ヒ ト と マ ウ ス を比べ る と 、哺乳類同士の ため、 明瞭に シ ン テニー の保存状態が 見 て 取 れ ま す 。

 一 方 、魚類で は四肢動物 と 分 か れ て か ら直後に 全 ゲ ノ ム の 重 複 が起こ っ て い る ため、魚類の

染色体は ヒ トやマ ウ ス の染色体に対し て 2 重 の シ ン テニー を 示 す 特徴が あ り ま す 。

54

Page 55: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

1 月 21 日 ( 第 15 回 )

55

Page 56: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

講 義

推薦図書

ゲ ノ ム 関 連

「 ゲ ノ ム 第4版」 T.A. Brown 著.石川冬木/中山潤一監訳・ メ デ ィカル ・ サ イ エ ン ス ・ イ

ン タ ー ナ シ ョ ナ ル社( 8,800 円)

「 ゲ ノ ム 研 究 実験ハン ド ブ ッ ク 」辻本豪三、田中利男・羊土社( 6,500 円)

「比較ゲ ノ ム か ら 読 み 解く生命シ ス テ ム 」藤山秋佐夫監修・秀潤社( 4,000 円)

バ イ オ イ ン フ ォ マ テ ィ ッ ク ス 関 連

「 バ イ オ イ ン フ ォ マ テ ィ ッ ク ス 基礎講 義 - 一歩進んだ発想を み がくために 」岡崎康司 / 坊農秀雅 監訳・ メ デ ィカル ・ サ イ エ ン ス ・ イ ン タ ー ナ シ ョ ナ ル社( 3,900 円)

「 バ イ オ イ ン フ ォ マ テ ィ ッ ク ス がわか る 」菅原秀明 ・羊土社( 4,200 円)

「 ゲ ノ ム 情 報 は こう活かせ」岡崎康司 / 坊農秀雅・羊土社( 4,410 円)

「即活用 の ための バ イ オ イ ン フ ォ マ テ ィ ッ ク ス入門 」広川貴次 / 美宅成 樹著・中山書店

( 3,500 円)

「 バ イ オ デ ー タ ベ ー ス と ウ ェ ブツー ル の手と り足と り活用 法 」中村保一 ら編集 ・羊土社

( 3,800 円)

「 できる バ イ オ イ ン フ ォ マ テ ィ ッ ク ス 」広川貴次 / 美宅成 樹著・中山書店( 3,500 円)

「 バ イ オ イ ン フ ォ マ テ ィ ッ ク ス 」 メ デ ィカル ・ サ イ エ ン ス ・ イ ン タ ー ナ シ ョ ナ ル 社

( 9,500 円)

「 バ イ オ リ ソ ー ス&デ ー タ ベ ー ス活用 術 」秀潤社( 4,600 円)

「 バ イ オ イ ン フ ォ マ テ ィ ク ス事典」 日本バ イ オ イ ン フ ォ マ テ ィ ク ス学会編集 ・共立 出版

( 14,000円)

次 世 代 シ ー ケ ン シ ン グ に 関 連 し た バ イ オ イ ン フ ォ マ テ ィ ッ ク ス

「 Dr. Bonoの 生命科学デ ー タ 解 析 」坊農秀雅・ ( 4,410 円) メ デ ィカル ・ サ イ エ ン ス ・ イ

ン タ ー ナ シ ョ ナ ル社( 3,000 円)

56

Page 57: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

ウ ェ ブ サ イ ト

研 究室 home page        http://www.agri.tohoku.ac.jp/bioinfor/index-j.html =========================================================================

文献検 索 、 塩 基 配 列 、 ホ モ ロ ジ ー 検 索 、 ORF finder 、 Map viewer 等

NCBI http://www.ncbi.nlm.nih.gov/ (National Center for Biotechnology Information)

塩 基 配 列 、 ホ モ ロ ジ ー 検 索 、 分 子 系 統 樹 作 成 、 シ ー ク エ ン ス登録等

DDBJ http://www.ddbj.nig.ac.jp/Welcome-j.html (DNA Data Bank of Japan)

塩 基 配 列 、 ホ モ ロ ジ ー 検 索 、 タ ン パ ク 質 の 構 造 ( ド メ イ ン ・ モ チ ー フ 検 索 等 ) 解 析

EBI http://www.ebi.ac.uk/Information/ (European Bioinformatics Institute)

ゲ ノ ム 配 列 の デ ー タ ベ ー ス

Ensembl            http://www.ensembl.org/index.html=======================================================================

分 子 系 統 樹 作 成

ClustalW http://clustalw.genome.jp/ =======================================================================

タ ン パ ク 質 ・ 遺 伝 子 の 機 能 検 索

オ ン ト ロ ジ ー

http://www.geneontology.org/ http://www.pir.uniprot.org/ ド メ イ ン ・ モ チ ー フ 検 索 http://www.ebi.ac.uk/Information/ シ グ ナ ル ペ プ チ ド の 予 測

http://www.cbs.dtu.dk/services/SignalP/ 3D 立体構 造 の 予 測 、 DNA の翻訳 http://ca.expasy.org/ノ ッ ク ア ウ ト マ ウ ス の表現型 http://www.informatics.jax.org/ =======================================================================

転 写 調節領域の モ チ ー フ 検 索

転 写 因 子 の 結 合 部 位 予 測         http://www.cbrc.jp/research/db/TFSEARCHJ.html ======================================================================

代 謝 経 路

KEGG http://www.genome.jp/kegg/pathway.html 57

Page 58: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

=======================================================================

ゲ ノ ム 研 究 の モ デ ル 生 物

マ ウ ス

http://www.informatics.jax.org/ツメ ガ エ ル http://genome.jgi-psf.org/cgi-bin/runAlignment?db=frog4x1ミ ド リ フ グ フ グ ゲ ノ ム デ ー タ ベ ー ス

http://www.genoscope.cns.fr/externe/tetranew/ト ラ フ グ フ グ ゲ ノ ム デ ー タ ベ ー ス

http://fugu.biology.qmul.ac.uk/ト ラ フ グ フ グ ゲ ノ ム デ ー タ ベ ー ス

http://genome.jgi-psf.org/cgi-bin/runAlignment?db=fugu6&advanced=1ゼブ ラ フ ィ ッ シュ http://zfin.org/

http://www.ensembl.org/Danio_rerio/index.htmlメダカ http://shigen.lab.nig.ac.jp/medaka/

http://medakagb.lab.nig.ac.jp/Oryzias_latipes/index.htmlシ ョ ウ ジ ョ ウ バ エ

http://www.ncbi.nlm.nih.gov/BLAST/Genome/Insects.html http://genome.med.yale.edu/lab/index.htm線 虫

http://omicspace.riken.jp/Ce/rnai/jsp/index.jsp 酵 母

http://www.ncbi.nlm.nih.gov/mapview/map_search.cgi?taxid=4932 http://www.fhcrc.org/science/labs/kruglyak/Data/

=======================================================================

cDNA, EST 情 報

マ ウ ス cDNA http://fantom3.gsc.riken.jp/index.htmlア フ リカツメ ガ エ ル EST http://xenopus.nibb.ac.jp/ メダカ EST http://medaka.lab.nig.ac.jp/est_index.htmlカタユウ レ イボヤ EST http://ghost.zool.kyoto-u.ac.jp/indexr1.html

=========================================================================

microarray に 関 す る 情 報

ヒ ト繊維芽細 胞 http://genome-www.stanford.edu/serum/data.htmlシ ョ ウ ジ ョ ウ バ エ http://genome.med.yale.edu/Lifecycle/

=========================================================================

その他

58

Page 59: バイオインフォマティックス概論授業予定 · Web view2019 バイオインフォマティックス概論授業予定(授業の進み具合によって変更の可能性があります)

http://genes.mit.edu/GENSCAN.html http://www.tigr.org/software/microarray.shtml http://motif.genome.jp/ http://www.rcsb.org/pdb/

=============================================================

59