バイオインフォマティックス概論授業予定 · web...
TRANSCRIPT
1
H30 バ イ オ イ ン フ ォ マ テ ィ ッ ク ス 概 論 授 業 予 定
( 授 業 の 進 み 具 合 に よ っ て 変 更 の 可 能 性 が あ り ま す )
黒 字 は 、 講 義 に よ る 解 説 。 青 字 は ウ ェ ブ を 使 っ た 実 習 を 示 し ま す 。 黄 色 の 網 掛 け は 、 重 要 な
キ ー ワ ー ド
第 1 回 10 月 2 日 授 業 概 要 説 明
Bioinformatics と は ?
ゲ ノ ム - 遺 伝 子 -mRNA- タ ン パ ク 質 の 関 係 の 復 習 ( D V D )
さ ま ざ ま な デ ー タ ベ ー ス ・ ゲ ノ ム デ ー タ ベ ー ス に 触 れ て み る
第 2 回 10 月 9 日 配 列 デ ー タ ベ ー ス に つ い て の 解 説
配 列 デ ー タ ベ ー ス か ら の 塩 基 配 列 と ア ミ ノ 酸 配 列 の 取 り 出 し 方
配 列 エ ン ト リ ー の 見 方
ヒ ト 全 ゲ ノ ム 解 読 プ ロ ジ ェ ク ト に つ い て の 解 説 ( 1/ 3 )
ヒ ト ゲ ノ ム プ ロ ジ ェ ク ト の 歴 史 ・ 戦 術
連 鎖 地 図 作 製
宿 題 ( 1 ) : 配 布
第 3 回 10 月 16日
ホ モ ロ ジ ー 検 索 ( BLAST 検 索 ) に つ い て の 解 説
BLAST 検 索 の 実 習 ( 1/2 ) ( BLASTP )結 果 の 見 方
ヒ ト 全 ゲ ノ ム 解 読 プ ロ ジ ェ ク ト に つ い て の 解 説 ( 2/ 3 )
BAC ラ イ ブ ラ リ ー の 作 製 、 整 列 化
第 4 回 10 月 23日
BLAST 検 索 の 実 習 ( 2 /2 ) ( BLASTN, BLASTX, TBLASTX )
ヒ ト 全 ゲ ノ ム 解 読 プ ロ ジ ェ ク ト に つ い て の 解 説 ( 3 / 3 )
BAC ラ イ ブ ラ リ ー の シ ョ ッ ト ガ ン シ ー ケ ン ス
配 列 の ア セ ン ブ リ ー 、 コ ー ド 配 列 の 予 測 ( ア ノ テ ー シ ョ ン )
宿 題 ( 2 ) : 配 布
第 5 回 10 月 30日
生 物 種 毎 の ゲ ノ ム デ ー タ ベ ー ス を 使 っ た BLAST 検 索 ( NCBI, BLAST の ペ ー ジ か ら )
whole genome shotgun sequence オ リ ジ ナ ル な 手 法 : Plasmid vector と Fosmid vector 、 蛍 光 シ ー
ケ ン サ ー を 使 っ た 配 列 解 読
次 世 代 シ ー ケ ン ス 解 析
次 世 代 シ ー ケ ン ス の 原 理
次 世 代 シ ー ケ ン サ ー を 使 っ た ゲ ノ ム 解 読
( 参 照 ゲ ノ ム 有 = リ シ ー ケ ン ス . 新 規 = de novo シ ー ケ ン ス :
2
whole genome shotgun sequence )次 世 代 シ ー ケ ン ス で 読 み 取 ら れ た リ ー ド の 情 報 処 理 ( 遺 伝 研 パ
イ プ ラ イ ン )
“ 宿 題 ( 1 ) : 提 出 ”
Pl 11 月 6 日 配 列 ア ラ イ メ ン ト に つ い て の 解 説
ペ ア ワ イ ズ ア ラ イ メ ン ト の 実 際
多 重 配 列 ア ラ イ メ ン ト の 作 成 と 見 方 ( CLUSTALW )
分 子 系 統 樹 に つ い て
配 列 解 読 で 明 ら か に な っ た 各 種 生 物 の 遺 伝 子 レ パ ー ト リ ー
第 7 回 11 月 13日
分 子 系 統 樹 の 作 成
分 子 系 統 樹 か ら 分 か る こ と
ゲ ノ ム 構 造 の 変 化 と 生 物 進 化
ゲ ノ ム の 重 複 、 遺 伝 子 の 重 複 と 遺 伝 子 レ パ ー ト リ ー の 増 加
オ ル ソ ロ グ と パ ラ ロ グ の 発 生
遺 伝 子 の 並 行 進 化
宿 題 ( 3 ) 配 布
第 8 回 11 月 20日
代 謝 経 路 デ ー タ ベ ー ス ( KEGG ) の 利 用 - 1
KEGG を 使 っ た 演 習
例 : デ ー タ ベ ー ス を 使 っ て 、 dopamine の 合 成 経 路 、 合
成 部 位 、 作 用 機 序 、 薬 剤 等 に つ い て 情 報 収 集 す る
宿 題 ( 2 ) 提 出
第 9 回 11 月 27日
代 謝 経 路 デ ー タ ベ ー ス ( KEGG ) の 利 用 - 1
論 文 の 構 成 、 総 説 の 内 容
研 究 計 画 立 案 、 レ ポ ー ト ・ 論 文 作 成 に 必 要 な 文 献 情 報 収 集
宿 題 ( 4 ) 配 布
第 10回
12 月 4 日 文 献 検 索 ( PubMed, 大 学 図 書 館 On line journals )
EndNote に つ い て ( 文 献 管 理 ・ 論 文 作 成 用 ソ フ ト )
3
第 11回
12 月 11日
タ ン パ ク 質 の 構 造 に つ い て の 解 説 ( シ グ ナ ル ペ プ チ ド 、 疎 水 ・ 親 水
性 プ ロ ッ ト 、 ド メ イ ン 構 造 )
ウ ェ ブ サ イ ト を 使 っ た タ ン パ ク 質 の 構 造 解 析
塩 基 配 列 か ら ア ミ ノ 酸 配 列 へ の 変 換
分 子 量 と 等 電点の 予 測
シ グ ナ ル ペ プ チ ド の 予 測
糖鎖 結 合 部 位 の 予 測
ド メ イ ン 構 造 の 予 測
“ 宿 題 ( 3 ) 提 出 ”
第 12回
12 月 18日
ポ ス ト ゲ ノ ム 研 究 - 1 : ゲ ノ ム編集 ( 遺 伝 子編集 )技術
CRISPR/Cas9 に よ る ゲ ノ ム編集 の 原 理 (動画 を 使 っ た 説 明 )
ゲ ノ ム編集 の農学 、医療へ の応用
プ ロ グ ラ ム を 使 っ て オ フ タ ー ゲ ッ ト の な い タ ー ゲ ッ ト 配 列 を設
計 す る
宿 題 (5) 配 布
12 月 2 5日
休講
第 13回
1 月 8 日 ゲ ノ ム ブ ラ ウザEnsembl Genome Browser の 利 用
ゲ ノ ム 塩 基 配 列 を ゲ ノ ム デ ー タ ベ ー ス か ら 取 り 出 す
取 り 出 し た プ ロ モ ー タ ー 配 列 か ら 転 写 因 子 が 結 合 す る
Consensus配 列 を 予 測 す る
バ イ オ デ ー タ ベ ー ス の 利 用 ( 遺 伝 子 の 機 能 、 発現、 遺 伝 性疾患)
OMIM (Online Menderian Inheritance in Man)MGI (Mouse Genome Informatics)ZFIN (The Zebrafish Model Organism Database)
ポ ス ト ゲ ノ ム 研 究 に つ い て : 21 世紀の 分 子 生 物 学
“ 宿 題 ( 4 ) 提 出 ”
4
第 14回
1 月 15 日 次世代シーケンス解析-利用 (1/3)De novo ゲ ノ ム シ ー ケ ン ス の 遺 伝形質 解 析 へ の応用
ト ラ ン ス ク リ プ ト ー ム 解 析 の 生 物 研 究 へ の応用
次世代シーケンス解析-利用 (2/3)Exome 解 析 : エ ク ソ ン の み に絞っ て 配 列 を比較す る こ と に よ
る 、 遺 伝形質 の 原因遺 伝 子 の同定 ( 一遺 伝 子 の 変異で メ ン デ ル
遺 伝 す る 遺 伝 子疾患に 有効 )Genome Wide Association Study (GWAS) : SNP マーカー を
使 っ た 遺 伝形質 の責任遺 伝 子 の同定 ( 複数遺 伝 子 が 関与し 、 こ
れ ま で 解 析困難で あ っ た 遺 伝形質 にも有効 )ヒ ト GWAS デ ー タ ベ ー ス の 利 用
第 1 5
回
最終回
1 月 2 2 日 次 世 代 シ ー ケ ン ス 解 析 - 利 用 (3/3):RADシ ー ケ ン ス :簡便で高速な ゲ ノ ム 全体にわた る SNP マ ー
カー の 収 集 と 遺 伝形質 の責任遺 伝 子 の同定 → マ ーカー ア シ
ス ト育種 に 有効 ( 農林水産で 有効 )
ポ ス ト ゲ ノ ム 研 究 - 3 :比較ゲ ノ ム ( Comparative Genomics )
進 化 に伴う染色体構 造 の 変 化 ( 繰り返し 配 列 の 発 生 、 シ ン テ
ニー領域)
プ ロ グ ラ ム を 使 っ て シ ン テニー を調べる
“ 宿 題 (5) 提 出 ”
授 業評価
5
10 月 2 日 ( 第 1 回 )
講 義
1 ) 授 業 の 予 定 と 進め方 (評価方 法 : 5 回 の 宿 題 で評価)
2 ) 「バ イ オ イ ン フ ォ マ テ ィ ッ ク ス」と は ?
3 ) 遺 伝 子 の 構 造 に つ い て の 復 習 : パ ワ ー ポ イ ン ト の ファイ ル を 参 照
4 ) 遺 伝 子 、転写、翻訳の 復 習 ( DVD を 使 っ て )
5) ゲ ノ ム デ ー タ ベ ー ス (動物 、植物 、菌類、 バ ク テ リ ア ) を のぞい て み る
6) どの ような デ ー タ ベ ー ス が 利 用 できる か
使 用 す る DVD : 講談社ブ ル ー バ ッ ク ス B1582 「見 てわか る DNA の しくみ」
今日 は 第一回目の 授 業 で す の で 、最初に今年の 授 業 予 定 を紹介し ま す 。 こ の 授 業 は 、「講
義」と「コ ンピュー タ ー を 使 っ た 実 習」で 進めま す 。 実 習 で は 、 ウ ェ ブ上で公開さ れ て い る
デ ー タ ベ ー スや配 列 解 析 プ ロ グ ラ ム を 使 い ま す 。
現在で は 、 多様な 生 物 の ゲ ノ ム 配 列 が 解 読 さ れ 、 配 列 は一般にも利 用 できる ように 整備さ れ
て い ま す 。どの ような 生 物 で ゲ ノ ム 解 読 が 行われ て い る の か 、今日 は 、 ウ ェ ブ サ イ ト ( NCBI, Ensembl ) を 使 っ て少し のぞい て み ま しょう。詳し い 使 い 方 は 、 こ れ か ら の 授 業 で教えま す 。
ま た 生 物 学 、 分 子 生 物 学 、農学 研 究 に 利 用 できる デ ー タ ベ ー ス にどの ようなもの が あ る かも、
概 要 を紹介し ま す 。
なおこ の テ キ ス ト で は 、その 日 の 授 業 で 行う講 義 内 容 と コ ンピュー タ ー を 使 っ た 実 習 に つ い
て 、操作 方 法 を含めて簡単に 説 明 し て あ り ま す 。 必 要 に応じて 、 コピー 、 プ リ ン ト ア ウ ト し て
下さ い 。 講 義 で 使うパ ワ ー ポ イ ン ト の 図 は 、 プ リ ン ト し たもの を資料と し て 配 布 し ま す 。 毎 回 、
翌週の プ リ ン ト を 配 り ま す の で 、 こ の テ キ ス ト と 配 布資料を 使 っ て 、 予 習 ・ 復 習 し て下さ い 。
参考に な る本を こ の ファイ ル の最後に紹介し て あ り ま す 。おそらく農学 部 の 図 書 館 にほとん
どあ る と思い ま す 。
————————————————————————————————
実 習
2 つ の ウ ェ ブ サ イ ト を開い て 、どの ような 生 物 で ゲ ノ ム 情 報 が 利 用 できる か調べて み よう
1. Ensembl Genome Browser: http://asia.ensembl.org/index.html
2. NCBI (National Center for Biotechnology): http://www.ncbi.nlm.nih.gov/Genome Data Viewer
6
10 月 09 日 ( 第 2 回 )
今日 の 授 業 内 容
1. 実 習 : デ ー タ ベ ー ス か ら の ア ミ ノ 酸 配 列 、 塩 基 配 列 の 取 り 出 し 方
2. 実 習 : 配 列 エ ン ト リ ー に 示 さ れ て い る 情 報 に つ い て
3. 講 義 : ゲ ノ ム 解 読 プ ロ ジ ェ ク ト ( 1/2 )
実 習
塩 基 配 列 ・ ア ミ ノ 酸 配 列 の 収 集
配 列 デ ー タ ベ ー ス か ら 必 要 な タ ン パ ク 質 の ア ミ ノ 酸 配 列 、 遺 伝 子 の cDNA 塩 基 配 列 の 取 り 出 し
方 を 実 習 し ま す .
ア ミ ノ 酸 配 列 の 取 り 出 し 方
使 用 す る ウ ェ ブ サ イ ト : NCBI.先頭ペ ー ジ右側に あ る Popular Resources の中の「 Protein 」を 使 用 す る .あ る い は左上( All databases ) か ら選ぶこ とも可 能 .
キ ー ワ ー ド に よ る 検 索
例 : cow, prion で キ ー ワ ー ド 検 索 し て み よう
cow, prion と 関 連 す る タ ン パ ク 質 が 多数リ ス ト さ れ る が 、先頭の 2 つ が目的の
配 列
タ ン パ ク 質名( 青 字 ) を ク リ ッ ク す る と 配 列 エ ン ト リ ー が表示 さ れ る ( 見 方 は
配付資料を 参 照 )
FASTA を ク リ ッ ク す る と 配 列 が FASTA format で表示 さ れ る
配 列 は 、別の ファイ ル に コピー できる .Graphics で は 、 タ ン パ ク の 構 造 が表示 さ れ る
Identical Proteins で は 、別の名前が付け ら れ て い る同一タ ン パ ク 質 が表示 さ
れ る
Related Sequences で は 、 関 連 す る タ ン パ ク 質 が表示 さ れ る
FASTA format 塩 基 配 列 と ア ミ ノ 酸 配 列 の ファイ ル フ ォ ー ム
「> 」で始ま る 1 行 が コ メ ン ト ( 遺 伝 子名や任意の番号やコ メ ン ト ) を記述す る た
めに 用意さ れ ており 、続く2 行目か ら 塩 基 配 列 あ る い は ア ミ ノ 酸 配 列 を記述す る 。
最後に改行 し て「 // 」を記載し 、 1 つ の 配 列 の記述が完了す る ( 記号「 // 」は なく
てもよ い;普通、付け な い ) .
ホ モ ロ ジ ー 検 索 、 多 重 ア ラ イ メ ン ト 、 分 子 系 統 樹 作 成 等 で 使うフ ォ ー ム .7
デ ー タ ベ ー ス をその ま ま コピー し たもの
>NP_001258555.1 major prion protein preproprotein [Bos taurus]MVKSHIGSWILVLFVAMWSDVGLCKKRPKPGGGWNTGGSRYPGQGSPGGNRYPPQGGGGWGQPHGGGWGQPHGGGWGQPHGGGWGQPHGGGWGQPHGGGGWGQGGTHGQWNKPSKPKTNMKHVAGAAAAGAVVGGLGGYMLGSAMSRPLIHFGSDYEDRYYRENMHRYPNQVYYRPVDQYSNQNNFVHDCVNITVKEHTVTTTTKGENFTETDIKMMERVVEQMCITQYQRESQAYYQRGASVILFSSPPVILLISFLIFLIVG//1 行 目 は 、 必 要 に 応 じ た ネ ー ミ ン グ に す る こ と が 可 能 . 例 え ば 、
>cow_prion_protein . 文 字間の ス ペ ー ス は 、空にせず _ と す る 方 が よ い .空きス
ペ ー ス が あ る と 、 配 列 を認識し な い プ ロ グ ラ ム が あ る の で .
>cow_prion_proteinMVKSHIGSWILVLFVAMWSDVGLCKKRPKPGGGWNTGGSRYPGQGSPGGNRYPPQGGGGWGQPHGGGWGQPHGGGWGQPHGGGWGQPHGGGWGQPHGGGGWGQGGTHGQWNKPSKPKTNMKHVAGAAAAGAVVGGLGGYMLGSAMSRPLIHFGSDYEDRYYRENMHRYPNQVYYRPVDQYSNQNNFVHDCVNITVKEHTVTTTTKGENFTETDIKMMERVVEQMCITQYQRESQAYYQRGASVILFSSPPVILLISFLIFLIVG
塩 基 配 列 の 取 り 出 し 方
使 用 す る ウ ェ ブ サ イ ト : NCBI. Popular Resources の中の「Nucleotide」を 使 用 す る
1 . キ ー ワ ー ド に よ る 検 索
例 : cow, prion で キ ー ワ ー ド 検 索 し て み よう
cow, prion の 配 列だけ で なく、 関 連 遺 伝 子も多数検 索 さ れ てくる ため、 必 要 な
配 列 を 見 つ け る 必 要 が あ る .Bos taurus prion (PRNP), transcript variant 1, mRNA が
今回 、欲し い 配 列 で あ る .上の 遺 伝 子 質名を ク リ ッ ク す る と 配 列 エ ン ト リ ー が表示 さ れ る ( デ ー タ の 見 方
は 配付資料を 参 照 の こ と )
FASTA を ク リ ッ ク す る と 配 列 が FASTA format で表示 さ れ る
配 列 は 、別の ファイ ル に コピー できる .Graphic で は 、 ゲ ノ ム上の 位置が表示 さ れ る
2 . ア ク セ ッ シ ョ ン番号に よ る 検 索
accession number=DDBJ/EMBL/GenBank 国際 塩 基 配 列 デ ー タ ベ ー ス におい て 各登録
単 位 ( エ ン ト リ ー ; 各 遺 伝 子 ) に 発 行 さ れ る エ ン ト リ ー 識 別 子 ( entry identification, ID ) を指す 。
例 : NM_001271626 ( entry identification, ID ) で 検 索 し て み よう
なお表示 結 果 の詳細な 説 明 は 、 次 の サ イ ト で閲覧できま す 。
http://hinv.ddbj.nig.ac.jp/manual_cdna-j.html
配 列 エ ン ト リ ー に 示 さ れ て い る デ ー タ
遺 伝 子名、 生 物名、 学名、 遺 伝 子座、 遺 伝 子 ク ロ ーニン グ を 行 っ た 論 文 リ ス ト 、翻訳
8
開始・終了点、 ド メ イ ン 構 造 、 塩 基 配 列 、 ア ミ ノ 酸 配 列 ( 配付資料で は 、 zebrafish, prion (NM_205586) を 使 っ て 説 明 し て あ り ま す )
講 義
ヒ ト ゲ ノ ム 解 読 プ ロ ジ ェ ク ト ( 1/3 )
国際 研 究 プ ロ ジ ェ ク ト に よ る ヒ ト ゲ ノ ム 計 画 (Human Genome Project) は 1990 年に着手
さ れ 、 13 年後の 2003 年に 解 読完了が宣言さ れ ま し た . ヒ ト ゲ ノ ム 計 画 は 、階層的シ ョ ッ ト
ガ ン 法 と呼ばれ る 手 法 で 行われ ま し た 。 す なわち連 鎖 地 図 の 作 成 か ら BAC ク ロ ー ン の 整 列 化 の
過程を 経 た のち、染色体上に マ ッ プ さ れ た BAC ク ロ ー ン を シ ョ ッ ト ガ ン 法 で 解 読 し 、染色体レ
ベ ル に ま で 塩 基 配 列 を繋ぐと いう過程を 経 て 、 ゲ ノ ム 塩 基 配 列 の完全 解 読 に ま で到達し ま し た 。
こ の プ ロ ジ ェ ク ト の間に 塩 基 配 列 の 解 析 能力( DNA シ ー ク エ ン サ ー ) は 大幅に ア ッ プ し 、同
時に 塩 基 配 列 を つ なぎ合わせる コ ンピュー タ ー の 処 理 能力も著しく進歩し た こ と に よ り 、 連 鎖
地 図 作 製 を省略し て 、 全 ゲ ノ ム を いきな り シ ョ ッ ト ガ ン 法 で 読むこ と が 可 能 と な り ま し た .民
間企業 の シ エ ラ社は 、数年の あ いだに 全 ゲ ノ ム シ ョ ッ ト ガ ン 法 に よ り ヒ ト ゲ ノ ム を 解 読 す る こ
と に 成功し ま し た 。最終的に は 、国際 研 究 プ ロ ジ ェ ク ト と シ エ ラ社の間で協議の 結 果 、 解 読 成
果 が同時に公表さ れ ま し た . ヒ ト ゲ ノ ム 計 画 の終了と前後し て 、 全 ゲ ノ ム シ ョ ッ ト ガ ン 法 の登
場に よ り 、 多くの 生 物 で 全 ゲ ノ ム 解 読 プ ロ ジ ェ ク ト が始めら れ ま し た .
前記の旧バ ー ジ ョ ン の 全 ゲ ノ ム シ ョ ッ ト ガ ン 法 で は 、 ゲ ノ ム を断片化後に 、 全 て の断片を プ
ラ ス ミ ド ベ ク タ ー に ク ロ ーニン グ す る 必 要 が あ り ま し た が 、 次 世 代 シ ー ケ ン サ ー の登場に よ り 、
状況は激変 し ま し た 。 次 世 代 シ ー ケ ン サ ー で は 、 ゲ ノ ム の断片を ク ロ ー ン 化 す る 必 要 が なく、
か つ 大 量 の 配 列 情 報 を一度に 解 読 できま す 。 全 ゲ ノ ム シ ョ ッ ト ガ ン を 使えば、数ヶ月 で ゲ ノ ム
解 読 が 可 能 と な り ま し た .その ため、既に数百種 の動物 で 全 ゲ ノ ム 配 列 の 解 読 が終了し 、現在
も新 し い 生 物 の ゲ ノ ム 解 読 が 次々に完了し て い ま す . こ の 授 業 で は 、 次 世 代 シ ー ケ ン サ ー の 原
理 と 、それ を 使 っ た ゲ ノ ム 解 読 の 概 要 を紹介し ま す 。
全 ゲ ノ ム 塩 基 配 列 が 利 用 できる と いう条件のもと で 、 進めら れ る 遺 伝 子 機 能やゲ ノ ム 研 究 が
ポ ス ト ゲ ノ ム 研 究 で す . ゲ ノ ム 情 報 は 、 遺 伝 子 の 機 能 解 析 の 有力なツー ル に な る こ と は言うま
でもあ り ませんが 、 生 物間で ゲ ノ ム 構 造 を比較す る こ と に よ り 、無脊椎動物 か ら脊椎動物 の 進
化 の過程で起こ っ た ゲ ノ ム 構 造 の 変 化 等も明 ら か に な り ま し た . ま た哺乳類の中でも単孔類
(カモ ノハシ ) 、 有袋類( オ ポ ッ サ ム ) か ら 有胎盤類に至る 進 化 の過程や、 ま た チ ン パ ン ジ ー
と ヒ ト で の知能 の差を ゲ ノ ム 構 造 の 進 化 の観点か ら議論 さ れ て い ま す .
既に家畜や野菜や穀物植物 の ゲ ノ ムもほとんどの 種 で 解 読 さ れ て い ま す 。農学 でも新 し い 研
究 分野を開拓す る ために は 、 ゲ ノ ム 情 報 を 有効に 利 用 できる がどうか が 、極めて 重 要 な素養と
な り ま す .
**********************************************************************ゲ ノ ム 解 読 プ ロ ジ ェ ク ト で 解 析 さ れ た ゲ ノ ム DNA 配 列 情 報 は 、 NCBI と Ensemblで一般に
利 用 できる よう整備さ れ て い ま す 。 遺 伝 子 の染色体上の 位置や類似遺 伝 子 の 検 索 に は NCBIが便利 で す 。 ゲ ノ ム の 塩 基 配 列 を デ ー タ ベ ー ス か ら 取 り 出 す場合 に は 、 Ensemblが便利 で
9
す 。 NCBI と Ensemblの 使 い 方 は 、 授 業 で 実 習 し ま す 。 ゲ ノ ム 情 報 が い か に強力なツー ル
に な る か を体験し 、 実感し てもらおうと考えて い ま す 。
————————————————————————————————ゲ ノ ム 解 読 の 歴 史的な背景と 、 ゲ ノ ム 解 読 の 方 法 論 を 理 解 し てもらうために 、 授 業 で は階層
的シ ョ ッ ト ガ ン 法 で 解 読 さ れ た ヒ ト ゲ ノ ム プ ロ ジ ェ ク ト を 例 に し て ゲ ノ ム 解 読 の道筋を 解 説 し
ま す .もはや、 歴 史 を振り返る ような感もあ り ま す が 、 ゲ ノ ム を 理 解 す る の にもよ い の で 3 回
に 分 け て 解 説 し ま す 。
ヒ ト 全 ゲ ノ ム 塩 基 配 列 解 読 の 行程( 1/ 3 )
1 ) 連 鎖 地 図
2 ) BAC ラ イ ブ ラ リ ー 作 製
3 ) BAC ラ イ ブ ラ リ ー 整 列 化 ( 物 理 地 図 )
4 ) シ ョ ッ ト ガ ン シ ー ク エ ン ス
5) ア セ ン ブ ル
6) ア ノ テ ー シ ョ ン
10
10 月 16 日 ( 第 3 回 )
今日 の 授 業 内 容
1 . 実 習 : ホ モ ロ ジ ー 検 索 BLASTP2 . 実 習 : 検 索 結 果 の 見 方
3 . 講 義 : ゲ ノ ム 解 読 プ ロ ジ ェ ク ト ( 2 /3)
実 習
ホ モ ロ ジ ー 検 索 ( BLAST検 索 ) 1/2 遺 伝 子やゲ ノ ム を扱う研 究 で 使 用 す る 機会が最も多 い プ ロ グ ラ ム が 、 塩 基 配 列やア ミ ノ 酸
配 列 の ホ モ ロ ジ ー (相同性 ) 検 索 プ ロ グ ラ ム で す . 実験で 新 し い 塩 基 配 列 が得ら れ た時に 、
遺 伝 子 を同定 す る ために 、最初に 行う操作 が相同性 検 索 でだか ら で す .相同性 検 索 に よ り 、
ク ロ ーニン グ し た 遺 伝 子 が 、 デ ー タ ベ ー ス に登録さ れ て い るどの 遺 伝 子 と類似し て い る か を
知る こ と が できま す .
次 世 代 シ ー ク エ ン ス 解 析 で得ら れ た 配 列 を ゲ ノ ム 配 列 に マ ッ プ す る 際 にもBLAST 検 索 が 用
い ら れ ま す . ゲ ノ ム 解 読 さ れ て い る 生 物 で あ れば、 100bp の短い 配 列 ( 次 世 代 シ ー ケ ン サ ー
の 解 析 で は 、 1 リ ー ド は 100-120bp ) でもゲ ノ ム のどの 位置に あ る か を調べる こ ともできま
す . ま た 次 世 代 シ ー ク エ ン ス 解 析 を 使 っ た ト ラ ン ス ク リ プ ト ー ム 解 析 (組織に 発現す る 遺 伝
子 を 網羅的に 配 列 解 読 と 遺 伝 子 の特定 、 発現量 の 解 析 が できる ) で は 、 解 読 し た 配 列 は ホ モ
ロ ジ ー (相同性 ) 検 索 の BLASTX で 遺 伝 子 の 種類を判別さ れ ま す .
授 業 で は 、 BLAST (Basic Local Alignment Search Tool) プ ロ グ ラ ム を 用 い ま す 。今日 は 、
塩 基 配 列 ・ ア ミ ノ 酸 配 列 の デ ー タ ベ ー ス 、問い 合わせ配 列 と デ ー タ ベ ー ス の組合せ、 各組合
せで 使う BLAST プ ロ グ ラ ム に つ い て 説 明 し ま す .その あ と テ ス ト 配 列 ( ア ミ ノ 酸 配 列 ) を
使 っ て 、 実 際 に BLAST 検 索 を 行 い ま す .
ホ モ ロ ジ ー ( homology ) 検 索 、 と は ?
問い 合わせ配 列 (query sequence) に対し 、類似し た 配 列 を デ ー タ ベ ー ス か ら探し 出 す
操作 .最も高頻度に 利 用 さ れ る バ イ オ イ ン フ ォ マ テ ィ ッ ク ス の 手 法 のひと つ .
検 索 内 容 :
例 ) 実験で ク ロ ーニン グ し た 遺 伝 子 の 種類を特定 す る 。それ が コ ー ド す る ア ミ ノ 酸 配
列 が デ ー タ ベ ー ス に登録さ れ て い る 遺 伝 子 、蛋白質 のどれ と 、 ま たどの程度類似す る
か ?
遺 伝 子 配 列 デ ー タ ベ ー ス : GenBank, DDBJ, EMBL
最 も広 く 利 用 さ れ ており 、 検 索 が高 速 な プ ロ グ ラ ム が BLAST(Basic Local Alignment Search Tool) で す (昔、 FASTと言うプ ロ グ ラ ムも使われ て い た が 、現在はほとんど見
か け な い )
--------------------------------------------------------――――――――――――――――――-------------11
検 索 の組合せ 問い 合わせ配 列 対 デ ー タ ベ ー ス
----------------------------------------------------――――――――――――――――――-----------------BLASTN 塩 基 配 列 対 塩 基 配 列 デ ー タ ベ ー ス
BLASTP ア ミ ノ 酸 配 列 対 ア ミ ノ 酸 配 列 デ ー タ ベ ー ス
BLASTX 塩 基 配 列 ( ア ミ ノ 酸 配 列 に置換 ) 対 ア ミ ノ 酸 配 列 デ ー タ ベ ー ス
TBLASTN ア ミ ノ 酸 配 列 対 塩 基 配 列 デ ー タ ベ ー ス ( ア ミ ノ 酸
配 列 に置換 )
TBLASTX 塩 基 配 列 ( ア ミ ノ 酸 配 列 に置換 ) 対 塩 基 配 列 デ ー タ ベ ー ス 塩 基 配 列 ( ア ミ ノ
酸 配 列 に置換 )
----------------------------------------------------――――――――――――――――――-----------------
配 列 の 種間変異の激し い 遺 伝 子 の場合 ( サ イ トカイ ン 等 ) 、 塩 基 配 列 を BLASTN 検 索 し て
も相同遺 伝 子 が デ ー タ ベ ー ス か ら 検 出 さ れ な い こ と が あ る .その場合 でも、 BLASTX な ら
相同遺 伝 子 が ヒ ッ ト す る こ と が 多 い .その ため、 塩基配列を 問い 合わ せ 配列に相同検索す る 場合、通常、BLASTX が 用い ら れ る .
**************************************************************************
BLAST 検 索 の 原 理 1 . ホ モ ロ ジ ー が観察さ れ る 配 列間の局所ア ラ イ メ ン ト に は 、 多くの場合 、ギャッ プ を含ま
な い保存領域が存在す る 。 BLAST で は 、その ような局所保存領域( ワ ー ド ) を まず高速
に 検 索 す る 。
2 . 一致し た ワ ー ド か ら ア ラ イ メ ン ト を 配 列 に沿っ てそれぞれ の 方向に拡張し て いき、 ス コ
ア が 増 加 す る ま で続け る 。拡張処 理 は 、 ス コ ア の 増 加 が止ま り 、伸ばす前の ベ ス ト ス コ
ア よ り減少し始めた時に終了す る 。 こ の時点で 、 HSP (high-scoring segment pair) と呼ば
れ る 、 大きな 配 列領域が 見 つ か る 。 こ の時点でギャッ プ が あ る とそこ か ら先に は伸長し
て い な い 。
3 . 一般に 、 ア ミ ノ 酸 配 列 と 塩 基 配 列 に はギャッ プ が 生じて い る ため、 HSP の み で は類似領
域の 検 索 と し て不十分 で あ る 。そこ で 、 BLAST で は 、 HSP におい て対応す る 位置に存在
す る 1 組の記号の ペ ア を適切に選び、類似度の高い領域は こ の ペ ア を含むもの と仮定 し
て 、動的計 画 法 と呼ばれ る 方 法 を 用 い て類似領域を探索 す る 。 HSP か ら選んだペ ア を起
点と し て探索範囲を狭く取 る こ と に よ っ て 、類似度の最適性 は保証さ れ な いもの の 、従
来の動的計 画 法 と比較し て高速な類似領域の探索 を 実現し て い る 。
ス コ アア ミ ノ 酸 配 列 の場合 : BLOSUM62 ス コ ア ( ア ミ ノ 酸 の組合せに よ っ て値が決めら れ て い る )
塩 基 配 列 の場合 :値は同じ塩 基 、異な る 塩 基 の組合せで の み決めら れ て い る
————————————————————————————————
BLASTP 実 習
下記の 2 つ の ア ミ ノ 酸 配 列 は 、当研 究室で 行われ た 次 世 代 シ ー ケ ン サ ー を 使 っ た De novo transcriptome 解 析 で得ら れ た 塩 基 配 列 か ら推定 さ れ た ア ミ ノ 酸 配 列 で す 。 サ サ ウ シ ノ シ タ
と言う非モ デ ル 生 物 の 配 列 で 、 まだデ ー タ ベ ー ス に登録さ れ て い ません。
12
BLASTP の操作 手順
1 . NCBI 先頭ペ ー ジ右上 Popular Resources か ら BLASTを選択す る 。 Basic BLASTに上記 5 種類の BLAST プ ロ グ ラ ム の ア イ コ ン が あ る .
2 . protein blastを ク リ ッ ク す る 。 ア ミ ノ 酸 配 列 (FASTA format) を枠内 に コピー す
る 。 Database (non-redundant protein sequences (nr) ), Algorithm (blastp; protein-protein BLAST) は 、 デ フ ォ ル ト の ま ま で よ い .
3 . BLASTのボタ ン を押し て 、 検 索 を開始す る 。
>bamboo_sole_Shh_protein
MLLWTRIALVALMCLSLVSSGMGCGPGRGYGRRRHPKKLTPLAYKQFIPNVAEKTLGASGRYEGKITRNSERFKELTPNYNTDII
FKDEENTGADRLMTQRCKDKLNSLAISVMNQWPGVKLRVTEGWDEDGHHFEESLHYEGRAVDITTSDRDKSKYGTLSRLAVEAGF
DWVYYESKAHIHCSVKAENSVAAKSGGCFPGSSTVTLEDGTRKAVRDLQTGDKVLAADTRGQLIYTDFIMFIDQDSTTRRLFHVI
ETDSGQKITLTAAHLLFVGHNGTSAETQGGRMSAIFASQVRPGQRVFVFDTERSELQPVTVKRIYTQEHEGSFAPVTVQGTVVVD
QVLASCYAVIEDHELAHWALAPVRLAHWVSSLLFSSQHQSRAQSDGVHWYSKVLYQLGTWILDSHSIHPLGMSVYPS
>bamboo_sole_Pcna_protein
MFEARLVQGSILKKVLEALKDLITEACWDVSSSGISLQSMDSSHVSLVQLTLRHDGFDSYRCDRNLAMGVNLSSMSKILKCAGNE
DIITLRAEDNADTLALVFETINQEKVSDYEMKLMDLDVEQLGIPEQEYSCVVKMPSGEFARICRDLSQIGDAVMISCAKDGVKFS
ATGELGTGNVKLSQTSNVDKEEEAVTIEMNEPVQLIFALNYLNFFTKATPLSKTVTLSMSADIPLVVEYKIADMGHVKYYLAPKI
DEEAS
PSI-BLASTP, PHI-BLAST: 比較的最近開発 さ れ た プ ロ グ ラ ム で 、 系 統的に離れ た 生 物 あ
る い は 関 連 遺 伝 子 を 検 索 す る場合 に 利 用 す る . 種間の保存性 が低い 遺 伝 子 の場合 に
利 用価値が高い .
検 索 結 果 の 見 方 :
グ ラ フ ィ ッ ク の 次 に 示 さ れ て い る数値の 説 明
E-value : 検 索 結 果 は 、 Query 配 列 と相同性 を 示 す 配 列 の ア ラ イ メ ン ト 結 果 が表示
さ れ る 。 e-value は 、 検 索 に 使 っ た デ ー タ ベ ー ス の な か で 、 Query の局所配 列 と
検 索 配 列 の組合わせが 、偶然に み つ か る個数を 示 す 。相同性 が高いほど、値は 0に近づく(最も重 要 な デ ー タ :蛋白質 の場合 、 e-3あ た り が 関 連 遺 伝 子 か ? 、そう
で な い か を判断す る 基準と な る;実 際 に は ア ラ イ メ ン ト の デ ー タも参考に し て判
定 す る 必 要 が あ る ) 。 検 索 結 果 の数値のうち、最も重 要 で あ る .
Total score (bits): 検 索 さ れ てきた局所配 列 の長さ をビッ ト形式で 示 し たもの 。値
が 大きいほど、相同性 を 示 す領域が長い 。
Query cover: 問合せ配 列 の 全長のうち、 検 索 配 列 と 配 列 が一致し て い る領域の%
Identities: ア ミ ノ 酸 配 列 で 、相同領域の な か で一致し て い る ア ミ ノ 酸 の比率
ア ラ イ メ ン ト の添えら れ て い る数字
Identities: ア ミ ノ 酸 配 列 で 、相同領域の な か で一致し て い る ア ミ ノ 酸 の比率
Positives: ア ミ ノ 酸 配 列 の場合 に 、一致し て い る ア ミ ノ 酸+化 学的に類似す る ア ミ
13
ノ 酸 の比率
Gaps: ア ラ イ メ ン ト さ れ た 配 列 で 、片一方 で欠損し て い る 塩 基 あ る い は ア ミ ノ 酸 の
総 計
最近で は 、 デ ー タ ベ ー ス に納めら れ て い る 生 物 種 、 配 列 情 報 が 大きくな り すぎた ため、 BLASTの 検 索 結 果 の 画面が 、 解 析 し た 配 列 の由来生 物 の近縁種 の 配 列だけ で ペ ー ジ が埋め尽くさ れ 、
進 化 的 に離 れ た 生 物 で相 同 遺 伝 子 が存 在 す る の か を判 定 できません. その ため、 BLASTP, BLASTX で は 、 Databaseを Model organisms (landmark) に指定 し て 解 析 す る こ と で 、 進 化的な 解
析 を 行うこ と が 可 能 に な っ て い ま す . Model organisms (landmark) に は 、 ヒ ト 、 マ ウ ス 、ゼブ ラ
フ ィ ッ シ ュ 、 シ ョ ウ ジ ョ ウ バ エ 、 線 虫 (Caenorhabditis elegans) 、 粘 菌 (Dictyostelium discoideurm) 、 シ ロ イヌナ ズ ナ,大豆 (Glycine max) 、酵母と細菌の一部 の デ ー タ が含ま れ て
い ま す 。 Model organisms (landmark) を選択し て 、 BLASTP 検 索 を 行 っ て み ま しょう.
講 義
ヒ ト 全 ゲ ノ ム 塩 基 配 列 解 読 の 行程( 2/ 3 )
1 ) 連 鎖 地 図 ・ 物 理 地 図 ( Radiation hybrid panel )
2 ) BAC ラ イ ブ ラ リ ー 作 製
3 ) BAC ラ イ ブ ラ リ ー の 整 列 化
4 ) シ ョ ッ ト ガ ン シ ー ク エ ン ス
5) ア セ ン ブ ル
6) ア ノ テ ー シ ョ ン
完全長 cDNA 配 列 解 読 プ ロ ジ ェ ク ト 、 EST ( expressed sequence tags ) プ ロ ジ ェ ク ト
に つ い て の 解 説
14
10 月 23 日 ( 第 4 回 )
今日 の 授 業 内 容
1 . 実 習 : BLAST検 索 ( BLASTN, BLASTX, TBLASTX )
2 . 講 義 : ゲ ノ ム 解 読 プ ロ ジ ェ ク ト ( 3/3 )
実 習ホ モ ロ ジ ー 検 索 ( BLAST検 索 ) 2/2
BLASTN 実 習
下記は 、私達の 研 究 グ ル ー プ 20 年あ ま り前にゼブ ラ フ ィ ッ シュか ら ク ロ ーニン グ し た 遺
伝 子 の 塩 基 配 列 と ア ミ ノ 酸 配 列 で す . こ れ ら の 配 列 を 使 っ て 実 習 し ま す 。
>zebrafish_dand5_cDNAAACGAAACCTTGAACCGCAAGATTTTTCAACAAATAATCGACTATATGTATTTTTAGAGAGAAATAAATTCCCTCTCTTTT
CTTTTTTGTAAAATTCTATAATTTAGCTAAAATGACTTTTCAGGTCGGCTTTTTTGTGCTGTTGTCAGTCACAACAATTGG
CGCTTTCCCGCGCAATGCATTTCAGCGGGAATTTCACCGACACGTGGCGAAAGACTTTGAATCCTCCGGGAATGGACCAGA
CGAACCTGTTCGGGGATCTGTCCGAATTGTCAAACTAAACCCTCATTTTCTGCGCCGGGCCGCCGTTAGTCATGTGCCGTT
CAGAAATTCACCAAGTCGAGGCGCGTTTCCCGCGTTCTTGGCCCTCGGACGTCCGGGCCCCGCAATCCTGACCCATAGCAA
ACCTGCGCCTCAGGTGAGCAGCAGTGCAGACAGGAGGAAACAAGGGCTCGAGATGTGGAAGAAAGTGGTGCACAAAAGCGA
GCGAAAAAAAGAGGCAGTGGCTCTGCGCATCAATCCCAAAGACATGAACAAACAGAGCTGTGCCGCAGTTCCCTTTACACA
GCGCATAACGGAGGAGGGCTGTGAGACGGTGACCGTTCACAATAATCTCTGCTACGGTCAGTGCAGCTCCATGTTCGTGCC
CTCCAGCGGAGGCTCTCACGGACAACAGAAAGCGCAGTGCATGCGCTGCGGCCCCTCTAGAGCGCGCTCCGTGCTCCTGCA
CCTGCGCCGCGGGTCTGAGGTGCGGGAGAGGCGCGTACTGATCGTTGAGGAGTGCAAGTGTGAAACCAGCAGCGAAGAGGC
CAAAGTTCAGAACACAGATATGTTTAATTTATAACAGTCATTTTAAAGTTTATAAAAATCGTAA
>zebrafish_ dand5_proteinMTFQVGFFVLLSVTTIGAFPRNAFQREFHRHVAKDFESSGNGPDEPVRGSVRIVKLNPHFLRRAAVSHVPFRNSPSRGAFP
AFLALGRPGPAILTHSKPAPQVSSSADRRKQGLEMWKKVVHKSERKKEAVALRINPKDMNKQSCAAVPFTQRITEEGCETV
TVHNNLCYGQCSSMFVPSSGGSHGQQKAQCMRCGPSRARSVLLHLRRGSEVRERRVLIVEECKCETSSEEAKVQNTDMFNL
blastn を 使 っ て 、 >zebrafish_ dand5 の相同遺 伝 子 を 検 索 し て み よう
BLASTN の 検 索 手順
1 . NCBI 、 Popular Resources の中か ら BLASTを選択す る 。 Basic BLAST に上記
5 種類の BLAST プ ロ グ ラ ム の ア イ コ ン が あ る 。
2 .nucleotide blast を ク リ ッ ク す る 。
「Database」が 、 デ フ ォ ル ト で は nucleotide collection (nr/nt) で 、通常こ
の ま ま で よ い 。 nucleotide collection の デ ー タ に は 、登録さ れ て い る 全 て
の cDNA の 配 列 が含ま れ て い る 。
15
注 意 : Program selection で somewhat similar sequences (blastn) を 選 択 す る 。
3 . 塩 基 配 列 (FASTA format) を枠内 に コピー す る 。
4 .BLAST のボタ ン を押し て 、 検 索 を開始す る 。
Blastn の 利 用 例 :
と り あえず調べた い 遺 伝 子 が 、既知のどの 遺 伝 子 に類似す る か ? を調べる時等 に
使う。 ただし 、 生 物間で 変異の激し い 遺 伝 子 ( 実 習 で 使う charon が一例 ) の場合
に は 、 Blastn で は相同遺 伝 子 が十分 に 検 索 さ れ て こ な い こ と が あ る の で 、 遺 伝 子
を特定 す る ために は 、 次 の Blastx を 使う方 が よ い 。
次 世 代 シ ー ケ ン ス 解 析 で得ら れ た断片( 100bp ) を ゲ ノ ム に マ ッ プ す る時は
Blastn を 用 い る 。
ヒ ト の ゲ ノ ム デ ー タ ベ ー ス に 対 し て 、zebrafish_dand5配 列 を 問 合 せ 配 列 に し て 、 blastx,blastn 検 索 を 行 い 、 得 ら れ る デ ー タ の 違 い を 理解 し よ う .
BLASTX 実 習
BLASTの先頭ペ ー ジ で デ ー タ ベ ー ス を [human] に設定
blastXを 使 っ て 、 zebrafish_dand5_cDNA の相同遺 伝 子 を 検 索
blastx の特性 :
こ の プ ロ グ ラ ム で は 、 遺 伝 子 が コ ー ド す る ア ミ ノ 酸 配 列 と相同性 の高い蛋白質 を
探す 。問い 合わせ塩 基 配 列 は 、一度 6 フ レ ー ム で翻訳さ れ 、翻訳さ れ た 配 列 が 6通り の ア ミ ノ 酸 配 列 デ ー タ ベ ー ス に対し て 検 索 に か け ら れ て い る 。 --- タ ン パ ク
の 配 列 で BLASTP 検 索 し た時と同じ検 索 結 果 が得ら れ て い る
ア ミ ノ 酸置換 の激し い 遺 伝 子 の相同性 検 索 に非常に 有効
進 化的に離れ た 生 物 か ら相同遺 伝 子 を探す場合 にも有効
次 世 代 シ ー ケ ン サ ー を 使 っ た de novo ト ラ ン ス ク リ プ ト ー ム 解 析 で得ら れ た 配
列 を同定 す る場合 、 BLASTX が 使 用 さ れ る
blastnを 使 っ て 、 zebrafish_dand5_cDNA の相同遺 伝 子 を 検 索
同じ遺 伝 子 の 配 列 zebrafish_dand5_cDNA の に 、 blastx と blastnで 検 索 さ れ てくる 遺 伝 子 の
数が違うこ と に注意!(その 理由を 理 解 し て下さ い )
16
TBLASTN 実 習
tblastx を 使 っ て 、 zebrafish_dand5_cDNA の相同性 検 索 を試し て み よう
human の ペ ー ジ で TBLASTX を選択、 デ ー タ ベ ー ス を RefSeq RNA と す る 配 列 を ペ ー ス ト し て 検 索
tblastx の特性 :
問い 合わせの 塩 基 配 列 、 デ ー タ ベ ー ス の 塩 基 配 列 とも3 フ レ ー ム で翻訳さ れ 、 検
索 に か け ら れ て い る 。
Tblastx の 利 用 例 :
単離し た 遺 伝 子 が コ ー ド す る ア ミ ノ 酸 配 列 と相同性 の高い ア ミ ノ 酸 配 列 を コ ー ド
す る 塩 基 配 列 を探す 。 配 列 の 変異が激し い 遺 伝 子 種 の場合 に 有効。
講 義
ヒ ト 全 ゲ ノ ム 塩 基 配 列 解 読 の 行程( 3/ 3 )
1 ) 連 鎖 地 図 ・ 物 理 地 図 ( Radiation hybrid panel )
2 ) BAC ラ イ ブ ラ リ ー 作 製
3 ) BAC ラ イ ブ ラ リ ー の 整 列 化
4 ) シ ョ ッ ト ガ ン シ ー ク エ ン ス
5) ア セ ン ブ ル
6) ア ノ テ ー シ ョ ン
完全長 cDNA 配 列 解 読 プ ロ ジ ェ ク ト 、 EST ( expressed sequence tags ) プ ロ ジ ェ ク ト に
つ い て の 解 説
17
10 月 30 日 ( 第5回 )
今日 の 授 業 内 容
1 . 実 習 : NCBI の ゲ ノ ム デ ー タ ベ ー ス で 生 物 種 を選択し て BLAST検 索
2 . 講 義 : プ ラ ス ミ ド ベ ク タ ー と 蛍 光 シ ー ケ ン サ ー を 使 っ た Whole genome shotgun sequence
3 . 講 義 : 次 世 代 シ ー ケ ン サ ー の 解 析 原 理 と
実 習NCBIの BLAST 検 索 シ ス テ ム で は 、 生 物 種 を選択し て BLAST 検 索 を 行うこ と が できま す 。 授 業 で
は 、 生 物 毎 の デ ー タ ベ ー ス を 使 っ て 、 3 つ の 使 用 法 を 実 習 し ま す 。
— さ ま ざ ま な 生 物 の ゲ ノ ム デ ー タ ベ ー ス の 利 用—
BLAST の先頭ペ ー ジ で 、 BLAST Genomes の枠内 に 生 物 の一般名(もちろん英語) あ る い は 学
名を入力し て 検 索 す る と 、 デ ー タ ベ ー ス に ゲ ノ ム 配 列 が納めら れ て い る 生 物 で あ れば、その 生
物 の 検 索 ペ ー ジ が表示 さ れ ま す 。 バ ク テ リ ア か ら植物 、哺乳類に至る ま で 多様な 生 物 の ゲ ノ ム
情 報 が 利 用 できま す 。 ヒ ト が持っ て い る 遺 伝 子 の相同遺 伝 子 を 進 化的に たどっ て 、どの 生 物 に
ま で存在し て い る か と言う疑問に つ い ても、 BLAST 検 索 に よ っ て調べる こ と が できま す 。
練習 : ヒ ト の 増殖細胞核抗原 ( PCNA: proliferating nuclear antigen ) の相同遺 伝 子 を イネゲ ノ ム
( Oryza sativa (japonica cultivar-group) ) 、 パ ン 酵 母 ( Baker’s yeast; Saccharomyces
cerevisiae ) 、 大腸菌( Escherichia coli ) か ら探し て み よう。
マ ウ ス ビ タ ミ ン D 受 容 体 の 相 同 遺 伝 子 が 、 シ ョ ウ ジ ョ ウ バ エ ( Fruit fly; Drosophila
melanogaster ) 、 線 虫 ( nematode; Caenorhabditis elegans ) 、 イ ネ ( Oryza sativa (japonica cultivar-group) ) に存在す る かどうかも試し て み よう。
>human_pcna
MFEGRLVQGSILKKVLEALKDLINEACWDISSSGVNLQSMDSSHVSLVQLTLRSEGFDTYRCDRNLAMGVNLTSMSKILKCAGNE
DIITLRAEDNADTLALVFEAPNQEKVSDYEMKLMDLDVEQLGIPEQEYSCVVKMPSGEFARICRDLSHIGDAVVISCAKDGVKFS
ASGELGNGNIKLSQTSNVDKEEEAVTIEMNEPVQLTFALRYLNFFTKATPLSSTVTLSMSADVPLVVEYKIADMGHLKYNLAPKI
EDEEGS
>mouse_vitamin_D_receptor
MEAMAASTSLPDPGDFDRNVPRICGVCGDRATGFHFNAMTCEGCKGFFRRSMKRKALFTCPFNGDCRITKDNRRHCQACRLKRCV
DIGMMKEFILTDEEVQRKREMIMKRKEEEALKDSLRPKLSEEQQHIIAILLDAHHKTYDPTYADFRDFRPPIRADVSTGSYSPRP
TLSFSGDSSSNSDLYTPSLDMMEPASFSTMDLNEEGSDDPSVTLDLSPLSMLPHLADLVSYSIQKVIGFAKMIPGFRDLTSDDQI
18
VLLKSSAIEVIMLRSNQSFTLDDMSWDCGSQDYKYDITDVSRAGHTLELIEPLIKFQVGLKKLNLHEEEHVLLMAICIVSPDRPG
VQDAKLVEAIQDRLSNTLQTYIRCRHPPPGSHQLYAKMIQKLADLRSLNEEHSKQYRSLSFQPENSMKLTPLVLEVFGNEIS
練習 : シ ロ イヌナ ズ ナ : efe; ethylene forming enzyme で 、どの範囲の 生 物 に 関 連 遺 伝 子 が存在
し て い る の か 検 索 し て み よう
> Arabidopsis_ethylene-forming_enzyme_proteinMESFPIINLEKLNGEERAITMEKIKDACENWGFFECVNHGISLELLDKVEKMTKEHYKKCMEERFKESIK
NRGLDSLRSEVNDVDWESTFYLKHLPVSNISDVPDLDDDYRTLMKDFAGKIEKLSEELLDLLCENLGLEK
GYLKKVFYGSKRPTFGTKVSNYPPCPNPDLVKGLRAHTDAGGIILLFQDDKVSGLQLLKDGEWVDVPPVK
HSIVVNLGDQLEVITNGKYKSVEHRVLSQTDGEGRMSIASFYNPGSDSVIFPAPELIGKEAEKEKKENYP
RFVFEDYMKLYSAVKFQAKEPRFEAMKAMETTVANNVGPLATA
—特定 の 生 物 の ゲ ノ ム に存在す る 遺 伝 子 ファミ リ ー の メ ン バ ー の 検 索—
多くの 遺 伝 子 に は 、 生 物 進 化 の過程で共通の 遺 伝 子 か ら派生 し た姉妹遺 伝 子 が存在し ま す 。
ま たその メ ン バ ー は 進 化 に伴っ て 増える傾向に あ り ま す 。 マ ウ ス な ら マ ウ ス の ゲ ノ ム に対し て 、
あ る メ ン バ ー で ゲ ノ ム を 検 索 す る こ と に よ り 、 進 化的に 関 連 し て 部 分的に でも共通の 配 列 を持
つ メ ン バ ー を 全 て 検 索 す る こ と が できま す 。今回 は 、 マ ウ ス ゲ ノ ム に存在す る核レ セ プ タ ー
ファミ リ ー の メ ン バ ー 、及びG タ ン パ ク共役受容体の メ ン バ ー を探す操作 を 実 習 し ま す 。
練習 : マ ウ ス に核受容体ファミ リ ー の メ ン バ ー が幾つ存在す る か ?
G-protein coupled receptor の メ ン バ ー で試し て み よう。
>human_MC4R
MVNSTHRGMHTSLHLWNRSSYRLHSNASESLGKGYSDGGCYEQLFVSPEVFVTLGVISLLENILVIVAIAK
NKNLHSPMYFFICSLAVADMLVSVSNGSETIVITLLNSTDTDAQSFTVNIDNVIDSVICSSLLASICSLLS
IAVDRYFTIFYALQYHNIMTVKRVGIIISCIWAACTVSGILFIIYSDSSAVIICLITMFFTMLALMASLYV
HMFLMARLHIKRIAVLPGTGAIRQGANMKGAITLTILIGVFVVCWAPFFLHLIFYISCPQNPYCVCFMSHF
NLYLILIMCNSIIDPLIYALRSQELRKTFKEIICCYPLGGLCDLSSRY
—次 世 代 シ ー ケ ン ス 解 析 で得ら れ た 配 列 の染色体へ の マ ッピン グ—
最も汎用 さ れ て い る 次 世 代 シ ー ケ ン サ ー で あ る Illumina2000 で は 、一度の 解 析 で 100bの断片配 列 が約 4000 万個得ら れ ま す 。 ゲ ノ ム 解 析 が 行われ て い る 生 物 で は 、 こ の ような
短い断片でも染色体に マ ッピン グ できま す 。 さ ら に 参 照 ゲ ノ ム と 塩 基 配 列 の違い が あ る か
どうか 、 遺 伝 子疾患の 原因が 解 析 さ れ た個人の ゲ ノ ム に存在し て い る かどうかも判定 可 能
で す 。
練習 :
BLAST 検 索 で human を選択し て 、 次 の 配 列 を ゲ ノ ム に マ ッピン グ し て み よう。
>human_100bp_fragment
CCAAATTTAATTGATAATGGAAGCTGGCCAGCCACCACCATACAGAATTCTGTAGCTTTGAAGAATGCAGGTTTAATATCC
19
ACTTTGAAAAAGAAAACAA
講 義
次 世 代 シ ー ケ ン ス 解 析 の 原 理
次 世 代 シ ー ケ ン ス 解 析 の 利 用 に つ い て は 、 配付し た 日本分 子 生 物 学会に よ る資料も参考に
し て下さ い 。
次 世 代 シ ー ケ ン ス 解 析 に つ い て
次 世 代 シ ー ケ ン ス 解 析 は 、 こ の数年で 実 用 化 さ れ た DNA シ ー ク エ ン ス 解 析技術 で 、
その 原 理 は従来の サ ン ガ ー 法 に 基づい た 蛍 光 シ ー ク エ ン サ ー と は異な り 、 ガ ラ ス 基盤
( フ ロ ー セ ル ) に固着し た プ ラ イ マ ー を鋳型に し て ( ブ リ ッ ジ PCR ) 、 基板上で 1 塩
基 の伸長反応ごと に 結 合 し た 塩 基 を 蛍 光 検 出 し ま す ( Sequence by synthesis ) 。 ナ ノ
技術 に よ り 、 1mm 四方 で万単位 の シ ー ク エ ン ス 解 析 が 可 能 で す 。最も汎用 さ れ て い
る Illumina 社の HiSeq2500 で は 、 1 リ ー ド の リ ー ド長は 125bp と短い で す が 、 シ ー ケ
ン サ ー を一度動か す と ( 1 ラ ン ) で 80 億リ ー ド が 読 ま れ ま す 。 つ ま り 1 ラ ン で 、
1000 Gbp (ギガ =10 億) の 配 列 が得ら れ る こ と に な り ま す 。 ヒ ト の ゲ ノ ム サ イ ズ は
約 3 Gbp な の で 、その x300 が 読 ま れ る こ と に な り ま す 。現在で は 、個人の ゲ ノ ム 解
読も可 能 で す 。
従来の 蛍 光 シ ー ケ ン サ ー で は 、 1 ラ ン で 700bp の リ ー ド が 96 、 総 計約 67kb の 塩
基 配 列 が得ら れ る の に比べる と 、 オ ーダー が千万単位違い ま す 。 つ ま り 次 世 代 シ ー ケ
ン サ ー が 1 台 で 、 蛍 光 シ ー ケ ン サ ー の 千 万 台 分 の 解 析 能 力 が あ る わ け で す 。
HiSeq2500 で は 、 ペ ア エ ン ド の シ ー ク エ ン ス 解 析 (約 300bp の断片を両側か ら 125bp読む) が 可 能 で す . シ ン グ ル エ ン ド の シ ー ケ ン ス 解 析 に比べ、 ペ ア 情 報 は 配 列 を コ ン
テ ィ グ に繋ぐ時に非常に 有 用 に な り ま す 。従っ て 、 de novo genome sequencing, de novo transcriptome 解 析 に は ペ ア エ ン ド の シ ー ク エ ン ス 解 析 が 必須で す 。
世 代 シ ー ケ ン サ ー は 1 台が数億円す る ため、 研 究室で購入す る こ と は非現実的で す
が 、依頼解 析 が随分廉価と な り 、 す で に農学 研 究 でも汎用 さ れ て い ま す 。農学 が対象
と す る 生 物も、ほぼ全 て の 種 の ゲ ノ ム 解 読 が終わっ て い ま す 。今後は 系 統間の 塩 基 配
列 の違い を調べ、 遺 伝形質 と 配 列 と の 関 係 を 解 析 す る こ と が 重 要 に な る と思われ ま す 。
こ こ で注意し な け ればな ら な い こ と は 、 1 レ ー ン あ た り 125bp の 配 列断片が約 7 億個得ら れ る と言うこ と で 、その 解 析 は とうて い人の 手 に負える はずは なく、 コ ン
ピュー タ ー 解 析技術 が 必須で す 。 ゲ ノ ム に し ても cDNA の 配 列 を 読むに し ても、最初
に 125bp の 配 列断片か ら 重 な り 合う部 分 を探し て 、 配 列 を コ ン テ ィ グ に つ なげる 必 要
が あ り ま す 。 配 列 解 析 の バ イ オ イ ン フ ォ マ テ ィ ッ ク ス は現在非常に 重 要 に な っ ており 、
まだ人材不足の状況で す 。 と り あえずは 、 遺 伝 研 の パ イ プ ラ イ ン 等 を 使えば、普通に
必 要 な 解 析 は誰に でもできま す 。
実験区毎 に 複数サ ン プ ル ( 例えば、 3 サ ン プ ル ) を 解 析 し て 、 実験区間で 発現が 統
計的に 有意に異な る 遺 伝 子 を探し た り す る に は 、 統 計 処 理 を 行 っ てくれ る プ ロ グ ラ ム
を 使 用 す る 必 要 が あ り ま す 。 こ の 関 連 の プ ロ グ ラ ム は R 言語で動くもの た開発 さ れ て
おり 、無料でダウ ン ロ ー ド し て 解 析 を 進める こ と が 可 能 で す 。是非、勉強し て 利 用 し
て み て下さ い 。
授 業 で は 、 ( 1 ) 次 世 代 シ ー ケ ン サ ー の 塩 基 配 列 解 読 原 理 、 ( 2 ) 次 世 代 シ ー ケ ン
20
ス 解 析 の 利 用 方 法 に つ い て 講 義 し ま す 。
次 世 代 シ ー ケ ン サ ー の 解 析 原 理 等 は 、国立 遺 伝 学 研 究所 先端ゲ ノ ミ ク ス推進 セ ン
タ ー の ホ ー ム ペ ー ジ が 参考に な る
http://genome.nig.ac.jp/glossary/glossary11.html
21
11 月 6 日 ( 第6回 )
今日 の 授 業 内 容
1 . 実 習 : 配 列 ア ラ イ メ ン ト
2 . 講 義 : 分 子 系 統 樹 に つ い て
4 . 講 義 : ゲ ノ ム 解 読 で 分 か っ た ヒ ト ゲ ノ ム の特性
講 義
2 つ以上の 塩 基 配 列 あ る い は ア ミ ノ 酸 配 列 の一致度を調べる場合 、 ア ラ イ メ ン ト プ ロ グ ラ ム
を 使 い ま す 。 タ ン パ ク 質 の場合 、異な る 生 物間で ア ミ ノ 酸 配 列 を ア ラ イ メ ン ト す る こ と に よ り 、
保存性 の高い領域を特定 す る こ と が できま す 。 系 統的に隔た っ た 生 物間( 例えば、 マ ウ ス とゼ
ブ ラ フ ィ ッ シュ、 あ る い は マ ウ ス と酵母の 関 係 等 ) で保存性 が高い領域は 、 タ ン パ ク 質 の 機 能
で 重 要 な役割を持っ た領域で あ る と考えら れ ま す 。 ま た シ ス テ イ ン残基 は 、 タ ン パ ク 質 の高次
構 造 に深く関わる ジ ス ル フ ィ ド ( S-S ) 結 合 を 作 る場合 が 多 い ため、保存さ れ て い る こ と が 多
く、異な る 生 物 の タ ン パ ク 質 を ア ラ イ メ ン ト す る こ と で 重 要 で保存さ れ た ジ ス ル フ ィ ド 結 合 の
位置を 予 測 できま す 。
ClustalW プ ロ グ ラ ム を 使うと 、 多 重 ( マ ル チ プ ル ) ア ラ イ メ ン ト の 結 果 か ら 分 子 系 統 樹 を 作
成 できま す 。 分 子 系 統 樹 で は 、 遺 伝 子 の 種間あ る い は同種間におけ る 進 化的関 係 を 予 測 す る こ
と が できま す 。 種間の 進 化的関 係 で は 、異な る 生 物間におけ る相同遺 伝 子 ( オ ー ソ ロ グ ) を同
定 す る こ と が 可 能 で す 。同種間で 関 連 遺 伝 子 の 系 統 樹 を 作 成 す る と 、 遺 伝 子 ファミ リ ー の メ ン
バ ー の 進 化的関 係 が 分 か り ま す 。 ま た モ デ ル 生 物 ( マ ウ ス 、ゼブ ラ フ ィ ッ シュ) の 配 列 を 分 子
系 統 樹 に 加える こ と で 、 研 究対象の 遺 伝 子 に対す る モ デ ル 生 物 の オ ー ソ ロ グ を 検 索 し 、 モ デ ル
生 物 の 情 報 か ら か ら 、 研 究対象の 遺 伝 子 の 機 能 に つ い ておおよその 情 報 を得る こ と が できま す 。
授 業 で は 、 ペ ア ワ イ ズ ア ラ イ メ ン ト ( 2 つ の 配 列 を比較) 、 マ ル チ プ ル ア ラ イ メ ン ト ( 3 つ
以上の 配 列 を比較)および分 子 系 統 樹 の 作 成 (来週) を 実 習 し ま す 。
配 列 ア ラ イ ン メ ン ト
配 列 ア ラ イ ン メ ン ト と は 、 配 列中で同じ並び方 を し て い る 文 字 列 を探す こ と で あ る 。同一
もしくは似た 文 字 は同じ列 に置き、同一で な い 文 字 は同じ列 に不一致と し て置くか 、
ギャッ プ を入れ る 。
ペ ア ワ イ ズ ア ラ イ ン メ ン ト (pairwise alignment) : 2 つ の 配 列 の比較
大域的ア ラ イ ン メ ン ト (global pairwise alignment)局所的ア ラ イ ン メ ン ト (local pairwise alignment)
多 重 配 列 ア ラ イ ン メ ン ト (multiple alignment) : 3 つ以上の 配 列 の比較
************************************************************************
22
実 習
AlignmentPairwise alignment
1 ) 使 用 す る ウ ェ ブ サ イ ト : The European Bioinformatics Institute (EBI )http://www.ebi.ac.uk/Information/ ( Internet explorerを 使 っ て EBI で 検 索 )
2 ) Services の中 か ら Proteins を選 択。 →左 下の See all toolsを開 け 、 リ ス ト の中か ら
EMBOSS を選択
Local alignment → Matcher (protein)2 つ の枠内 に 配 列 を ペ ー ス ト し て Submit練習 :
下の gnrh ( gonadotropin-releasing hormone; 生腺腺刺激ホ ル モ ン ) か ら ヒ ト とゼブ ラ フ ィ
シュを選んで ア ラ イ ン メ ン ト を 実 行 し て み よう。
次 に 、 ヒ ト と ホヤ( Ciona ) で 実 行 し て み よう
Global alignment → Needle (protein)Needle, Protein を選択し 2 つ の枠内 に 配 列 を ペ ー ス ト し て Submit練習 :上と同じ入力を 行 い 、 結 果 の違い を 理 解 し よう
>human_GNRH1
MKPIQKLLAGLILLTSCVEGCSS
QHWSYGLRPGGKRDAENLIDSFQEIVKEVGQLAETQRFECTTHQPRSPLRDLKGALESLIEEETGQKKI
>mouse_Gnrh
MILKLMAGILLLTVCLEGCSSQHWSYGLRPGGKRNTEHLVESFQEMGKEVDQMAEPQHFECTVHWPRSPLRDLRGALESLIEEEA
RQKKM
>chicken_Gnrh1
MEKSRKILVGVLLFTASVAICLAQHWSYGLQPGGKRNAENLVESFQEIANEMESLGEGQKAECPGSYQHPRLSDLKETMASLIEG
EARRKEI
>xenopus_GnRH1
MKAFPTFALLFLVLLFSAHVSDAQHWSYGLRPGGKRDTESLQDMYHETPNEVALFPELERLECSVPQSRLNVLRGALMNWLEGEN
RKKI
>zebrafish_gnrh2
MVLVCRLLLVVGLMLCLSAQLSSAQHWSHGWYPGGKREIDLYDTSEVSEEVKLCEAGKCSYLRPQGRNILKTILLDALIRDFQKR
K
>ciona_gnrh1
MLDIEKDELAALLQRENSAFRDLLYHKNAGNFEKSDSGKFGSLKPQNNFPHLDLGLGVDLDAVDQWNRYKQANAQRMQDLGVPVN
ARQHWSYEFMPGGRRAAWENANVGVPVSRQHWSYEYMPGGRRSAGRHAMTKRQHWSKGYSPGGKRSVDLSEFDDQGRRITKHEGM
PEEPFKVEQPRPRNGIHGPAGLDQNEPDWKNWMNEQPAVSSDDKGSDVE
GNRH: 生腺刺激ホ ル モ ン放出 ホ ル モ ン . 視床下部 で 合 成 さ れ 、下垂体門脈経 路 を介し て下垂体
前葉に運ばれ 、 生腺刺激ホ ル モ ン で あ る 黄体形成 ホ ル モ ン (LH) と濾法刺激ホ ル モ ン (FS
23
H) の産生 と放出 を促進 す る神経 性 ペ プ チ ド ホ ル モ ン . ホ ル モ ン前駆体と し て 合 成 さ れ た あ と
酵素に よ り切断さ れ 、 ヒ ト で は HWSYGLRPG ペ プ チ ド が ホ ル モ ン と し て 機 能 す る 。
Ciona: カタユレ イボヤ( ホヤの仲間で 日本の 研 究 グ ル ー プ に よ っ て ゲ ノ ム シ ー ク エ ン ス が 解 読
さ れ た )
講 義分 子 系 統 樹 : Phylogenetic tree, Evolutionary tree
分 子 系 統 樹 ( 進 化 系 統 樹 ) (molecular phylogenetic tree, evolutionary tree)塩 基 配 列やア ミ ノ 酸 配 列 を 基 に 分岐位置と 分岐時間を推定 し 、 構築さ れ た 系 統 樹
近接接合 法 (neighbor-joining method): 距離行 列 法 で 作 成 す る 分 子 系 統 樹 の 作 成 方
法 で 、 生 物 分野で最も一般的に 利 用 さ れ る 。
キ ー ワ ー ド
節、枝、 ク ラ ス タ ー (cluster) あ る い は ク レ ー ド (clade)Outgroup 、 Bootstrap value ( ブ ーツス ト ラ ッ プ値) 、 Evolutionary distance
分 子 系 統 樹 の 利 用
( 1 ) 遺 伝 子 の同種間、異種間で の 系 統 関 係 の 解 析
( 2 ) 遺 伝 子 ファミ リ ー に属す る メ ン バ ー の 系 統 関 係 の 解 析
( 3 ) 重 複 遺 伝 子 の 重 複時期と 進 化的関 係 の 解 析
( 4 ) 種や系 統 の 進 化的関 係 の推定
分 子 系 統 樹 か ら 、様々な 情 報 を 読 み 取 る こ と が できま す 。異な る 生 物達の 関 連 ( ホ モ ロ グ )
遺 伝 子 で 分 子 系 統 樹 を 作 製 す る と 、 遺 伝 子 の 進 化的関 係 を 予 測 す る こ と が できま す 。 ま た ミ ト
コ ン ド リ ア DNA の 配 列 を 使うと 、人種 の類縁関 係や進 化的関 係 を 解 析 す る こ と が 可 能 で す 。 授
業 で は 、 分 子 系 統 樹 の 作 製 方 法 と デ ー タ の 見 方 を 講 義 し ま す 。
実 習
分 子 系 統 樹 の 作 製
ClustalW を 使 っ た Multiple alignmen と 分 子 系 統 の 作 成 1 ) 使 用 す る ウ ェ ブ サ イ ト ClustalW http://clustalw.genome.jp/2 ) Fasta format で 並べた 配 列 を枠内 に ペ ー ス ト し 、 execute multiple alignment を押
す ( 各 種ボタ ン は デ フ ォ ル ト で よ い )
練 習 : 下 の gnrh (gonadotropin-releasing hormone) のうち、 >ciona_gnrh1 ( ホ
ヤ) を除く配 列 で ア ラ イ ン メ ン ト を 実 行 し て み よう。 次 に 、 >ciona_gnrh1 を入
れ て ア ラ イ ン メ ン ト を 実 行 し 、 結 果 を比べて み よう。
24
上に Multiple sequence alignments の 結 果 が表示 さ れ る 。
その下に あ る select tree menu で表示形式を選択し て 、 Exec を ク リ ッ ク す る
表示形式、 N-J tree branch length と Unrooted dendrogram の 結 果 を比較
し て み よう
>human_GNRH1
MKPIQKLLAGLILLTSCVEGCSS
QHWSYGLRPGGKRDAENLIDSFQEIVKEVGQLAETQRFECTTHQPRSPLRDLKGALESLIEEETGQKKI
>mouse_Gnrh
MILKLMAGILLLTVCLEGCSSQHWSYGLRPGGKRNTEHLVESFQEMGKEVDQMAEPQHFECTVHWPRSPLRDLRGALESLIEEEA
RQKKM
>chicken_Gnrh1
MEKSRKILVGVLLFTASVAICLAQHWSYGLQPGGKRNAENLVESFQEIANEMESLGEGQKAECPGSYQHPRLSDLKETMASLIEG
EARRKEI
>xenopus_GnRH1
MKAFPTFALLFLVLLFSAHVSDAQHWSYGLRPGGKRDTESLQDMYHETPNEVALFPELERLECSVPQSRLNVLRGALMNWLEGEN
RKKI
>zebrafish_gnrh2
MVLVCRLLLVVGLMLCLSAQLSSAQHWSHGWYPGGKREIDLYDTSEVSEEVKLCEAGKCSYLRPQGRNILKTILLDALIRDFQKR
K
>ciona_gnrh1
MLDIEKDELAALLQRENSAFRDLLYHKNAGNFEKSDSGKFGSLKPQNNFPHLDLGLGVDLDAVDQWNRYKQANAQRMQDLGVPVN
ARQHWSYEFMPGGRRAAWENANVGVPVSRQHWSYEYMPGGRRSAGRHAMTKRQHWSKGYSPGGKRSVDLSEFDDQGRRITKHEGM
PEEPFKVEQPRPRNGIHGPAGLDQNEPDWKNWMNEQPAVSSDDKGSDVE
こ の サ イ ト で の 検索結果で は 、 Bootstrap value, evolutionary distance の 値は 表示さ れ な い 。DDBJ の ClustalWを 使え ば 、こ れ ら の 値が 求め ら れ る 。た だ し 、ま た 結果の 図形を 表示す る た め に 、Tree View と言う 無料ソ フ ト を ダ ウ ン ロ ード す る 必要が あ る 。教室の コ ン ピ ュ ータ ーで は 、ソ フ ト ウ ェ ア の ダ ウ ンロ ード は た め ら わ れ る の で 、各自の パ ソ コ ン でDDBJ を 試し て 下さ い 。あ る い は 、ClustalX の プ ロ グ ラ ム を ダ ウ ン ロ ードし て 解析す る (下記URL)。http://www.cbs.dtu.dk/courses/humanbio/2010/exercises/ExMulPhyl/Ex_Phylo.php
NCBI を 使 っ た Multiple alignment と 系 統 樹 の 作 成
1 . NCB→BLAST→ 下に あ る Multiple Alignment を選択
2 . 枠内 に 配 列 を Fasta format で コピー
3 . Align を ク リ ッ ク し て 検 索
25
4 . 検 索 画面上の Phylogenetic Tree を ク リ ッ ク
5 . Evolutionary distance を反映し た 系 統 樹 が表示 さ れ る
6 . Tools か ら Layout 、 Radial tree を選択す る と無根系 統 樹 が表示 さ れ る
プ ロ グ ラ ム に は 、 2007 年に開発 さ れ た 、 COBALT: constraint-based alignment tool for multiple protein sequences が 使われ て い る
26
11 月 13 日 ( 第 7 回 )
実 習
分 子 系 統 樹 の 作 成シ ョ ウ ジ ョ ウ バ エ ( Drosophila ) の hedgehog タ ン パク 質 に 対 す る 、 マ ウ ス ( Mus musculus ) と ツ メ ガエ ル ( Xenopus tropicalis) の 類 似 遺 伝 子 を 検 索 し て分 子 系 統 樹 を 作 成 す る 。配 列 は Word あ る い は メ モ 帳 ( Text フ ァ イ ル ) にコ ピ ー す る 。
手順は以下の ように 行う
1 . シ ョ ウ ジ ョ ウ バ エ ( Drosophila ) の hedgehog タ ン パ ク 質 の ア ミ ノ 酸 配 列
を 取 り 出 す
NCBIを 使 っ て 、 proteinデ ー タ ベ ー ス で Drosophila と hedgehog で キ ー ワ ー ド 検 索
す る (Accession number: AAF56102) 。 FASTA ボタ ン を押す と 、 FASTA フ ォ ー ム の 配
列 が表示 さ れ る 。 ア ミ ノ 酸 配 列 を Word に コピー す る 。 > 名前を付け て 、 Fasta format と す る ( ス ペ ー ス と数字 は 、 検 索時に削除さ れ て 計算さ れ る の で 、その ま
ま に し てもか まわな い ) 。
2 . マ ウ ス の Drosophila hedgehog に対す る ホ モ ロ グ を 検 索 し て 、 配 列 を 取 り
出 す
BLAST の先頭ペ ー ジ で 、 mouse を ク リ ッ ク し 、 Bastp を選択し て 検 索 す る ( マ ウ
ス ゲ ノ ム に コ ー ド さ れ る 全 て の タ ン パ ク 質 ア ミ ノ 酸 情 報 に対し て 検 索 ) 。
検 索 に よ り表示 さ れ た 3 種類の hedgehog の 配 列 を 取 り 出 す 。 取 り 出 し 方 は 、
Accession 番号を ク リ ッ ク し 、表示 さ れ た 配 列 情 報 ペ ー ジ の上に あ る FASTA ボタ
ン を押す 。 FASTA フ ォ ー ム の 配 列 が表示 さ れ る で 、 コピー す る 。
3 . Xenopusの Drosophila hedgehog に対す る ホ モ ロ グ を 検 索 し て 、 配 列 を 取 り 出 す
BLAST の先頭ペ ー ジ で 、 Xenopus tropicalis を指定 す る 。以下、 2 の操作 と同じ。
3 . ClustalW で 解 析
こ の 授 業 で は 、 ClustalW ( http://clustalw.genome.jp/ ) を 使う。枠内 に7つ の 遺 伝
子 の 全 配 列 を コピー し 、 マ ル チ プ ル ア ラ イ メ ン ト を 実施す る 。
マ ウ ス と Xenopus の間で 配 列 の保存性 を注意深くみ て 、保存性 の特徴を 理 解 す る 。
4 . 分 子 系 統 樹 を得る
検 索 結 果 の一番下で 分 子 系 統 樹 を 出力。
N-J tree branch length と Unrooted dendrogram の 結 果 を比較
4 の 結 果 と あわせて 、 Outgroup, Paralog, Ortholog の 関 係 を 理 解 す る 。 ヒ ト 遺 伝 子間の パ
ラ ロ グ よ りも、 ヒ ト と Xenopus の オ ル ソ ロ グ間の 方 が保存性 の高い こ と に注意 。 こ れ は
27
祖先遺 伝 子 が 重 複 し て 2 つ の 遺 伝 子 ( パ ラ ロ グ と な る ) を形成 し 、その あ と に 種 分 化 が
起こ っ た ためで あ る 。
講 義
オ ル ソ ロ グ と パ ラ ロ グ 、 ホ モ ロ グ の 関 係 に つ い て
無 脊椎 動 物 か ら脊椎 動 物 へ の 進 化 の過 程で 、 全 ゲ ノ ム ( 全 て の染 色体 ) の 重 複 ( whole genome duplication: WGD ) が 2 回起こ っ て い ま す 。その ため原 索動物 ( ナ メ ク ジ ウ オ ・ ホヤ等
が含ま れ 、脊索 を形成 す る 。無脊椎動物 の な か で脊椎動物 に 進 化的に最も近い ) で 1 種類で
あ っ た 遺 伝 子 は 、一度 4 つ に数が 増えて い ま す ( 遺 伝 子 に よ っ て は 4 つ に 増えた あ と 、 4 つ と
も残っ て い るもの 、 1 つ消失し て 3 つ が残っ て い るもの 、 2 つ消失し て 2 つ が残っ て い るもの 、
3 つ が消失し て 1 種類だけ残っ て い るものもあ り ま す ) 。一つ の 遺 伝 子 か ら 、 ゲ ノ ム 重 複 に よ
り誕生 し た 重 複産物 の 種 内 で の 関 係 は パ ラ ロ グ ( Paralog ) と呼ばれ ま す 。
一方 、 生 物 種間で相同な 遺 伝 子 は 、 オ ル ソ ロ グ ( Ortholog ) と呼ばれ ま す 。脊椎動物 (円口
類を除く: 1 回 の み 重 複 、 2 度目の 重 複 の前に 分岐) で は 、 進 化 の初期段階で 2 回 の ゲ ノ ム の
重 複 が起こ り 、その後で 、 多様な 種 に 分岐し て い ま す 。その ため、 多くの 遺 伝 子 が 種 を超えて
重 複 し た状態で ゲ ノ ム中に存在し て い ま す 。それ ら の組み 合わせの中で 、 生 物 種間で相同な 重
複 遺 伝 子 ( 配 列 が最も近似) が オ ル ソ ロ グ ( Ortholog ) と な り ま す 。 パ ラ ロ グ に相当す る 遺 伝
子 は通常、それ ら の 機 能 は 大きく変 化 し て い る の に対し 、 オ ル ソ ロ グ の 関 係 に あ る 遺 伝 子 は 、
種 が異な っ ても( 例えば哺乳類と魚類) 機 能 が良く保存さ れ て い ま す 。その ため、ゼブ ラ
フ ィ ッ シュでもヒ ト の モ デ ル 生 物 と し て十分 な役割を は た す こ と が できるわけ で す 。 オ ル ソ ロ
グ と パ ラ ロ グ と の 関 係 は 、 分 子 系 統 樹 を 作 製 す る こ と に よ り 理 解 できま す 。 ホ モ ロ グ ( 関 連 遺
伝 子 ) は 、共通祖先か ら 発 生 し た 遺 伝 子 の 総称で 、 ホ モ ロ グ に は オ ル ソ ロ グ と パ ラ ロ グ とも含
ま れ ま す 。
オ ル ソ ロ グ と パ ラ ロ グ の 関 係 を 理 解 す る ために 、 生 物 の 進 化 の 歴 史 、 遺 伝 子 重 複 の 歴 史 に つ
い て 解 説 し ま す 。 ま た hedgehog 遺 伝 子 を モ デ ル と し て 、 分 子 系 統 樹 を 作 製 し 、 ホ モ ロ グ と パ
ラ ロ グ の 関 係 を 説 明 し ま す 。
無脊椎動物 か ら脊椎動物 に 進 化 す る過程で 発 生 し た ゲ ノ ム 重 複 に つ い て少し詳しく説 明 し ま
す 。 hox 遺 伝 子 、核内受容体遺 伝 子 を 例 に し て 、 ゲ ノ ム に刻ま れ た 遺 伝 子 重 複 の 歴 史 を 解 説 し
ま す ( こ こ で は 、 配付資料を 参考に し て 説 明 し ま す ) 。
>zebrafish_dand5
MTFQVGFFVLLSVTTIGAFPRNAFQREFHRHVAKDFESSGNGPDEPVRGSVRIVKLNPHFLRRAAVSHVP
FRNSPSRGAFPAFLALGRPGPAILTHSKPAPQVSSSADRRKQGLEMWKKVVHKSERKKEAVALRINPKDM
NKQSCAAVPFTQRITEEGCETVTVHNNLCYGQCSSMFVPSSGGSHGQQKAQCMRCGPSRARSVLLHLRRG
SEVRERRVLIVEECKCETSSEEAKVQNTDMFNL
>zebrafish_gremlin-2
MFWKLAIPAILAWTLFASTETKKQRPQGSIPSPYKLKGNDLSSPSHALASLPQHTASARRQKGKHDMLSS
SREALVVTERKYLKSDWCKTQPLRQTVSLEGCISRTVINRFCYGQCNSFYIPRHLTSQSSHRSRKTASTP
DHTTSFQSCAFCRPSRITTVTVRLHCPGLQPPYRQRKVQRIKQCKCVSVNVNAAY
>zebrafish_gremlin-1
MGRFTDRFFSKISPGRSSSTLTVMPASCASSSGWILCAVLLSSALLWCPTESKRNRGAIPHPDKNTPNES
28
SRSPQQQESASGSRARSRGSEEVLESSQEALHVTERRYLKRDWCKTQPLKQTIHEEGCISRTIINRFCYG
QCNSFYIPRHVRREEGAFQSCSFCKPKRFTTMSFTLSCPDQQPPTRKKRVQRVKQCRCISIELD
>Human_gremlin-1
MSRTAYTVGALLLLLGTLLPAAEGKKKGSQGAIPPPDKAQHNDSEQTQSPQQPGSRNRGRGQGRGTAMPG
EEVLESSQEALHVTERKYLKRDWCKTQPLKQTIHEEGCNSRTIINRFCYGQCNSFYIPRHIRKEEGSFQS
CSFCKPKKFTTMMVTLNCPELQPPTKKKRVTRVKQCRCISIDLD
>Human_gremlin-2
MFWKLSLSLFLVAVLVKVAEARKNRPAGAIPSPYKDGSSNNSERWQHQIKEVLASSQEALVVTERKYLKS
DWCKTQPLRQTVSEEGCRSRTILNRFCYGQCNSFYIPRHVKKEEESFQSCAFCKPQRVTSVLVELECPGL
DPPFRLKKIQKVKQCRCMSVNLSDSDKQ
>Hman_cerberus
MHLLLFQLLVLLPLGKTTRHQDGRQNQSSLSPVLLPRNQRELPTGNHEEAEEKPDLFVAVPHLVATSPAG
EGQRQREKMLSRFGRFWKKPEREMHPSRDSDSEPFPPGTQSLIQPIDGMKMEKSPLREEAKKFWHHFMFR
KTPASQGVILPIKSHEVHWETCRTVPFSQTITHEGCEKVVVQNNLCFGKCGSVHFPGAAQHSHTSCSHCL
PAKFTTMHLPLNCTELSSVIKVVMLVEECQCKVKTEHEDGHILHAGSQDSFIPGVSA
>Human_dand5
MLLGQLSTLLCLLSGALPTGSGRPEPQSPRPQSWAAANQTWALGPGALPPLVPASALGSWKAFLGLQKAR
QLGMGRLQRGQDEVAAVTLPLNPQEVIQGMCKAVPFVQVFSRPGCSAIRLRNHLCFGHCSSLYIPGSDPT
PLVLCNSCMPARKRWAPVVLWCLTGSSASRRRVKISTMLIEGCHCSPKA
29
>drosophila_hh
MDNHSSVPWASAASVTCLSLDAKCHSSSSSSSSKSAASSISAIPQEETQTMRHIAHTQRCLSRLTSLVALLLIVLPMVFSPAHSCGPGRGLGRHRA
RNLYPLVLKQTIPNLSEYTNSASGPLEGVIRRDSPKFKDLVPNYNRDILFRDEEGTGADRLMSKRCKEKLNVLAYSVMNEWPGIRLLVTESWDEDY
HHGQESLHYEGRAVTIATSDRDQSKYGMLARLAVEAGFDWVSYVSRRHIYCSVKSDSSISSHVHGCFTPESTALLESGVRKPLGELSIGDRVLSMT
ANGQAVYSEVILFMDRNLEQMQNFVQLHTDGGAVLTVTPAHLVSVWQPESQKLTFVFADRIEEKNQVLVRDVETGELRPQRVVKVGSVRSKGVVAP
LTREGTIVVNSVAASCYAVINSQSLAHWGLAPMRLLSTLEAWLPAKEQLHSSPKVVSSAQQQNGIHWYANALYKVKDYVLPQSWRHD
>mouse_dhh
MALPASLLPLCCLALLALSAQSCGPGRGPVGRRRYVRKQLVPLLYKQFVPSMPERTLGASGPAEGRVTRGSERFRDLVPNYNPDIIFKDEENSGAD
RLMTERCKERVNALAIAVMNMWPGVRLRVTEGWDEDGHHAQDSLHYEGRALDITTSDRDRNKYGLLARLAVEAGFDWVYYESRNHIHVSVKADNSL
AVRAGGCFPGNATVRLRSGERKGLRELHRGDWVLAADAAGRVVPTPVLLFLDRDLQRRASFVAVETERPPRKLLLTPWHLVFAARGPAPAPGDFAP
VFARRLRAGDSVLAPGGDALQPARVARVAREEAVGVFAPLTAHGTLLVNDVLASCYAVLESHQWAHRAFAPLRLLHALGALLPGGAVQPTGMHWYS
RLLYRLAEELMG
>mouse_ishh
MSPAWLRPRLRFCLFLLLLLLVPAARGCGPGRVVGSRRRPPRKLVPLAYKQFSPNVPEKTLGASGRYEGKIARSSERFKELTPNYNPDIIFKDEEN
TGADRLMTQRCKDRLNSLAISVMNQWPGVKLRVTEGWDEDGHHSEESLHYEGRAVDITTSDRDRNKYGLLARLAVEAGFDWVYYESKAHVHCSVKS
EHSAAAKTGGCFPAGAQVRLENGERVALSAVKPGDRVLAMGEDGTPTFSDVLIFLDREPNRLRAFQVIETQDPPRRLALTPAHLLFIADNHTEPAA
HFRATFASHVQPGQYVLVSGVPGLQPARVAAVSTHVALGSYAPLTRHGTLVVEDVVASCFAAVADHHLAQLAFWPLRLFPSLAWGSWTPSEGVHWY
PQMLYRLGRLLLEESTFHPLGMSGAGS
>mouse_shh
MLLLLARCFLVILASSLLVCPGLACGPGRGFGKRRHPKKLTPLAYKQFIPNVAEKTLGASGRYEGKITRNSERFKELTPNYNPDIIFKDEENTGAD
RLMTQRCKDKLNALAISVMNQWPGVKLRVTEGWDEDGHHSEESLHYEGRAVDITTSDRDRSKYGMLARLAVEAGFDWVYYESKAHIHCSVKAENSV
AAKSGGCFPGSATVHLEQGGTKLVKDLRPGDRVLAADDQGRLLYSDFLTFLDRDEGAKKVFYVIETLEPRERLLLTAAHLLFVAPHNDSGPTPGPS
ALFASRVRPGQRVYVVAERGGDRRLLPAAVHSVTLREEEAGAYAPLTAHGTILINRVLASCYAVIEEHSWAHRAFAPFRLAHALLAALAPARTDGG
GGGSIPAAQSATEARGAEPTAGIHWYSQLLYHIGTWLLDSETMHPLGMAVKSS
>xenopus_shh
MLVATQSLLLLSFICTLVTPPGLACGPGRGIGKRRHPKKLTPLAYKQFIPNVAEKTLGASGRYEGKITRNSDCFKELTPNYNPDIMFKDEESTGAD
RLMTQRCKDKLNALAISVMNQWPGVKLRVTEGWDEDGHHLEESLHYEGRAVDITTSDRDRSKYGMLGRLAVEAGFDWVYYESKAHIHCSVKAENSV
AAKSGGCFPAGARVMVEFGGTKAVKDLRPGDRVLSSDPQGNLLYSDFLMFIDQERDVKKLFYVIETSQRKIRLTAAHLLFVAQTKVNGTRSFKSVF
ASNIQPGDLIYTADPKTMTLKAVKVEKVDLEEDTGAYAPLTAHGTVVIDQVLASCYAVIEEHTWAHLAFAPLRFGMSLSSYIYPRDSSPPSGLQPH
HQVDLQSHHQVDLQSHHQVDLQSHHQLEGIHWYSQLLYQIGTWLLDSNSLHPLGMATKSS
>xenopus_dhh
MPAVRIVILAICCGLLLVPVRCCGPGRGPVGRRRYMRKLVPLHYKQFVPNVPEKTLGASGKSEGKIHRGSERFIELVPNYNPDIIFKDEEKTGADR
LMTERCKDRVNALAISVMNMWPGVKLRVTEGWDEDGHHAHDSLHYEGRALDITTSDRDRNKYGMLARLAVEAGFDWVYYESKAHIHVSVKADNSLG
VRSGGCFPGTAMVMMGTGERKPLSELKIGDTVYTTDETGQLITSVVLLFLHRNPYKTATFVLIEAEGHPSKLLVTPNHLLFIQSSSSAGFLPFAYR
VQIGDLVQIYVNGTQVQSSKVVRVSLEEQTGVYAPMTEHGTLLVDGVLTSCYATVESHTLAHVSLAPLRLFQGIASMLPDLDMSDGVHWYCHILYV
LAKYVLWWDMP
>xenopus_ihh
MQLPKVVLLLCAAALLLSGAVRGCGPGRVVGRRRRPTKLSPLSYKQFSPNVPEKTLGASGRYEGKISRNSERFKELTPNYNPDIIFKDEEITGADR
LMTQRCKDRLNSLAISVMNQWPGVKLRVTEGWDEDGHHFEESLHYEGRAVDITTSDRDRNKYGMLARLAVEAGFDWVYYESKAHIHCSVKSEHSAA
AKTGGCFPGEALATLESGEKIPVSQLSPGLRVLAMDNSGRPTYSDFLSFLDHSPKEEHMFQVIKTQDPHRRLFLTPAHLIFVSDNYSTPASEFQAV
FASSVRPGQYILVSNVVGLIPAKVRSVNTQTNYGAYAPLTQHGTLVVDDVVVSCFALVQKQRLAQIVYWPLRVLYNLGIIAGTQPSQQMGIHWYSK
ALYHLGRLILHGNEFHPLGIVQLES
30
31
11 月 20 日 ( 第 8 回 )
実 習
代 謝 経 路 デ ー タ ベ ー ス の 利 用
無料で公開さ れ て い る 代 謝 経 路 の デ ー タ ベ ー ス と し て最も充実 し て い る の が 、京都大 学 化 学
研 究所が 統括し て い る KEGG (Kyoto Encyclopedia of Genes and Genomics) で あ る 。 代 謝 経 路
の マ ッ プ を調べる こ と が できるだけ で なく、 遺 伝 子 の 機 能 、 配 列 、 タ ン パ ク 質 の 立体構 造も検
索 できる 。 ク ロ ーニン グ し た 遺 伝 子 がどの ような 代 謝 経 路 で 機 能 し て い る か 、 あ る い は 代 謝異
常の メカニズ ム なども調べる こ と が できる 。
ま た さ ま ざ ま な 化 合 物 (抗生 物 質 等 )や市販の医薬品の 構 造 、 薬 理 作 用 、副作 用 を 検 索 す る
こ ともできる 。 遺 伝 子や化 合 物 の 機 能や相互作 用 を調べる場合 、 ま た レ ポ ー ト 作 成 等 にも役立
つ 。 日本語表記の サ イ トも利 用 できる 。
KEGG MEDICUS と名付け ら れ た 、医薬品・疾患・ パ ス ウ ェ ー の 統 合 デ ー タ ベ ー スも公開さ
れ て い る 。疾患・医薬品・環境物 質 など社会的ニー ズ の高い デ ー タ を 、 ゲ ノ ム 情 報 を 基盤と し
た 生体シ ス テ ム 情 報 と い て 統 合 し た リ ソ ー ス で 、 研 究者だけ で なく、医療従事者や一般の人に
も情 報 を 提供し て い る 。
KEGG ブ ラ ウザ: http://www.genome.jp/kegg/pathway.html
KEGG Pathway を開け て み よう。 パ ス ウ ェ ー の項目は 、以下ように 分類さ れ て い る 。
1. Metabolism ;代 謝 経 路 (ビタ ミ ン A, retinol metabolism, の 代 謝 経 路 を調べて み よ
う。 代 謝産物 を 示 す が ア ク テ ィ ブ で 構 造 等 が表示 さ れ る 。 ま た 代 謝 を司る酵素名も◯ア ク テ ィ ブ で 、 配 列 情 報 等 が表示 さ れ る )
2. Genetic Information Processing ;遺 伝 子 か ら蛋白質 合 成 経 路 ・蛋白の修飾と 分
解 ・ ゲ ノ ム の修復 等 ( homologous recombination と non-homologous end-joining の 経 路
を比較し て み よう)
3. Environmental Information Processing ;細胞内 シ グ ナ ル 伝達経 路 ・ 分泌性 シ グ ナ
ル因子 を介し た細胞間相互作 用 ( TGF-beta の細胞内 伝達系 を調べて み よう。 発現の促
進 と抑制( アゴニス ト ) の 関 係 が 分 か る )
4. Cellular Processes :細胞の活動、細胞分裂サ イ ク ル 等 ( Oocyte meiosis (卵母細
胞減数分裂) を調べて み よう)
5. Organismal system;免疫系 ・ 内 分泌制御経 路 等 ( GnRH 、 生殖腺刺激ホ ル モ ン放
出 ホ ル モ ン 、 の 内 分泌経 路 を調べて み よう)
6. Human Deseases : 発 ガ ン 経 路 ・ 代 謝異常等 ( Melanoma, プ リ オ ン病 , diabetes( 1型糖尿病、 2 型糖尿病) の 発症経 路 を調べて み よう)
7. Drug Development :抗生 物 質 ・ 薬 剤 の 化 学 構 造 ( penicillin, antidepressants を調べ
て み よう。 合 成 経 路 、 薬 剤 の 分 解酵素等も表示 さ れ る )
32
遺 伝 子 の キ ー ワ ー ド で パ ス ウ ェ ー を 検 索 す る時の操作 は下記の通り ( 遺 伝 子名か ら パ ス
ウ ェ ー に入る )
練習 に hh; hedgehog の シ グ ナ ル パ ス ウ ェ ー を 見 よう
1 . 先頭ペ ー ジ で KEGG PATHWAT を ク リ ッ ク
2 . 枠に hedgehog を入力し て GO3 . hedgehog が 関与す る パ ス ウ ェ ー ( Entry ) が 複数表示 さ れ る
4 . 試し に map04340 を選択し て み よう。
5. パ ス ウ ェ ー が拡大 さ れ る 。 各 遺 伝 子 が ア ク テ ィ ブ で 、 配 列 ・ 機 能 情 報 に リ
ン ク し て い る 。
6. 上の HEDGEHOG SIGNALLING PATHWAY を選択す る と 、 こ の シ グ ナ ル の 説 明
を 見 る こ と が できる 。
練習 に estradiol の 合 成 経 路 を調べて み よう
1 . 先頭ペ ー ジ で KEGG PATHWAT を ク リ ッ ク
2 . 枠に estradiol を入力し て GO3 . estradiol が 関与す る パ ス ウ ェ ー ( Entry ) が 複数表示 さ れ る
4 . Steroid hormone biosynthesis を あ け る と cholesterol か ら の 合 成 経 路 を 見 ら
れ る
5. 反応を 触媒す る酵素名が ア ク テ ィ ブ で反応系 、 配 列 等 の 情 報 を 見 る こ と が
できる
6. ま た 各 代 謝産物 の 化 学 構 造も表示 できる
遺 伝 子 の 化 合 物 の 構 造 を 検 索 す る時の操作 は下記の通り
練習 に ampicillin の 構 造 を調べて み よう
1 . 先頭ペ ー ジ で KEGG DRUG を ク リ ッ ク
2 . 枠に ampicillinを入力し て GO3 . Entry を選択す る と 構 造 等 が 見 ら れ る
KEGG の BLAST検 索 を 使 っ て 、調べた い 遺 伝 子 ・ タ ン パ ク 質 が乗っ て い る パ ス ウ ェ ー を 検
索 す る こ ともできる .1. KEGG2 先頭ペ ー ジ上段の GENES を ク リ ッ ク 。 BLAST を開け る 。
2 . 例 と し て 、下の 塩 基 配 列 (私達の 研 究 グ ル ー プ が ウ ナギか ら ク ロ ーニン グ し
た 遺 伝 子 で まだデ ー タ ベ ー ス に は登録し て い な い ) で BLASTX 検 索 し て み よ
う
>test_DNA_sequence-2
ATCACTGCGTCTTGTGTCCTATCGGTCTAGCCTAGCCACTGTCTANAAGCTATAGGAAGGTTTCAGTATTGGGAGCCATGTTTGGGAGC
CTGCTGTTCACTGTGCTGTGTGAGGCAGCAGTGGCCCTCATCAACCCAAATCTAAGCCTCCATTGGGAGATGTGGAAGGAGGGACATGA
CAAGACCTACCTGTTTAAGGCTGAAGAGTTTGCACGCCGCCAGATCTGGGAGAAGAACCTGAAGCTGATAACTCTGCATAATTTGGAGG
CGTCCATGGGAATGCACACCTATGATCTGGGCATGAACCACCTAGGAGACTTGACTACCGAGGAGATTCTTGACGTGCTAGCTGTAACT
CGTGTGCCTCCAAACTTCAGCAGGGGTCCTTCTCCCTTTGTGGGGGTATCCAGGGCCCCTGTGCCTCACAATGTTGATTGGCGAAGAAA
GGGCTATGTCACAGAAGTCAAGAGTCAGGGGCGTTGTGGCTCCTGCTGGGCCTTCAGTGCTGCAGGTGCCCTGGAGGGCCAGCTGATGA
33
AGACTCAGGGAACACTTGTATCCCTCAGCCCTCAGAACCTGGTTGACTGCTCCTACAAATATGGCAACGAGGGCTGTCATGGAGGGTTC
ATGACTCAAGCCTTCCAGTATGTCATTGAGAACGGGGGCATTGAGTCTGACTTTTCATACCCTTACACTGGCATGGAAGAACAATGCAG
ATATGATTCAGAACTCCGTGTTGCCAACTGTTCCAGCTACAGGTTTCTTCCTGAAGGTGATGAGGTTGCATTAAAATGGGCTCTGGCCA
CTGTTGGACCAATCTCTGTGGCTATTGATGCTGCTCGACCTAATTTCCACTTCTACCGGAGTGGTGTGTACCATGACCCTACCTGTACC
CAAGAAGTAAACCATGGTGTTCTAGCAGTTGGCTATGGTACGCTCAATGGTGAGGACTACTGGCTTGTGAAGAACAGCTGGGGACAGCC
TTTTGGGGAACAGGGCTACATTCGCATGGCACGAAACAAGAACAACCAGTGTGGCGTTGCCTTGTATGCCTGCTACCCCATTATGTGAC
GACCTGAAGCAAAGGATTGATTTCTAACTTGAAACATTTTAAAATTTTTATTTTGATTTGCACCTGTGCATGTTACTGATTTGTAAAGA
ATACTGTTAAAATGATTTGTATTAAAAAAATATATATTTTTAGATGTGGAATTTTAGTTGAACCTAAATAAATAAATGTAAAAAAAAA
1 . ゼブ ラ フ ィ ッ シュDre の エ ン ト リ ー を開け て み よう
2 . Pathway を開け て み よう。 検 索 し た 遺 伝 子 の パ ス ウ ェ ー上の 位置が 分 か る
KEGG MEDICUS利 用 できる サ ービス
・ KEGG MEDICUS 医薬品情 報
・ KEGG MEDICUS 疾患情 報
・ KEGG MEDICUS 医薬品相互作 用
・ KEGG BRITE 医薬品分類
・ KEGG お薬 情 報
・ KEGG 先頭ペ ー ジ上段で 、 MEDICUS を選択
・ Imatinib と言う医薬品で キ ー ワ ー ド 検 索 し て み よう
・効果 、 製 造会社、 化 学 構 造 等 を知る こ と が できる :
34
11 月 27 日 ( 第 9 回 )
12 月 4 日 ( 第 10 回 )
1 . 講 義 : 論 文 の 構 成 、 文 献 デ ー タ ベ ー ス
2 . 実 習 : 文 献 検 索 ( PubMed )
講 義
配 列 情 報 と 文 献 の 検 索
研 究 計 画 を 立 て る場合 、その 研 究 に 関 連 し た過去の 論 文 を リ ス ト ア ッ プ し て 、既に 報告さ れ
て い る 成 果 を調べておくこ と が 大 変 重 要 で す 。 こ の操作 に よ り 、 こ れ か ら 進める 研 究 テ ー マ に
つ い て 、 研 究 がどこ ま で 進んで い る の か 、何が 分 か っ て い な い の か を調べる訳で す 。そし て未
知の 生 物現象を 解 明 す る の に 、最も有効な 計 画 を 立 案 し ま す 。もちろん研 究 で 遺 伝 子 を扱う場
合 、その 遺 伝 子 の 配 列 、 こ れ ま で に 分 か っ て い る 性 質 を調べておくこ とも重 要 で す 。 こ の 検 索
操作 をちゃんと し ておか な い と 、「せっ かく得ら れ た 実験成 果 が既に 報告さ れ て い た」と言う
ような悲惨な こ とも起きかねません。
ま た卒業 論 文や投稿用 論 文 の 作 成時に は 、緒言に 研 究 の 歴 史 と背景、 研 究 内 容 の意義 を述べ、
考察で は 実験結 果 と既知の 成 果 を比較検討し 、 研 究 で得ら れ た 新 し い知見 に つ い て議論 し ま す 。
論 文 を仕上げる時にも、 関 連 論 文 を 収 集 し て精査す る 必 要 が あ り ま す 。 文 献以外にも、 ク ロ ー
ニン グ し た 遺 伝 子 と 関 連 遺 伝 子 と の ア ラ イ メ ン ト を 行うこ とや、 分 子 系 統 樹 を 作 成 す る の に 関
連 遺 伝 子 を デ ー タ ベ ー ス か ら引き出 し てくる こ と が 必 要 と な る こ と が あ り ま す 。
例えば、自分 の 研 究 で ウ シやブ タ などの家畜、 あ る い は 作 物 で 遺 伝 子 を ク ロ ーニン グ し た と
し ま す 。 遺 伝 子 機 能 に 関 す る 研 究 が 進んだ現在で は 、 モ デ ル 生 物 ( マ ウ ス 、ニワ ト リ 、ゼブ ラ
フ ィ シュ、 シ ョ ウ ジ ョ ウ バ エ 、線虫、酵母、 シ ロ イ ズ ナ ズ ナ 等 ) のどれ か で相同遺 伝 子 の 機 能
が 解 析 さ れ 、 論 文 の形で 出版さ れ て い る こ と が 多 い と言えま す 。その 論 文 を 読めば、 ク ロ ーニ
ン グ し た 遺 伝 子 の持つ 機 能 の 概 要 を知る こ と が できま す 。 デ ー タ ベ ー ス を 利 用 す れば、 こ の様
な 情 報も簡単に 収 集 できま す 。 遺 伝 子 を BLAST 検 索 し 、 モ デ ル 生 物 の相同性 の高い 遺 伝 子 配 列
を探し 、そこ か ら 文 献 情 報 を探す こ と が 可 能 で す 。
今日 は 、 研 究 計 画 を 立 て る時や論 文 を 書く際 、 ク ロ ーニン グ さ れ た 遺 伝 子 に 関 連 す る 論 文 の
検 索 、 研 究や論 文 作 成 で 必 要 な 論 文 の 検 索 方 法 を 実 習 し ま す 。
文 献 の 検 索 に は 、 ( 1 ) NCBIの PuBMed 、 ( 2 ) 大 学 の 図 書 館 の オ ン ラ イ ン ジャー ナ ル 、
( 3 ) Scopus( Elsevier 社の 有料検 索 シ ス テ ム ) が 利 用 できま す 。 PuBMed の 使 い勝手 が最近
非常に よくな っ た の で 、ほとんどの こ と は PuBMed で す み ま す 。従っ て 、 PuBMed の 使 い 方 を
中心に 演 習 し 、 大 学 の 図 書 館 の オ ン ラ イ ン ジャー ナ ル に つ い て少し 解 説 を 加えま す 。
文 献 検 索 を 使う目的に は 、下記の ように幾つ か の シ チュエ ー シ ョ ン に 分 か れ ま す 。 いずれも
35
PuBMed で 可 能 で す 。
1 . 特定 の 論 文 をダウ ン ロ ー ド し た い 。
2 . あ る 研 究者がどの ような 論 文 を 出版し て い る か知り た い
3 . あ る 生 物現象に 関 す る 論 文 をもれ なく調べた い 。
4 . 作 成中の 論 文 の考察に 必 要 な 論 文 を探し た い
5. 扱う遺 伝 子 に 関 連 す る 論 文 を調べた い 。
実 習
文 献 の 検 索
使 用 す る ウ ェ ブ サ イ ト : NCBI使 用 す る ア イ テ ム : PubMed 上の枠の下に あ る Advanced ボタ ン を 使う。
左の All Fields ボタ ン を ク リ ッ ク す る と 、 著者名、 出版年度 、 タ イ ト ル中の ワ ー ド 、
Abstract中の ワ ー ド 、 Journal (雑誌)名で 検 索 できる シ ス テ ム に な っ て い る 。 こ れ
ら をうまく使うと 必 要 な 文 献 をうまく検 索 す る こ と が 可 能 で あ る 。それぞれ に つ い て
授 業 で は 実 習 し ま す 。東北大 学 図 書 館 が購読契約し て い る雑誌、 あ る は Plos One の よ
うな on-line journal で あ れば、 検 索 結 果 の ペ ー ジ か ら 論 文 の pdf ファイ ル を と りだし て 、
プ リ ン トやダウ ン ロ ー ド が できま す 。
1 . 特定 の 論 文 をダウ ン ロ ー ド し た い 。
例えば、山中先生 が ノ ー ベ ル賞をもらうこ と に な っ た iPS 細胞の 論 文 を探し て み よ
う。
Author: Yamanaka ShinyaJournal: Cell
2 . あ る 研 究者がどの ような 論 文 を 出版し て い る か知り た い
例えば、私と 研 究室の助教の横井さんの共著論 文 を探し て み よう。
Author: Suzuki TohruAuthor: Yokoi Hayato
3 . あ る 生 物現象に 関 す る 論 文 をもれ なく調べた い 。 論 文 の考察に 関 連 す る 論 文 を探し た い 。
例えば、魚類の iPS 細胞に 関 す る 論 文 が 出版さ れ て い る か ?
Title/Abstract: FishTitle/Abstract: iPS cell
成長ホ ル モ ン の 日周リ ズ ム に 関 す る 論 文 を知り た い
Title/Abstract: growth hormoneTitle/Abstract: circadian rhythm
36
4 . 扱う遺 伝 子 に 関 連 す る 論 文 を調べた い 。
例えば、癌遺 伝 子 Brca2 に 関 す る 論 文 を調べた い 。
Title/Abstract: Brca2Title/Abstract: human or mouse or zebrafish
BLAST 検 索 結 果 か ら 、 検 索 し た 遺 伝 子 に 関 す る 文 献 情 報 を 収 集 す る こ ともできま す 。 リ ス ト
ア ッ プ さ れ てきた 遺 伝 子 の名称が ア ク テ ィ ブ で 、それ を ク リ ッ ク す る と 配 列 情 報 に 加えて 、
PUBMED の番号を添えた形で 関 連 の 論 文もリ ス ト ア ッ プ さ れ て い ま す 。 PUBMED 番号を ク リ ッ
ク す る と 文 献 情 報 に入る こ と が できま す 。
test_sequence-1 で試し て み よう。
>test_sequence-1(zebrafish_charon)_peptide
MTFQVGFFVLLSVTTIGAFPRNAFQREFHRHVAKDFESSGNGPDEPVRGSVRIVKLNPHFLRRAAVSHVPFRNSPSRGAFP
AFLALGRPGPAILTHSKPAPQVSSSADRRKQGLEMWKKVVHKSERKKEAVALRINPKDMNKQSCAAVPFTQRITEEGCETV
TVHNNLCYGQCSSMFVPSSGGSHGQQKAQCMRCGPSRARSVLLHLRRGSEVRERRVLI
「電 子 ジャー ナ ル」へ の ア ク セ ス の 方 法
東北大 学 ホ ー ム ペ ー ジ→東北大 学付属図 書 館→電 子 ジャー ナ ル リ ス ト ( 学 内者限定 )→
雑誌名の キ ー ワ ー ド 検 索 OR ア ル ファベ ッ ト順で 検 索→ volume, page 入力・ 検 索
EndNote文 献 の ラ イ ブ ラ リ ー の 作 成 、 論 文 へ の 文 献 の引用 、 文 献 リ ス ト の 作 成 に は 、 EndNote が
広く使われ て い ま す 。市販品は 6 万円程度で か な り高価で す 。 論 文 を 書く人に は 必携で
す 。
短期間で あ れば、試供品が 使えま す 。 ま た 機 能 は か な り 製 薬 さ れ て い ま す が 、無料版も
公開さ れ て い ま す 。
Impact factor科学 分野毎 に 、 複数の Journal が 出版さ れ て い ま す 。どれだけ Journal 内 の 論 文 が 、他の 論
文 に よ っ て引用 さ れ て い る か 、 す なわち引用 回数に よ っ て 、 Journal の評価が 分 か れ ま す 。
それ ら を数値化 し たもの に Impact factor が あ り ま す 。 Impact factor は 、「大 学 図 書 館」
の「デ ー タ ベ ー ス」に あ る「 InCites Journal Citation Reports (JSR) 」で 、調べる こ と が
できま す 。
37
12 月 11 日 ( 第 11 回 )
鈴木不在( 分 子 生 物 学会に 出席) の ため酒井先生 が 代わり に下記の 内 容 で 授 業 を 行 い
ま す 。
配 列 の ア ラ イ ン メ ン ト 手 法 とBLAST検 索 の 原 理
・ 配 列 の ア ラ イ ン メ ン ト と は
・ 全域ア ラ イ ン メ ン ト と局所ア ラ イ ン メ ン ト
・ ア ミ ノ 酸置換 行 列
・動的計 画 法 に 基づく局所ア ラ イ ン メ ン ト の求め方
・BLASTはどの ように 検 索 を 行 っ て い る の か
(動的計 画 法 と の違い と 、それ に ともなう利点、問題点)
進 化 系 統 樹 とCLASTAL Wで 用 い ら れ て い る近隣結 合 法 の 原 理
・ 種 の 進 化 モ デ ル
・ 分 子時計仮説
・ ウ ル ト ラ メ ト リ ッ ク木と 加 法木
・UPGMA法
・近隣結 合 法
以上に つ い て 概 説 す る 。
同内 容 の詳細に つ い て は 3年前期「生 物 生産情 報 処 理 概 論」に て 講 義 す る 。
38
12 月 1 8 日 ( 第 1 2 回 )
講 義
タ ン パ ク 質 の 構 造 に つ い て の 解 説各 種 プ ロ グ ラ ム を 使うこ と に よ り 、 タ ン パ ク 質 の 構 造的特徴を 予 測 す る こ と が できま す 。今日
の 授 業 で は 、 シ グ ナ ル ペ プ チ ド 、 ド メ イ ン 構 造 に つ い て 解 説 し た あ と 、 テ ス ト 配 列 を 使 っ て 実
際 に こ れ ら 構 造 の 検 索 ( 分 子 量 、 等 電点、 シ グ ナ ル ペ プ チ ド 、 疎 水 性 ・ 親 水 性領域、 ド メ イ ン
構 造 ) を 行 い ま す 。
代表的な ド メ イ ン 構 造 ( モ チ ー フ ) 検 索 サ イ ト に は 、 イギリ ス の サ ン ガ ー 研 究所が公開し て
い る Pfam が あ り ま す 。
シ グ ナ ル ペ プ チ ド
分泌性 の蛋白質 の N 末端に存在す る 、 15-30 残基 の 疎 水 性 ア ミ ノ 酸 か ら 構 成 さ れ た シ グ ナ ル 配
列 。 分泌前に 、 シ グ ナ ル ペ プ チダーゼに よ っ て切断さ れ る 。
タ ン パ ク 質 の ド メ イ ン ( モ チ ー フ ) 構 造
ド メ イ ン 構 造 ( = モ チ ー フ ) : タ ン パ ク 質 の ア ミ ノ 酸 配 列 の な か で 、特有 な 性 質 を持っ た領域。
分 子 の 構 造上あ る い は 機 能上一つ の ま と ま り を持つ領域。
ド メ イ ン 構 造 の 例
細胞膜レ セ プ タ ー : リ ガ ン ド 結 合 ド メ イ ン 、細胞膜貫通ド メ イ ン 、 チ ロ シ ン キ ナ ーゼ
ド メ イ ン 、 リ ン 酸 化 ド メ イ ン
核レ セ プ タ ー : リ ガ ン ド 結 合 ド メ イ ン 、 DNA 結 合 ド メ イ ン
実 習
塩 基 配 列 の ア ミ ノ 酸 配 列 へ の 変 換
し て み ま す 。 コ ンピュー タ ー操作 に慣れ る ように し て下さ い 。今回 は 、魚類の cDNA ラ イ ブ
ラ リ ー か ら ク ロ ーニン グ さ れ た cDNA ク ロ ー ン の 全長配 列 ( 5’UTR, CDS, 3’UTR を含んで い る )
を 使 っ て 実 習 し ま す 。
5’UTR ( 5’非翻訳領域) , CDS ( コ ー ド 配 列 ) , 3’UTR( 3’非翻訳領域)
塩 基 配 列 ( >test_DNA_sequence-1 ) を ア ミ ノ 酸 配 列 に 変 換 し て み よう
1 ) 利 用 す る ウ ェ ブ サ イ ト : NCBI (National Center for Biotechnology Center) http://www.ncbi.nlm.nih.gov/
2 ) 使 用 す る ア イ コ ン : Open Reading Frame Finder (ORF finder )open reading frame = 蛋白質 を コ ー ド す る 塩 基 配 列 の 読 み 取 り枠
39
あ る い は 、 Epaxy の Translatehttps://web.expasy.org/translate/
ORF finder に よ る 検 索 手 順1 . NCBIの ウ ェ ブ サ イ ト を開き、左上Resource List (A-Z) を ク リ ッ ク
2 . Open reading frame finder(ORF finder)を開け る
3 . ア ミ ノ 酸 配 列 に 変 換 す る
配 列 (FASTA format) を枠内 に 配 列 を コピー す る
OrfFind ボタ ン を押す
青 で 示 さ れ た 部 分 が 、 予想さ れ る ア ミ ノ 酸 配 列
( セ ン ス 、 ア ン チ セ ン ス 鎖 の 3 フ レ ー ム で の翻訳結 果 が 示 さ れ る )
通常、一番長い フ レ ー ム が タ ン パ ク 質 の コ ー ド 配 列 で あ る
青 の バ ー を ク リ ッ ク す る = 塩 基 配 列 と ア ミ ノ 酸 配 列 が表示 さ れ る
4 .推定 さ れ た ア ミ ノ 酸 配 列 を 取 り 出 す に は
Acceptボタ ン を押す
Viewボタ ン を押す : ア ミ ノ 酸 配 列 デ ー タ と諸情 報 が 示 さ れ て い る
ア ミ ノ 酸 配 列 を テ キ ス ト ファイ ル 等 に コピー す る
>test_DNA_sequence-1(zebrafish_charon)
AACGAAACCTTGAACCGCAAGATTTTTCAACAAATAATCGACTATATGTATTTTTAGAGAGAAATAAATTCCCTCTCTTTT
CTTTTTTGTAAAATTCTATAATTTAGCTAAAATGACTTTTCAGGTCGGCTTTTTTGTGCTGTTGTCAGTCACAACAATTGG
CGCTTTCCCGCGCAATGCATTTCAGCGGGAATTTCACCGACACGTGGCGAAAGACTTTGAATCCTCCGGGAATGGACCAGA
CGAACCTGTTCGGGGATCTGTCCGAATTGTCAAACTAAACCCTCATTTTCTGCGCCGGGCCGCCGTTAGTCATGTGCCGTT
CAGAAATTCACCAAGTCGAGGCGCGTTTCCCGCGTTCTTGGCCCTCGGACGTCCGGGCCCCGCAATCCTGACCCATAGCAA
ACCTGCGCCTCAGGTGAGCAGCAGTGCAGACAGGAGGAAACAAGGGCTCGAGATGTGGAAGAAAGTGGTGCACAAAAGCGA
GCGAAAAAAAGAGGCAGTGGCTCTGCGCATCAATCCCAAAGACATGAACAAACAGAGCTGTGCCGCAGTTCCCTTTACACA
GCGCATAACGGAGGAGGGCTGTGAGACGGTGACCGTTCACAATAATCTCTGCTACGGTCAGTGCAGCTCCATGTTCGTGCC
CTCCAGCGGAGGCTCTCACGGACAACAGAAAGCGCAGTGCATGCGCTGCGGCCCCTCTAGAGCGCGCTCCGTGCTCCTGCA
CCTGCGCCGCGGGTCTGAGGTGCGGGAGAGGCGCGTACTGATCGTTGAGGAGTGCAAGTGTGAAACCAGCAGCGAAGAGGC
CAAAGTTCAGAACACAGATATGTTTAATTTATAACAGTCATTTTAAAGTTTATAAAAATCGTAA
//
Expasyの Translate に よ る 検 索 手 順
タ ン パ ク 質 の 構 造 解 析 で は 、ヨー ロ ッ パ の 研 究 機 関 の ウ ェ ブ サ イ ト が充実 し て い る 。特に
Swiss Institute of Bioinformatics 、 Sanger研 究所( イギリ ス ) の サ イ ト は 、 利 用価値が高い 。前
者は 、 ExPASy (Bioinformatics Resource Portal) 、後者は Pfam ( ド メ イ ン 解 析 ) を公開し て い る 。
ま た European Bioinformatics Institute (EBI)でも、 タ ン パ ク 質 の 構 造 解 析 プ ロ グ ラ ム を公開し て い
る 。
1 . Expasy を あ け る
40
2 . 左の Resource A..Z を選択
3 . Translate を選択
4 . 枠内 に 塩 基 配 列 の み コピー し 、 Translate sequenceを ク リ ッ ク し て 検 索
基 本 構 造 の 解 析
タ ン パ ク 質 の 分子量・等電点の 予 測 :
1 ) ExPASy (http://ca.expasy.org/)を開け る 。
2 ) 左の Resource A..Z を選択
3 ) Compute PI/Mw を選択
4 ) 下記の > zebrafish_Charon で 検 索 し て み よう。 ア ミ ノ 酸 配 列 を枠内 に コピー す る
( 配 列 の み : こ の プ ロ グ ラ ム で は > で 始 ま る 行 は コ ピ ー し な い ) 。 Click here to computepI/Mw ボタ ン を ク リ ッ ク す る 。
5) 検 索 結 果 : Theoretical pI/Mw: 10.00 ( 等 電点) / 27073.04( 分 子 量 )
>zebrafish_CharonMTFQVGFFVLLSVTTIGAFPRNAFQREFHRHVAKDFESSGNGPDEPVRGSVRIVKLNPHFLRRAAVSHVPFRN
SPSRGAFPAFLALGRPGPAILTHSKPAPQVSSSADRRKQGLEMWKKVVHKSERKKEAVALRINPKDMNKQSCA
AVPFTQRITEEGCETVTVHNNLCYGQCSSMFVPSSGGSHGQQKAQCMRCGPSRARSVLLHLRRGSEVRERRVL
IVEECKCETSSEEAKVQNTDMFNL
//
(ゼブ ラ フ ィ ッ シュCharon: 分泌型の シ グ ナ ル タ ン パ ク 質 )
疎水性・親水性領域の 解 析 :
1 ) ExPASy Proteomics tools (http://ca.expasy.org/) を開け る 2 )左の Resource A..Z を選択
3 ) Prot Scale を選択
4 ) ア ミ ノ 酸 配 列 を枠内 に コピー す る 。 Hphob. / Kyte &Doolittle ( デ フ ォ ル ト状態:
疎 水 性 / 親 水 性 解 析 で最も利 用 さ れ て い る プ ロ グ ラ ム ) を選択す る 。
5) >zebrafish_fgfr1 で試し て み よう
6) Submit ボタ ン を押す
7) 結 果 : グ ラ フ の プ ラ ス が 疎 水 性 、 マ イ ナ ス が 親 水 性 を 示 す . fgfr1 で は 、 ア ミ ノ末端
側の 疎 水領域は シ グ ナ ル ペ プ チ ド の 部 分 。中央の 疎 水領域は 、細胞膜貫通ド メ イ ン で
あ る 。
>zebrafish_fgfr1
MIMKTTLLLISVLLTQALQSQGRPAIQDEAPAEPTSYTLDSGEKLELSCKAKEDTQKVTWTKDLVPLVDGEHTRLRN
DQMEIEKVEPADSGLYACFAQGLNSNHTEYFNISVTDEEDEVDSSSEEAKLSNDQNLPMAPVWAQPDKMEKKLHAVP
ASKTVKFRCQANGNPTPTLKWLKNGKEFKRDQRIGGFKVREHMWTIIMESVVPSDRGNYTCLVENRHGSINHTYQLD
VVERSPHRPILQAGLPANRTAVVGSDVEFECKVFSDPQPHIQWLKHIEVNGSRYGPDGLPYVRALKTAGVNTTDKEM
EVLQIRNVSLEDAGEYTCLAGNSIGHSHHSAWLTVYKAVPPTQLPNQTYLEVLIYCVGFFLICVMVGTAVLAKMHSS
AKKSDFNSQLAVHKLAKSIPLRRQVTVSVDSSSSMHSGGMLVRPSRLSSSGSPMLSGVSEYELPQDPRWEVQRDRLV
41
LGKPLGEGCFGQVMMAEAMGMDKEKPNRITKVAVKMLKSDATEKDLSDLISEMEMMKIIGKHKNIINLLGACTQDGP
LYVIVEFAAKGNLREYLRVRRPPGMEYCYNPDQVPVENMSIKDLVSCAYQVARGMEYLASKKCIHRDLAARNVLVTE
DNVMKIADFGLARDIHHIDYYKKTTNGRLPVKWMAPEALFDRIYTHQSDVWSFGVLLWEIFTLGGSPYPGVPVEELF
KLLKEGHRMDRPSTCTHELYMMMRDCWHAVPSQRPTFKQLVEDLDRTLSMTSNQEYLDLSVSLDQFSPNFPDTRSST
CSSGEDSVFSHDAGADEPCLPKFPPHPNRGVAFKKR
( FGF 受容体:細胞内 に チ ロ シ ン キ ナ ーゼド メ イ ン を持っ た膜貫通型細胞膜受容体・
FGF=fibroblast growth factor/ 繊維芽細胞増殖因子 :創傷治癒、培養条件下で繊維芽細
胞の 分裂を促進 す る 。胚発 生 で は中胚葉誘導に 関与す る )
シ グ ナ ル ペ プ チ ド の 検 索
タ ン パ ク 質 の シ グ ナ ル ペ プ チ ド の 予 測 :
1 ) SignalP 3.0 Server ( http://www.cbs.dtu.dk/services/SignalP/ ) を開け る ( デ ン マ ー
ク の Technical University が公開)
2 ) >zebrafish_Charon で 検 索 し て み よう。 ア ミ ノ 酸 配 列 を枠内 に コピー す る 。 Submitボタ ン を ク リ ッ ク す る 。
練習 :下の ア ミ ノ 酸 配 列 でも検 索 し て み よう
>mouse_vitamin_D_receptor
MEAMAASTSLPDPGDFDRNVPRICGVCGDRATGFHFNAMTCEGCKGFFRRSMKRKALFTCPFNGDCRITKDNR
RHCQACRLKRCVDIGMMKEFILTDEEVQRKREMIMKRKEEEALKDSLRPKLSEEQQHIIAILLDAHHKTYDPT
YADFRDFRPPIRADVSTGSYSPRPTLSFSGDSSSNSDLYTPSLDMMEPASFSTMDLNEEGSDDPSVTLDLSPL
SMLPHLADLVSYSIQKVIGFAKMIPGFRDLTSDDQIVLLKSSAIEVIMLRSNQSFTLDDMSWDCGSQDYKYDI
TDVSRAGHTLELIEPLIKFQVGLKKLNLHEEEHVLLMAICIVSPDRPGVQDAKLVEAIQDRLSNTLQTYIRCR
HPPPGSHQLYAKMIQKLADLRSLNEEHSKQYRSLSFQPENSMKLTPLVLEVFGNEIS
(ビタ ミ ン D受容体は 、核に移行 す る蛋白質 な の で シ グ ナ ル ペ プ チ ド は な い )
ド メ イ ン 構 造 の 検 索
タ ン パ ク 質 の ド メ イ ン 構造の 予 測 -1: Pfam を 使う( ド メ イ ン 検 索 で最も利 用 さ れ て
い る : 機 能 ド メ イ ン を探す の に便利 )
今日 は 、下の マ ウ ス のビタ ミ ン D受容体で 検 索 し ま す 。
1 ) Pfam ( http://pfam.sanger.ac.uk/ ) ( イギリ ス の サ ン ガ ー 研 究所) を開け る
2 ) SEQUENCE SEARCH ボタ ン を押す
3 ) 枠内 に ア ミ ノ 酸 配 列 (試し に >mouse_vitamin_D_receptor ) を コピー し 、 Go を押す
4 ) み つ か っ た ド メ イ ン 構 造 が グ ラ フ ィ ッ ク で上に 図 示 さ れ る 。
5) 下に は 各 ド メ イ ン の 説 明 が表示 さ れ る 。
6) 一番右の Show/hide alignment を押す と 、 デ ー タ ベ ー ス に納めら れ て い る ド メ イ ン
42
配 列 と問い 合わせ配 列 の ア ラ イ メ ン ト が表示 さ れ る
7) ド メ イ ンネー ム (上の グ ラ フ ィ ッ クも同様) が ア ク テ ィ ブ で 、それ を押す と 、 ド メ
イ ン の 説 明 、 立体構 図 が表示 さ れ る
8) 右上の グ ラ フ ィ ッ クツー ル のうち、 crystallographic structuresを押す と 、 み つ か っ た
タ ン パ ク 質 の高次 構 造 が グ ラ フ ィ ッ ク で 示 さ れ 、詳細な 構 造 の 説 明も表示 さ れ る 。
PBD ID を押す と 、 タ ン パ ク 質 の高次 構 造 ( ア ル ファへ リ ッ ク ス 構 造 等 ) が表示 さ れ
る 。
>mouse_vitamin_D_receptor
MEAMAASTSLPDPGDFDRN
VPRICGVCGDRATGFHFNAMTCEGCKGFFRRSMKRKALFTCPFNGDCRITKDNRRHCQACRLKRCVDIGMMKEFILT
DEEVQRKREMIMKRKEEEALKDSLRPKLSEEQQHIIAILLDAHHKTYDPTYADFRDFRPPIRADVSTGSYSPRPTLS
FSGDSSSNSDLYTPSLDMMEPASFSTMDLNEEGSDDPSVTLDLSPLSMLPHLADLVSYSIQKVIGFAKMIPGFRDLT
SDDQIVLLKSSAIEVIMLRSNQSFTLDDMSWDCGSQDYKYDITDVSRAGHTLELIEPLIKFQVGLKKLNLHEEEHVL
LMAICIVSPDRPGVQDAKLVEAIQDRLSNTLQTYIRCRHPPPGSHQLYAKMIQKLADLRSLNEEHSKQYRSLSFQPE
NSMKLTPLVLEVFGNEIS
(ビタ ミ ン D受容体;核タ ン パ ク 質受容体ファミ リ ー の メ ン バ ー で 、骨形成 等 に 関与
す る )
終わっ た人は 、 次 の タ ン パ ク 質 で 検 索 し て み よう:
ゼブ ラ フ ィ ッ シュ・ FGF レ セ プ タ ー
等 鎖 結 合 部 位 の 予 測
Asn-Xaa-Ser/Thr タ イ プ の 等 鎖 結 合 部 位 の 予 測 プ ロ グ ラ ム
http://www.cbs.dtu.dk/services/NetNGlyc/
3D 構 造 デ ー タ ベ ー ス の閲覧
NCBI の 利 用
NCBIの Resource List の中に あ る Structure (Molecular Modelling Database) を 使うと 、 タ ン パ ク 質
構 造 デ ー タ ベ ー ス に納めら れ て い る 3D 構 造 を閲覧す る こ と が できま す 。
↓NCBI homepage↓Resource List か ら Structure (Molecular Modelling Database) を選択
↓ 左カラ ム の Search を選択
↓Search の枠に タ ン パ ク 質 明 を入力し て 検 索 (試し に prion, VDR で 検 索 し て み よう)
PDB (Protein Data Bank) の 利 用
www.pdb.org 上の ア イ コ ン か ら macromolecule を指定 し て キ ー ワ ー ド 検 索 (試し に prion, VDR で 検 索 し て み
よう)
43
3D 構 造だけ で なく、 遺 伝 子 の 機 能 の 解 説も添えら れ て い る
NCBI blastp に よ る 検 索
Blastp で デ ー タ ベ ー ス を Protein Data Bank を選択し て 検 索 す る (上の Protein Data Bankに登録さ れ て い る高次 構 造 の 分 か っ て い る タ ン パ ク 質 に対し て blastp検 索 が 行われ る )
配 列類似遺 伝 子 で高次 構 造 の 解 析 さ れ て い る タ ン パ ク 質 が表示 さ れ る 。右の Accession ボ
タ ン を押す と 、 デ ー タ が表示 さ れ る 。右に 3D 構 造 が 図 示 さ れ る 。
44
1 月 8 日 ( 第 1 3 回 )
講 義 と 実 習
21 世紀の 分 子 生 物 学 で革新的な 新技術
こ の 5 年間で 実 用 化 さ れ た ゲ ノ ム編集技術 ( Genome editing ) と 次 世 代 シ ー ケ ン ス 解
析 ( New generation sequencing: NGS ) の 2 つ の技術 は 、おそらく分 生 生 物 学 におけ る
今世紀最大 の技術革新 で あろうと思われ ま す 。前者は 生 物 の ゲ ノ ム 配 列 を人為的か つ簡便
に 書き換える こ と を 可 能 に し た技術 で 、後者は ヒ ト の ゲ ノ ム でも 1 回 の 解 析 で シ ー ケ ン ス
できる ナ ノ技術 で す 。 2 つ の技術 の 重 要 な点と し て 、 基礎生 物 学 に 加えて 、農学 を含め応
用 研 究 に無限の 可 能 性 を秘めて い る こ と を強調し ておく必 要 が あ り ま す 。 ゲ ノ ム編集 で は 、
農林水産の 新品種開発 が活発 に推進 さ れ て い ま す 。 NGS は 、既に品種 の ゲ ノ ム育種や形質
の責任遺 伝 子 の同定 に 有効利 用 さ れ て い ま す 。
ゲ ノ ム編集技術 の 原 理
ゲ ノ ム編集広く使われ て い る CRISPR/Cas9 法 は 、簡単に ま とめる と 、 ファー ジ ウ ィ ル
ス に対す る細菌の獲得免疫シ ス テ ム を 遺 伝 子工学 の技術 に展開す る こ と で 、 ゲ ノ ム に
配 列特異的に 2 本鎖切断を誘起す る こ と を 可 能 に し た技術 と いえま す 。 ゲ ノ ム編集 は 、
CRISPR/Cas9 法 を 用 い て 遺 伝 子 の ノ ッ ク ア ウ ト 、 あ る い は 配 列 の ノ ッ ク イ ン を 行う技
術 と な り ま す 。 ノ ッ ク ア ウ ト で は 、 2 本鎖切断の修復 で起こ る 塩 基 の欠損や挿入に よ
る フ レ ー ム シ フ ト を 利 用 し て い ま す 。 あ る い は 、 2 本鎖切断を 遺 伝 子 内 に 2 カ所誘起し て 、その間の 配 列 を削除す る こ と でもノ ッ ク ア ウ ト が 可 能 で す 。受精卵に Cas9 と
複数の 遺 伝 子 の ガ イ ド RNA を導入す る こ と で 、同時に 複数個の 遺 伝 子 を ノ ッ ク ア ウ ト
す る こ とも可 能 で す 。
ノ ッ ク イ ン で は 、 2 本鎖切断部 位 に ド ナ ー 配 列 を設計 す る こ と で 、相同組換えに よ る
遺 伝 子導入が高効率と な り 、 ES 細胞を 用 いずに 、直接受精卵内 で ノ ッ ク イ ン す る こ
と が 可 能 で す 。
CRISPR/Cas9 で の標的配 列 の設計
CRISPR/Cas9 の標的配 列 は 20 塩 基程度で極めて短い ために 、同じ配 列 あ る い は 1塩 基違う配 列 が標的配 列以外にも存在す る 可 能 性 は 大 い に あ り ま す 。標的配 列 に 加え
て 、 こ の ような 配 列 は CRISPR/Cas9 で切断さ れ る ために オ フ タ ー ゲ ッ ト と呼ばれ 、正
確な ゲ ノ ム編集 に は オ フ タ ー ゲ ッ ト の無い 配 列 を標的に す る 必 要 が あ り ま す 。 全 ゲ ノ
ム の 配 列 が決定 さ れ て い る 生 物 で あ れば、 オ フ タ ー ゲ ッ ト の無い 配 列 を選択す る こ と
が 可 能 で す 。 ま た CRISPR/Cas9 で は 、標的配 列 の設定 部 位 は 、 Pam配 列 ( NGG ) に
よ り制限さ れ ま す 。 CRISPRdirect を 使うと 、 Pam 配 列 の上流に特異性 の高い標的配
列 が設計 す る こ と が できま す 。 授 業 で は 、 CRISPR/Cas9 法 の 原 理 を簡単に 説 明 し たう
えで 、 CRISPRdirect の 使 い 方 を 実 習 し ま す 。
45
46
1 月 1 5 日 ( 第 1 4 回 )
実 習
— ゲ ノ ム 塩 基 配 列 を デ ー タ ベ ー ス か ら 取 り 出す —
Ensembl Genome Brower
Ensembl Genome Brower ( ゲ ノ ム デ ー タ の 統括サ イ ト ) は 、 Sanger研 究所・ EBI が 管 理 す る
ゲ ノ ム デ ー タ ベ ー ス で す 。最大 の特徴は 、 必 要 な 遺 伝 子 、 あ る い は染色体領域の ゲ ノ ム 塩 基
配 列 を 取 り 出 す こ と が できる こ と に あ り ま す 。 cDNA を特異的に 増幅す る PCR プ ラ イ マ ー の
設計 、 CRIPR-Cas9 を 使 っ た ゲ ノ ム編集 、 ノ ッ ク ア ウ ト マ ウ ス の相同組換えに 用 い る 配 列 、
GFP を 使 っ た レ ポ ー タ ー 遺 伝 子 作 製 用 の プ ロ モ ー タ ー 配 列 が 必 要 な場合 などで 、 Ensembl を
使 っ て ゲ ノ ム 配 列 を 取 り 出 す こ と に な り ま す 。 実 習 で は 、 Ensembl の 説 明 と 実 際 の 配 列 の 取
り 出 し 方 を教えま す 。
ま た 、 ゲ ノ ム 配 列 、 全 遺 伝 子 の コ ー ド 配 列 、 全蛋白質 の ア ミ ノ 酸 配 列もダウ ン ロ ー ド す る こ
と が 可 能 で 、それ ら を 使 っ て自前で バ イ オ イ ン フ ォ マ テ ィ ッ ク ス 解 析 を 行うこ と が できま す 。
「使 用 法 - 1」
Ensemblを 使 っ て 、試し に マ ウ ス の sonic hedgehog ( shh ) の ゲ ノ ム 配 列 を 取 り 出 し て み
ま す 。
1 .下記の ウ ェ ブ サ イ ト を開け る
http://www.ensembl.org/index.html (ensembl で キ ー ワ ー ド 検 索 )2 . 生 物 種 を指定 す る
マ ウ ス を選択
3 . 検 索項目か ら gene を選び、 遺 伝 子名 (shh) をボッ ク ス に入れ て 検 索
4 . リ ス ト ア ッ プ さ れ てきた 複数の 遺 伝 子 か ら 、 shh を ク リ ッ ク ( ESMSUSG000000002633 )
す る
染色体上の 地 図 が表示 さ れ る
5.左側のツー ルボッ ク ス の中か ら Sequence を選択し て ク リ ッ ク
6. 配 列 が表示 さ れ る ( エ ク ソ ン は赤字 で肌色 の背景、 エ ク ソ ン間の 黒 字 の 部 分 は イ ン ト ロ ン 、
第一エ ク ソ ン よ り上流は プ ロ モ ー タ ー領域の一部 で あ る )
7.戻っ て 、 Location か らもゲ ノ ム 構 造 を 検 索 す る こ と が できる
8.左側に あ る Export data で 、範囲を選択し て 配 列 を 取 り 出 す こ と が できる (範囲を指定 し て 、
よ り長い プ ロ モ ー タ ー 配 列 を 取 り で す こ と が できる )
「使 用 法 - 2」
ゲ ノ ム 配 列 、 全 遺 伝 子 の コ ー ド 配 列 、 全蛋白質 の ア ミ ノ 酸 配 列 をダウ ン ロ ー ド す る
Gene annotation --- Download genes, cDNAs, ncRNA, proteins (FASTA) か らダウ ン ロ ー ド 可 能
転写調節領域の コ ン セ ン サ ス 結 合 配 列 の 予 測 -47
講 義遺 伝 子 の 発現調節機 構
遺 伝 子 は 、特定 の細胞ま た時期に 必 要 量だけ 発現す る ように調節さ れ て い ま す 。 例えば、 ペ
プ シ ノ ー ゲ ン の 発現は胃に限定 さ れ ており 、筋肉や脳で は決し て 発現し な い ように制御さ れ て
い ま す 。 発 生 に 関 係 す る 遺 伝 子 の な か に は 、魚類の孵化酵素の ように一生 のうち孵化時に一度
だけ 発現す る 遺 伝 子もあ り ま す 。 こ の ような 発現調節に 関 す る 情 報 は 、 ゲ ノ ム の コ ー ド領域で
は なく、その近辺に存在す る転写調節領域( エ ンハン サ ー領域) に コ ー ド さ れ て い ま す ( 5’上流に あ る場合 が 多 い が 、 3’下流に あ るものやイ ン ト ロ ン に あ る 遺 伝 子も存在す る ) 。 具体的に
は 、転写因子 が 結 合 す る コ ン セ ン サ ス 結 合 配 列 がその 情 報 と言うこ と に な り ま す 。それぞれ の
転写因子 は 、 ゲ ノ ム の決ま っ た 配 列 を認識し て 結 合 し ま す 。その 配 列 が コ ン セ ン サ ス 結 合 配 列
で す 。 コ ン セ ン サ ス 結 合 配 列 は 、 6-20 塩 基ほどの短い 配 列 で す 。転写調節領域に は 、 複数個の
コ ン セ ン サ ス 配 列 が存在し 、 複数の転写因子 が 結 合 ・ 解離す る こ と に よ り 、 遺 伝 子 の転写を精
密に調節し て い ま す 。 講 義 で は転写調節の メカニズ ム に つ い て 解 説 し 、 実 習 で転写調節領域の
コ ン セ ン サ ス 配 列 を 検 索 し ま す 。
実 習ゼブ ラ フ ィ ッ シュの sonic hedghog遺 伝 子 の 5’上流域の転写調節領域の 配 列 を ゲ ノ ム デ ベ ー ス か
ら 取 り 出 し 、 コ ン セ ン サ ス 結 合 配 列 を 予 測 し て み ま す 。
コ ン セ ン サ ス 結 合 配 列 の 検 索 に は幾つ か の プ ロ グ ラ ム が あ り ま す が 、 実 習 で は LASAGNA-Search 2.0を 用 い ま す 。
http://biogrid-lasagna.engr.uconn.edu/lasagna_search/
問題 :ゼブ ラ フ ィ ッ シュの sonic hedghog ( shh ) 遺 伝 子 の転写調節領域の 配 列 を ゲ ノ ム デ ー
タ ベ ー ス か ら 取 り 出 し 、 コ ン セ ン サ ス 結 合 配 列 を 予 測 す る 。
( 1 )最初にゼブ ラ フ ィ ッ シュの sonic hedghog遺 伝 子 の 5’上流域の転写調節領域の 配 列 を ゲ
ノ ム デ ベ ー ス か ら 取 り 出 し ま す 。
1 ) Emsembl (http://www.ensembl.org/index.html) を開け ま す
2 ) 対象性 物 か ら zebrafish を選択
3 ) 検 索項目か ら gene を選び、 shh で 検 索
4 ) 検 索 結 果 の ペ ー ジ に あ る shh の ア ク セ ッ シ ョ ン を ク リ ッ ク
5) 左側ボタ ン の Sequence を ク リ ッ ク す る と 、 ゲ ノ ム 配 列 が表示 さ れ る
6) 第 1 エ ク ソ ン (赤字 ) か ら上流の 配 列 (転写調節領域) を メ モ帳に コピー す る
( 2 ) 次 に 、 LASAGNA-Search 2.0 を開け る
( http://biogrid-lasagna.engr.uconn.edu/lasagna_search/ l )7) プ ロ モ ー タ ー 配 列 に コ ン セ ン ス 配 列 が存在す る か を調べた い転写因子 を選択す る 。
Matrix-Derived Models か ら 、 Use TRANSFAC matrices を選択す る と 、転写因子 の リ ス ト が
表示 さ れ る の で 、調べた い転写因子 を選択(転写因子 にカー ソ ル を持っ て 行くと 、転写
因子 の コ ン セ ン サ ス 配 列 を 見 る こ と が 可 能 )
8) 枠に 塩 基 配 列 を コピー 、 検 索
48
注意: コ ン セ ン サ ス 配 列 は 、ほとんどの場合 6-10b 程の短い 配 列 で あ り 、 加えて あ る程度の 配
列 の バ リ エ ー シ ョ ン を許容 し ま す 。その ため予想さ れ た 配 列 に は 、 実 際 に は転写因子 と相互作
用 し な い 配 列 が高い確率で含ま れ ま す 。 検 索 結 果 は 、目安程度に考えて下さ い 。 実 際 の コ ン セ
ン サ ス 配 列 を同定 す る ために は 、 分 子 生 物 学 の技術 ( ゲ ル シ フ ト ア ッ セ イ 、 ル シ フ ェ ラ ーゼを
レ ポ ー タ ー に し た プ ロ モ ー タ ー 解 析 等 ) を 使 っ て 実験的に 検証す る 必 要 が あ り ま す 。
バ イ オ デ ー タ ベ ー ス の 利 用
遺 伝 子 の 機 能 を知り た い場合 に は 、 ポ ス ト ゲ ノ ム の モ デ ル 生 物 ( マ ウ ス 、ゼブ ラ フ ィ ッ シュ、
シ ロ イ ズ ナ ズ ナ 等 ) の 検 索 サ イ ト が 重宝し ま す 。 こ れ ら は 、 バ イ オ デ ー タ ベ ー ス と呼ばれ ま す 。
モ デ ル 生 物 の な か でも、特に マ ウ ス とゼブ ラ フ ィ ッ シュの デ ー タ ベ ー ス が充実 し ており 、 遺 伝
子 の 機 能だけ で なく発現パ タ ー ン ( 遺 伝 子 が何時、どの組織で 、どれだけ の 量 が 発現す る か ) 、
遺 伝 子 ノ ッ ク ア ウ トやノ ッ クダウ ン の表現型もデ ー タ ベ ー ス 化 さ れ ており 、 遺 伝 子名の キ ー
ワ ー ド 検 索 で デ ー タ を入手 す る こ と が 可 能 で す 。
ヒ ト の 遺 伝 子 機 能 と 遺 伝 子 疾 患 の デ ー タ ベ ー ス と し て NCBIに OMIM ( Online Menderian Inheritance in Man ) が公開さ れ て い ま す 。 遺 伝 子名で キ ー ワ ー ド 検 索 す る と 、 遺 伝 子 の 機 能 、
遺 伝 子疾患が存在す る場合 に は 、 配 列 変異と疾患の表現型を知る こ と が 可 能 で す 。
マ ウ ス の デ ー タ ベ ー ス ( MGI: mouse genome informatics ) の特徴と し て 、 遺 伝 子ごと に ノ ッ
ク ア ウ ト マ ウ ス の表現型が デ ー タ ベ ー ス 化 さ れ ており 、表現型か ら 遺 伝 子 の 機 能 を調べる こ と
が できま す 。 マ ウ ス の デ ー タ ベ ー ス で は 、 遺 伝 子 の正確な マ ッ プ ポ ジ シ ョ ン ( 連 鎖 地 図 、 ゲ ノ
ム 配 列上) 等も示 さ れ て い ま す 。
ゼブ ラ フ ィ ッ シュの デ ー タ ベ ー ス ( ZFIN: zebrafish Organism Data Base ) に は 、 in situ ハイ
ブ リダイゼー シ ョ ン に よ る 発現解 析 の デ ー タ が写真で掲載さ れ ており 、 遺 伝 子 発現に 関 す る組
織レ ベ ル の 情 報 を得る こ と が できる特徴が あ り ま す 。脊椎動物中で あ ればオ ル ソ ロ グ 遺 伝 子
(異な る 生 物 の同一遺 伝 子 ) の 発現パ タ ー ン は類似し て い る こ と が 多 い の で 、 マ ウ ス 、 ウ シや
ニワ ト リ を 研 究対象に す る場合 でも参考と な り ま す 。
論 文や単行 書 を 読んで 機 能 が 分 か ら な い 遺 伝 子 ( タ ン パ ク 質 ) が で てきた時に は 、それ ら の
遺 伝 子 の 機 能 を 調 べ る 必 要 が あ り ま す 。 こ の よ う な と き に は NCBI の OMIM (Online Mendelian Inheritance in Man) と マ ウ ス ・ゼブ ラ フ ィ ッ シュの ウ ェ ブ サ イ ト を 使うと 情 報 を
得る こ と が できま す 。 授 業 で は 、 こ れ ら の サ イ ト の 使 い 方 と特徴に つ い て 説 明 し ま す 。
OMIM の 使 い 方
ヒ ト で 分 か っ て い る 遺 伝 子 の 機 能 を詳細に記述し て い る 。 関 連 文 献もリ ス と さ れ て い る 。
る
1. NCBIを開け 、左上の All List (A-Z)か ら Online Menderian Inheritance in Man (OMIM) を選択
す る 。
2 . 枠内 に 遺 伝 子名を入力し て 検 索
練習 に growth hormone ( 成長ホ ル モ ン ) を 検 索 し て み よう
49
growth hormone 遺 伝 子および関 連 遺 伝 子 の 配 列 変異に よ っ て起こ る症候群の リ ス ト が表
記さ れ る 。 遺 伝 子 の 機 能 、 変異に伴う疾患、 タ ン パ ク 質 の 構 造 、 関 連 論 文 を調べる こ と
が できる 。
MGI, ZFIN の 使 い 方
ポ ス ト ゲ ノ ム 研 究 の モ デ ル 生 物 の ウ ェ ブ サ イ ト を 利 用 し て み よう。 こ れ ま で の 研 究 に よ っ て 明
ら か に さ れ て い る 遺 伝 子 の 機 能 が 検 索 できる 。
1 . マ ウ ス ( MGI )
mouse genome informatics : http://www.informatics.jax.org/ 1 . 先頭ペ ー ジ の QuickSearch の枠内 に 遺 伝 子名を入力す る
2 . 入力し た 遺 伝 子 の 情 報 、 遺 伝 子改変 マ ウ ス が リ ス ト さ れ る
試し に Pax6 (眼の 発 生 の上流に あ る転写因子 ) を入力し て み よう
Pax6と言うワ ー ド を含む遺 伝 子 リ ス ト が表示 さ れ る 。 Pax6 を選択す る
得ら れ る 情 報
Symbol/Name/ID : 遺 伝 子 の正式名称、略記
Synonyms :同義語(別名)
Genetic map : 遺 伝 子 の 連 鎖 地 図上の 位置
Sequence Map : 遺 伝 子 の 物 理 地 図上の 位置
Mammalian Homology :哺乳類の相同・類似遺 伝 子
Sequences : ゲ ノ ム 塩 基 配 列 ・ cDNA 塩 基 配 列 ・ ア ミ ノ 酸 配 列 情 報
Phenotypes; ノ ッ ク ア ウ ト マ ウ ス の表現型。 遺 伝 子 の 生 物 機 能 が 分 か る
Polymorphism: 系 統間で 見 ら れ る 配 列 多型。 SNPs ( 1 塩 基 多型) 等
Gene Ontology (GO) : 遺 伝 子 の 機 能 、 構 造
Expression : 発現す る組織の リ ス ト
Protein Domains :転写産物 が持つ ド メ イ ン 構 造 の リ ス ト
References : 関 連 文 献
2 .ゼブ ラ フ ィ ッ シュ( ZFIN)
The Zebrafish Model Organism Database : http://zfin.org/ 1 . Genes/Makers/Clones を開け る
2 . Name/Symbol に 遺 伝 子名を入力し て 検 索
試し に pax6 と入力し て 検 索 し て み よう。
魚類で単独に起こ っ た ゲ ノ ム 重 複 の ため pax6a と pax6b が あ る
Symbol-name で は 遺 伝 子 の 各 種 情 報 が表記さ れ る
Expression で は 、 遺 伝 子 発現の デ ー タ が表記さ れ る
Phenotypeで は 、 ノ ッ クダウ ン と ノ ッ ク ア ウ ト の表現型が表記さ れ る
Locationで は 、染色体上の 位置が表記さ れ る
50
51
1 月 2 2 日 ( 第 1 5回 )
講 義
次 世 代 シ ー ケ ン ス で 読 み 取 ら れ た リ ー ド の 情 報 処 理
ト ラ ン ス ク リ プ ト ー ム 解 析 ( RNA配 列 の 解 析 )
ゲ ノ ム シ ー ケ ン ス
HiSeq2000 だと一つ の リ ー ド長は 100bp 、 HiSeq2500 だと 125bp で 、依頼解 析 に 出 す と 、 1サ ン プ ル あ た りギガ オ ーダー の リ ー ド が USB に コピー さ れ て送ら れ てきま す 。 日本で は 、 次 世
代 シ ー ケ ン ス 解 析 を広く普及す る ために 、 遺 伝 学 研 究所に よ り 、 次 世 代 シ ー ケ ン ス の リ ー ド を
情 報 処 理 す る プ ロ グ ラ ム (Pipeline) が 、 ウ ェ ブ上で無料で 利 用 できる ように 整備さ れ て い ま す 。
有料の プ ロ グ ラ ム の場合 、半年契約で 50 万円あ ま り と高額で す 。 解 析 は 、 大型コ ンピュー
タ ー が 必 要 な の で 、 ク ラ ウ ド シ ス テ ム で 、 配 列 を Pipeline で送り 、 遺 伝 研 の コ ンピュー タ ー で
情 報 処 理 さ れ 、数日後に 解 析 デ ー タ が送ら れ てくる シ ス テ ム に な っ て い ま す 。
シ ー ケ ン ス の サ ン プ ル は 、 ゲ ノ ム DNA の場合 と組織・細胞に 発現す る mRNA(cDNA) に 大別さ
れ ま す 。 ま た 、 解 析 の対象生 物 は 、 参 照 ゲ ノ ム の あ る 生 物 、 新 規 に シ ー ク エ ン ス す る 生 物 に 分
か れ ま す 。 参 照 ゲ ノ ム の あ る 生 物 で は 、 ゲ ノ ム 配 列 の デ ー タ ベ ー ス とcDNA の デ ー タ ベ ー ス が
準備さ れ て い る の で 、 ゲ ノ ム DNA 、 RNA の リ ー ド ともに 参 照 配 列 に直接マ ッ プ す る こ と が でき
ま す 。 ゲ ノ ム DNA で あ れば、 サ ン プ ル間で 、 SNP や配 列 の挿入・欠損を 見 いだす こ と が 可 能 で
す ( ゲ ノ ム リ シ ー ケ ン ス ) 。 RNA で あ れば、 各cDNA に マ ッ プ さ れ る リ ー ド数をカウ ン ト と し
て 、 サ ン プ ル間で比較す る こ と に よ り 、組織に 発現す る 全 遺 伝 子 を同定 す る と ともに 、 サ ン プ
ル間で現量 を比較す る こ と が 可 能 で す ( ト ラ ン ス ク リ プ ト ー ム 解 析 ) 。
参 照 ゲ ノ ム の な い 生 物 の場合 、 リ ー ド を一度、 ア セ ン ブ ル す る 必 要 が あ り ま す 。 こ れも遺 伝
研 の Pipeline で 実 行 できま す 。 ゲ ノ ム の場合 、現在だと HiSeq2500 の リ ー ド を繋いだ
Contig に 、 PacBio の 次 世 代 シ ー ケ ン ス 解 析 の リ ー ド ( 約 10kb) を併用 す る こ と で か な り長い
Scaffold に ま で つ なぎ合わす こ と が 可 能 で す (de novo ゲ ノ ム シ ー ケ ン ス ) 。 RNA の場合 、 リ ー
ド を ア セ ン ブ ル し て得ら れ る Contig が コ ー ド す る 遺 伝 子 を BLASTX に よ り同定 し ま す が 、 こ の
操作も Pipeline の Maser が 解 析 し てくれ ま す 。 さ ら に KEGG の 代 謝 パ ス ウ ェ ー へ の GO(gene ontology)ア ノ テ ー シ ョ ンも同時に 実 行 し てくれ ま す 。
次 世 代 シ ー ケ ン ス を 使 っ た ゲ ノ ム シ ー ク エ ン ス に よ り 、 こ れ ま で の 連 鎖 解 析 で は同定困難で
あ っ た疾患や形質 の 原因遺 伝 子 を 見 つ け 出 す こ と が 可 能 と な っ て い ま す 。最近の 報告例 を 使 っ
て 、紹介し ま す 。
Whole genome association study (WGAS)コ ン ト ロ ー ル群と 実験群(表現形質 : 例えば左利き) で 、 全 ゲ ノ ム にわた っ て SNP の
出現頻度を比較す る 。表現型の責任遺 伝 子近傍の SNP で は表現型集団で一致度が高くな
る の で 、それ を 検 出 す る こ と で責任遺 伝 子 の ゲ ノ ム上の 位置を特定 す る 。
Exome 解 析
メ ン デ ル 遺 伝 す る 1 遺 伝 子 に よ る レ ア な 遺 伝 子疾患の場合 、 コ ー ド領域の 変異に よ り
52
ア ミ ノ 酸 の置換 が起こ っ て い る こ と が 多 い 。 こ の技術 で は 、 ゲ ノ ム の エ ク ソ ン の み 配 列
を 解 読 す る こ と で 、患者に特異的な 塩 基置換 、 InDelを 検 出 す る こ と で 、 遺 伝 子疾患の
責任遺 伝 子 を特定 す る 。 総 エ ク ソ ン の 塩 基 配 列 は 、 ゲ ノ ム の 1 %程度な の で 、 解 析 量 が
少なくて すむ。場合 に よ っ て は 、 5 名程度の患者を 解 析 す るだけ で 、 原 遺 伝 子 が特定 さ
れ る 例もあ る 。
Rad-Seq ゲ ノ ム を特定 の制限酵素で消化 し 、消化断片の末端を 次 世 代 シ ー ケ ン ス で 解 析 し 、
SNAP を 検 出 す る 。通常の NGS ゲ ノ ム 解 読 で は ラ ンダム に断片化 す る の で 、 集団間で
リ ー ド を直接比較す る こ と は不可 能 で あ る の に対し 、 Rad-Seq の場合 に は 、制限酵素の
切り口がそろっ て い る の で 、 ゲ ノ ム 全体にわた っ て リ ー ド を高速か つ間便に 系 統間で す
る こ と が 可 能 で あ る 。農林水産で の品種 の 解 析 に 有効だと思われ る 。
講 義ポ ス ト ゲ ノ ム 研 究
様々な 生 物 の ゲ ノ ム 配 列 が 解 読 さ れ る ように な り 、 ゲ ノ ム 配 列 を 使 っ た 新 し い 研 究 が ス タ ー
ト し て い ま す 。 ゲ ノ ム 配 列 が 利 用 できる と言う前提 のもと に始ま る 研 究 が ポ ス ト ゲ ノ ム 研 究 で
す 。その 内 容 は 、 遺 伝 子 の 機 能 解 析 、 生 物 進 化 、 遺 伝 子疾患の 原因遺 伝 子 の探索 など多岐にわ
た り ま す 。 こ の 授 業 で は 、時間の 関 係 か ら「生 物 進 化 と ゲ ノ ム」の トピッ ク ス に つ い てだけ紹
介し ま す 。
ポ ス ト ゲ ノ ム 研 究 - 1
比較ゲ ノ ム 学 : 進 化 に伴うゲ ノ ム 構 造 の 変 化
進 化的に隔た っ た 多様な 生 物 で ゲ ノ ム 解 読 が 行われ た こ と に よ り 、 種 内 の パ ラ ロ グ の 検
索 、 ま た異な る 生 物間で オ ル ソ ロ グ を比較す る こ と 、 遺 伝 子 ファミ リ ー の メ ン バ ー を比較
す る こ と が 可 能 に な り ま し た 。 ま た染色体上の 遺 伝 子 の 配 列 を 系 統的に離れ た 生 物間で比
較す る こ と に よ り 、それ ら の共通祖先生 物 の染色体構 造 を推定 す る こ と が 可 能 と な っ て い
ま す 。比較ゲ ノ ム は 、 こ の ように 生 物間で ゲ ノ ム を比較し て 、 進 化 を 論じる 研 究 分野で す 。
授 業 で は 、哺乳類と魚類の比較ゲ ノ ム を紹介し ま す 。
フ グ と ヒ ト は 、 進 化的観点か ら 見 る と脊椎動物 系 統 樹 の両端に 位置し ま す 。脊椎動物 は 、
大 部 分 の魚類を含む条鰭類、それ と シ ー ラカン ス ・肺魚および四肢動物 を含む総鰭類の 2
つ の グ ル ー プ に 大別さ れ ま す 。条鰭類と 総鰭類は 4億5千年前に 分岐し ま し た 。 フ グ と ヒ
ト の ゲ ノ ム 構 造 を比較す る こ と に よ り 、 4億 5 千年前に 生きて い た 総鰭類と条鰭類の共通
祖先(もちろん現存し な い ) の ゲ ノ ム 構 造 が 明 ら か と な り 、その後の ゲ ノ ム 構 造 の 変 化 が
解 明 さ れ ま し た 。 解 析 の 結 果 、脊椎動物 の ゲ ノ ム の 進 化 に つ い て 、 次 の ような 予想もさ れ
て い な か っ た 結 果 が得ら れ ま し た 。
( 1 ) 4億 5 千年前に 生きて い た 総鰭類と条鰭類の共通祖先は 1 2組の染色体を
持っ て い た 。
( 2 ) 総鰭類で は条鰭類と 分 か れ た直後に 、 ゲ ノ ム に 大 量 の レ ト ロ ウ ィ ル ス が挿
入さ れ 、 ゲ ノ ム サ イ ズ が 大きくな っ た 。その後染色体間の転移と融合 ( ミ キ シ ン
53
グ ) が頻繁に起こ っ た 。
( 3 ) 条鰭類で は 総鰭類と 分 か れ た直後に 、 ゲ ノ ム の倍化 (脊椎動物 の誕生 か ら
数える と 3度目) が起こ っ た 。 重 複 し た 遺 伝 子 の 大 部 分 は片方 が ゲ ノ ム か ら脱落し
た が 、約 20 %の 遺 伝 子 は倍加 し た ま ま現在でも機 能 遺 伝 子 と し て働い て い る 。そ
の ため、 ゲ ノ ム上の 遺 伝 子数は条鰭類の 方 が 総鰭類よ りも 20 %程多 い 。 こ の よう
な 遺 伝 子数の 増 加 が 、魚類に形態や環境適応の 多様性 をもた ら し た の で は な い か と
考えら れ て い る 。 ま た条鰭類で は染色体へ の レ ト ロ ウ ィ ル ス の挿入はわずか で あ り 、
染色体の ミ キ シ ン グもわずか で あ る 。
ま た 、無脊椎動物 でも進 化的に 重 要 な 位置に あ る ホヤやナ メ ク ジ ウ オ の ゲ ノ ム 解 読 が 行
われ 、哺乳類でも多数の 生 物 の ゲ ノ ム が 解 読 さ れ て い ま す 。 生 物間で ゲ ノ ム を比較す る こ
と に よ り 、臭覚受容 遺 伝 子 が無脊椎動物 か ら脊椎動物 の 進 化 の過程で 遺 伝 子数を 増 加 し て
きた こ と が 、 明 ら か に な っ て い ま す 。 ま た胎盤の 進 化 で は 、 レ ト ロ ト ラ ン ス ポゾン由来の
遺 伝 子 が 重 要 な役割を 果 た し て い る と いう、意外な事実も示唆さ れ て い ま す 。 ま た ヒ ト と
チ ン パ ン ジ ー で は 、 塩 基 の置換率は た っ た 1.23%で す が 、反復 配 列 の挿入が ヒ ト の 方 が か
な り 多 い こ と が 分 か り ま し た 。 こ の ように挿入配 列 は 、以前考えら れ て い た ような たんな
る ガ ラ ク タ で は な い こ と が 分 か っ てきま し た 。
シ ン テ ニ ー
異な る脊椎動物 ( 例えば、 ヒ ト - マ ウ ス 、 ヒ ト - フ グ ) を過去に遡る と 、共通祖先が存在し
ま す 。共通祖先か ら 分岐し た あ と 、それぞれ の 系 で転座と融合 が起こ っ て い る が 、小さ な ブ
ロ ッ ク単位 で 見 る と 遺 伝 子 の 並びが一致す る領域が あ り ま す 。染色体上で 遺 伝 子 の 並びが一致
し て い る状態は 、 シ ン テニー と呼ばれ ま す 。 全 ゲ ノ ム が 解 読 さ れ る と ゲ ノ ム 全体を 生 物間で比
較す る こ と が 可 能 と な り 、 シ ン テニー の様子 が 明 ら か と な り ま す 。
ヒ ト と マ ウ ス を比べる と 、哺乳類同士の ため、 明瞭に シ ン テニー の保存状態が 見 て 取 れ ま す 。
一方 、魚類で は四肢動物 と 分 か れ て か ら直後に 全 ゲ ノ ム の 重 複 が起こ っ て い る ため、魚類の
染色体は ヒ トやマ ウ ス の染色体に対し て 2 重 の シ ン テニー を 示 す特徴が あ り ま す 。
54
以下工事中
以 下 、 今 年 使 用 し な か っ た 過 去 の 資 料
1 月 16 日 ( 第 14 回 )
ポ ス ト ゲ ノ ム 研 究 ( 3 )
— 機 能 ゲ ノ ム 学—
- ゲ ノ ム を比較し て 遺 伝 子 の 発現調節機 構 を探る - ポ ス ト ゲ ノ ム 研 究 の 重 要 な テ ー マ と し て 、 全 て の 遺 伝 子 の 機 能 を調べる こ と に 加えて 、 遺 伝
子 の転写調節に 重 要 な 配 列領域を 見 つ け る こ と が あ り ま す 。転写調節領域は 遺 伝 子 が何時、何
処 で 、どれだけ 発現さ れ る か と言う情 報 を コ ー ド し て い る こ と か ら 、 生 物 の形態や環境適応の
多様性 の背景に あ る ゲ ノ ム 情 報 は 、 タ ン パ ク 質 コ ー ド領域よ りもむしろ転写調節領域に存在す
る場合 が 多 いもの と 予想できま す 。
特に胚発 生 など生 物 の 基本的な 生命現象に 関 係 す る 遺 伝 子 ( 例えば sonic hedghogや Pax 遺 伝
子 ) の転写調節領域は 、 生 物間で強く保存さ れ る傾向に あ り ま す 。 ゲ ノ ム 情 報 を 利 用 す る こ と
に よ り 、 遺 伝 子 発現に 必須の領域を 検 索 し た り 、 生 物間で 変異が起こ っ て い る領域を 見 つ けだ
し 、それ ら の 機 能や生 物 学的意味を 解 析 す る 研 究 分野は 、 機 能 ゲ ノ ム 学 と呼ばれ ま す 。 授 業 で
は 、 ヒ ト と フ グ の非コ ー ド領域の比較か ら 、 遺 伝 子 の転写調節に 重 要 な領域( CNE; conserved non-coding elements ) を 見 つ けだし た 研 究事例 を紹介し ま す 。
実 習今日 は 、 こ れ ま で の 実 習 の 復 習 を 行 い ま す 。
lefty と言う名前の 遺 伝 子 を材料に し て 復 習 を し ま しょう:
lefty の 機 能 の 検 索
メ ン バ ー の同定
遺 伝 子 の 発現パ タ ー ン
ヒ ト とゼブ ラ で 分 子 系 統 樹 を 作 製
メ ン バ ー の 進 化的関 係 を推定 し よう
1 月 10 日 ( 13 回 )
1 . ゲ ノ ム 解 読 で 明 ら か に な っ た ヒ ト ゲ ノ ム の特徴、医療へ の 利 用 に つ い ても簡単に紹
介し ま す
ポ ス ト ゲ ノ ム 研 究 - 2
次 世 代 シ ー ケ ン ス を 使 っ た ゲ ノ ム シ ー ク エ ン ス に よ り 、 こ れ ま で の 連 鎖 解 析 で は同定困難で
55
あ っ た疾患や形質 の 原因遺 伝 子 を 見 つ け 出 す こ とも可 能 と な っ て い ま す 。 こ の技術 は 、 whole genome association study (WGAS) と呼ばれ ま す 。最近の 報告例 を 使 っ て 、 WGAS に つ い て紹介
し ま す 。
ま た 、 ゲ ノ ム の 多様性 ( 多型性 ) をもた ら す 配 列 変 化 に つ い ても説 明 し 、 配 列 の 多様性 が動
物 の形質 と リ ン ク し て い る 例 を紹介し ま す 。
実 習発現デ ー タ ベ ー ス を 使 っ た シ ミュレ ー シ ョ ン 実験( 1 )
- digital differential display - ゲ ノ ム 解 読 プ ロ ジ ェ ク ト の 進めら れ て い る 生 物 で は 、 EST (expressed sequence tags) の 塩 基
配 列 解 読 プ ロ ジ ェ ク トも並 行 し て 進めら れ て い ま す 。 EST プ ロ ジ ェ ク ト で は 、組織あ る い は細
胞種ごと に 、 cDNA ラ イ ブ ラ リ ー か ら無作為に ク ロ ー ン を選んで 配 列 ( 5’, 3’ 末端の ワ ン パ ス
シ ー ク エ ン ス ) を 解 析 し て い ま す 。 EST デ ー タ ベ ー ス で は 、同定 さ れ た 遺 伝 子 種 とその数値
(何個検 出 さ れ た か ) が組織あ る い は細胞種ごと に 整 理 さ れ て い ま す 。従っ て デ ー タ に は 、 各
組織に 発現し て い る 遺 伝 子 種 と 遺 伝 子ごと の相対的な 発現強度が反映さ れ て い る こ と に な り ま
す 。 こ れ ら の デ ー タ は 、 ト ラ ン ス ク リ プ ト ー ム (Transcriptome) と呼ばれ ま す 。 こ の デ ー タ を
利 用 す る こ と に よ り 、調べた い組織に 発現し て い る 遺 伝 子 の 種類と 発現強度、組織間で 発現強
度の異な る 遺 伝 子 を調べる こ と が できま す 。 コ ンピュー タ ー で 遺 伝 子 発現を調べる操作 は 、
digital differential display と呼ばれ ま す 。 授 業 で は 次 の 例 題 を 使 っ て 、 digital differential displayの操作 を 実 習 し ま す 。
例 題 1 . 生 物 の 各器官で 発現す る 遺 伝 子 の 種類と 発現強度を調べる
ウ シ の乳腺で 発現す る 遺 伝 子 種 とその強度は ?
例 題 2 . 2 つ の細胞種 で 発現量 が異な る 遺 伝 子 を調べる
マ ウ ス の ES 細胞 (Embryonic stem cells) と胚細胞 (Blastocytes) で 発現量 の異な る 遺 伝
子 は ?
例 題 3 . あ る 生 物 の 2 つ の器官で 発現量 が異な る 遺 伝 子 を調べる
マ ウ ス の小脳 (Cerebellum) と 大脳皮質 (Cortex) で 発現量 の異な る 遺 伝 子 は ?
Digital differential display (DDD) の ペ ー ジ の開け 方
NCBI の Transcriptome 情 報 を 使う - Digital differential display1 . NCBIの先頭ペ ー ジ に あ る All Resources か ら 、 Digital differential display (DDD) を選択
例 題 1 . 生 物 の 各器官で 発現す る 遺 伝 子 の 種類と 発現強度を調べる
ウ シ の乳腺 (mammary gland) で 発現す る 遺 伝 子 種 とその強度は ?
手順
1 . Species を Bos taurus に選択、 continue を ク リ ッ ク
2 . 組織名( Mammary gland ) の ID番号を ク リ ッ ク 。 発現強度の強い 遺 伝 子 か ら順に表
記さ れ る 。 TMP は 、 100 万個の mRNA 当た り に 出現す る個数を 示 す 。
56
例 題 2 . あ る 生 物 の 2 つ の器官・細胞で 発現量 が異な る 遺 伝 子 を調べる
マ ウ ス の ES 細胞 (Embryonic stem cells) と胚細胞 (Blastocytes) で 発現量 の異な る 遺 伝
子 は ?
1 . Species を Mus musculus に選択、 continue を ク リ ッ ク
2 . まずA ( こ こ で は Embryonic stem cells ) の ID番号 (15703, 15704, 15705) を
選択、上の枠内 に名前( ES cells ) と記入し 、 continue を押す
3 . B の組織( こ こ で は Blastocytes ) の ID(850, 875, 1021, 10026) を チ ェ ッ ク し 、
枠内 に名前( Blastocytes ) と記入し 、 continue を押す
4 . A と B で 発現強度が 有意に異な る 遺 伝 子 が 、表示 さ れ る
5 .
1 月 17 日 ( 第 14 回 :最終回 )
講 義次 世 代 シ ー ケ ン サ ー の応用 に つ い て 2 例紹介し ま す 。
1 . RANA-seq: Transcriptome 解 析 ( mRNA の 発現プ ロ ファイ ル の 解 析 、 サ ン プ ル間比
較)
2 . Rad –seq: ゲ ノ ム 全体をカバ ー す る簡便な SNP マ ーカー の 収 集
2 つ の 方 法 とも農学 分野の 研 究 に非常に 有効で す 。
RANA-seq:組織に 発現し て い る 遺 伝 子 をほぼ全 て 網羅的に同定 す る こ と が できま す 。 ま た 各 遺
伝 子 の 発現量 (組織にm RNA が何コピー 発現し て い る か )も数値化 さ れ ま す 。従っ て 、組織の
遺 伝 子 発現プ ロ ファイ ル が 明 ら か に な るだけ で なく、 2 つ の サ ン プ ル ( 例えば、対照区と 実験
区) で 発現し て い る 全 遺 伝 子 の 発現量 を比較す る こ と が できま す 。
Rad –seq:通常の ゲ ノ ム シ ー ケ ン ス で は 、精製 し た ゲ ノ ム DNA を 物 理的に 300bp 程度に切断し て 、
断片の両側か ら 100bp を シ ー ケ ン ス し ま す 。 物 理的に切断す る の で断片は完全 に ラ ンダム な ゲ
ノ ム断片と な り ま す 。 Rad –seq で は 、決ま っ た 4 塩 基 あ る い は 6 塩 基 の 配 列 を認識し て切断す
る制限酵素で ゲ ノ ム を断片化 し 、断片の両側か ら 100bp を シ ー ケ ン ス し ま す 。異な る 系 統 でも、
同じ部 位 で ゲ ノ ム が切断さ れ る の で 、断片の 配 列 を 2 系 統 で直接比較( ア ラ イ メ ン ト ) す る こ
と が 可 能 と な り ま す 。 100bp の中に存在す る SNP を同定 でき、 ゲ ノ ム 全体にわた っ て SNP を ま
んべんなく収 集 す る こ と が 可 能 で す 。高密度な SNP マ ーカー が短時間で一挙に得ら れ る ため、
品種間の 遺 伝的差異や形質 の 連 鎖 解 析 に 有効に 利 用 できま す 。
57
ポ ス ト ゲ ノ ム 研 究 ( 1 )
— ゲ ノ ム に存在す る 全 て の 遺 伝 子 の 機 能 を調べる
全 ゲ ノ ム 塩 基 配 列 の 解 読 の あ と にくる最も重 要 な 研 究課題 と し て 、 ゲ ノ ム に存在す る 全
て の 遺 伝 子 の 機 能 解 明 が あげら れ ま す 。 遺 伝 子 の 機 能 を 解 析 す る ス ト ラ テ ジ ー は 、 大きく
分 け る と フ ォ ワ ー ド ジ ェ テ ィ ク ス ( Forward Genetics: 順遺 伝 学 ) と リ バ ー ス ジ ェネテ ィ ク
ス ( Reverse Genetics: 逆遺 伝 学 ) に 分 け る こ と が できま す 。 マ ウ ス 、ゼブ ラ フ ィ ッ シュ、
シ ョ ウ ジ ョ ウ バ エ 、線虫は こ れ ら ポ ス ト ゲ ノ ム 研 究 の モ デ ル 生 物 と し て 用 い ら れ て い ま す 。
リ バ ー ス ジ ェネテ ィ ク ス は 、 遺 伝 子 の 生体内 で の 機 能 を 解 明 す る ための最も直接的な 方
法 で 、 遺 伝 子 の 機 能 を破壊し 、 発 生や器官形成 、 代 謝 、 行動に表れ る表現型を 解 析 し 、表
現型か ら 遺 伝 子 の 機 能 を 解 明 し ま す 。 遺 伝 子 の 機 能破壊の 方 法 に は 、 遺 伝 子 ノ ッ クダウ ン
あ る い は 遺 伝 子 ノ ッ ク ア ウ ト の 2 つ が あ り ま す 。上の モ デ ル 生 物 で は いずれも、 遺 伝 子破
壊に よ る 全 遺 伝 子 の 機 能 解 明 プ ロ ジ ェ ク ト が 進めら れ て い ま す 。線虫と魚類は 、 ア ン チ セ
ン ス技術 を個体レ ベ ル で適応できる点で 、 遺 伝 子 機 能 解 析 に圧倒的に 有 利 で す 。特に線虫
は 、 RNAi法 で簡単に 遺 伝 子 機 能 を破壊できる こ と か ら 、ゴー ル ( 全 遺 伝 子 の 機 能 解 明 ) に
最も近い と言えま す 。線虫で は 機 能破壊に よ り寿命が延びる と言うような興味深い 遺 伝 子
も見 つ か っ て い ま す 。
遺 伝 子 機 能 を 解 明 す るうえで 、 ノ ッ ク ア ウ ト マ ウ ス は 重 要 な役割を 果 た し て い ま す が 、
ES 細胞で相同組み 換えに よ り 遺 伝 子破壊を 行 い 、その ES 細胞を胚移植し て ノ ッ ク ア ウ
ト個体を 作 製 す る に は 、 1 年あ ま り 必 要 で す 。最近、 TALEN 法 、 CRISPR/Cas9 法 と よばれ
る 新 し い ノ ッ ク ア ウ ト と ノ ッ ク イ ン技術 が開発 さ れ て い ま す 。卵生 の魚類やカエ ル で は 、
受精卵に コ ン ス ト ラ ク と の RNA を顕微注入す るだけ で 遺 伝 子 の ノ ッ ク ア ウ ト が 可 能 で す 。
ま た TALEN 法 は 原 理的に は 、 遺 伝 子疾患の 原因で あ る 変異遺 伝 子 の 配 列 を正常に治癒させ
る こ とも可 能 で す 。 iPS 技術 と組み 合わせる と 遺 伝 子治療へ の 発展が期待できま す 。 授 業
で は簡単に TALEN 法 と CRISPR/Cas9 法 の 原 理 を 解 説 し ま す 。
講 義
脊椎動物 の中で はゼブ ラ フ ィ ッ シュが 、 モ ル フ ォ リ ノ オ リゴを 使 っ た ア ン チ セ ン ス技術
で 遺 伝 子 機 能 を破壊できる点で 、 遺 伝 子 機 能 の 解 析 が 容易だと言えま す 。 具体的に は 、顕
微注入に よ り ア ン チ セ ン ス モ ル フ ォ リ ノ オ リゴを受精卵に注入し 、 発 生 で現れ る表現型
(体に表れ る異常) を調べる こ と で 、 遺 伝 子 機 能 を 解 析 す る こ と が 可 能 で す 。 ただし こ の
方 法 で 解 析 できる の は 、受精後 2 日以内 に働く遺 伝 子 に限ら れ 、 成人病に 関 連 す る ような
遺 伝 子 等 の 機 能 は 解 析不能 で す 。ゼブ ラ フ ィ ッ シュの ウ ェ ブ サ イ ト ( ZFIN) で は 、誰に で
も機 能破壊実験を 行うこ と が できる ように 、 各 遺 伝 子 の 機 能破壊に 必 要 な モ ル フ ォ リ ノ オ
リゴの 塩 基 配 列 が掲載さ れ て い ま す 。
一 方 、 フ ォ ワ ー ド ジ ェ テ ィ ク ス で は 、 点 変 異 を 誘 導 す る 化 学 変 異 源 ( ENU. Ethyl nitrosourea ) に よ り突然変異体の ラ イ ブ ラ リ ー を まず作 製 し ま す 。様々な表現型の突然変
58
異体が得ら れ ま す が 、 こ の時点で は突然変異体でどの 遺 伝 子 に 変異が起こ っ て い る の か
( 原因遺 伝 子 、責任遺 伝 子 ) は 明 ら か で あ り ません。 フ ォ ワ ー ド ジ ェ テ ィ ク ス で は 、 遺 伝
マ ーカー (主に マ イ ク ロ サ テ ラ イ ト ) と の 連 鎖 解 析 に よ り 、 原因遺 伝 子 を 連 鎖 地 図 に マ ッ
プ し 、組換え率が 0.1% 程度の マ ーカー が 見 つ か る ま で 連 鎖 解 析 を 進めま す 。 見 つ か っ た
近隣マ ーカー近くの 変異体ゲ
ノ ム を 解 読 し 、突然変異に よ り 塩 基置換 が起こ っ て い る場所を探し 出 し ま す 。 こ の 方 法 は 、
ポ ジ シ ョ ナ ル ク ロ ーニン グ と呼ばれ ま す 。
デ ー タ ベ ー ス を 使 っ た 遺 伝 子 機 能 の 検 索
ENTREZNCBIの 全 デ ー タ ベ ー ス ( 配 列 、 文 献 、 遺 伝 子 発現、 SNP 等々) に納めら れ て い る 情 報 か
ら 、 キ ー ワ ー ド 検 索 に よ り 関 連 情 報 を 網羅的に 検 索 できる サ イ ト
ENTREZ の 利 用
NCBI (http://www.ncbi.nlm.nih.gov/) に は 、 キ ー ワ ー ド で 全 て の デ ー タ ベ ー ス を一挙に 検 索 す る
ツ ー ル ENTREZ が あ り ま す 。 ENTREZ で キ ー ワ ー ド 検 索 す る と 、 配 列 情 報 、 文 献 情 報 、
OMIM 、 OMIA 、 立体構 造 等々の デ ー タ がもれ なく検 索 さ れ てきま す 。 ENTREZ を 利 用 す れば、
タ ン パ ク 質 の 構 造や遺 伝病等 に 関 す る 情 報 を一挙に入手 す る こ と が でき、非常に便利 な 検 索 シ
ス テ ム と いえま す 。
ENTREZ の 使 い 方
・ 開け 方 : NCBIの先頭ペ ー ジ All databeses で 、枠内空欄の ま ま Search を ク リ ッ ク
・ 枠内 に 遺 伝 子名(略字 等 ) を入力し て 検 索
・ 調べた 遺 伝 子 に つ い て NCBIの デ ー タ ベ ー ス に あ る 情 報 が 全 て表示 さ れ る (数字 は デ ー タ
ベ ー ス に納めら れ て い る 情 報 の数を 示 す )
講 義
推薦図 書
ゲ ノ ム 関 連
「ゲ ノ ム」岡崎康司 / 坊農秀雅監訳・ メ デ ィカル ・ サ イ エ ン ス ・ イ ン タ ー ナ シ ョ ナ ル社
( 9,500 円)
「ゲ ノ ム 研 究 実験ハン ド ブ ッ ク」辻本豪三、田中利男・羊土社( 6,500 円)
「大 規模ゲ ノ ム 解 析 と ポ ス ト シ ー ク エ ン ス時代 の 遺 伝 子 機 能 解 析」林崎良英監修・中山書
店( 3,600 円)
「比較ゲ ノ ム か ら 読 み 解く生命シ ス テ ム」藤山秋佐夫監修・秀潤社( 4,000 円)
バ イ オ イ ン フ ォ マ テ ィ ッ ク ス 関 連
「生命科学 デ ー タ 解 析」 坊農秀雅・ メ デ ィカル ・ サ イ エ ン ス ・ イ ン タ ー ナ シ ョ ナ ル社
( 3240 円)
「バ イ オ イ ン フ ォ マ テ ィ ッ ク ス 基礎講 義 - 一歩進んだ発想を み がくために」岡崎康司 / 坊農秀雅 監訳・ メ デ ィカル ・ サ イ エ ン ス ・ イ ン タ ー ナ シ ョ ナ ル社( 3,900 円)
「バ イ オ イ ン フ ォ マ テ ィ ッ ク ス がわか る」菅原秀明 ・羊土社( 4,200 円)
「ゲ ノ ム 情 報 は こう活かせ」岡崎康司 / 坊農秀雅・羊土社( 4,410 円)
59
「即活用 の ための バ イ オ イ ン フ ォ マ テ ィ ッ ク ス入門 」広川貴次 / 美宅成 樹著・中山書店
( 3,500 円)
「バ イ オ デ ー タ ベ ー ス と ウ ェ ブツー ル の 手 と り足と り活用 法 」中村保一ら編集 ・羊土社
( 3,800 円)
「できる バ イ オ イ ン フ ォ マ テ ィ ッ ク ス」広川貴次 / 美宅成 樹著・中山書店( 3,500 円)
「 バ イ オ イ ン フ ォ マ テ ィ ッ ク ス 」 メ デ ィカル ・ サ イ エ ン ス ・ イ ン タ ー ナ シ ョ ナ ル 社
( 9,500 円)
「バ イ オ リ ソ ー ス&デ ー タ ベ ー ス活用 術」秀潤社( 4,600 円)
「バ イ オ イ ン フ ォ マ テ ィ ク ス事典」日本バ イ オ イ ン フ ォ マ テ ィ ク ス 学会編集 ・共立 出版
( 14,000円)
ウ ェ ブ サ イ ト
研 究室 home page http://www.agri.tohoku.ac.jp/bioinfor/index-j.html =========================================================================
文 献 検 索 、 塩 基 配 列 、 ホ モ ロ ジ ー 検 索 、 ORF finder 、 Map viewer 等
NCBI http://www.ncbi.nlm.nih.gov/ (National Center for Biotechnology Information)
塩 基 配 列 、 ホ モ ロ ジ ー 検 索 、 分 子 系 統 樹 作 成 、 シ ー ク エ ン ス登録等
DDBJ http://www.ddbj.nig.ac.jp/Welcome-j.html (DNA Data Bank of Japan)
塩 基 配 列 、 ホ モ ロ ジ ー 検 索 、 タ ン パ ク 質 の 構 造 ( ド メ イ ン ・ モ チ ー フ 検 索 等 ) 解 析
EBI http://www.ebi.ac.uk/Information/ (European Bioinformatics Institute)
ゲ ノ ム 配 列 の デ ー タ ベ ー ス
Ensembl http://www.ensembl.org/index.html=======================================================================
分 子 系 統 樹 作 成
ClustalW http://clustalw.genome.jp/ =======================================================================
タ ン パ ク 質 ・ 遺 伝 子 の 機 能 検 索
オ ン ト ロ ジ ー
http://www.geneontology.org/ http://www.pir.uniprot.org/ ド メ イ ン ・ モ チ ー フ 検 索 http://www.ebi.ac.uk/Information/
60
シ グ ナ ル ペ プ チ ド の 予 測
http://www.cbs.dtu.dk/services/SignalP/ 3D 立体構 造 の 予 測 、 DNA の翻訳 http://ca.expasy.org/ノ ッ ク ア ウ ト マ ウ ス の表現型 http://www.informatics.jax.org/ =======================================================================
転写調節領域の モ チ ー フ 検 索
転写因子 の 結 合 部 位 予 測 http://www.cbrc.jp/research/db/TFSEARCHJ.html ======================================================================
代 謝 経 路
KEGG http://www.genome.jp/kegg/pathway.html =======================================================================
ゲ ノ ム 研 究 の モ デ ル 生 物
マ ウ ス
http://www.informatics.jax.org/ツメ ガ エ ル http://genome.jgi-psf.org/cgi-bin/runAlignment?db=frog4x1ミ ド リ フ グ フ グ ゲ ノ ム デ ー タ ベ ー ス
http://www.genoscope.cns.fr/externe/tetranew/ト ラ フ グ フ グ ゲ ノ ム デ ー タ ベ ー ス
http://fugu.biology.qmul.ac.uk/ト ラ フ グ フ グ ゲ ノ ム デ ー タ ベ ー ス
http://genome.jgi-psf.org/cgi-bin/runAlignment?db=fugu6&advanced=1ゼブ ラ フ ィ ッ シュ http://zfin.org/
http://www.ensembl.org/Danio_rerio/index.htmlメダカ http://shigen.lab.nig.ac.jp/medaka/
http://medakagb.lab.nig.ac.jp/Oryzias_latipes/index.htmlシ ョ ウ ジ ョ ウ バ エ
http://www.ncbi.nlm.nih.gov/BLAST/Genome/Insects.html http://genome.med.yale.edu/lab/index.htm線 虫
http://omicspace.riken.jp/Ce/rnai/jsp/index.jsp 酵 母
http://www.ncbi.nlm.nih.gov/mapview/map_search.cgi?taxid=4932 http://www.fhcrc.org/science/labs/kruglyak/Data/
=======================================================================
cDNA, EST 情 報
マ ウ ス cDNA http://fantom3.gsc.riken.jp/index.htmlア フ リカツメ ガ エ ル EST http://xenopus.nibb.ac.jp/
61
メダカ EST http://medaka.lab.nig.ac.jp/est_index.htmlカタユウ レ イボヤ EST http://ghost.zool.kyoto-u.ac.jp/indexr1.html
=========================================================================
microarray に 関 す る 情 報
ヒ ト繊維芽細胞 http://genome-www.stanford.edu/serum/data.htmlシ ョ ウ ジ ョ ウ バ エ http://genome.med.yale.edu/Lifecycle/
=========================================================================
その他
http://genes.mit.edu/GENSCAN.html http://www.tigr.org/software/microarray.shtml http://motif.genome.jp/ http://www.rcsb.org/pdb/
=============================================================
62