遺伝子発現解析と データマイニング - 京都大学ocw...データマイニング...

22
遺伝子発現解析と データマイニング 統合薬学教育開発分野 奥野 恭史 [email protected] 眦ブ穟硪碟硪箐窊碝竨䅏硇磺祲◉4 2005.6.

Upload: others

Post on 10-Feb-2020

1 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 遺伝子発現解析と データマイニング - 京都大学OCW...データマイニング データマイニングとは 蓄積したデータから、意味のある相関関係やパター

遺伝子発現解析とデータマイニング

統合薬学教育開発分野奥野 恭史

[email protected]

2005.6.

work
テキストボックス
Page 2: 遺伝子発現解析と データマイニング - 京都大学OCW...データマイニング データマイニングとは 蓄積したデータから、意味のある相関関係やパター

ゲノム情報から創薬へ

┑┑

•分子生物学技術•細胞生物学技術•ゲノム解析

•遺伝子発現解析•プロテオーム解析•疾患モデル(KO)解析

•コンビナトリアルケミストリー•ハイスループットスクリーニング•情報化学・計算化学

•薬理学•薬物代謝学•薬物動態学

•バイオスタティスティクス•臨床インフォマティクス•ゲノム多型解析

•ケミカルゲノミクス•医薬品合成化学•構造生物学

バイオインフォマティクス

Page 3: 遺伝子発現解析と データマイニング - 京都大学OCW...データマイニング データマイニングとは 蓄積したデータから、意味のある相関関係やパター

機能ゲノミクス

複製

DNA mRNA タンパク質転写

逆転写

翻訳

・セントラルドグマ(ゲノム情報から機能発現までのプロセス) 

・生命の機能発現の大半はタンパク質が担う。・mRNAはタンパク質の機能発現を示す指標の一つである。

mRNAの発現量(遺伝子発現情報)を検出すれば機能解析につながる

Page 4: 遺伝子発現解析と データマイニング - 京都大学OCW...データマイニング データマイニングとは 蓄積したデータから、意味のある相関関係やパター

マイクロアレイ

マイクロアレイはmRNAの発現量(遺伝子発現情報)を網羅的に検出する

患者 動物 細胞株

適切な組織サンプルの採取

RNAの抽出

マイクロアレイ実験

解析(データマイニング)

サンプル中のmRNA発現量を網羅的に算出

Page 5: 遺伝子発現解析と データマイニング - 京都大学OCW...データマイニング データマイニングとは 蓄積したデータから、意味のある相関関係やパター

マイクロアレイ解析フロー(GeneChip)

1.cDNA / cRNA合成

2.ハイブリダイゼーション

3.蛍光標識

4.スキャニング

5.データ解析

Page 6: 遺伝子発現解析と データマイニング - 京都大学OCW...データマイニング データマイニングとは 蓄積したデータから、意味のある相関関係やパター

DNAチップスライドガラス等の基盤上に数千~数万種類の遺伝子断片(プローブ)を固定させたもの

<分類>・スポット型マイクロアレイ:Stanford方式   cDNAプローブ配列をガラススライドにスポットしたマイクロアレイ   Stanford大P.Brownが開発・オリゴヌクレオチドマイクロアレイ:Affymetrix方式   25塩基長のオリゴヌクレオチドをアレイ上に合成   Affymetrix社が開発、GeneChip・スポット型オリゴヌクレオチドマイクロアレイ

Page 7: 遺伝子発現解析と データマイニング - 京都大学OCW...データマイニング データマイニングとは 蓄積したデータから、意味のある相関関係やパター

ハイブリダイゼーション ・物質がお互いを認識し、結合する現象 ・マイクロアレイでは、相補的配列をもつ核酸同士であ  るプローブと、ターゲットが特異的に結合すること

標識物質ターゲット(cDNAまたはcRNA)

 プローブ (オリゴヌクレオチド またはcDNA)

相補鎖による特異的結合

Page 8: 遺伝子発現解析と データマイニング - 京都大学OCW...データマイニング データマイニングとは 蓄積したデータから、意味のある相関関係やパター

発現低い 発現高い

マイクロアレイから得られるデータ

<GeneChipのスキャン結果>

1. コントロール 2. サンプル

遺伝子 a ab bc ce gf gd de f

拡大 色を数値化する

a b c d e f g a b c d e f g① ②8 92 27 95 56 610 93 5

Page 9: 遺伝子発現解析と データマイニング - 京都大学OCW...データマイニング データマイニングとは 蓄積したデータから、意味のある相関関係やパター

1. Scan data 2. 遺伝子の発現量の 数値化

3. サンプルの遺伝子の発現量の数値 のマトリックス化

サンプル1

サンプル2

サンプル15

・・

・・

j

15

マイクロアレイ解析(データ行列)

サンプル

遺伝子

bacde

1 2

・・op

・ ・・

a b c d e f g h i j k lm n o p

a b c d e f g h i j k lm n o p

a b c d e f g h i j k lm n o p

Page 10: 遺伝子発現解析と データマイニング - 京都大学OCW...データマイニング データマイニングとは 蓄積したデータから、意味のある相関関係やパター

遺伝子

サンプル

マイクロアレイ解析(クラスター解析)

遺伝子とサンプルについてそれぞれCluster解析

サンプル

遺伝子

bacde

1 2

・・op

・ ・・ 15

Log2(各遺伝子発現量) <HeatMap>

Page 11: 遺伝子発現解析と データマイニング - 京都大学OCW...データマイニング データマイニングとは 蓄積したデータから、意味のある相関関係やパター

クラスター解析復習

Page 12: 遺伝子発現解析と データマイニング - 京都大学OCW...データマイニング データマイニングとは 蓄積したデータから、意味のある相関関係やパター

クラスター解析┘

a 29 33 55 79 74

b 71 68 72 64 97

c 74 91 79 76 100

d 52 56 58 60 85

e 77 92 96 88 98

a e Ⅴ ╈

a e

Page 13: 遺伝子発現解析と データマイニング - 京都大学OCW...データマイニング データマイニングとは 蓄積したデータから、意味のある相関関係やパター

a e

= (29, 33, 55, 79, 74)

= (71, 68, 72, 64, 97)

= (74, 91, 79, 76, 100)

……

Va=(x1, y1)

Vb=(x2, y2)R ゝ

aV

r

bVr

cV

r

2)( bVaVDrr

!=

22 )21()21( yyxxD !+!==

=

!++!+!=

Dbc

Dac

Dab222 )9774(....)6833()7129(

…..…..

Page 14: 遺伝子発現解析と データマイニング - 京都大学OCW...データマイニング データマイニングとは 蓄積したデータから、意味のある相関関係やパター

ab

c

d

e

f

g h

g h f a b c d e

D1

D1

D2

D2

Page 15: 遺伝子発現解析と データマイニング - 京都大学OCW...データマイニング データマイニングとは 蓄積したデータから、意味のある相関関係やパター

データマイニング

データマイニングとは蓄積したデータから、意味のある相関関係やパターンなどを発見する技術

対象がゲノム情報の場合、大量のゲノム情報を有用な発見が潜む「鉱山」とみなし、そこから有用な情報を「採掘(mining)」するという意味

Page 16: 遺伝子発現解析と データマイニング - 京都大学OCW...データマイニング データマイニングとは 蓄積したデータから、意味のある相関関係やパター

何がマイニングできるか?<遺伝子側クラスタリング>1. データセットの中に何種類の遺伝子発現パターンが含まれているか?

2. 遺伝子Xはどの機能カテゴリーに属するか?3. 機能未知の遺伝子群の発現パターンの中に、すでによく知られた遺伝子の発現パターンと似たものはあるか?

<細胞・組織(サンプル)側クラスタリング>4. 疾患Xのサブタイプを組織の遺伝子発現パターンで認識、発見することができるか?

5. 対象の組織サンプルはどの組織由来か?

Page 17: 遺伝子発現解析と データマイニング - 京都大学OCW...データマイニング データマイニングとは 蓄積したデータから、意味のある相関関係やパター

<遺伝子相互作用ネットワーク>6. 対象の組織サンプルで観測される全ての遺伝子間の相互作用の違いは?

7. 発現パターンが類似した全ての遺伝子ペアを明らかにできるか?

<遺伝子ハンティング>8. 正常と疾患など2群の組織サンプルを最もよく識別できる遺伝子群はどれか?

9. 薬物の影響を受けている遺伝子群は?10. ある遺伝子Xの発現パターンは他の遺伝子群と比較してどれくらい特異か?

11. 医薬品のターゲットとなる遺伝子は?

何がマイニングできるか?

Page 18: 遺伝子発現解析と データマイニング - 京都大学OCW...データマイニング データマイニングとは 蓄積したデータから、意味のある相関関係やパター

R復習

Page 19: 遺伝子発現解析と データマイニング - 京都大学OCW...データマイニング データマイニングとは 蓄積したデータから、意味のある相関関係やパター

7 ゝゝ

7

\\\ 7 H

H F F H F _F\F

7

7

< ) H ^

#

@ B

# C

@ B

# F ^ F ! C

# F ^ F

@ B

# ] ! C

# ]

@ B

# F ^ F

@ B

+ H D3F

#

@ B

#

@ B

# ^ !

# ^

@ B

Page 20: 遺伝子発現解析と データマイニング - 京都大学OCW...データマイニング データマイニングとは 蓄積したデータから、意味のある相関関係やパター

+ H D3F

# $ H

#

Usage hclust(d, method = "complete", members=NULL) Arguments d a dissimilarity structure as produced by dist. method the agglomeration method to ……….

# ] ! FI FG F ]

# ]

^F F F F

F

G

H

I

# ]@ B

@ B

# ]@ B

^F F F F

I

# ]@ B

^F F F F

I

# ]@ B

^F F F F

I

# ^ ! ]@ B

# ^

Page 21: 遺伝子発現解析と データマイニング - 京都大学OCW...データマイニング データマイニングとは 蓄積したデータから、意味のある相関関係やパター

# \ FG ^ ]

# F[ ^ ]

*=(*1

7 ( F ) H ^

FI FG I H

IF ! FI FG ] ]

) ! I IF

( ! H ) H

F H

F "

( 5 \

( F "

H ( "

9IF ! IF ㌹

9I ! I 9IF

9H ! H 9I H

9H F "

Page 22: 遺伝子発現解析と データマイニング - 京都大学OCW...データマイニング データマイニングとは 蓄積したデータから、意味のある相関関係やパター

- F F

)H ! F I I F (

)9H ! F I I F 9H

2IF ! F F ] IF

F F 2IF 7 \[")H ( [")9H H "H H

F F 2IF 7 \[")H ( [")9H H " F H @ B