§6.4 群体遗传的数学模型

34
§6.4 §6.4 群群 群群群群群 体传 群群 群群群群群 体传

Upload: jane-dickson

Post on 03-Jan-2016

63 views

Category:

Documents


6 download

DESCRIPTION

§6.4 群体遗传的数学模型. 一 . 问题与背景 1. 问题 生物的细微变异在进化中很重要,可以为物种进化提供原始材料。 但变异的个体在群体中数量很少。 它会不会在群体的随机交配的过程中逐渐减弱直至消失? 人类的遗传病(如色盲)在群体中会不会由于一代一代地遗传而使患者越来越多?. 农作物的新品种主要是用杂交的方法培育的。 即选择某种作物具有互补性状的两个品种杂交,在它们的后代中选择培育出合乎要求的新品种。 由于杂交后代性状分离的不稳定性,使得它不可能杂交后直接用于农业生产。 多少代以后就可以达到生产所需要的稳定性呢?. - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: §6.4  群体遗传的数学模型

§6.4 §6.4 群体遗传的数学模群体遗传的数学模型型

Page 2: §6.4  群体遗传的数学模型

一 . 问题与背景 1. 问题 生物的细微变异在进化中很重要,可

以为物种进化提供原始材料。 但变异的个体在群体中数量很少。 它会不会在群体的随机交配的过程中逐

渐减弱直至消失? 人类的遗传病(如色盲)在群体中会

不会由于一代一代地遗传而使患者越来越多?

Page 3: §6.4  群体遗传的数学模型

农作物的新品种主要是用杂交的方法培育的。

即选择某种作物具有互补性状的两个品种杂交,在它们的后代中选择培育出合乎要求的新品种。

由于杂交后代性状分离的不稳定性,使得它不可能杂交后直接用于农业生产。

多少代以后就可以达到生产所需要的稳定性呢?

Page 4: §6.4  群体遗传的数学模型

2. 背景:孟德尔遗传学的要点 1. 生物体的性状是由一对(多对)基因

控制的。 染色体是基因的载体。基因在染色体上

的位置称为基因座,处于同一基因座的不同的基因为等位基因。

等位基因对性状的控制有显性和隐性之分。

Page 5: §6.4  群体遗传的数学模型

2. 处于同一基因座上的两个基因的组合形式称为基因型。

生物体表现出来的特征为表现型。 一般表现型反映显性基因所控制的性状。

3. 遗传的过程是由亲代每基因座上的等位基因分离并随机进入到一个配子中去

在交配过程中雌雄配子将随机结合形成新的合子而传入下一代。

Page 6: §6.4  群体遗传的数学模型

二二 . . 假设假设 1. 1. 雌性和雄性在遗传上是对等的。雌性和雄性在遗传上是对等的。 2. 2. 没有没有迁移迁移、、突变突变和和选择选择。。 3. 3. 群体足够大。群体足够大。 4. 4. 随机交配随机交配,控制有关性状的雌雄配子,控制有关性状的雌雄配子

完全随机结合。完全随机结合。

Page 7: §6.4  群体遗传的数学模型

三三 . . 模型模型 1. 1. 群体的遗传结构:一个基因座,两个等群体的遗传结构:一个基因座,两个等

位基因 位基因 AA ,, aa 。三个基因型 。三个基因型 AAAA ,, AaAa ,, aaaa 。。 基因型频率:基因型频率: ff11 ,, ff22 ,, ff33 , , (f(f11+f+f22+f+f33=1).=1). 基因频率基因频率 : p= f: p= f11+f+f22/2, q=f/2, q=f33+f+f22/2./2. 群体的遗传结构群体的遗传结构 :: FF=(f=(f11 ,, ff22 ,, ff33))TT.. 基本群体基本群体 :: FF11=(1,0,0)=(1,0,0)TT,, FF22=(0,1,0)=(0,1,0)TT,, FF33=(0,0,1)=(0,0,1)TT.. F F = f= f11××FF11+f+f22××FF22+ f+ f33××FF33..

Page 8: §6.4  群体遗传的数学模型

2. 2. 遗传过程的基本平衡关系遗传过程的基本平衡关系 由孟德尔遗传学的理论可知由孟德尔遗传学的理论可知 , , 有有 AAAAAA=AA, AAAA=AA, AAaa=Aa, aaaa=Aa, aaaa=aa, aa=aa, AAAAAa =(1/2)AA+(1/2)Aa,Aa =(1/2)AA+(1/2)Aa, aaaaAa =(1/2)Aa +(1/2)aa,Aa =(1/2)Aa +(1/2)aa, AaAaAa =Aa =(1/4)AA+(1/2)Aa+(1/4)aa(1/4)AA+(1/2)Aa+(1/4)aa 即即 , , 有如下的平衡关系有如下的平衡关系 FF11FF11== F F11,, FF11FF33 == FF22,, FF33FF33== FF33,, FF11 FF22= (1/2)= (1/2)FF11+(1/2)+(1/2)FF22,, FF33 FF22= (1/2)= (1/2)FF22+(1/2)+(1/2) F F33,, FF22 FF2 2 = = (1/4)(1/4)FF11+(1/2)+(1/2) F F22+(1/4)+(1/4) F F33..

Page 9: §6.4  群体遗传的数学模型

3. 3. 群体遗传的模型群体遗传的模型 : : F(n)F(n)=(f=(f11(n), f(n), f22(n), f(n), f33(n))(n))TT: : 第 第 n n 代群体的结构代群体的结构 .. 1100. . 基本遗传过程基本遗传过程 :: FF11 与与 F(n)F(n) 交配的后代 交配的后代 F(n+1)F(n+1)==FF11F(n)F(n)==FF11[f[f11(n)(n)FF11+f+f22(n)(n)FF22+f+f33(n)(n)FF33]] = = ff11(n)[(n)[ FF11 FF11]+f]+f22(n)[(n)[FF11 FF22]+f]+f33(n)[(n)[ FF11 FF33] == [[FF11 FF1 1 FF11 FF2 2 FF11 FF33]] F(n)F(n) = [= [ FF11 ((FF11++FF22)/2)/2 FF22]] F(n) F(n) = M= M11 F(n)F(n)

000

12/10

02/11

1M

Page 10: §6.4  群体遗传的数学模型

FF22 与与 F(n)F(n) 交配的后代交配的后代 F(n+1)F(n+1)==FF22F(n)F(n)= M= M22 F(n)F(n)

FF33 与与 F(n)F(n) 交配的后代交配的后代 F(n+1)F(n+1)==FF33F(n)F(n)= M= M33 F(n)F(n)

2/14/10

2/12/12/1

04/12/1

2M

12/10

02/11

000

3M

Page 11: §6.4  群体遗传的数学模型

2200. . 随机交配群体的遗传模型随机交配群体的遗传模型 : : 一个结构为一个结构为FF 的群体与第的群体与第 nn 世代的群体世代的群体 G(n)G(n) 随机交配的随机交配的后代后代 ..

G(n+1)G(n+1)==FFG(nG(n))=(f=(f11FF11+f+f22FF22+f+f33FF33) ) G(n)G(n) = = ff11[[FF1 1 G(n)G(n) ]+f]+f22[[FF2 2 G(n)G(n) ]+f]+f33[[FF3 3 G(n)G(n)]] = f= f11MM11 G(n)G(n) +f+f22MM22 G(n)G(n) +f+f33MM33 G(n)G(n)

= (f= (f11MM11+ f+ f22MM2 2 + f+ f33MM3 3 )) G(n)G(n) = = MMrr G(n)G(n)

qq

pq

pp

ffff

ffff

ffff

M r

2/0

2/1

02/

2/2/)2/(0

2/2/12/

02/)2/(2/

2323

2123

2121

Page 12: §6.4  群体遗传的数学模型

3300. . 自交群体的遗传模型自交群体的遗传模型 . . 自交群体指每个自交群体指每个个体自交所产生的后代群体个体自交所产生的后代群体 ..

F(n+1)F(n+1)==F(n)F(n) F(n)F(n) =f=f11(n)(n)FF FF11+ f+ f22(n)(n)FF22 FF22+ f + f 33(n)(n)FF33 FF33

=[=[FF1 1 FF11/4+/4+ FF22/2+/2+ FF33/4/4 FF33]] F(n)F(n) = M= MSS F(n)F(n)

14/10

02/10

04/11

SM

Page 13: §6.4  群体遗传的数学模型

四四 . . 模型的分析模型的分析 1. Hardy–Weinberg 1. Hardy–Weinberg 平衡平衡 (H–W(H–W 平衡平衡 )) 在前述假设下在前述假设下 , , 一个随机交配的有性繁一个随机交配的有性繁

殖的群体中,等位基因频率保持不变,基因殖的群体中,等位基因频率保持不变,基因型频率至多经过一个世代也将保持不变。型频率至多经过一个世代也将保持不变。

一个基因座,两个等位基因。一个基因座,两个等位基因。 群体 群体 FF =( f=( f11, f, f22, f, f33 ) )TT; ; ff11, f, f22, f, f33 基因型 基因型 AA, Aa, aa AA, Aa, aa 的频率的频率 ; ; p = fp = f11+ f+ f22/2, q = f/2, q = f33 + f + f22/2 /2 基因 基因 A, a A, a 的频率的频率 ..

Page 14: §6.4  群体遗传的数学模型

群体自身的随机交配 , 有模型 : F(n+1) = Mr(n)F(n)

其中 p(n) = f1(n)+ f2(n)/2, q(n) = f3(n) + f2(n)/2.

)(2/)(0

)(2/1)(

02/)()(

)(

nqnq

npnq

npnp

nM r

Page 15: §6.4  群体遗传的数学模型

1. 证明 p(n+1)=p(n) , q(n+1)=q(n) 由模型可以得到 f1(n+1) = p(n)f1(n)+p(n)f2(n)/2 = p(n)[f1(n)+f2(n)/2]= p(n)2 f3(n+1) = q(n)f3(n)+q(n)f2(n)/2 =q(n)[f3(n)+f2(n)/2]=q(n)2 f2(n+1) = q(n) f1(n)+[p(n)+q(n)]f2(n)/2+p(n)f3(n) = q(n)[f1(n)+f2(n)/2]+p(n)[f3(n)+f2(n)/2] =2p(n)q(n) p(n+1)=f1(n+1)+f2(n+1)/2=p(n), q(n+1)=f3(n+1)+f2(n+1)/2=q(n).

Page 16: §6.4  群体遗传的数学模型

2. 证明基因型频率不变 ( 至多经过一个世代 ) 矩阵 Mr 的列和为 1, 因此它有全 1 的左特

征向量 1 =(1, 1, 1)T, 且有 1T Mr = 1T. 由此可知 矩阵有特征值λ=1, 并且只有这一个正特征根 它所对应的右特征向量为 F* >0, (Perron–Frobenious 定理 ) 由 MrF*=F* 不难得到 F*=(p2 2pq q2)T 就是模

型的平衡态。 对于任意的初始状态 F(0)=(f1(0),f2(0),f3(0))T, 容易算出 F(1) = Mr F(0) = F*.

因此 , 至多经过一个世代 , 群体的基因型频率将处于平衡状态不变。

Page 17: §6.4  群体遗传的数学模型

例 1. M–N血型: 血红细胞膜上的特异抗原类型,分别对抗

体 M 和抗体 N成阳性反应,这一性状分别由一对等位基因 LM 和 LN 控制,呈并显性。

调查 1279人三种基因型频数的比例为 LMLM : LMLN : LNLN = 363 : 634 : 282 由此可以算出群体的遗传结构为: (f1 f2 f3) =( 0.284 , 0.496 , 0.220 ) 群体中基因 LM 和 LN 的频率分别为 p=0.532, q=0.468 p2 = 0.283, 2pq = 0.498, q2 = 0.219 与群体的遗传结构基本相同。 群体为 H–W 群体。

Page 18: §6.4  群体遗传的数学模型

例 2. 地中海贫血病, 由一对等位基因 Tm

、 Tn 控制。调查意大利群体 10000 人三种基因型的频数为 TmTm : TmTn : TnTn = 4 : 400 : 9596 基因 Tm 和 Tn 的频率分别为 p = 0.0204 , q = 0.9796 p2=0.00042 , 2pq=0.03997, q2 = 0.95961 。 与群体的遗传结构基本相同。 群体为 H–W 群体

Page 19: §6.4  群体遗传的数学模型

问题: 问题: P175 8P175 8 民 族民 族 O(%)O(%) A(%A(% )) B(%) B(%) AB(%) AB(%)

汉汉 30.86 30.86

31.3131.31 28.0628.06 9.779.77

维吾尔维吾尔 27.5027.50 29.2229.22 31.9231.92 11.3611.36

壮壮 47.2847.28 21.2521.25 27.5727.57 3.903.90

回回 35.9435.94 27.2327.23 28.3428.34 8.498.49

哈萨克哈萨克 37.9737.97 22.8222.82 29.8329.83 9.389.38

锡伯锡伯 24.4224.42 25.0025.00 40.1240.12 10.4610.46

乌兹别克乌兹别克 25.5825.58 25.5825.58 38.7638.76 10.0810.08

柯尔克孜柯尔克孜 34.6834.68 18.5418.54 39.5239.52 7.267.26

塔克尔塔克尔 21.6221.62 40.5440.54 35.1435.14 2.702.70

白白 31.4031.40 34.0034.00 23.4023.40 11.2011.20

傣傣 40.4440.44 22.0822.08 29.5929.59 7.897.89

景颇 景颇 37.8137.81 34.8334.83 20.3920.39 6.976.97

Page 20: §6.4  群体遗传的数学模型

2. 杂交育种的稳定性 作物的品种:同型合子的基因型 育种的过程:双亲杂型合子 分离后代 优良组合 分

离后代 优良组合…

Page 21: §6.4  群体遗传的数学模型

问题:杂交后要自交多少世代就可以形成品种? F(n)=MSF(n-1)= … =MS

n-1F(1)=MSnF2.

λ=1 u1=(1,0,-1)T

λ=1 u2=(0,0, 1)T

λ=0.5 u3=(1,-2,1)T. 令

则有分解式 MS=U-1ΛU, MSn = U-1ΛnU.

14/10

02/10

04/11

SM

)5,.1,1(,

05.0

111

05.1

,

111

200

1011 diagUU

Page 22: §6.4  群体遗传的数学模型

由此不难算出由此不难算出

可得可得 F(n)F(n) = (0.5-0.5= (0.5-0.5n+1n+1, 0.5, 0.5nn, 0.5-0.5, 0.5-0.5n+1n+1))TT.. F(6)F(6) = (0.4921875, 0.015625, 0.4921875)= (0.4921875, 0.015625, 0.4921875)TT.. 一般杂交后至少要经过六代的选择、自交才一般杂交后至少要经过六代的选择、自交才

有可能作为一个稳定的品系参加品比试验。有可能作为一个稳定的品系参加品比试验。

15.05.00

05.00

05.05.01

1

1

n

n

n

nSM

Page 23: §6.4  群体遗传的数学模型

五五 . . 状态转移的马尔可夫链模型状态转移的马尔可夫链模型 1. 1. 遗传模型的特征与马尔可夫链遗传模型的特征与马尔可夫链 1100. . 研究的对象具有几个可能的不同状态。研究的对象具有几个可能的不同状态。 2200. . 各状态之间可能会发生随机转移的现象。各状态之间可能会发生随机转移的现象。 3300. . 状态转移时将来的状态只与现在的状态状态转移时将来的状态只与现在的状态

有关,而独立与过去的状态。有关,而独立与过去的状态。 我们称描述这一类状态随机转移问题的模型我们称描述这一类状态随机转移问题的模型

为为马尔可夫链模型。马尔可夫链模型。

Page 24: §6.4  群体遗传的数学模型

2. 状态转移的流程图: 用图示来描述状态及其相互转移

的关系。 FF1 FF2 2 1/2

1/2

AA Aa aa

F2 F2 1/4 1/4

1/2

AA Aa aa

Page 25: §6.4  群体遗传的数学模型

F1 F 1/2 1

1 1/2

AA Aa aa

F2 F 1/4 1/2 1/2

¼

1/2 1/2 1/2

Aa aaAA

F3 F 1/2 1

1/2 1

Aa aa AA

Page 26: §6.4  群体遗传的数学模型

随机交配群体

pp1212=q p=q p2323=q/2=q/2

pp2121=p/2 p=p/2 p3232= p= p

pp1111=p p=p p2222=1/2 p=1/2 p3333=q=q

F2:Aa F1:AA F3:aa

Page 27: §6.4  群体遗传的数学模型

其中, {fi} 表示参与转移的状态的频率, pij 表示从状态 j 向状态 i 转移的概率。

如果用 F(n)=(f1(n), f2(n), f3(n))T 表示第 n 代群体的遗传结构 ,

它实际上描述了一个个体在群体中处于各种状态的概率 ,

我们称之为状态向量 .

Page 28: §6.4  群体遗传的数学模型

矩阵 M 则描述了状态随机转移的状况 , 称之为转移矩阵 . M 非负且列和等于 1 。 流程图所描述的状态转移的过程就可以

用模型 F(n+1) = M F(n) 来描述 . 由此得到的状态向量序列 {F(n)}称之为马尔可夫链 . 模型就称为马氏链模型 .

Page 29: §6.4  群体遗传的数学模型

4. 模型的分析 10. 正则链 . 对于转移矩阵 M, 若存在正整数 k, 使

得 Mk > 0 (pij > 0), 则称 M 是正则的 , M 所描述的链为正则链 . 我们有 :

(1) M 有唯一的不动点向量 π = (π1, …, πn)T, 使得 M π = π.

(2) , 其中 1=(1,…, 1)T. (3) . 正则链的状态向量一定趋向于一个稳定的分布

π, 并且这个分布与状态向量的初始取值无关 .

Tn

nM 1),,(lim

)0(1)0(lim)(lim FFMnF Tn

nn

Page 30: §6.4  群体遗传的数学模型

20. 吸收链 . 若状态转移矩阵有形式

其中 Ir 为 r 阶单位阵 , O为零阵 , R 的行和均为正 . 则称由 M 给出的马氏链为吸收链 . 矩阵 Ir 所对应的状态 S1 称为吸收态 , 其余的状态 S2 为非吸收态 .

QO

RIM r

Page 31: §6.4  群体遗传的数学模型

(( 11 )例)例

2/100

4/110

4/101

4/110

2/100

4/101

14/10

02/10

04/11

SM

2/1,4/1

4/1,

10

01

SRI

2/1,4/1

4/1,

10

01

SRI

Page 32: §6.4  群体遗传的数学模型

(2) 分析 10lim S(n)T=(S1

T, 0T)

20 称 F=(I – Q)-1 为吸收链的基本矩阵 . F= ( fij ), 其中 fij 为从非吸收状态 si 在被吸收

前转移到非吸收状态 sj 的平均转移次数 .

30 令 B = F RT = ( bij ), 则给出了从非吸收状态 fi 出发 , 被吸收状态 fj 吸收的概率 .

0lim,

n

nnnrn QQO

RIM

Page 33: §6.4  群体遗传的数学模型

F = (I – Q)F = (I – Q)-1-1 = (1- ½) = (1- ½)-1-1 = 2 = 2 从非吸收状态从非吸收状态 SS33 出发出发 , , 平均转移平均转移 2 2 次次 , , 就就

会被吸收状态会被吸收状态 SS11, S, S22 吸收吸收 .. B = F RB = F RTT = 2 = 2 ×(1/4 1/4) ×(1/4 1/4) = (1/2 1/2)= (1/2 1/2) 从非吸收状态从非吸收状态 SS33 出发出发 , , 被吸收状态被吸收状态 SS11, S, S22 吸收的概率分别为 吸收的概率分别为 1/2.1/2.

Page 34: §6.4  群体遗传的数学模型

问题 : 1. 乒乓球比赛,每胜一球得一分,先

得三分者胜一局。建模描述一局乒乓球的比赛过程。

2. 在上面的乒乓球比赛中,如果双方打成 2 : 2 平局,则在后面的比赛中需要一方连续胜两球才能赢得此局。是给出模型描述一局乒乓球比赛的过程。