张海成 李希希 张艳聪

104
张张张 张张张 张张张 张张张张张 -- 张张张张张张张张张

Upload: esma

Post on 12-Jan-2016

215 views

Category:

Documents


0 download

DESCRIPTION

非线性拟合 -- 捕食和功能响应曲线. 张海成 李希希 张艳聪. 主要内容. 1 基本概念原理. 2. 3. 生态学问题. 统计学解答. 2. 一 基本概念原理. 1.1 引入. 1.2. 1.3. 1.4. 多元线性回归. 一元线性回归. 非线性回归. 张海成. 3. 1.1 引入. 考察变量之间关系的统计方法:. 连续变量 : 相关分析、回归分析. 4. 回归. 相关. 不必区分 自变量与因变量 描述两变量数量上 联系的密切程度 所研究变量属于 对等 的关系. 区分 自变量和因变量 - PowerPoint PPT Presentation

TRANSCRIPT

Page 1: 张海成 李希希 张艳聪

张海成李希希张艳聪

非线性拟合-- 捕食和功能响应曲线

Page 2: 张海成 李希希 张艳聪

1 基本概念原理

2 生态学问题

3 统计学解答

2

主要内容

Page 3: 张海成 李希希 张艳聪

一 基本概念原理

1.1 引入

1.2 一元线性回归

1.3 多元线性回归

1.4 非线性回归

张海成3

Page 4: 张海成 李希希 张艳聪

考察变量之间关系的统计方法:

自变量

连续 分类 混合

响应变量

连续 回归分析 方差分析(ANOVA)

协方差分析(ANCOVA)

分类 逻辑斯蒂回归 分对数模型逻辑斯谛回归或分对数模型

1.1 引入

连续变量 : 相关分析、回归分析

4

Page 5: 张海成 李希希 张艳聪

不必区分自变量与因变量

描述两变量数量上联系的密

切程度

所研究变量属于对等的关系

回归相关

区分自变量和因变量

自变量对因变量数量上的影

响程度

所研究变量属于非对等关系

5

Page 6: 张海成 李希希 张艳聪

回归分析法: 通过实验和观测建立变量之间关系的一种数理统计方法

回归分析非线性回归分析

线性回归分析

多元回归分析

一元回归分析

6

Page 7: 张海成 李希希 张艳聪

主要目的:

在于了解自变量对因变量影响

内容:

探索和确定变量之间的相关关系和相关程度

建立回归模型,检验变量之间的相关程度

应用回归模型进行估计和预测等

7

Page 8: 张海成 李希希 张艳聪

1.2 一元线性回归

Y 因变量; x 自变量; β0, β1 回归系数, ε 随机误差

适用条件:

无偏性: E(ε) = 0

正态性, ε 为服从正态分布的随机变量

方差齐性:各组 ε 的方差都相同,即 ε 与自变量、因变量之间相互独立

独立性:各组 ε 之间相互独立,且 COV(ε i, ε j) = 0, (i ≠ j)

xY 10

8

Page 9: 张海成 李希希 张艳聪

参数 β0, β1 的普通最小二乘估计基本思想:回归直线与所有样本数据点距离最近

n

iii xyQ

1

21010 )(),(

2

11010

2

110 min),(minˆˆ

n

iii

n

iii xyQxy

9

体重—身高

Page 10: 张海成 李希希 张艳聪

02

02

110

1

110

0

i

n

iii

n

iii

xxyQ

xyQ

iiii

ii

yxxx

yxn

12

0

10

)(

2221 )(

))((ˆxx

yyxx

xxn

yxyxn

i

ii

ii

iiii

xyn

x

n

y ii110

ˆˆˆ

对 β0 , β1 分别求偏导且令两偏导等于 0

整理后得到

求解

10

Page 11: 张海成 李希希 张艳聪

回归方程拟合优度的评价

拟合优度: 样本观测值聚集在样本回归线周围的紧密程度 决定系数: R²

2

1

)(

yySSTn

ii

2

1

2

1

2

1

ˆˆ

n

ii

n

iii

n

ii yyyyyy

SST总离差平方和

SSR回归平方和

SSE残差平方和

11

Page 12: 张海成 李希希 张艳聪

2

2

yy

yy

SST

SSRR

i

i

R² 表示全部偏差中有百分之多少可由 x 和y 的回归关系来解释

y

y 2)( yySST

2)ˆ( yySSE

2)ˆ( yySSR

12

Page 13: 张海成 李希希 张艳聪

回归方程的显著性检验

• 对整个回归方程的显著性检验( F 检验)

1

• 对各回归系数的显著性检验( t

检验)2

13

Page 14: 张海成 李希希 张艳聪

① 提出假设: H0 :回归方程不显著 (βi = 0); H1: 回归方程显著 (βi 不全为 0)

② F- 检验( ANOVA )

对整个回归方程的显著性检验

方差来源 平方和 自由度 均方 F 值

回归 SSR 1

误差 SSE n-2

总计 SST n-1

③ 给出显著性水平 α ,确定临界值 F(1, n-2)

④ 若 F ≥ Fα (1, n-2), 拒绝 H0 ,说明回归方程总体显著;反之

1

SSRMSR

MSE

MSRF

2

n

SSEMSE

14

Page 15: 张海成 李希希 张艳聪

对回归系数的显著性检验① 提出建设: H0: 回归系数不显著 (β1 = 0 ) ; H1 :回归系数显著 (β1 ≠0)

② t- 检验

1

^

1

St

2

ˆˆˆ 10

2

n

xyyyS yx

22

)(ˆ

22^

2

n

e

n

yy iii

211

)(

)ˆ(

xx

SVarS yx

t 统计量

S1 :回归系数 的标准差

Syx, σ: 估计标准误差

σ² : 误差项方差

③ 给定显著性水平 α ,确定临界值 tα/2(n-2)

④ 若 | t |≥ tα/2(n-2), 则拒绝 H0 ,认为回归系数显著;反之

1

15

Page 16: 张海成 李希希 张艳聪

两条或多条回归方程的差异性比较

例: 1 ) A,B 两样地观测数据得到的回归方程是否有显著性差异 2 )男、女生身高与体重的回归方程是否有显著性差异Y = a1X + b1 + ε1

Y = a2X + b2 + ε2

…Y = anX + bn + εn

原理: 检验斜率、残差、截距三项1 )残差 ε : F- 检验2 )斜率 a, 截距 b 使用其他复杂统计量, SPSS 以协方差分析进行检验(见ANCOVA-63 )

Page 17: 张海成 李希希 张艳聪

多用协方差分析检验截距和斜率的差异,以 SPSS 为例: 1. 先重新整理数据 , 将 y2 数据列加到 y1 下面 , 变成一个变量 y; 将 x2

数据列加到 x1 下面 , 变成一个变量 x; 然后再设定一个新的分组变量 group, 原来第 1 组值为 1, 第 2 组值为 2. 

2. 进行协方差分析 ( 第一步分析斜率是否无差异 ). 

Analyze->General Linear Model->Univariate 

Dependent List: 填入 y--------- 将 y 做为因变量 Fixed Factor: 填入 group 

Covaraites: 填入 x-------- 将 x 做为协变量 Model: 选 Custom 

Model: 填入 x group x*group--------- 注意如果变量填入顺序不一样 , 结果也会不一样 . (注意: x*group 是通过双选得到)Sum of squares 下拉列表框 : 选 TypeI 

然后点击 ok, 看结果里 x*group 这一行的 Sig.P 值 , 若大于 0.05, 则接受原假设 , 即两条回归直线的斜率无差异 , 否则拒绝 . 

3. 再来进行截距的无差异分析 其实过程跟上面一样 , 只是 Model 里去掉了 x*group 交叉项 . 

Analyze->General Linear Model->Univariate 

Dependent List: 填入 y--------- 将 y 做为因变量 Fixed Factor: 填入 group 

Covaraites: 填入 x-------- 将 x 做为协变量 Model: 选 Custom 

Model: 填入 x group --------- 注意如果变量填入顺序不一样 , 结果也会不一样 . 

Sum of squares 下拉列表框 : 选 TypeI 

点击 ok 后 , 看 group 一行的 Sig.P 值 , 若 P 值大于 0.05 说明两条回归直线截距也无差异 , 若小于 0.05 说明截距是有差异的 . 

PS : paired test 是 student-t 检验的一种,但检验的结论是两组数据所来源总体的差异。所以判断两回归曲线的差异,需用协方差分析或单独的检验统计两来判断截距和斜率的差异。

SPSS 具体处理步骤:

Page 18: 张海成 李希希 张艳聪
Page 19: 张海成 李希希 张艳聪

回归方程的估计与预测

点估计点估计回归方程估计回归方程估计

置信区间估计置信区间估计

19

Page 20: 张海成 李希希 张艳聪

回归方程的估计与预测对于给定的 X 值,求出 Y 平均值的一个估计值或 Y 的一个个别值的预测值。点估计点估计

0x

bxay ˆ

y

x

20

Page 21: 张海成 李希希 张艳聪

回归方程的估计与预测

置信区间估计置信区间估计

对于给定的 x = x0 , Y 的 1- 置信区间为:

yty ˆ20ˆ 自由度为 n-2 的 t 分布的 水平双侧分位数

21

利用估计的回归方程,对于自变量 x 的一个给定值 x0 ,求出因变量 y 的平均值 E(y0) 的估计区间 ,这一估计区间称为置信区间

Page 22: 张海成 李希希 张艳聪

回归方程的估计与预测置信区间估计置信区间估计

Sy: 回归估计标准差

22

Page 23: 张海成 李希希 张艳聪

1.3 多元线性回归 pp xxxY ......22110

Y :因变量 ; x1, x2, … xp: 自变量 ; Β0, β1, … βp: 回归系数ε :随机误差

适用条件: 无偏性 E(ε) = 0

服从正态分布 方差齐性 独立性

ny

y

y

Y2

1

npnn

p

p

xxx

xxx

xxx

X

21

22221

11211

1

1

1

p

1

0

ε =

n

2

1

23

(假定: x1,x2…xp 无交互作用)

Page 24: 张海成 李希希 张艳聪

多元线性回归模型的参数估计基本思想:使估计值 与观测值 y 之间的残差在所有样本点上达到最小y

步骤: 分别对 β0, β1…… βp 求偏导 令各偏导等于 0

求得 β0, β1…… βp

方法:最小二乘法 ( 详见路径分析 )

24

Q 最小

Page 25: 张海成 李希希 张艳聪

拟合优度检验

2

2

yy

yy

SST

SSRR

i

i

总偏差 (SST) = 回归偏差 (SSR) + 剩余偏差 (SSE)

25

Page 26: 张海成 李希希 张艳聪

回归方程显著性检验对整个回归模型的显著性检验(似一元回归模型)

① 提出假设, H0: 回归模型不显著( β1 = β2……= βp = 0 ); H1 :回归模型显著( β1 , β2…… βp 不全为 0 )

② 建立 F 统计量

方差来源 平方和 自由度 均方和 F 值

回归 SSR p

误差 SSE n-p-1

总计 SST n-1

MSE

MSRF

1

pn

SSEMSE

p

SSRMSR

③ 给出显著性水平 α ,查 F 分布表,得临界值 Fα (p, n-p-1)

④ F ≥ Fα (p, n-p-1), 则拒绝 H0 ,回归模型显著 26

Page 27: 张海成 李希希 张艳聪

回归系数显著性检验① 提出假设: H0: βi = 0 ; H1 : βi = 0;

② 建立 t 检验计算公式:③ ④

i

i

St

i

^

ˆ)ˆ( iiii cVarS Si :回归系数标准差; Cii 是

(XTX)-1 中第 i+1 个主对角线元素

③ 给出显著性水平 α ,查 t 分布表,得临界值 tα / 2 (n-p-1)

④ | t | ≥ tα / 2 (n-p-1), 则拒绝 H0 ,回归系数显著

27

Page 28: 张海成 李希希 张艳聪

1.4 非线性回归模型

pp xxxy ......22110

yi 是解释变量 xi 的线性函数

yi 是相应参数 βi 的线性函数

线性模型:

28

Page 29: 张海成 李希希 张艳聪

非线性模型 : 建立因变量与自变量之间的非线性关系 无假设条件,可建立任意形式的模型

非线性模型本质非线性模型

本质线性模型

29

Page 30: 张海成 李希希 张艳聪

本质线性模型

30

Page 31: 张海成 李希希 张艳聪

31

模型的选取

了解数据特点或可辨别变量间的相关关系 —— 直接选择函数模型 数据认识不充分,不能辨别变量间的相关关系 —— 绘制散点图,根据图形特点选择模型形式 对于无法直接从散点图看出应选取何种回归模型的 ——尝试多种可能的模型,并通过 R² 的大小、图形本身的比较选择出最优模型

B = pDq

Page 32: 张海成 李希希 张艳聪

函数转换法不足:

可能导致更复杂的计算

可能导致数据失真

不是所有非线性模型均可转换为线性模型

32

Page 33: 张海成 李希希 张艳聪

本质非线性模型

无法通过变量变换转化为线性模型

33

Page 34: 张海成 李希希 张艳聪

非线性回归模型解法 最小二乘法(模型主体部分占优势)

最大似然法(模型随机误差部分占优势)

1) 估算模型中参数的起始值及其取值范围2) 利用迭代算法寻找使得残差平方和最小的参数估计值

Gauss-Newton算法Newton-Raphson算法

Newton-Raphson算法计数算法BHHH算法

34

Page 35: 张海成 李希希 张艳聪

二 生态学问题

2.1 生态学问题

2.2 数学模型

李希希35

Page 36: 张海成 李希希 张艳聪

动物生态学的基本知识

动物生态学( animal ecology):是从生物种群和群落的角度研究动物与其周围环境相互关系的科学,是生态学的分支,是由动物学与生态学等交叉形成的学科。

36

Page 37: 张海成 李希希 张艳聪

( 1)阐明动物与生存条件的关系,生存条件的变化对动物的生理结构、形态特征和行为方式的影响;( 2)研究在一定的生存条件下各种动物种群的数量关系,出生率和死亡率的变化,种群密度和年龄分布;( 3)研究一定的环境条件下种内和种间关系以及它们对动物进化的意义,种内与种间的合作与竞争,捕食 -被捕食,种间各种共生关系,以及动物种群的结构和演化;( 4)研究不同生态条件下动物种群和群落的形成、适应性和演化;( 5)人类对动物资源开发利用和动物遗传资源的保护等。

研究内容

37

Page 38: 张海成 李希希 张艳聪

2.1 生态学问题

自然界中有很多例子能证明捕食者具有控制其捕食猎物密度的功能。

38

例如: 1 、 1950年~ 1960年间北美五大洲中的七鳃鳗几乎导致湖红点鲑的灭绝; 2 、在人类开始捕杀狼之前,黄石地区的狼使得当地麋鹿的密度受到控制。

Page 39: 张海成 李希希 张艳聪

功能响应( Functional Response ):一个捕食者

个体所能猎杀的猎物数量(或者一个寄生物能攻击的

寄主数量)是关于猎物密度的函数。

一定时间内被猎杀的猎物数随着猎物密度的增加

逐渐接近一个渐近线。

39

Page 40: 张海成 李希希 张艳聪

第Ⅰ类功能响应※捕食者随机搜寻猎物※搜寻时间为一常数※食欲有限

※不考虑猎物被捕食者处理所需的时间。

被捕食猎物数在一定范围内随猎物种群的增加而直线增加,超过则不再增加。被猎杀猎物比例保持最大(非 密度依赖型),继而降低。其中, Ne 是被捕食猎物数; N 是猎物密度。 40

Page 41: 张海成 李希希 张艳聪

第Ⅱ类功能响应※捕食者随机搜寻猎物※搜寻时间与处理时间成反比※捕食者食欲有限

捕食的猎物数随猎物密度的增加,以双曲线型接近渐近线,超过这一范围将不再增加被猎杀猎物的比例渐进型减少(反密度依赖型)。

41

T 表示总时间。Th 表示每个捕食者处理每个猎物所需的时间(其中包括用于吞食猎物和无法攻击其他猎物的所有时间)。

Page 42: 张海成 李希希 张艳聪

第Ⅲ类功能响应※取食猎物的效率 ~ 食量限制 ~猎物种群低密度下的敏感 程度※猎物数与猎物种群密度为 “S” 型曲线

猎物被猎杀比例逐渐增加至 S型曲线的拐点(密度依赖型),然后开始减少。

42

Page 43: 张海成 李希希 张艳聪

1. 功能响应的类型是什么?(比较 C 和 E 、 D 和 F )2. 功能响应的机制模型中系数的最佳估计是什么?3. 描述两种功能响应的模型中系数是否有显著的不同?

研究功能响应涉及的相关问题

43

Page 44: 张海成 李希希 张艳聪

研究功能响应相关问题的一般方法

• 模型选择——包括使用对被捕杀猎物与猎物总数之

比的逻辑斯蒂回归方法

• 假设检验——包括对被杀猎物数量和所提供猎物数

量比值的非线性最小二乘回归来估计功能响应的参

数以及比较不同功能响应的参数。

44

Page 45: 张海成 李希希 张艳聪

2.2 功能响应的数学模型

Ne = a*TsN

• 与功能响应相关的因素1. 被捕食量,用 Ne 表示。2. 攻击系数(瞬时的搜寻速率)使得猎物的遇

到概率和猎物密度相关联。用 a 表示。3. 猎物密度,用 N 表示。4. 从开始捕食到捕到猎物所用的时间。用 Ts 表

示。5. 总时间,用 T 表示。6. 每个捕食者处理每个猎物所需的时间(其中包 括用于吞食猎物和无法攻击其他猎物的所有时 间),用 Th 表示。

45①

Page 46: 张海成 李希希 张艳聪

Ne = a* TsN• 将 Ts 考虑为一个变量,又根据:

Ts = T - ThNe

• 将 代入 中,变形可得:

公式 2 : Ne = aNT/( 1+ aNTh )

46

② ①

Page 47: 张海成 李希希 张艳聪

公式 2 : Ne = aNT/( 1+ aNTh )

第Ⅰ类功能响应

当 Th= 0 , 即不考虑猎物的处理时间时:

公式 1 : Ne = aNT

47

Page 48: 张海成 李希希 张艳聪

Disc 方程模拟第Ⅱ类功能响应

模型假定:1.渐近线由时限决定;

2. 捕食者遇到猎物概率和猎物密度线性相关;

3.当捕食者在处理猎物时不再进行其他捕获;

4.猎物密度恒定。

48

Page 49: 张海成 李希希 张艳聪

第Ⅱ类功能响应公式 2 : Ne = aNT/( 1+ aNTh )

1. 被捕食量,用 Ne 表示。2. 攻击系数(瞬时的搜寻速率)使得 猎物的遇到概率和猎物密度相关联。 用 a 表示。3. 猎物密度,用 N 表示。4. 总时间 , 用 T 表示。5. 每个捕食者处理每个猎物所需的时 间(其中包括用于吞食猎物和无法 攻击其他猎物的所有时间),用 Th

表示。49

Page 50: 张海成 李希希 张艳聪

存在猎物消耗时描述功能响应的适合模型 ɑ 关于 N 的双曲线型函数

b , c 和 d 均为常数

cN1

bN

d

a

50

Page 51: 张海成 李希希 张艳聪

式 产生的各种形式的 ɑ 和 N 之间的关系

等于零的系数 ɑ 的计算公式 ɑ 与 N 之间的关系

无 ( d+bN )/ (1+cN)

增加至渐近线;截距为 d ,不等于零

c d+bN 线性增加;截距为 d ,不等于零

d bN∕(1+cN) 增加至渐近线;截距等于零

d 和 c bN 线性增加;截距等于零

ɑ 假定功能响应已知是Ⅲ型;因而至少有 b> 0

cN1

bN

d

a

51

Page 52: 张海成 李希希 张艳聪

52

代入cN1

bN

d

a

式 公式 2

公式 3

猎物消耗的功能响应

2

21e

h

dNT bN TN

cN dNTb bN T

1e

h

aNTN

aNT

Page 53: 张海成 李希希 张艳聪

公式 32

21e

h

dNT bN TN

cN dNTb bN T

第Ⅲ类功能响应

当 a 是一个 N 的增函数时,就会出现第Ⅲ类功能响应:

53

Page 54: 张海成 李希希 张艳聪

上述模型假定猎物密度 N恒定,而实际上 N往往随实验的进行而降低。当 N减少时,描述功能响应的合适模型应是对公式 2 和 3 的时间积分式,从而可应对变化的猎物密度。

54

Page 55: 张海成 李希希 张艳聪

公式 4:

猎物密度降低

1e

h

aNTN

aNT

公式

2:

0 1 exp ( )e h eN N a T N T

55

Page 56: 张海成 李希希 张艳聪

对于第Ⅲ类功能响应,当 ɑ如式 中所示是初始密度的函数时为最简单的形式:

公式 5:

0 0 01 exp ( )( )/(1 )e h eN N d bN T N T cN

0 1 exp ( )e h eN N a T N T 式 : 公式 4:

0

0

bN

1 cN

da

56

Page 57: 张海成 李希希 张艳聪

1. 功能响应( Functional Response ):一个捕

食者个体所能猎杀的猎物数量(或者一个寄生物能

攻击的寄主数量)是关于猎物密度的函数。

总结

Page 58: 张海成 李希希 张艳聪
Page 59: 张海成 李希希 张艳聪

实验时猎物密度 N恒定类型 II 类型 III

a : 攻击系数Th :处理每个猎物所需的时间

b,c,d: 决定攻击系数 a

Th :处理每个猎物所需的时间

haNT

aNTNe

1 hh TbNdNTcN

TbNdNTNe

2

2

1

实验时猎物密度 N 不恒定(初始 N0)

类型 II 类型 III

a : 攻击系数Th :处理每个猎物所需的时间

b,c,d: 决定攻击系数 a

Th :处理每个猎物所需的时间

)]}(exp[1{0 TNTaNNe eh )]}1/())(exp[(1{ 000 cNTNTbNdNN ehe

59

Page 60: 张海成 李希希 张艳聪

3.1 统计学问题解答

3.2 实例分析

三 统计学解答

张艳聪60

Page 61: 张海成 李希希 张艳聪

1. 功能响应的类型是什么?(比较 C 和 E 或 D 和 F )

2. 功能响应的机制模型中系数的最佳估计是什么?

3. 描述两种功能响应的模型中系数是否有显著的不同?

研究功能响应时涉及的问题

61

Page 62: 张海成 李希希 张艳聪

3.1 统计学问题解答

62

Page 63: 张海成 李希希 张艳聪

43.1.1

1 )

2 )

模型选择:确定功能响应形状

求解过程(区分相应曲线)

求解过程(最大似然法)

3.1.2

1 )

假设检验:参数估计和比较方法(最小二乘法)

2 ) 求解过程(牛顿迭代法)

63

Page 64: 张海成 李希希 张艳聪

3.1.1 模型选择:确定功能响应曲线

描述离散型因变量和连续型自变量的关系的回归模型

自变量 (N) 因变量(Y)

Y=1 的概率( μY·N )

μY·N 的 Logistic

变换 连续型 N [0,+∞)∈

离散型 Y= 0,1

连续型μY·N=P(Y=1)

∈[0,1]

连续型Q∈ (-∞ ,+∞)

变量特征: 因变量 Y 取值: Y=1 死亡, Y=0 活着 , 0-1 变量 自变量 N : N0 猎物初始密度, 为连续变量

方法:被杀猎物和现有猎物比例的逻辑斯蒂回归

64

Page 65: 张海成 李希希 张艳聪

Logistic 变换关系

),(1

ln)(

P

PpLogitQ ),0[ N

]1,0[P ),0[ N?P=f(N)

Logistic 变换

zz NaNaNaNaaNfQ 3

32

210)(

)exp(1

)exp(

1 33

2210

33

2210

zz

zz

Q

Q

NaNaNaNaa

NaNaNaNaa

e

eP

被捕食的概率 猎物密度

P

PQ

1ln

65

Page 66: 张海成 李希希 张艳聪

最大似然法:

( 1 )最大似然估计是一种统计方法,它用来求一个样本集的相关概率密度函数的参数。

( 2 )当从模型总体随机抽取 n组样本观测值后,最合理的参数估计量应该使得从模型中抽取该 n组样本观测值的概率最大。

1 )求解过程 ( 最大似然法 )

66

Page 67: 张海成 李希希 张艳聪

)exp(1

)][exp(

1}1{obPr

2210

2210

zz

Yizz

Q

Q

NaNaNaa

NaNaNaa

e

eYi

1 )求解过程 ( 最大似然法 )

Logistic 回归方程:

(其中 a0, a1, a2 … az 是需要估计的系数)

n

iz

z

Yzz

NaNaNaNaa

NaNaNaNaa i

13

32

210

33

2210

)exp(1

)][exp(L

利用迭代法寻找参数数值使得似然函数 L 最大化因变量 Y 为 (0, 1) 变量

)exp(1

)][exp(

1

1

1-1}0{obPr

2210

2210

zz

Yizz

QQ

Q

NaNaNaa

NaNaNaa

ee

eYi

被捕食:

存活:

67

Page 68: 张海成 李希希 张艳聪

例题 1 :假设 B 组每只老鼠被捕食的概率为 P ,则同时出现以下 10 项观察值的概率 L 是多少?

Q

YQ

Qii

Q

YQ

Q

Q

i

e

e

eYPYP

e

e

e

eYP

i

i

1

)(

1

1)1(1)0(

1

)(

1)1(

n

iz

z

Yzz

n

iQ

YQ

n

iin

NaNaNaNaa

NaNaNaNaa

e

e

YPYPYPYP

i

i

13

32

210

33

2210

1

121

)exp(1

)][exp(

1

)(

)()()()(L

1 )求解过程 ( 最大似然法 )

68

Page 69: 张海成 李希希 张艳聪

n

iz

z

Yzz

NaNaNaNaa

NaNaNaNaa i

13

32

210

33

2210

)exp(1

)][exp(L

对于给定的自变量 N 值,当参数 a0, a1, a2, …, az 取不同的值时, L大小会发生变化,表明不同参数估计对实际结果的拟合情况。 L越大,说明产生实际结果的概率越大,即与实际结果拟合得越好。

当参数 a0, a1, a2, …, az 取某些特定值,使得 L 最大时,表明这些参数使得实际结果发生的概率最大,说明这些参数是拟合模型的最佳值。使用得到实际观测值的概率来作为拟合参数优劣标准的方法,就是最大似然估计。

1 )求解过程 ( 最大似然法 )

69

Page 70: 张海成 李希希 张艳聪

难区分

Ne ~ N

2 )求解过程(区分功能曲线)

使用 Logistic 回归区分 II 、 III 型功能响应

70

Page 71: 张海成 李希希 张艳聪

容易区分

P= Ne/N ~ N

0)0( P0)0( P

使用 Logistic 回归区分 II 、 III 型功能响应

2 )求解过程(区分功能曲线)

71

Page 72: 张海成 李希希 张艳聪

)exp(1

)exp(

1 33

2210

33

2210

zz

zz

Q

Q

NaNaNaNaa

NaNaNaNaa

e

eP

N

Ne

21

2)0(

)0(

12321

22

)1()1(

)0()0(

32

)1()1(

)1()1()(

0

0

a

a

Q

Q

zz

Q

Q

Q

QQQQ

e

ea

e

eQP

NzaNaNaaQ

e

eQ

e

eeeeP

型曲线型曲线

II0)0(0

III0)0(0

1

1

Pa

Pa

2 )求解过程(区分功能曲线)

72

Page 73: 张海成 李希希 张艳聪

443.1.1

1 )

2 )

模型选择:确定功能响应形状

求解过程(区分相应曲线)

求解过程(最大似然法)

3.1.2

1 )

假设检验:参数估计和比较方法(最小二乘法)

2 ) 求解过程(牛顿迭代法)

73

Page 74: 张海成 李希希 张艳聪

方法:最小二乘法

寻找特定的参数使得模型预测值与观测值的离差平方和最小,以此作为拟合参数优劣的标准。

2)ˆ( ii yyL

实际观测值 理论预测值

3.1.2 假设检验:参数估计与比较

74

Page 75: 张海成 李希希 张艳聪

实验时猎物密度 N恒定类型 II 类型 III

a :攻击系数Th :处理每个猎物所需的时间

b,c,d: 决定攻击系数 a

Th :处理每个猎物所需的时间

haNT

aNTNe

1 hh TbNdNTcN

TbNdNTNe

2

2

1

实验时猎物密度 N 不恒定(初始 N0)

类型 II 类型 III

a : 攻击系数Th :处理每个猎物所需的时间

b,c,d: 决定攻击系数 a

Th :处理每个猎物所需的时间

)]}(exp[1{0 TNTaNNe eh )]}1/())(exp[(1{ 000 cNTNTbNdNN ehe

1 )方法(最小二乘法)

75

Page 76: 张海成 李希希 张艳聪

例子: II 型曲线

( 1 )猎物密度 N恒定 hi

ii TaN

TaNeN

22 )1

()ˆ(

i hi

ii

iii TaN

TaNNeeNNeL

( 2 )猎物密度 N 不恒定

)]}ˆ(exp[1{ˆ0 TeNTaNeN ihi i

?ˆ ieN

1 )方法(最小二乘法)

76

Page 77: 张海成 李希希 张艳聪

使用牛顿迭代法求 ?ˆ eN

)]}ˆ(exp[1{ˆ0 TeNTaNeN h

的方程:解关于 eN

eee

eehe

NNNf

NTNTaNNNf

ˆ0)(

)](exp[)( 00

值即为需要求的时的

,当函数令

2 )求解过程(牛顿迭代法)

77

Page 78: 张海成 李希希 张艳聪

eN)0,( 1Ne

))(,( 11 NefNe

)0,( 2Ne

))(,( 22 NefNe

12

11

)(0)(

NeNe

NefNefk

)0,( 3Ne

23

22

)(0)(

NeNe

NefNefk

78

Page 79: 张海成 李希希 张艳聪

最小二乘法 最大似然法目的 拟合回归模型的参数

模型自变量( X )

连续变量

因变量( Y )连续变量 离散变量

( 0-1 型分布)

条件平均数连续变量,一般∈[0 , +∞]

Y= 1 的概率,∈ [0,1]

函数

最优标准参数取值使得 L 最

小参数取值使得 L 最大

统计意义

参数取值使得观测值与

模型预测值的离差平方

和最小,即为最优参

数,模型与实际最符

合。

参数取值使得利用模型预测

产生实际观测值的概率最

大,即为最优参数,模型与

实际最符合。

XY2

)ˆ( ii yyL )(ˆ iyyPL

总结比较:最小二乘法与最大似然法

79

Page 80: 张海成 李希希 张艳聪

3.2 实例演示Notonecta 捕食 Asellus

捕食者: Notonecta glauca 中国大仰蝽属猎物: Asellus aquaticus 栉水虱 1 )猎物密度从 5,7,8…..100 等 11 个取值;

2 )每个密度至少八个重复; 3 )总共有 89 个观测值

4 )持续 72h 。

Q1 :功能响应的曲线是那种,Ⅱ或者Ⅲ?Q2 :最佳的参数估计是什么?

80

Page 81: 张海成 李希希 张艳聪

N0 REP FATE NE5 1 0 05 1 1 55 2 0 15 2 1 45 3 0 15 3 1 45 4 0 25 4 1 35 5 0 25 5 1 35 6 0 25 6 1 35 7 0 25 7 1 35 8 0 35 8 1 27 1 0 07 1 1 77 2 0 0

原始数据如右表:N0 = initial number of prey

REP = replicate number,

FATE: 0 = prey eaten

1 = prey alive

NE = count of prey in each FATE

FATE=0时, NE: 为被捕食数目,即 Ne

FATE=1时, NE: 为活着的数目

对一个重复, N0=ΣNE81

Page 82: 张海成 李希希 张艳聪

第一步:模型选择

( 1 )进行 Logistic 回归分析,建立回归方程

)NP+NP+NP+(P+

)NP+NP+NP+(PP=

N

Ne303

202010

303

202010

0 exp1

exp

型曲线

型曲线

II0)0(0

III0)0(0

1

1

Pp

Pp

( 2 )根据回归方程估计相应曲线的形状

21

2)0(

)0(

)1()1(

)0()0(

0

0

p

p

Q

Q

e

ep

e

eQP

82

Page 83: 张海成 李希希 张艳聪

program

log

SAS界面 run

output log editor 83

Page 84: 张海成 李希希 张艳聪

84

Page 85: 张海成 李希希 张艳聪

DATA NOTONECT; /* name the database*/

INPUT N0 REP FATE NE;

N02=N0**2; /* initial number of prey squared */

N03=N0**3; /*initial number of prey cubed */

CARDS; /*data followed, ends with “;”*/

SAS procedure CATMOD

85

/* 对参数等于 0 进行最大似然检验,同时对似然比率进行检验来检验模型的整体拟合度 */

Page 86: 张海成 李希希 张艳聪

PROC CATMOD DATA=NOTONECT;

DIRECT N0 N02 N03;

MODEL FATE = N0 N02 N03 / ML NOGLS NOPROFILE ;

POPULATION N0 REP;

WEIGHT NE; /*指定权重变量 */

不使用广义最小二乘法估计

最大似然法

SAS procedure CATMOD

86

不显示样本值和响应值

对一个重复, N0=ΣNE

Page 87: 张海成 李希希 张艳聪

The result of CATMOD procedure

所有参数显著不等于 0 ,但是模型整体拟合不佳一次项系数大于 0 ,可以判断应属于 III 类功能相应

Analysis of Maximum Likelihood Estimates Standard Chi- Parameter Estimate Error Square Pr > ChiSq ---------------------------------------------------------- Intercept -1.3457 0.2513 28.68 <.0001 N0 0.0478 0.0185 6.66 0.0098 N02 -0.00103 0.000376 7.52 0.0061 N03 5.267E-6 2.211E-6 5.67 0.0172

Maximum Likelihood Analysis of VarianceSource DF Chi-Square Pr > ChiSq--------------------------------------------------Intercept 1 28.68 <.0001N0 1 6.66 0.0098N02 1 7.52 0.0061N03 1 5.67 0.0172Likelihood Ratio 85 206.82 <.0001

0)0( P0)0( P

87

Page 88: 张海成 李希希 张艳聪

DATA NOTONEC2; /* 修正数据,去除猎物存活的数据行,添加捕食比例数据列 */

SET NOTONECT; IF FATE= 0; PROPEAT= NE/N0;

PROC MEANS DATA=NOTONEC2; /* 计算基本统计量:均值, SE 等*/

BY N0 NOTSORTED; /*按照 N0 值分组且不排序 */VAR PROPEAT; /*指定被食比例变量,计算该变量的均值、方差等 */OUTPUT OUT=NOTOMEAN MEAN=MEANPROP; /*输出结果到

NOTOMEAN 数据集中,输出每个 N0 对应的均值 */

DATA NOTONEC3; /* 产生估计值数据集 ,包括每组 N0 对应的预测值*/

SET NOTOMEAN;K=EXP(-1.3457+(0.0478*N0)-(0.00103*N0**2)+(0.000005267*N0**3));PRED=K/(1+K);

PROC PLOT DATA=NOTONEC3; /* 绘制平均观测值与估计值散点图 */

PLOT PRED*N0='P' MEANPROP*N0='*'/OVERLAY;

88

观测值

估计值

Page 89: 张海成 李希希 张艳聪

每个点代表在给定猎物初始密度下的被捕食概率* : 实际观测值 P : 拟合估计值

89

Page 90: 张海成 李希希 张艳聪

非线性最小二乘法 ( SAS procedure NLIN)

应用条件: ( 1 )正态分布 ( 2 ) 方差齐性

)]}1/())(exp[(1{ 000 cNTNTbNdNN ehe H0 : b=0 c=0 d=0 Th=0

第二步:拟合数据并估计参数

N0: 猎物初始密度 Ne: 被食数量T :可利用时间 Th :处理每个猎物所需时间

90

选用存在猎物消耗的 III 类功能响应模型:

Page 91: 张海成 李希希 张艳聪

初始值的设定: d: 许多情况下比较小,一般初值设置为 0

b 和 c: 通常是选择覆盖两个数量级的不同初始值, 因为当攻击系数a (瞬时搜索速率 ) 是一个N的增函数时,出现第三类功能相响应,所以参数 b>0 ,c>=0,d>=0

Th: 猎物处理时间 Th>0

)]}1/())(exp[(1{ 000 cNTNTbNdNN ehe

第二步:假设检验

N0: 猎物初始密度 Ne: 被食数量T :可利用时间 ( 72h ) Th :处理每个猎物所需时间 91

Page 92: 张海成 李希希 张艳聪

PROC NLIN DATA=NOTONEC2;

PARMS BHAT= 0.001 0.01 0.1CHAT= 0.001 0.01 0.1 DHAT= 0 THHAT=3.0; BOUNDS BHAT>0,CHAT>=0,THHAT>0;T=72; X=NE; A=(DHAT+BHAT*N0)/(1+CHAT*N0); C1=EXP(-A*T); C2=A*THHAT;H=N0*C1*EXP(C2*X)+X-N0; ITER=0;

)]1/())(exp[( 0000 cNTNTbNdNNN ehe 完整模型:

待续……92

Page 93: 张海成 李希希 张艳聪

完整模型:续上一页

DO WHILE(ABS(H)>0.0001 AND ITER<50); X=X-H/(N0*C1*C2*EXP(C2*X)+1); H=N0*C1*EXP(C2*X)+X-N0; ITER=ITER+1; END;MODEL NE=X;

牛顿迭代法

/*新的预测值 Nei+1*/

/* 将 Nei+1 带入函数求取 f(Nei+1) */

93

Page 94: 张海成 李希希 张艳聪

Procedure NLIN: Full modelNonlinear Least-Squares Summary Statistics

Dependent Variable NE Sum of Mean Approx Source DF Squares Square F Value Pr > F Model 3 9526.8 3175.6 157.57 <.0001 Error 86 1733.2 20.1535 Uncorrected Total 89 11260.0 Approx Approximate 95% Parameter Estimate Std Error Confidence Limits Label BHAT 0.000416 0.000228 -0.00004 0.000869 CHAT 0 0 0 0 DHAT 0.000832 0.00382 -0.00676 0.00842 THHAT 4.0640 0.3575 3.3534 4.7747 Bound0 107.9 315.6 -509.1 725.0 0 <= CHAT

)]}1/())(exp[(1{ 000 cNTNTbNdNN ehe

)]})(exp[(1{ 00 TNTbNdNN ehe 94

Page 95: 张海成 李希希 张艳聪

PROC NLIN DATA=NOTONEC2; PARMS BHAT=0.001 0.01 0.1 DHAT=0 THHAT=3.0; BOUNDS BHAT>0,THHAT>0; T=72; X=NE; A=(DHAT+BHAT*N0); C1=EXP(-A*T); C2=A*THHAT;H=N0*C1*EXP(C2*X)+X-N0; ITER=0;

待续……

简化模型1 :

95

Page 96: 张海成 李希希 张艳聪

简化模型 1 :

DO WHILE(ABS(H)>0.0001 AND ITER<50); X=X-H/(N0*C1*C2*EXP(C2*X)+1); H=N0*C1*EXP(C2*X)+X-N0; ITER=ITER+1; END;MODEL NE=X;

续上一页

牛顿迭代法

96

Page 97: 张海成 李希希 张艳聪

Procedure NLIN: Reduced model 1

Nonlinear Least-Squares Summary Statistics Dependent Variable NE Sum of Mean Approx Source DF Squares Square F Value Pr > F Model 3 9526.8 3175.6 157.57 <.0001 Error 86 1733.2 20.1535 Uncorrected Total 89 11260.0

Approx Parameter Estimate Std Error Approximate 95% Confidence Limits BHAT 0.000416 0.000228 -0.00004 0.000869 DHAT 0.000831 0.00382 -0.00676 0.00842 THHAT 4.0641 0.3575 3.3534 4.7747

)]})(exp[(1{ 00 TNTbNdNN ehe

)]}(exp[1{ 00 TNTbNNN ehe 97

Page 98: 张海成 李希希 张艳聪

PROC NLIN DATA=NOTONEC2;

PARMS BHAT= 0.001 0.01 0.1

THHAT= 3.0;

BOUNDS BHAT>0,THH>0;

T=72;

X=NE;

A=BHAT*N0;

C1=EXP(-A*T);

C2=A*THHAT;

H=N0*C1*EXP(C2*X)+X-N0;

ITER=0;

待续……

简化模型2 :

98

Page 99: 张海成 李希希 张艳聪

DO WHILE(ABS(H)>0.0001 AND ITER<50); X=X-H/(N0*C1*C2*EXP(C2*X)+1); H=N0*C1*EXP(C2*X)+X-N0; ITER=ITER+1; END;MODEL NE=X;

简化模型 2 :续上一页

牛顿迭代法

99

Page 100: 张海成 李希希 张艳聪

)]})(exp[(1{ 00 TNTbNdNN ehe

)]}4.1043(0.0005exp[1{ 00 TNNNN ee

Procedure NLIN: Reduced model 2

Nonlinear Least-Squares Summary Statistics Dependent Variable NE

Sum of Mean Approx Source DF Squares Square F Value Pr > F Model 2 9525.8 4762.9 238.93 <.0001 Error 87 1734.2 19.9338 Uncorrected Total 89 11260.0

Approx Parameter Estimate Std Error Approximate 95% Confidence Limits BHAT 0.000460 0.000104 0.000254 0.000666 THHAT 4.1043 0.2892 3.5294 4.6792

100

Page 101: 张海成 李希希 张艳聪

小结

101

回归分析统计方法:

捕食和功能响应生态学问题:

线性回归

非线性回归

确定功能响应类型

功能响应参数的估计和比较

Logistic 回归

非线性最小二乘法

应用

Page 102: 张海成 李希希 张艳聪

作业

102

Page 103: 张海成 李希希 张艳聪

样本 N 胸径 D ( cm ) 材积 V ( m3 ) 样本 N 胸径 D ( cm ) 材积 V ( m3 )1 8.3 0.0300 16 8.5 0.0388

2 6.7 0.0133 17 3.8 0.0035

3 4.2 0.0035 18 10.2 0.0703

4 9 0.0333 19 3.4 0.0008

5 8.6 0.0390 20 13.4 0.1388

6 8.1 0.0233 21 7.9 0.0368

7 4.5 0.0035 22 10.8 0.0708

8 6.8 0.0115 23 4.5 0.0105

9 4.8 0.0043 24 13.8 0.1550

10 8.3 0.0278 25 6.1 0.0200

11 4.5 0.0035 26 11.9 0.1055

12 9.4 0.0463 27 8.9 0.0400

13 6.6 0.0183 28 5.2 0.0113

14 3.9 0.0048 29 10.6 0.0703

15 9.9 0.0515 30 11.2 0.0925

A林场有 100 公顷落叶松林地,林分密度为 1000棵 / 公顷,整个林地落叶松的平均胸径 D=10cm,现随机伐取 30棵落叶松样本,测得各样本胸径(D) 及材积 (V) 的数据如下表, (1) 求胸径 (D) 和材积 (V) 的最佳回归关系(取线性、幂、指数、对数方程中最优的) (2) 求置信度 α=0.05 , D=10cm时的点估计,置信区间估计 ( 提示:可先转化为线性, tα/2(28)=2.048) (3)落叶松价格为 800 元 /m3, 求当前 A林场落叶松总经济价值。

103

Page 104: 张海成 李希希 张艳聪

代入cN1

bN

d

a

攻击系数 II 类功能曲线

III 类功能曲线

猎物消耗的功能响应

2

21e

h

dNT bN TN

cN dNTb bN T

1e

h

aNTN

aNT

等于零的系数 ɑ 的计算公式 ɑ 与 N 之间的关系

无 ( d+bN )/ (1+cN)

增加至渐近线;截距为 d ,不等于零

c d+bN 线性增加;截距为 d ,不等于零

d bN∕(1+cN) 增加至渐近线;截距等于零

d 和 c bN 线性增加;截距等于零

104