第二节 描述性统计量及检验
Post on 05-Feb-2016
147 Views
Preview:
DESCRIPTION
TRANSCRIPT
第二节 描述性统计量及检验2.1. 描述性统计量 随机变量的期望: =E(X) 随机变量的方差: 2=E[(X- )2] k- 阶矩: E(Xk) k- 阶中心矩: E[(X - )k] 偏度 (skewness) : S=E[(X-)3/3] 峰度 (kurtosis) : K = E[(X-)4/4]
偏度和峰度都是用来测定收益率分布的形状,且都以正态分布为基准的。
正态分布:偏度 =0,峰度 =3 。
第二节 描述性统计量及检验
偏度的符号反映了分布偏斜的方向: 当偏度 S 值 =0 时,序列分布是对称的。 当偏度 S >0 时,称为正偏,意味着序列分布有长的
右拖尾。 当偏度 S <0 时,称为负偏,意味着序列分布有长的
左拖尾。
偏度的大小反映了分布偏斜的程度。
第二节 描述性统计量及检验
S=0 S>0 S<0
均值=中位数 均值 > 中位数 均值 < 中位数
第二节 描述性统计量及检验
峰度反应分布隆起的程度: 当峰度 K>3 时,序列分布曲线的凸起程度大于正态
分布,即相对于正态分布更隆起; 当峰度 K<3 时,序列分布曲线的凸起程度小于正态
分布,即相对于正态分布更平坦。
正态分布的峰度 K=3 。
第二节 描述性统计量及检验
K=3 K>3 K<3
正态分布的峰度= 3
第二节 描述性统计量及检验
峰度也反映了分布尾部的厚薄。 正态分布的峰度 K=3 。 K-3 称为超出峰度。 具有正的超出峰度的分布称为尖峰分布。 尖峰分布具有厚尾性,即该分布在其支撑的尾部有
比正态分布更大的概率。 用公式表示为: P{ <c}>p{X<c} , c 是一个比较小
的数。 服从尖峰分布随机变量, X 服从正态分布。
第二节 描述性统计量及检验
在实际中,意味着来自于尖峰分布的随机样本会有更多的极端值。
如果小概率事件发生的可能性大于正态分布所描述的情形,那该变量的分布应当用尖峰分布来描述。
这在金融市场风险研究中有着重要的意义。
第二节 描述性统计量及检验
样本均值
样本方差
样本偏度
样本峰度
T
ttrT
rE1
1)(
T
ttrT
r1
22 )(1
1)var(
T
ttrT
k1
44)(1
1
T
ttrT
s1
33)(1
1
第二节 描述性统计量及检验
Eviews 操作: 主菜单: File/New/Filework 工作窗口 : Unstructured/Deservation/OK 主菜单窗口: Data/ 空格 / 变量名 / 回车 工作窗口: 导入数据 /view/Descriptive Ststistics (描述统计量) /
Histogram and Stats (直方图和统计量)
第二节 描述性统计量及检验
例 2.1 右表是我国 1992-2003 年的实际 GDP 增长率(可比价格),对其进行描述性统计分析。
第二节 描述性统计量及检验
1992 14.2
1993 13.5
1994 12.6
1995 10.5
1996 9.6
1997 8.8
1998 7.8
1999 7.1
2000 8.0
2001 7.5
2002 8.0
2003 9.1
例 2.1 中 GDP 增长率的统计量:
例 2.1 中 GDP 增长率的偏度是 0.78 ,峰度 K 为2.14 ,
说明 GDP 增长率的分布是不对称的,相对于正态分布也是平坦的。
第二节 描述性统计量及检验
2.2. 统计量的检验 Jarque-Bera检验 统计量
其中 n 是样本个数, S 是偏度, K 是峰度
由于正态分布的偏度 S=0 ,峰度 K=3 ,所以 JB 统计量是用来衡量偏度和峰度偏离 0 和 3 的程度。
JB 统计量是用来检验时间序列是否服从正态分布的。
]4
)3([
6
22
KS
nJB
第二节 描述性统计量及检验
第二节 描述性统计量及检验
检验步骤: 原假设:时间序列服从正态分布。 计算 S 、 K ,并计算 JB 统计量。 在原假设下, JB 统计量服从自由度为 2 的 X^2 分
布,即 JB ~ X^2(2) 。以检验水平 5% 为例,对应的临界值 =5.99 ,即 P(X>5.99)=0.05 。
若计算的 JB >5.99 ,则拒绝原假设,分布不是正态分布。否则接受原假设。
上证综合指数收盘价曲线
0
1,000
2,000
3,000
4,000
5,000
6,000
7,000
250 500 750 1000
SH
上证综合指数收盘价曲线统计量
0
40
80
120
160
200
240
1000 2000 3000 4000 5000 6000
Series: SHSample 1 1000Observations 1000
Mean 2501.364Median 1743.640Maximum 6092.060Minimum 1011.500Std. Dev. 1460.333Skewness 0.783449Kurtosis 2.267514
Jarque-Bera 124.6544Probability 0.000000
上证综合指数收益率曲线
-.100
-.075
-.050
-.025
.000
.025
.050
.075
.100
250 500 750 1000
SHR
上证综合指数收益率统计量
0
40
80
120
160
200
240
-0.05 0.00 0.05
Series: SHRSample 1 1000Observations 999
Mean 0.000550Median 0.000353Maximum 0.088875Minimum -0.092562Std. Dev. 0.018805Skewness -0.460843Kurtosis 6.365833
Jarque-Bera 506.9232Probability 0.000000
第二节 描述性统计量及检验
Quantile—QuantileQuantile—Quantile 图图 Q-Q 图是借助分位数来比较两个分布的一种简单而
重要的工具(比 JB 统计量的用途更加广泛)。
分位数( QuantileQuantile )):对于介于 0 , 1之间的数 q ,满足如下条件的数 x(q) 称为 q 的分位数:
P( x< x(q) ) < q
第二节 描述性统计量及检验
分位数的计算: 对于一组观察值,取概率: Pi=(i-0.5)/n , i=1,…,n 。 与 Pi 对应的分位数是把数据从小到大排列后的第 i
个数,记为 Q(Pi) 。 对任意概率 P : Pi <P< Pi+1, 有 P=Pi +a( Pi+1-Pi) ,
那么 Q(P)=(1-a)Q(Pi) +aQ(Pi+1)
第二节 描述性统计量及检验 例:数据为 1.1 , 3.1 , 0.9 , 4.2 , 0.7 从小到大排列为: 0.7 , 0.9 , 1.1 , 3.1 , 4.2 与概率 P 对应的分位数: P1=(1-0.5)/5=0.1, , P2=0.3 , P3=0.5 , P4=0.7 , P5=0.9 Q(0.1)=0.7 , Q(0.3)=0.9 , Q(0.5)=1.1 , Q(0.7)=3.1 , Q(0.9)=4.2
对于概率 0.2 ,由于介于 P1 和 P2 之间,且有 0.2=0.1+0.5X (0.3-0.1) , 所以 Q(0.2)=(1-0.5) X Q(0.1)+0.5X Q(0.3)=0.5X0.7+0.5X0.9=0.8
第二节 描述性统计量及检验
随机变量分位数的计算: 若已知某个随机变量的分布函数,给定概率 q ,由
公式 P( x< x(q) )=q
即可求解出分位数 x(q)
第二节 描述性统计量及检验
Q-Q 图 ----把已知分布的分位数标在纵轴上,样本分位数标在横轴上,所得到的图形称为 Q-Q 图
Q-Q 图方法是根据 Q-Q 图的形状来判定样本数据分布是否与已知分布相同:
若样本数据分布与已知分布相同,则 Q-Q 图在一条直线上。
若 Q-Q 图不在一条直线上,则样本数据分布与已知分布不相同。
第二节 描述性统计量及检验
Q-Q 图的 Eviews 6 操作: 双击文件名 (sh), 选择View
/Graph … /Quantile-Quantile
点击QQ graph中的 options
第二节 描述性统计量及检验
Q-Q 图的 Eviews 6 操作: 双击文件名 (sh), 选择View
/Graph … /Quantile-Quantile
点击QQ graph中的 options , 出现右边的对话框
第二节 描述性统计量及检验
Q-Q 图的 Eviews 6 操作:
双击文件名 (sh), 选择View/Graph … /Quantile-Quantile
点击QQ graph中的 options , 在出现对话框中 distribution 选择对比的分布,如 Normal
第二节 描述性统计量及检验 可选与如下的理论分布的分位数相比较 : Normal( 正态 ) 分布:钟形并且对称的分布 . Uniform( 均匀 ) 分布:矩形密度函数分布 . Exponential( 指数 ) 分布:联合指数分布是一个有着一条
长右尾的正态分布 . Logistic(逻辑 ) 分布:除比正态分布有更长的尾外是一种近似于正态的对称分布 .
Extreme value( 极值 ) 分布: I 型极小值分布是有一条左长尾的负偏分布 , 它非常近似于对数正态分布 .
可以在工作文件中选择一些序列来与这些典型序列的分位数相比较,也可以在编辑框中键入序列或组的名称来选择对照的序列或组, EViews将针对列出的每个序列计算出 QQ图。
第二节 描述性统计量及检验
Q-Q 图的 Eviews 6 操作: 双击文件名 (sh), 选择View/G
raph … /Quantile-Quantile 点击QQ graph中的 options ,
在出现对话框中 distribution 选择对比的分布,如 Normal
第二节 描述性统计量及检验
Q-Q 图的 Eviews 6 操作:双击文件名 (sh), 选择View/Graph … /Quantile-Quantile
点击QQ graph中的 options , 在出现对话框中 distribution 选择对比的分布,如 Normal
点击 OK ,再点击确定,即出现上证综指收盘价 sh与正态分布的 QQ图
-4,000
-2,000
0
2,000
4,000
6,000
8,000
0 2,000 4,000 6,000 8,000
Quantiles of SH
Qu
antil
es
of
No
rma
l
第二节 描述性统计量及检验
Q-Q 图的 Eviews 6 操作:双击文件名 (sh), 选择View/Graph … /Quantile-Quantile
点击QQ graph中的 options , 在出现对话框中 distribution 选择对比的分布,如 Normal
点击 OK ,再点击确定,即出现上证综指收盘价 sh与指数分布的 QQ图
0
2,000
4,000
6,000
8,000
10,000
12,000
14,000
0 2,000 4,000 6,000 8,000
Quantiles of SH
Qu
an
tile
s o
f E
xpo
ne
nti
al
第二节 描述性统计量及检验
Q-Q 图的 Eviews 6 操作:双击文件名 (sh), 选择View/Graph … /Quantile-Quantile
点击QQ graph中的 options , 在出现对话框中 distribution 选择对比的分布,如 Normal
点击 OK ,再点击确定,即出现上证综指收盘价 sh与正态分布的 QQ图
-.08
-.06
-.04
-.02
.00
.02
.04
.06
.08
-.10 -.05 .00 .05 .10
Quantiles of SHR
Qu
antil
es
of N
orm
al
第二节 描述性统计量及检验
Excel 表格的编辑 表格的编辑
top related