第三章 统计整理

Post on 01-Jan-2016

46 Views

Category:

Documents

0 Downloads

Preview:

Click to see full reader

DESCRIPTION

第三章 统计整理. 1. 统计整理的内容和方法. 2. 统计分组. 3. 统计分布. 4. 数据的计算机录入汇总与质量控制. 5. 统计表. 第三章 统计整理. 第一节 统计整理的内容和方法. 一、统计整理的含义 根据统计研究的任务和要求,对调查 搜集到的 原始资料 进行审核、分组、汇总,使其条理化、系统化,从而得到反映总体特征的综合资料的过程。它是统计调查的继续,是统计分析和预测的前提和基础。. 二、统计整理的内容 1 、对原始资料进行审核与检查; 2 、对各项指标进行综合汇总; 3 、将汇总的结果编制成统计表与分析表 - PowerPoint PPT Presentation

TRANSCRIPT

COMPANY NAME

第三章 统计整理第三章 统计整理

1.1. 统计整理的内容和方统计整理的内容和方法法2.2. 统计分组统计分组

3.3. 统计分布统计分布

5.5. 统计表统计表

第三章 统计整理

4.4. 数据的计算机录入数据的计算机录入汇总与质量控制汇总与质量控制

第一节 统计整理的内容和方法第一节 统计整理的内容和方法

一、统计整理的含义 根据统计研究的任务和要求,对调查 搜集到的原始资料进行审核、分组、汇总,使其条理化、系统化,从而得到反映总体特征的综合资料的过程。它是统计调查的继续,是统计分析和预测的前提和基础。

二、统计整理的内容1 、对原始资料进行审核与检查;2 、对各项指标进行综合汇总;3 、将汇总的结果编制成统计表与分析表4 、对统计资料进行系统积累。

三、统计整理的方法 分组 是根据研究任务的要求,对调查所得的原始资料,确定哪些分组或分类。统计分组是统计整理的关键。

汇总 是在统计分组的基础上,把总体单位各种标志的标志值汇总起来,汇总主要有手工汇总和电子计算机汇总。统计汇总是统计整理的中心内容。

编表 是把汇总的资料按一定的规则在表格上表现出来。

第二节 统计分组第二节 统计分组

一、统计分组的含义 根据研究任务的要求和现象总体的内在特点,按照某种分组标志将统计总体分为若干组成部分。

理解统计分组的概念需要注意的问题: 1 、统计分组的对象是总体; 2 、统计分组应有分组标志; 3 、统计分组对总体而言是“分”,对总体单位而言是“合”

二、统计分组的作用(一)发现社会经济现象的特点与规律; 某班 40位学生统计学考试成绩如下 : 89 88 76 99 74 60 82 60 89 86 93 99 94 82 77 79 97 78 95 92 87 84 79 65 98 67 59 72 84 85 56 81 77 73 65 66 83 63 79 70

某班学生统计学考试成绩表

考 分 人 数(人)

比 重(%)

50 ~ 60

60 ~ 70

70 ~ 80

80 ~ 90

90 ~100

2

7

11

12

8

5

17.5

27.5

30

20

合 计 40 100

(二)将复杂的社会经济现象划分为性质不同的各种类型;

(三)分析总体中各个组成部分的结构情况;(四)揭示现象之间的依存关系。

某乡某种农作物的耕作深度与收获率的关系耕地按耕作深度分组 地块数 平均收获率(千克 / 亩)

10 ~ 1212 ~ 1414 ~ 1616 ~ 1818 ~ 20

71016123

200230270310340

三、统计分组的方法 统计分组的关键在于分组标志的选择与划分各组界限。

(一)分组标志选择的原则1 、根据研究目的与任务选择分组标志。2 、选用能反映事物本质或主要特征的标志。3 、根据现象所处的历史条件及经济条件来选择标志。

(二)分组方法1 、按品质标志与数量标志分组 按数量标志分组的关键是使用什么样的数量作为分组的组距

2 、按主要标志与辅助标志分组

四、统计分组体系 根据统计分组的要求,对同一总体进行多种不同分

组而形成的体系。(一)简单分组与平行分组体系 简单分组:将总体按某一个标志进行分组。 平行分组体系:将同一总体选择两个或两个以上的标志分

别进行独立的简单分组,就形成平行分组体系。

项目按学历分组 按性别分组 按学科性质分组

本科 专科 男学生 女学生 文科 理科就业人数

合计

大学生毕业就业情况平行分组体系

(二)复合分组与复合分组体系 复合分组:对同一总体选择两个或两个以上的标志重叠起来进行分组。

复合分组体系:多个复合分组组成的复合分组体系就是复合分组体系。(复合分组本身形成复合分组体系)

大学生毕业就业情况复合分组体系

大学生分组 就业人数

本科

文科男学生女学生小计

理科男学生女学生小计

专科

文科男学生女学生小计

理科男学生女学生小计

合 计

五、统计工作中常用的分组(一)按生产资料所有制性质分组(二)按国民经济行业分组(三)按单位隶属关系分组(四)按地区分组

第三节 次数分布第三节 次数分布

一、次数分布的概念 在分组的基础上,把总体的所有单位按组归并排列,形成总体各个单位在各组间的分布,称为统计分布,又称为分配数列或分布数列,通常称为分配数列。

分配数列包括两个要素:分组和次数。

二、分配数列的种类 (一)品质分配数列 按品质标志分组,观察总体各单位分布情况的分配数列。

表 1 、某班学生的性别构成情况

按性别分组 绝对数人数 比重(%)

男 30 75

女 10 25

合 计 40 100

表 2 某高校年底专职教师职称构成情况

教师按职称分组 教师人数(人) 比重(%)教授副教授讲师助教

其他教师

8821055013220

8.82155

13.22

合计 1000 100

(二)变量分配数列 按数量标志分组,观察总体各单位分布情况的分配数列。1 、单项式分组例如:某车间第二季度工人平均日产量资料如下

2 4 5 3 6 2 6 5 4 3 5 5 6 2 4

3 5 6 4 3 2 5 4 2 6 5 4 3 2 4 工人平均日产量(件)

2

3

4

5

6

表 3 某厂第二季度工人平均日产量单项数列

工人平均 日产量(件)

工 人 数 绝对数

比重( %)

2

10 8.7

3 15 13

4 30 26.1

5 40 34.8

6 20 17.4

合计 115 100

表 4 某公司下属连锁商店职员人数分布情况

按职工人数分组(人) 连锁商店个数(家) 比重(%)

89101112

1228322216

10.9125.4529.0920.0014.55

合 计 110 100

2 、组距式分组

例如:企业按工人数组距式分组为 200~ 499人 500~ 999人 1000~ 1999人 2000人以上

工人按月工资分组 : 1000~ 2000元 2000~ 3000元 3000~ 4000元 4000~ 5000元 5000元以上

( 1 )组限 每个组的两端数值,每组的起点称为下限,每组的终点称为上限。

如按工资分组,工资为连续型变量 1000~ 2000元 2000~ 3000元 3000~ 4000元 4000~ 5000元

也可只列出下限,不列出上限,如 300-, 400-, 500-, 600- , 或者只列出上限不列出下限,如: 800以下。

开口组组限的计算:首组开口的下限=首组上限-邻组组距末组开口的上限=末组下限+邻组组距例如: 1000以下 1000- 1500 1500- 2000 2000- 2500 2500以上首组下限: 1000-( 1500- 1000)= 500末组上限: 2500+( 2500- 2000)= 3000

( 2 )组距 每组的上限减下限得到的数值。 组距=上限-下限( 3 )组数 将某一变量数列划分为多少组。组数与组距成反比。组数越多,组距越小;组数越少,组距越大。

组数=全距 / 组距( 4 )组中值 上下限之间的中点数值,用来代表各组标志值的一般水平或平均水平。

计算方法:(上限+下限) /2 或 下限+(组距 ÷ 2) 上限-(组距 ÷ 2) 开口组组中值的计算缺下限的开口组组中值=上限-邻组组距 /2例如: 10以下 (组中值= 10- 10/2=5 ) 10~ 20 20~ 30缺上限的开口组组中值=下限+邻组组距 /2例如: 700~ 800 800以上 (组中值= 800+ 100/2= 850)

( 5 )等距分组和不等距分组等距分组:标志值在各组保持相等的组距。不等距分组:标志值在各组保持不相等的组距。

表5 某工厂工人完成生产定额情况表组距数列

工人按完成生产定额分组(%)

工 人 数 绝对数 比重( %)

80 - 90 30 16.7

90 - 100 40 22.2

100 - 110 60 33.3

110 - 120 30 16.7

120 - 130 20 11.1

合 计 180 100

表 6 某乡镇企业职工月收入分布表月收入(元) 职工人数 ( 人 ) 比重(%)1000元以下1000 ~ 1200

1200 ~ 1400

1400 ~ 1600

1600元以上

21420104

42840208

合计 50 100

所有的分配数列必须满足两个条件:各组频率都 >0;各组频率之和= 1

频数(频率)越大,该组标志值对总体标志水平所起的作用也越大;反之,越小。

三、次数分布的表示方法(一)列表法 将次数分布以统计表的形式表示

某班学生统计学考试成绩次数分配

考 分 次数 向上累计 向下累计 人数(人)

比率 (%)

人数(人 )

比率 (%)

人数 ( 人)

比率 (%)

50 ~ 60

60 ~ 70

70 ~ 80

80 ~ 90

90 ~ 100

2

7

11

12

8

5

17.5

27.5

30

20

2

9

20

32

40

5

22.5

50

80

100

40

38

31

20

8

100

95

77.5

50

20

合 计 40 100 _ _ _ _

(二)图示法1 、直方图2 、折线图3 、曲线图4 、饼图

第四节 数据的计算机录入汇总与质量控制 第四节 数据的计算机录入汇总与质量控制 ××

一、计算机汇总的步骤1 、编制程序2 、编码3 、数据录入4 、数据编辑5 、计算与制表二、数据录入的质量控制1 、做好登记与审查工作2 、控制录入质量3 、利用计算机进行审查 比较法审查:主要审查数据之间的关系

第五节 统计表 第五节 统计表 ××

一、统计表的概念及作用1 、概念:把汇总结果的资料按一定的规则在表格上表现出来,这种表格就叫统计表。

广义 狭义2 、作用

二、统计表的构成和内容(一)统计表的构成 从形式上看,统计表由总标题、横行标题、纵栏标题、指标数值四部分组成。

(二)统计表的内容

统计表从内容来看,包括主词和宾词两部分。 主词:统计表要说明的总体及其分组的名称。 宾词:说明总体的统计指标,包括指标名称和指标数值。

某市工商银行各项贷款构成情况

贷款余额 (万元)

比重(% )

流动资金贷款技术改造贷款基本建设贷款

523858463295323

91.03 8.05 0.92

三、统计表的种类(一)按作用不同分类1 、调查表2 、汇总表3 、分析表(二)按主词是否分组和分组的程度分类

简单表:简单表是主词未经任何分组的统计表。 某地区 2000~ 2006年地区生产总值表

年 份

国民生产总值(亿元)

2000200120022003200420052006

18598.421662.526651.934560.546670.057494.967559.7

分组表: 是主词按某一标志进行分组的统计表。

某城市商店商品销售额计划完成情况某城市商店商品销售额计划完成情况

按销售额计划完成情况分组

商定数(个)

销售额(万元)

售货员人数 平均每人销售额

100 以下100 ~ 105

105 ~ 110

110 以上

复合表 :是主词按两个或两个以上的标志进行复合分组的统计表。

按学历和性别分组 学生人数 比重在校学生数

一、硕士研究生男生女生

二、本科生男生女生

三、专科生男生女生

3600

112

90

22

2800

2310

490

688

300

388

100

3.11

2.5

0.61

77.78

64.17

13.61

19.11

8.33

10.78

20052005年末某高校在校学生情况表年末某高校在校学生情况表

四、统计表的编制规则

练习题

一、单选题1 、某企业职工月工资收入最高为 4260元,最低为2700元,据此分为六个组,形成闭口式等距数列,则组距应为()。A 、 710 B、 260C 、 1560 D、 3480

2 、统计整理主要是对()的整理。A 、历史统计资料 B 、统计分析资料C 、原始调查资料 D 、综合统计资料

3 、划分组限时相邻组的上下限如重叠,则()。A 、与上限相等的标志值计入上一组B 、与下限相等的标志值计入下一组C 、与上限相等的标志值计入下一组D 、与下限相等的标志值计入上一组

4 、某连续变量数列,其末组为开口组,下限为 200,又知邻组的组中值为 170,则末组组中值为()。A 、 260 B、 215C 、 230 D、 285

5 、按数量标志分组的关键是确定()。A 、变量值的大小 B 、组数C 、组中值 D 、组距

6 、对某校学生先按年级分组,在此基础上再按年龄分组,这种分组方法是()。

A 、简单分组 B 、复合分组C 、再分组 D 、平行分组

7 、统计分组是统计资料整理中常用的统计方法,它能够区分()。

A 、总体中性质相同的单位 B 、总体标志C 、一总体与它总体 D 、总体中性质相异的单位

8 、比较法审查是()。A 、利用逻辑理论检查指标之间有无矛盾B 、主要审查数据之间的关系C 、利用指标之间的比例关系进行审查D 、与上期资料进行对照研究

二、多选题1 、统计分组是将统计总体按一定标志区分为若干部分的统计方法。它()A 、是统计研究中的基本方法B 、是在统计总体内部进行的C 、是在统计总体之间进行的D 、对总体而言是分E 、对个体而言是合

2 、统计分组有按品质标志分组和按数量标志分组两种,下述人口总体分组属于按数量标志分组的是()。A 、按性别分组 B 、按年龄分组C 、按文化程度分组 D 、按收入水平分组E 、按居住地区分组

3 、指出下表表示的分布数列的类型()。

按劳动生产率分组(件 / 人) 职工人数50- 6060- 7070- 8080- 100

5102015

合计 50

A 、品质数列 B 、变量数列

C 、组距数列 D 、不等距数列

E 、等距数列

4 、统计整理的基本方法包括()A 、分组B 、汇总C 、编制统计图表D 、计算机录入E 、计算指标值

5 、下列分组中,按数量标志分组的有()。A 、企业按所有制分组B 、企业按产值分组C 、企业按工人数分组D 、企业按计划完成程度分组E 、企业按隶属关系分组

6 、在次数分配数列中( )。A、总次数一定 , 频数和频率成反比 B、各组的频数之和等于 100C、各组频率大于 0 ,频率之和等于 1D、频率越小,则该组的标志值所起的作用越小E、频率又称为次数

7 、下面按品质标志分组的有()。A 、工厂按产值计划完成程度分组B 、学生按健康状况分组C 、企业按所有制分组D 、职工按工龄分组E 、职工按文化程度分组

8 、组中值的计算公式为()。A 、组中值=(上限+下限) /2B 、组中值=上限+下限 /2 C 、组中值=上限 /2+下限D 、组中值=下限+(上限-下限) /2E 、组中值=上限-(上限-下限) /2

9 、将某班学生的统计学考试成绩分为 60分以下、 60- 70分、 70- 80分、 80- 90分、 90- 100分共 5 组,下列说法正确的是()。A 、某学生的成绩如果是 80分,他应归入 70- 80分这组B 、第一组的假定下限是 50C 、相邻组组限是重叠的D 、第三组组中值为 75E 、它属于等距分组

三、判断题1 、对连续变量数列,既可以编制成单项式变量数列,也可以

编制成组距式变量数列。()2 、在统计分组中,频数实际上是各组标志值的加权,用以权衡各组作用的大小。()

3 、统计分布是指总体中各个单位在各组间的分布。()4 、根据数量标志下的各变量值,很容易就能判断出现象性质

上的差异。()5 、各组次数占总次数的比值通常称为频数。()6 、将同一总体选择两个或两个以上的标志重叠起来进行分组,

就是复合分组。()7 、统计分组的关键问题是确定组距和组数。()

四、综合应用题某企业工人日产量资料如下:

日产量分组 工人数50 - 6060 - 7070 - 8080 - 9090 - 100100 - 110110 - 120120 - 130

61212141518228

合 计 107

( 1 )上述数列属于()。

A 、单项式数列 B 、品质数列

C 、不等距数列 D 、等距数列

( 2 )上列数列中的变量是()。A 、日产量 B 、工人数C 、日产量的具体数值 D 、工人数的具体数值( 3 )上述数列中工人数是()。A 、变量 B 、频数C 、变量值 D 、分组标志( 4 )各组的频数分别为()。A 、 6 12 12 14 15 18 22 8B 、 55 65 75 85 95 105 115 125C 、 0.06 0.11 0.11 0.13 0.14 0.17 0.21 0.07D 、 60 70 80 90 100 110 120 130

( 5 )从表中可看出日产量 80- 90件组的工人数为 14人,该人数包括()。A 、日产量为 80件的人数B 、日产量为 90件的人数C 、既包括日产量为 80件的人数也包括日产量为 90件的人数D 、不包括日产量为 80件的人数也不包括日产量为90件的人数

top related