统计学第三章统计整理.ppt

上传人:m**** 文档编号:570247893 上传时间:2024-08-03 格式:PPT 页数:85 大小:1.20MB
返回 下载 相关 举报
统计学第三章统计整理.ppt_第1页
第1页 / 共85页
统计学第三章统计整理.ppt_第2页
第2页 / 共85页
统计学第三章统计整理.ppt_第3页
第3页 / 共85页
统计学第三章统计整理.ppt_第4页
第4页 / 共85页
统计学第三章统计整理.ppt_第5页
第5页 / 共85页
点击查看更多>>
资源描述

《统计学第三章统计整理.ppt》由会员分享,可在线阅读,更多相关《统计学第三章统计整理.ppt(85页珍藏版)》请在金锄头文库上搜索。

1、第三章第三章 统计整理统计整理统计学课件制作人:制作人: 胡胡 宝宝 臣臣 教学目的与要求教学目的与要求 通过本章学习,首先要明确统计整理的意义和步通过本章学习,首先要明确统计整理的意义和步骤,重点掌握统计分组的理论和方法,学会编制变量骤,重点掌握统计分组的理论和方法,学会编制变量数列和统计表。数列和统计表。 教学重点与难点教学重点与难点 重点重点:分组标志的选择;:分组标志的选择; 连续型变量的组距分连续型变量的组距分组;次数分布数列的编制;权数意识的培养,正确理组;次数分布数列的编制;权数意识的培养,正确理解权数。解权数。 难点难点:组距分组中组数、组距和组限的确定。:组距分组中组数、组距

2、和组限的确定。1.女,本科,讲师,月收入3500; 2.男,本科,副教授,月收入3800;3.男,专科,讲师,月收入2600; 4.女,本科,讲师,月收入2800;5.女,本科,副教授,月收入3900; 6.女,研究生,讲师,月收入3100;7.男,本科,教授,月收入4200; 8.女,研究生,副教授,月收入3200;9.女,研究生,教授,月收入4300; 10.女,专科,讲师,月收入2900;11.女,本科,讲师,月收入3100; 12.女,研究生,讲师,月收入3100;13.男,本科,教授,月收入4500; 14.男,研究生,教授,月收入3600;15.女,本科,讲师,月收入3500; 1

3、6.男,研究生,副教授,月收入3800;17.男,专科,讲师,月收入2600; 18.女,本科,讲师,月收入2800;19.女,本科,副教授,月收入3900;20.女,本科,副教授,月收入3100;21.男,本科,教授,月收入4200; 22.女,研究生,教授,月收入3500;23.女,研究生,讲师,月收入3200 24.女,研究生,讲师,月收入3900;25.女,研究生,教授,月收入4800;26.女,研究生,讲师,月收入3100; 教学导例教学导例 某高校教师有关资某高校教师有关资料料27.男,本科,教授,月收入4500; 28.男,研究生,教授,月收入470029.男,研究生,教授,月收

4、入4800;30.女,研究生,讲师,月收入380031.女,研究生,讲师,月收入3500;32.男,研究生,副教授,月收入360033.男,本科,副教授,月收入4200;34.女,本科,教授,月收入390035.男,研究生,讲师,月收入3200;36.女,本科,讲师,月收入320037.女,本科,助教,月收入2100; 38.男,本科,副教授,月收入3600;39.男,专科,讲师,月收入2600; 40.女,本科,教授,月收入4800;41.女,本科,副教授,月收入3900;42.女,研究生,讲师,月收入3100;43.男,本科,教授,月收入4500; 44.女,研究生,副教授,月收入3900

5、45.女,研究生,教授,月收入4200;46.女,专科,助教,月收入2900;47.女,研究生,讲师,月收入2800;48.女,本科,教授,月收入4900;49.男,本科,助教,月收入1800; 50.男,研究生,教授,月收入4600;51.女,本科,助教,月收入1900; 52.男,本科,副教授,月收入3800; 某高校教师有关资料某高校教师有关资料(续(续1 1)53.男,专科,讲师,月收入2600; 54.女,本科,助教,月收入1800;55.女,本科,助教,月收入1900; 56.女,本科,副教授,月收入3100;57.男,本科,教授,月收入4200; 58.女,研究生,副教授,月收入

6、350059.女,本科,讲师,月收入2800; 60.女,研究生,副教授,月收入390061.女,研究生,教授,月收入4100;62.女,研究生,助教,月收入180063.男,本科,助教,月收入1800; 64.男,研究生,助教,月收入160065.女,本科,助教,月收入1900; 66.男,本科,副教授,月收入370067.男,专科,讲师,月收入2600; 68.女,本科,讲师,月收入2800;69.女,本科,助教,月收入1600; 70.女,本科,副教授,月收入310071.男,本科,教授,月收入4200; 72.女,研究生,教授,月收入450073.女,本科,讲师,月收入2800; 74

7、.女,研究生,副教授,月收入420075.女,研究生,助教,月收入2100; 76.女,研究生,助教,月收入180077.女,本科,助教,月收入1800; 78.女,本科,副教授,月收入390079.女,研究生,讲师,月收入3300 80.女,本科,助教,月收入1800 某高校教师有关资料某高校教师有关资料( (续续2)2)面对如此繁杂的个体资料,大家感觉怎么样?那么整理为下面的图表又怎么样呢?乱乱乱乱乱乱.整理结果的表现形式整理结果的表现形式- -统计图统计图该校教师职称及性别柱形图该校教师职称、性别、学历结构图整理结果的表现形式整理结果的表现形式- -统计表统计表 该校教师职称及性别分布数

8、列 单位:人职称职称小计小计男男女女助教助教15153 31212讲师讲师26266 62020副教授副教授19197 71212教授教授202011119 9合计合计808027275353某高校教师月收入分布表收入(元)人数(人)比重%2000以下2000-30003000-40004000以上1215341915.018.742.523.8合计80100.0本章主要内容本章主要内容 统计整理的意义和步骤统计整理的意义和步骤 统计分组统计分组 次数分布(分配)数列次数分布(分配)数列 统计表统计表第一节第一节 统计整理的意义和步骤统计整理的意义和步骤 主要内容主要内容 统计整理的意义统计整

9、理的意义 统计整理的步骤统计整理的步骤 统计整理的地位统计整理的地位统计整理的地位统计整理的地位 统计调查统计调查统计调查统计调查 统计整理统计整理统计整理统计整理 统计分析统计分析统计分析统计分析 一、统计整理的意义一、统计整理的意义搜集原始资料搜集原始资料搜集原始资料搜集原始资料对个体的感性认识对个体的感性认识对个体的感性认识对个体的感性认识分类、汇总分类、汇总分类、汇总分类、汇总过渡阶段过渡阶段过渡阶段过渡阶段 取得研究结论取得研究结论取得研究结论取得研究结论对总体的理性认识对总体的理性认识对总体的理性认识对总体的理性认识 统计整理的概念统计整理的概念统计整理的概念统计整理的概念 根据目

10、的根据目的根据目的根据目的 对统计调查资料对统计调查资料对统计调查资料对统计调查资料 实施实施实施实施分类、汇总分类、汇总分类、汇总分类、汇总 编制统计图表编制统计图表编制统计图表编制统计图表 为统计分析奠定基础为统计分析奠定基础为统计分析奠定基础为统计分析奠定基础二、统计整理的步骤二、统计整理的步骤制订整理方案制订整理方案审核调查资料审核调查资料具体实施整理具体实施整理复查整理结果复查整理结果编制统计图表编制统计图表134425统计整理的步骤统计整理的步骤(续)(续)(续)(续)制订整理方案制订整理方案制订整理方案制订整理方案:主要内容有:主要内容有:统计分组体系和统计指标体系;统计分组体系

11、和统计指标体系;编制整理表格和填表说明;编制整理表格和填表说明;整理的组织形式和汇总的技术方法。整理的组织形式和汇总的技术方法。 审核调查资料审核调查资料审核调查资料审核调查资料:审核内容包括:审核内容包括:调调查资料的完整性和正确性。查资料的完整性和正确性。 审核方法:逻辑检查和计算检查。审核方法:逻辑检查和计算检查。绘制统绘制统绘制统绘制统计图表计图表计图表计图表:统计资料表现:统计资料表现形式形式家庭户规模家庭户一代户二代户三代户四代户五代及户 数以上户总总 计计4019341961373631121922378466956213527681892914一人户一人户58396327583

12、96327二人户二人户979476867521823222729454三人户三人户10797865424632941020504863464874四人户四人户70598493742461512560831852703972910五人户五人户40332512352069122498412723335749718362六人户六人户1688755483923269250713118985991806333七人户七人户5753970376567869514212526716033804八人户八人户2235271232722721831657839281117860九人户九人户9425111105010

13、2349713749114900463十人及以上户十人及以上户8612183482897992633766942403922010年全国不同规模的家庭户类别年全国不同规模的家庭户类别 “十五”时期我国进出口情况第二节第二节 统计分组统计分组 主要内容主要内容 统计分组的意义统计分组的意义统计分组的意义统计分组的意义 统计分组的两个关键问题统计分组的两个关键问题统计分组的两个关键问题统计分组的两个关键问题 统计分组体系统计分组体系统计分组体系统计分组体系 统计分组的种类及方法统计分组的种类及方法统计分组的种类及方法统计分组的种类及方法一、统计分组的意义一、统计分组的意义 统计分组统计分组: 根据

14、统计研究的需要,将总体 按一定的标志划分为若干性质 不同的组成部分的统计方法。 两个涵义两个涵义: 对总体而言是“分”, 对个体而言是“合”。质量标准质量标准: 组内同质性组内同质性 组间差异性组间差异性 统计分组的主要作用对社会经济现象进行对社会经济现象进行对社会经济现象进行对社会经济现象进行类型划分类型划分类型划分类型划分统计分统计分统计分统计分组过组过组过组过程就是类型划分的过程。划分类型,程就是类型划分的过程。划分类型,程就是类型划分的过程。划分类型,程就是类型划分的过程。划分类型,揭示差异是统计分组的根本作用揭示差异是统计分组的根本作用揭示差异是统计分组的根本作用揭示差异是统计分组的

15、根本作用 。对社会经济现象进行对社会经济现象进行对社会经济现象进行对社会经济现象进行结构分析结构分析结构分析结构分析 反映总体内部结构,判定现象性质及变化。反映总体内部结构,判定现象性质及变化。反映总体内部结构,判定现象性质及变化。反映总体内部结构,判定现象性质及变化。研究社会经济现象间的研究社会经济现象间的研究社会经济现象间的研究社会经济现象间的依存关系依存关系依存关系依存关系分析影响因素和结果之间的变动关系及规律。分析影响因素和结果之间的变动关系及规律。分析影响因素和结果之间的变动关系及规律。分析影响因素和结果之间的变动关系及规律。20002000及及20112011年我年我国城乡居民消费

16、结构对比表国城乡居民消费结构对比表吃吃穿穿住住用用医医教教通通其他其他城城镇镇0000 11111111农农村村0000 11111111 39.239.236.236.236.236.249.149.14 4 4 40.40.40.40.410.010.01 1 1 11.11.11.11.15.85.86.6.6.6.5 5 5 510.010.09.9.9.9.3 3 3 315.515.51 1 1 18.48.48.48.48.88.86.6.6.6.8 8 8 84.54.55.95.95.95.96.46.46.46.46.46.45.25.28.48.48.48.412.612

17、.61 1 1 12.22.22.22.211.211.27.67.67.67.67.97.91 1 1 14.24.24.24.25.65.610.10.10.10.5 5 5 55.25.23.3.3.3.8 8 8 83.13.12.32.32.32.3 (资料来源:2001、2012年中国统计年鉴) 注:表中“用”为家庭设备、用品及服务; “教”为教育文化娱乐服务;“通”为交通和通讯。2012年某地区职工受教育程度与月收入关系表受教育程度受教育程度平平均数(元)均数(元)博士博士硕士硕士本科本科大专大专中专、高中中专、高中初中及以下初中及以下5515551542184218279927

18、99201520151597159712271227二、统计分组的两个关键问题(一)(一)选择分分组标志志(首要问题)选择分组标志选择分组标志 的原则的原则根据研究目的具体问题具体分析选择主要标志( (二)划分各二)划分各组界限界限在选定分组标志后,就需要明确组与组之间的界限。如何正确选择分组标志?选择主要标志:选择主要标志:选择主要标志:选择主要标志:有时存在若干个标志有时存在若干个标志都能不同程度满足研究目的的需要。都能不同程度满足研究目的的需要。如研究如研究某高某高校职工生活水平,可用的校职工生活水平,可用的标标志有志有: :职工工资、收入、职工家庭月职工工资、收入、职工家庭月人均收入、

19、职工家庭年人均收入。人均收入、职工家庭年人均收入。该选择哪个更为合适呢?该选择哪个更为合适呢?三、统计分组体系三、统计分组体系简单分组简单分组:对总体只按一个标志分组。平行分组体系平行分组体系:两个及以上标志分别分别分组统计分组体系统计分组体系:运用多个分组标志对同 一总体进行分组形成的一系列相互联系、相互补充的统计分组的整体。复合分组体系复合分组体系:两个及以上标志层叠层叠分组 平行分组体系平行分组体系(人口分组为例)(人口分组为例)(人口分组为例)(人口分组为例)性别性别男女年龄年龄0-1415-6465以上户籍户籍城乡 平行分组体系适宜对研究对象进行 多角度、多方面分析。 复合分组体系(

20、人口分组为例)(人口分组为例) 城城镇 农村村 男男 女女 女女 男男 0-14 15-64 65以上 0-14 15-64 65以上 0-14 15-64 65以上 0-14 15-64 65以上复合分组体系宜对研究对象 进行多层次逐层深入分析复复合分组合分组体系体系 按城乡和性别分组按城乡和性别分组小计小计0-140-1415-6415-64 6565以上以上 城城 镇镇 男男 女女 农农 村村 男男 女女 合合 计计 注意:复合分组每增加一个层次就会使组数几何级增加。如上例: 2618组。因此复合分组层次也不可过多。有时候,为了排版和观感的需要复合分组的表现形式还可以采用上表式样。 年

21、龄人 口 数性别比合计男女(女=100)总总 计计1332810869682329104650481765104.90 0-4岁755326104106256634470044119.13 5-9岁708815493846466532416884118.66 10-14岁749084624026727734641185116.24 15-19岁998891145190483047984284108.17 20-24岁1274125186400857363403945100.95 25-29岁1010138525083703850176814101.32 35-39岁11802595960391

22、10457634855104.78 45-49岁1055945535377641851818135103.78 50-54岁787531714036323438389937105.14 55-59岁813124744108293840229536102.12 60-64岁586672822983442628832856103.47 65-69岁411132822074847120364811101.88 70-74岁32972397164034531656894499.00 75-79岁23852133112788591257327489.71 80-84岁133731985917502745

23、569679.37 85-89岁56319282199810343211864.09 90-94岁1578307530872104743550.68 95-99岁36997911771625226346.66 100岁及以上3593488522708232.692010年第六次人口普查分性别和年龄的人口复合分组情况年第六次人口普查分性别和年龄的人口复合分组情况对问题的研究往往需要多角度和多层次。平行分组体系可以满足多角度研究的需要,复合分组体系可以满足多层次研究的需要。四、统计分组的种类及方法统计统计分组分组变量变量分组分组品质品质分组分组单项单项分组分组组距组距分组分组等距分组等距分组异距分

24、组异距分组 2012年年末人口数及其构成年年末人口数及其构成 单位:万人单位:万人指标指标年末数年末数比重比重%全国总全国总人口(大陆)人口(大陆)135404100.0其中:城镇其中:城镇7118252.6乡村乡村6422247.4其中:男性其中:男性6939551.3女性女性6600948.7 (一)(一) 品质分组(实例)品质分组(实例)2012年居民消费价格比上年涨跌幅度年居民消费价格比上年涨跌幅度单位:%指标全国城市农村居民消费价格2.62.72.5其中:食品其中:食品4.85.14.0烟酒及用品2.92.92.7衣着3.12.93.8家庭设备用品及维修服务1.92.11.5医疗保健

25、和个人用品2.02.02.1交通和通信-0.1-0.30.6娱乐教育文化用品及服务0.50.41.0居住2.12.21.9 (二)变量分组(二)变量分组变量分组反映的是各组量的差别,通过量的差别来反映事物间的性质差别。 1.单项分组单项分组 每组只用一个具体的变量值来表示的分组。其组数由不重复的变量值个数决定;各组组值明确。适用于不重复的变量值个数不多的离散变量。 单项分组单项分组(实例)(实例) 现有现有5050名育龄妇女(名育龄妇女(15-4915-49)生育子女数情况)生育子女数情况: : 0 2 1 1 3 1 3 0 0 1 1 3 2 0 0 0 3 1 0 0 2 0 2 0 1

26、 1 0 1 1 0 1 1 2 1 3 1 5 3 2 1 2 0 2 3 2 1 0 1 2 0按育龄妇女生育子女数进行单项分组可分为:按育龄妇女生育子女数进行单项分组可分为: 0 0 0 0、1 1 1 1、2 2 2 2、3 3 3 3、5 5 5 5五组。五组。 2、组距分组各组用变量值的变动区间来表示。各组用变量值的变动区间来表示。各组用变量值的变动区间来表示。各组用变量值的变动区间来表示。适用于连续变适用于连续变适用于连续变适用于连续变量和不重复的变量值个数很多的离散变量。量和不重复的变量值个数很多的离散变量。量和不重复的变量值个数很多的离散变量。量和不重复的变量值个数很多的离散

27、变量。 (1 1)几个基本概念:几个基本概念:几个基本概念:几个基本概念:组限组限组限组限:(下限、上限):(下限、上限):(下限、上限):(下限、上限)闭口组闭口组闭口组闭口组:下限、上限都有。如下限、上限都有。如下限、上限都有。如下限、上限都有。如200300200300开口组开口组开口组开口组: 下开口组:下开口组:下开口组:下开口组: 以下以下以下以下 上开口组:上开口组:上开口组:上开口组: 以上以上以上以上为什么要设开口组?为什么要设开口组? 统计分组的原则统计分组的原则统计分组的原则统计分组的原则:“ “不漏不重不漏不重不漏不重不漏不重” ” 。即:。即:。即:。即:(1 1)要

28、使总体中的每个单位都有组可归,贯彻分)要使总体中的每个单位都有组可归,贯彻分)要使总体中的每个单位都有组可归,贯彻分)要使总体中的每个单位都有组可归,贯彻分 组的组的组的组的“ “穷举穷举穷举穷举” ”原则;原则;原则;原则;即即即即:“ “不遗漏不遗漏不遗漏不遗漏” ”原则原则原则原则。(2 2)每个单位都只能归到某一组,不能重复归组;)每个单位都只能归到某一组,不能重复归组;)每个单位都只能归到某一组,不能重复归组;)每个单位都只能归到某一组,不能重复归组; 即即即即“ “互斥互斥互斥互斥” ”原则原则原则原则。 在出现极端值情况下,为了遵循统计分组的原在出现极端值情况下,为了遵循统计分组

29、的原在出现极端值情况下,为了遵循统计分组的原在出现极端值情况下,为了遵循统计分组的原则,应设置开口组解决极端值归组问题。则,应设置开口组解决极端值归组问题。则,应设置开口组解决极端值归组问题。则,应设置开口组解决极端值归组问题。全距全距=最大值最小值组距组距=上限下限 (注意:开口组组距以邻组组距代替)实例实例实例实例: 组距分组(续(续2 2) 学生成绩分组学生成绩分组学生成绩分组学生成绩分组 6060以下以下 60-70 60-70 70-80 70-80 80-90 80-90 90 90以上以上 职工工资分组职工工资分组 1000以下 1000-2000 2000-3000 3000-

30、4000 4000以上年龄年龄0-1415-6465以上下开口组下开口组下开口组下开口组 以下以下以下以下上开口组上开口组上开口组上开口组 以上以上以上以上上限上限下限下限组距组距组中值组中值注注 意意组中值代表组内各单位的一般水平。组中值代表组内各单位的一般水平。其代表性受组内各单位分布是否均匀或是否在组中值两侧成对称分布,否则计算出来的数值与实际会有较大偏差。 (2 2)组距分组要解决的几个主要问题)组距分组要解决的几个主要问题)组距分组要解决的几个主要问题)组距分组要解决的几个主要问题组距组距组距组距:等距分组或异距分组?等距分组或异距分组?等距分组或异距分组?等距分组或异距分组? 组距

31、多长?组距多长?组距多长?组距多长? 实际工作中,一般采用等距分组。实际工作中,一般采用等距分组。实际工作中,一般采用等距分组。实际工作中,一般采用等距分组。组数组数组数组数 :就是决定将总体分成多少组?就是决定将总体分成多少组?就是决定将总体分成多少组?就是决定将总体分成多少组? 组距和组数必须先确定一个。组距和组数必须先确定一个。组距和组数必须先确定一个。组距和组数必须先确定一个。当研究对象有明显的几当研究对象有明显的几当研究对象有明显的几当研究对象有明显的几个组成部分,则可先确定组数,再根据情况确定各组的组个组成部分,则可先确定组数,再根据情况确定各组的组个组成部分,则可先确定组数,再根

32、据情况确定各组的组个组成部分,则可先确定组数,再根据情况确定各组的组距。距。距。距。组限组限组限组限:确定组限就是要找出何处是决定事物性质差别的数确定组限就是要找出何处是决定事物性质差别的数确定组限就是要找出何处是决定事物性质差别的数确定组限就是要找出何处是决定事物性质差别的数量界限?组限的表示方法?量界限?组限的表示方法?量界限?组限的表示方法?量界限?组限的表示方法?组距和组数组距和组数的关系 组数与组距的确定,要力求能够将总体分布的组数与组距的确定,要力求能够将总体分布的特点反映出来。特点反映出来。由于全距是既定的,在等距分组由于全距是既定的,在等距分组情况下,组距和组数存在相互制约的关

33、系:情况下,组距和组数存在相互制约的关系: 需要注意:根据上式计算的只能是一个参考数。需要注意:根据上式计算的只能是一个参考数。需要注意:根据上式计算的只能是一个参考数。需要注意:根据上式计算的只能是一个参考数。若先确定组距若先确定组距若先确定组距若先确定组距 组距要适中。若组距过小,易将同质单位划组距要适中。若组距过小,易将同质单位划分在不同组;若组距过大,会使不同性质的单位同分在不同组;若组距过大,会使不同性质的单位同处一组,掩盖现象质的差异。处一组,掩盖现象质的差异。 若先确定组距,应先观察原始资料,大致判若先确定组距,应先观察原始资料,大致判断总体的水平高低和分布,然后确定组距。如对某

34、断总体的水平高低和分布,然后确定组距。如对某公司职工按月收入分组。公司职工按月收入分组。据资料若大致判断其收入据资料若大致判断其收入普遍在普遍在30003000元左右,此时以元左右,此时以500500元元或或10001000元元做为组做为组距比较合适,若大致为距比较合适,若大致为10001000元左右,则组距为元左右,则组距为100100元或元或200200元比较合适。元比较合适。 资料:现有某地区现有某地区现有某地区现有某地区500500500500个企业的计划完成个企业的计划完成个企业的计划完成个企业的计划完成 程度资程度资程度资程度资 料,其中最低料,其中最低料,其中最低料,其中最低83

35、%83%83%83%,最高,最高,最高,最高125%125%125%125%,全距为,全距为,全距为,全距为42%42%42%42%。 据本资料可确定组数为据本资料可确定组数为6 6,则计算出的组距为,则计算出的组距为7 7,分组结果为(分组结果为(1 1)。观察以下三种分组结果:)。观察以下三种分组结果:若先确定组数-实例讨论先确定组数-实例讨论 分组结果(分组结果(分组结果(分组结果(1 1 1 1)83% -90%83% -90%90%-97%90%-97% 97%-104% 97%-104% 104%-111%104%-111% 111%-118%111%-118%118%-125%1

36、18%-125% 分组结果(分组结果(分组结果(分组结果(3 3 3 3)80%-90%80%-90%90%-100%90%-100%100%-110%100%-110%110%-120%110%-120%120%-130%120%-130% 分组结果(分组结果(分组结果(分组结果(2 2 2 2)83%-93% 83%-93% 93%-103%93%-103% 103%-113%103%-113%113%-123% 113%-123% 123%-133%123%-133% 以上哪种分组效果最好?以上哪种分组效果最好?以上哪种分组效果最好?以上哪种分组效果最好?首先首先,分组(分组(分组(分组

37、(1 1 1 1)杂乱,难分析判断。一般等距分组时,组)杂乱,难分析判断。一般等距分组时,组)杂乱,难分析判断。一般等距分组时,组)杂乱,难分析判断。一般等距分组时,组距尽可能取距尽可能取距尽可能取距尽可能取10101010或或或或10101010的倍数,此例选的倍数,此例选的倍数,此例选的倍数,此例选10101010较合适较合适较合适较合适。 其次其次,分组(分组(分组(分组(1 1 1 1)第三组和分组()第三组和分组()第三组和分组()第三组和分组(2 2 2 2)第二组均出现严重问)第二组均出现严重问)第二组均出现严重问)第二组均出现严重问题,既包括超额完成计划的,还包括没有完成计划的

38、。题,既包括超额完成计划的,还包括没有完成计划的。题,既包括超额完成计划的,还包括没有完成计划的。题,既包括超额完成计划的,还包括没有完成计划的。再次再次,组限问题,如确定组距为组限问题,如确定组距为组限问题,如确定组距为组限问题,如确定组距为10101010,组数为,组数为,组数为,组数为5 5 5 5,而各组具体,而各组具体,而各组具体,而各组具体范围没搞清,分组(范围没搞清,分组(范围没搞清,分组(范围没搞清,分组(2 2 2 2)也不合适。)也不合适。)也不合适。)也不合适。最后最后,在算全距时要注意别机械。若有极端值,则以次大在算全距时要注意别机械。若有极端值,则以次大在算全距时要注

39、意别机械。若有极端值,则以次大在算全距时要注意别机械。若有极端值,则以次大或次小值计算全距,再用开口组解决最大或最小值归组问或次小值计算全距,再用开口组解决最大或最小值归组问或次小值计算全距,再用开口组解决最大或最小值归组问或次小值计算全距,再用开口组解决最大或最小值归组问题。题。题。题。 若此例有若此例有20%20%和和180%180%,可以在计算全距时不考虑,可以在计算全距时不考虑组限的表示方法组限的表示方法组限的表示方法组限的表示方法组限的表示方式取决于变量的类型。连续变量,组限的表示方式取决于变量的类型。连续变量,须采用重叠组限;离散变量可采用间断组限或重须采用重叠组限;离散变量可采用

40、间断组限或重叠组限。叠组限。如:如:企业按职工人数分组企业按职工人数分组 不重叠组限不重叠组限 99以下 100 999 10004999 5000以上 重叠组限重叠组限100以下 1001000100050005000以上连续变量组限的表现方法-重叠组限职工月收入分组职工月收入分组 (元) 1500以下 1500-2000 2000-2500 2500-3000 3000-3500 3500-4000 4000以上组距组距分组一般采用等距分组; 各组组距以10或10的倍数为宜;组数组数不可过多(少),10组以内5-10组为宜;组限组限以10或10 的倍数为宜;为保持一致,离散变量也采用重叠组

41、限的方法。重叠组限为保持一致,离散变量也采用重叠组限的方法。重叠组限解决了遗漏问题,但同时却出现了重复归组问题。为解决此解决了遗漏问题,但同时却出现了重复归组问题。为解决此问题,采用重叠组限时,应遵循问题,采用重叠组限时,应遵循“上组限不在内上组限不在内上组限不在内上组限不在内”原则。原则。 根据根据“穷举穷举”原则要求,原则要求,最小组的下限要不高于最小变量最小组的下限要不高于最小变量值值;最大组的上限要不低于最大变量值最大组的上限要不低于最大变量值。 组距分组的一般处理方法组距分组的一般处理方法第三节 次数分布(分配)数列主要内容主要内容次数分布(分配)数列概念及构成次数分布(分配)数列概

42、念及构成次数分布(分配)数列概念及构成次数分布(分配)数列概念及构成次数分布(分配)数列的种类及编制次数分布(分配)数列的种类及编制次数分布(分配)数列的种类及编制次数分布(分配)数列的种类及编制变量数列次数分布的主要类型变量数列次数分布的主要类型变量数列次数分布的主要类型变量数列次数分布的主要类型统计汇总技术统计汇总技术统计汇总技术统计汇总技术一、次数分布(分配)数列概念及构成次数分布(分配)数列次数分布(分配)数列次数分布(分配)数列次数分布(分配)数列:是指在统计分组的基础上,将总体各单位进行归组整理编制而成的一种反映总体单位在各组之间分配状况的统计数列。权权数数 各组组别各组组别各组组

43、别各组组别 单位数(频数、次数)单位数(频数、次数) 比重(频率)比重(频率)比重(频率)比重(频率)构构成成要要素素 【课堂讨论1】讨论目的讨论目的:认识权数的作用; 比较绝对数权数和相对数权数的作用差别 资料(1)现有甲乙两个班的某学期考试的成绩。 成绩成绩 甲甲 班班 乙乙 班班人数人数比重比重% %人数人数比重比重% %及及 格格不及格不及格7 763631010909063637 790901010合合 计计70701001007070100100 甲乙两班的英语学习成绩表甲乙两班的英语学习成绩表 【课堂讨论2】资料资料(2):现有A、B两个不同股份公司的甲、乙两股东所持本公司股份如

44、下表。若甲、乙都是所在公司第一大股东。甲掌握本公司2000万股份,而乙只掌握本公司120万股份。要求要求:判断甲、乙在本公司的决定权大小。 股东股东A A公司公司公司公司B B公司公司公司公司股份数(万)股份数(万)比重比重%股份数(万)股份数(万)比重比重%甲甲乙乙200020004 41201206060总股份总股份5000050000100100200200100100二、次数分布(分配)数列的种类 次数分布等距等距数列数列变量变量数列数列品质品质数列数列单项单项数列数列组距组距数列数列异距异距数列数列某校学生性别构成某校学生性别构成性别性别人数人数(人)(人)比重比重(%)男男女女25

45、0250530530 32.132.1 67.9 67.9合计合计780780100.0100.0某村农户按子女数分组某村农户按子女数分组品质数列品质数列子女数子女数户数户数比率比率%0 01 12 23 3 1010 90 90 60 60 40 40 5 5 45 45 30 30 20 20合计合计200200100100次数次数频率频率变量数列变量数列组别组别 组距数列的编制(实例)(实例)资料资料:现有:现有20122012年某地年某地5050户居民家庭人均月收入资料户居民家庭人均月收入资料如下:如下: 822 794 773 737 898 822 794 773 737 898

46、827 827 798 776 798 776 746 811 746 811 855 740 775 796 867 855 740 775 796 867 824 824 882 729 764 788 735 882 729 764 788 735 771 791 819 771 791 819 860 726 860 726 762 762 786 809 852 786 809 852 15201520 722 722 760 784 940 930 760 784 940 930 689 659 689 659 380 380 803 803 700 753 781 801 829

47、 700 753 781 801 829 712 857 712 857 781 781 803 832803 832可以看出这些资料很凌乱,难以直接判断其分布特征。可以看出这些资料很凌乱,难以直接判断其分布特征。 组距数列的编制实例组距数列的编制实例(续(续1 1)第一步第一步:按顺序排列变量值;按顺序排列变量值;第二步第二步:计算全距;计算全距; 变量值在变量值在380-1520380-1520之间,全距为之间,全距为11401140。由于。由于380380和和15201520为极端值,计算全距可不予考虑。可用为极端值,计算全距可不予考虑。可用开口组表示;则全距开口组表示;则全距=940-

48、659=281=940-659=281 第三步第三步:确定组距或组数;确定组距或组数; 若分若分6 6组,则组距组,则组距=281/6=46.8 =281/6=46.8 ,组距设为,组距设为5050;若分;若分4 4组,则组距设为组,则组距设为100100。组距太小不能反。组距太小不能反映收入水平的差异,若先考虑组距,映收入水平的差异,若先考虑组距,100100更合适。更合适。 组距数列的编制实例(续(续2 2)人均月人均月 收入(元)收入(元)户数户数(次数)(次数)比重比重(频率)(频率)%700700以下以下700-750700-750750-800750-800800-850800-8

49、50850-900850-900900900以上以上3 31010171710107 73 36 620203434202014146 6合合 计计5050100100某地某地5050户居民家庭人均月收入表居民家庭人均月收入表(1 1) 组距数列的编制实例组距数列的编制实例(续(续3 3)人均月收入人均月收入(元)(元)户数户数(次数)(次数)比重比重(频率)(频率)%700700以下以下700-800700-800800-900800-900900900以上以上3 3262618183 36 6525236366 6合计合计5050100100某地某地50户居民家庭人均月收入表(户居民家庭人

50、均月收入表(2) 对以上两种组距数列进行比较可以看出:表(1)反映情况比较详细。三、累三、累计次数和累计频率计次数和累计频率向下累计:将各组次数和频率由变量值大的组向变量值小的组逐项累计,各组累计数表明各组下限以上的累计次数和累计频率。 向上累计:将各组次数和频率由变量值小 的组向变量值大的组逐项累计,各组累计 数表明各组上限以下的累计次数和累计频 率。 累计次数和累计频率累计次数和累计频率(实例(实例1 1)成成成成绩绩人数人数人数人数频频率率率率% % % %向上累向上累向上累向上累计计向下累向下累向下累向下累计计人数人数人数人数频频率率率率%人数人数人数人数频频率率率率%60606060

51、以下以下以下以下60-7060-7060-7060-7070-8070-8070-8070-8080-9080-9080-9080-9090909090以上以上以上以上4 4 4 45 5 5 515151515222222224 4 4 48 8 8 81010101030303030444444448 8 8 84 4 4 49 9 9 92424242446464646505050508 8 8 8181818184848484892929292100100100100505050504646464641414141262626264 4 4 4100100100100929292928

52、2828282525252528 8 8 8合合合合计计50505050100100100100- - - - - - - - - - - - - 某班英语考试成绩表某班英语考试成绩表 累计频数和累计频率累计频数和累计频率(实例(实例2 2) 累计频数和累计频率亦可用于品质数列累计频数和累计频率亦可用于品质数列累计频数和累计频率亦可用于品质数列累计频数和累计频率亦可用于品质数列, , , ,如如如如: 累计频数和累计频率(实例(实例3 3) 某某县农民家庭民家庭户按年人均按年人均纯收入累收入累计次数和累次数和累计频率表率表农户农户按人均年按人均年纯纯收入分收入分组组(元)(元)农农 户户 数数

53、向上累向上累计计向下累向下累计计累累 计计 次次 数数累累计计频频率率%累累 计计 次次 数数累累计计频频率率% 1000 1000以下以下10001000200020002000200030003000300030004000400040004000500050005000500060006000 6000 6000以上以上3636747422322326026020820815715742423636110110333333593593801801958958100010003.63.611.011.033.333.359.359.380.180.195.895.8100.0100.010

54、0010009649648908906676674074071991994242100.0100.096.496.489.089.066.766.740.740.719.919.94.24.2合合 计计10001000四、次数分布的主要类型各种不同性质的现象有着各自特殊的次数分布。概各种不同性质的现象有着各自特殊的次数分布。概括起来主要有三种:钟形(正态与偏态)、括起来主要有三种:钟形(正态与偏态)、 U U形和形和J J形(正形(正J J与反与反J J)分布。如下图:)分布。如下图:五、统计汇总统计汇总统计汇总:是在统计分组基础上,根据整理方是在统计分组基础上,根据整理方是在统计分组基础上,

55、根据整理方是在统计分组基础上,根据整理方案所确定的指标体系的要求,计算各项指标分组案所确定的指标体系的要求,计算各项指标分组案所确定的指标体系的要求,计算各项指标分组案所确定的指标体系的要求,计算各项指标分组数值和总计数值,以获得综合统计资料的工作过数值和总计数值,以获得综合统计资料的工作过数值和总计数值,以获得综合统计资料的工作过数值和总计数值,以获得综合统计资料的工作过程。程。程。程。统计汇总组织形式统计汇总组织形式:逐级汇总和集中汇总逐级汇总和集中汇总逐级汇总和集中汇总逐级汇总和集中汇总统计汇总技术方法统计汇总技术方法:手工汇总手工汇总手工汇总手工汇总 计算机汇总计算机汇总计算机汇总计算

56、机汇总第四节第四节 统计资料的主要表现形式统计资料的主要表现形式 (统计表)统计表) 主要内容主要内容 统计表的作用统计表的作用 统计表的分类统计表的分类 统计表的构成统计表的构成 统计表的设计统计表的设计根据某机械制造厂职工资料分组汇总如下:初级工初级工:240240人,其中男人,其中男8080人,女人,女160160人,在男职工中,工龄在人,在男职工中,工龄在5 5年年以下的以下的3030人,在人,在5-105-10年的年的4040人,人,1010年以上的年以上的1010人,在女职工中,工龄在人,在女职工中,工龄在5 5年以下的年以下的9090人,在人,在5-105-10年的年的4040人

57、,人,1010年以上的年以上的3030人;人; 中级工中级工:420420人,人,其中男其中男380380人,女人,女4040人,在男职工中,工龄在人,在男职工中,工龄在5 5年以下的年以下的150150人,在人,在5-105-10年的年的200200人,人,1010年以上的年以上的3030人,在女职工中,工龄在人,在女职工中,工龄在5 5年以下的年以下的1010人,在人,在5-105-10年的年的2525人,人,1010年以上的年以上的5 5人;人;高级工高级工:360360人,其中男人,其中男250250人,女人,女110110人,在男职工中,工龄在人,在男职工中,工龄在5 5年以下的年以

58、下的5050人,在人,在5-105-10年的年的7070人,人, 1010年以上年以上的的130130人,在女职工中,工龄在人,在女职工中,工龄在5 5年以下的年以下的7070人,在人,在5-105-10年的年的3030人,人,1010年年以上的以上的1010人。人。思考:该种表现形式好吗?思考:该种表现形式好吗? 某机械制造厂某机械制造厂职工分布情况表工分布情况表-统计表表表表现整理整理结果果 单位:人级 别合计 男 女小计5年以下5-10年10年以上小计5年以下5-10年10年以上初级工中级工高级工2404203608038025030150504020070103013016040110

59、90107040253030510合 计1020 7102303101703101709545这种表现形式如何?一、统计表的作用统计表统计表统计表统计表:是用表格来系统显示统计资料的一种基本形式。是用表格来系统显示统计资料的一种基本形式。统计表是重要和有效的统计资料表现形式。统计表是重要和有效的统计资料表现形式。广义的统计表包括统计工作各个阶段的一切表格,包括调广义的统计表包括统计工作各个阶段的一切表格,包括调查表、整理表和分析表。统计整理表是表明前述资料整理查表、整理表和分析表。统计整理表是表明前述资料整理的结果,又是后续资料分析工作的开始。的结果,又是后续资料分析工作的开始。统计表的作用统

60、计表的作用统计表的作用统计表的作用:通过对统计资料有条理地组织与安排,统:通过对统计资料有条理地组织与安排,统计表使计表使枯燥杂乱的统计数字枯燥杂乱的统计数字资料系统清晰,直观易懂,资料系统清晰,直观易懂,鲜鲜明、形象和生动,一目了然。统计表内的数字组织科学,明、形象和生动,一目了然。统计表内的数字组织科学,排列有序,便于阅读和对照比较。统计表还是分析研究各排列有序,便于阅读和对照比较。统计表还是分析研究各指标之间的数量关系,进行统计分析的有效工具。指标之间的数量关系,进行统计分析的有效工具。二、统计表的构成从统计表的表式结构看,统计表包括:总标题、横行标题、纵栏标题总标题、横行标题、纵栏标题

61、和数字资料数字资料四个部分。从统计表的内容看,统计表由主词主词和宾词宾词两部分组成。2012年我国三次产业产值构成表年我国三次产业产值构成表 产业类型产业类型产业类型产业类型 绝对数(亿元)绝对数(亿元)绝对数(亿元)绝对数(亿元) 比重(比重(比重(比重(%) 第一产业第一产业第一产业第一产业 第二产业第二产业第二产业第二产业 第三产业第三产业第三产业第三产业 5237752377 2 23531935319 2 23162631626 10.110.1 4 45.35.3 4 44.64.6 合合合合 计计计计 519322519322 100.0100.0总标题总标题纵栏纵栏标题标题横横

62、行行标标题题数数字字资资料料主主 词词宾宾 词词三、统计表的分类三、统计表的分类统计表分析表对主词的分组情况按性质整理表调查表按作用空间数列表时间数列表复合分组表简单分组表平行分组表简单表分组表时空数列结合表2012年对主要国家和地区货物进出口额及其增长速度(简单表)年对主要国家和地区货物进出口额及其增长速度(简单表)单位:亿美元国家和地区出口额比上年增长%进口额比上年增长%美国35188.413298.8欧盟3340-6.221210.4中国香港323520.718015.9东盟204320.119581.5日本15162.31778-8.6韩国8775.716863.7印度477-5.71

63、88-19.6俄罗斯44113.24119.2中国台湾3684.813225.82011年末我国三次产业就业构成表年末我国三次产业就业构成表(简单分组表)(简单分组表) 产业类型产业类型产业类型产业类型 绝对数(万人)绝对数(万人)绝对数(万人)绝对数(万人) 比重(比重(比重(比重(%) 第一产业第一产业第一产业第一产业 第二产业第二产业第二产业第二产业 第三产业第三产业第三产业第三产业 26594 26594 22544 22544 27282 27282 34.834.8 29.5 29.5 35.7 35.7 合合合合 计计计计 7642076420 100.0100.0资料来源:20

64、11年度人力资源和社会保障事业发展统计公报年度人力资源和社会保障事业发展统计公报2012012 2年我国人口数及其构成年我国人口数及其构成(平行分组表)(平行分组表)指指 标标年末数(万人)年末数(万人)年末数(万人)年末数(万人)比重(比重(比重(比重(% % % %) 总总人口(大人口(大陆陆)131313135404540454045404100.0100.0100.0100.0 城城镇镇711827118271182711825 5 5 52.62.62.62.6 乡乡村村6 6 6 642224222422242224 4 4 47 7 7 7. . . .4 4 4 4 男性男性6

65、969696939539539539551.351.351.351.3 女性女性6 6 6 6600960096009600948.748.748.748.7 0-14 0-14岁岁2222222228728728728716.516.516.516.5 15-59 15-59岁岁9 9 9 9372737273727372769.69.69.69.2 2 2 2 60 60岁岁及以上及以上1 1 1 193909390939093901 1 1 14.34.34.34.3 65 65岁岁及以上及以上121212127147147147149.9.9.9.4 4 4 4 2012012 2年某

66、地人口城年某地人口城乡及性及性别分布表分布表(复合分(复合分组表)表) 按按按按户户籍、性籍、性籍、性籍、性别别分分分分人数(人)人数(人)城城镇镇 男男 29500 295000 0 女女 26320 263200 0农农村村 男男 78560 785600 0 女女 56380 563800 0 合合 计计1907601907600 0统计表-时空数列结合表时空数列结合表 河南与全国人口老河南与全国人口老龄化化进程表程表 单位:% 年份年份 全全 国国 河河 南南0-140-1415-6415-646565及以上及以上0-140-1415-6415-646565及以上及以上 1953 19

67、53 1964 1964 1982 1982 1990 1990 2000 2000 2010 201036.2836.2840.6940.6933.5933.5927.6927.6922.8922.8916.616.659.3159.3155.7555.7561.5061.5066.7466.7470.1570.1574.574.54.414.413.563.564.914.915.575.576.966.968.98.935.7135.7139.7839.7834.9034.9029.2929.2927.6027.6021.0021.0059.1659.1655.9655.9659.875

68、9.8764.8864.8865.3065.3070.6470.645.135.134.264.265.235.235.835.837.107.108.368.36(资料来源:第六次人口普查统计公报,河南为常驻人口资料)四、统计表的设计-宾词宾词的配置的配置在设计统计表时在设计统计表时在设计统计表时在设计统计表时, , , ,除对主词是否分组外除对主词是否分组外除对主词是否分组外除对主词是否分组外, , , ,对宾词也对宾词也对宾词也对宾词也要根据分析问题的祥略要求,进行合理配置要根据分析问题的祥略要求,进行合理配置要根据分析问题的祥略要求,进行合理配置要根据分析问题的祥略要求,进行合理配置。

69、宾词配置的三种形式:宾词配置的三种形式:宾词配置的三种形式:宾词配置的三种形式:简单配置、平行配置、复合配置简单配置、平行配置、复合配置简单配置、平行配置、复合配置简单配置、平行配置、复合配置企业名称企业名称合计合计男男女女四通四通百利百利856856357357663663140140193193217217合计合计12131213803803410410 2012年四通和百利公司职工性别分布表 单位:人 统计表宾词的配置-简单简单配置配置 简单配置简单配置简单配置简单配置:在对宾词指标不再要求细分的情况下,将各项指标按主次在对宾词指标不再要求细分的情况下,将各项指标按主次在对宾词指标不再要

70、求细分的情况下,将各项指标按主次在对宾词指标不再要求细分的情况下,将各项指标按主次 顺序作简单排列。顺序作简单排列。顺序作简单排列。顺序作简单排列。宾词平行配置宾词平行配置宾词平行配置宾词平行配置是对宾词指标进行几种简单分组以后在表中平是对宾词指标进行几种简单分组以后在表中平行编排。如:行编排。如:企业企业名称名称工人工人总数总数性性 别别工工 龄龄男男女女5 5年以下年以下 5-105-10年年 1010年以年以上上甲甲(1 1)(2 2)(3 3)(4 4)(5 5)(6 6)四通四通百利百利8568563573576636631401401931932172175195191201202

71、122121801801251255757合计合计12131213803803410410639639392392182182某地两企业工人的性别和工龄分布表 单位:人 统计表宾词的配置 -平行配置平行配置 宾词复合配置宾词复合配置宾词复合配置宾词复合配置:对宾词指标复合分组以后在表中层叠配置。对宾词指标复合分组以后在表中层叠配置。如下表:如下表: 某地两企业工人的工龄和性别分布表 单位:人企业企业名称名称工人总数工人总数工工 人人 工工 龄龄5 5年以下年以下510510年年1010年以上年以上男男女女计计男男女女计计男男女女计计男男女女计计甲甲(1)(1)(2)(2)(3)(3)(4)(4)(5)(5)(6)(6)(7)(7)(8)(8)(9)(9)(10)(10)(11)(11)(12)(12)四通四通百利百利合计合计 统计表宾词的配置 -复合配置复合配置 统计表的设计规则 一般原则:科学、实用、简明、美观。注意事项: 1、标题简明 2、左右开口 3、线条清晰 4、基线加粗 5、标明单位 6、数字照齐 7、排列有序 8、编写序号 9、布局合理 10、表外注释统计整理统计整理知识结构图知识结构图

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号