应用统计学第3章数据整理

上传人:ji****72 文档编号:48621934 上传时间:2018-07-18 格式:PPT 页数:73 大小:1.84MB
返回 下载 相关 举报
应用统计学第3章数据整理_第1页
第1页 / 共73页
应用统计学第3章数据整理_第2页
第2页 / 共73页
应用统计学第3章数据整理_第3页
第3页 / 共73页
应用统计学第3章数据整理_第4页
第4页 / 共73页
应用统计学第3章数据整理_第5页
第5页 / 共73页
点击查看更多>>
资源描述

《应用统计学第3章数据整理》由会员分享,可在线阅读,更多相关《应用统计学第3章数据整理(73页珍藏版)》请在金锄头文库上搜索。

1、第三章 数据整理1本章学目标1.熟悉统计整理的步骤和方法。 2.了解统计分组的概念和次数分配的统计方法。 3.了解统计数据的表现形式统计表和统计图 的基本内容。 4.学整理数据并以适当的统计图表来表现。2数据整理n对统计调查所搜集到的数据进行分类和汇总, 使其系统化、条理化、科学化,以得出反映事 物总体综合特征的资料的工作过程。3统计调查统计整理统计分析统计整理的步骤1.统计整理方案设计2.数据预处理 审核、订正3.对调查资料进行分组、汇总、计算4.对汇总后调查资料的审核5.编制统计表、绘制统计图4统计分组5统计分组n统计分组是指按照统计研究目的和任务的要求 ,根据选定的某个或几个标志,将被研

2、究的总 体数据分成若干部分的科学分类。6选择分组标志的原则1.根据研究任务和目的选择分组标志。 2.选择能反映事物本质特征或重要特征的标志。7班应用统计学学情况8成 绩人数/人成 绩人数/人 60分以下188090分196070分1990分以上107080分25合 计91班应用统计学成绩性别与喜好车型的关系9性别与喜好车型练n以一个企业的工人为总体,研究任务是分析该 企业工人的文化素质,则分组标志应选择: 1.工人的技术等级 2.工人的文化程度 3.工人的日产量 4.工人的出勤天数n210统计分组的原则n(1)穷举原则(或不遗漏原则)。(2)互斥原则(或不重复原则)。11统计分组的基本类型n按

3、照分组标志的个数多少不同,可分为:简单分组和复合分组12简单分组浙江省各市2007年人口资料全 省人口/万人全 省人口/万人杭州市672.35金华市459.19宁波市564.56衢州市247.74温州市764.57舟山市96.69嘉兴市336.81台州市569.39湖州市 257.8丽水市253.99绍兴市436.24复合分组2005年我国某地区工业增加值和职工人数项 目类 型增加值/万元职工人数/人内资企业大型975013800中型860045000小型420010050外商投资大型73007500中型520010400小型44004500统计分组 品质型数据15饭店食物质量状况调查【例3.

4、1】坐落于杭州西湖西山路的一家饭店使用一种调查 问卷,用来询问顾客对饭店的服务、食物质量、价格与气氛 的看法。每一个属性分别以极好(1)、非常好(2)、良好(3) 、一般(4)和较差(5)的标准来评价。60份饭店食物质量状况 的问卷结果如表32所示。16312341212321 122242122132 124223332121 213211231224 142124122122表32 饭店食物质量状况调查的样本数据按品质标志分组时,组数是品质标志的全部类型数据整理的方法 次数分配n将观察值分类、分组并计算观察值在各组出现 的次数的统计方法称为次数分配,也叫做次数 分布、分布数列、分配数列等。

5、17统计表n将搜集得到的数据整理成表格的形式,并以文 字或数字的形式表现出来,即是所谓的统计表 。18统计表的结构19表314 我国2008年年底城乡人口数 按城乡分组人数(万人) 比重(%)城 镇乡 村60667 7213545.68 54.32合 计132802 100资料来源:中国统计年鉴2005,中国统计出版社。 注:本表为城镇居民家庭收支抽样调查材料。 横横 行行 标标 题题纵纵 栏栏 标标 题题指指 标标 数数 值值表题表题说说 明明统计表的内容20表314 我国2008年年底城乡人口数 按城乡分组人数(万人) 比重(%)城 镇乡 村60667 7213545.68 54.32合

6、计132802 100资料来源:中国统计年鉴2005,中国统计出版社。 注:本表为城镇居民家庭收支抽样调查材料。 (主词栏)(宾词栏)饭店食物质量状况调查21表33 饭饭店食物质质量状况的频频数分布饭店食物质量频 数(人) 极好18非常好27 良好9 一般6 较差0 合计60相对次数分配n频率是用各组次数与总体单位总个数相比,其 计算公式为:22频率某一组次数 总体单位总个数饭店食物质量状况调查23表34 饭饭店食物质质量状况的频频率分布饭店食物质量频 数(人)频率() 极好1830非常好2745 良好915 一般610 较差00 合计60100统计图n条形图n饼图24饭店食物质量的条形图25

7、条形图通常用于显示分类数据和顺序数据的分布特征 以及变量值较少的离散数据的分布特征 饭店食物质量的饼图26饼形图只能显示一个总体的结构比例 统计分组 数值型数据27数值型数据分组方法n1.单项式分组 2.组距式分组28单项式分组n单项式分组是指在变量分组时,一个变量值设为 一个组,顺序排列。在组数不多和组值变化幅度 不大时采用此方法。29组距式分组n组距式分组是指把一段变量值设为一组的分组 方式。n按连续型变量 (可以连续计数的变量。如产 值、利润、收入等) 分组时,一般只能采用组 距式分组;n而离散型变量 (只能间断计数的变量。如人 口数、设备台数等) 可以采用单项式分组,也 可以采用组距式

8、分组。30冰店的营业收入n黄小倫在公司上班好幾年,厭倦一成不變的生 活,2010年年初自己在住家附近租了一间店面 ,开了一家叫海之滨的冰店,春秋卖冰品及红 豆汤等,夏天卖各式冰品,冬天卖花生汤圆、 咖啡等。n冰店开张后,起初生意不佳,但因為產品口感 好、料又實在,因此生意逐漸好轉。到了年中 ,黃小倫想統計一下4、5月的营收收入,看看 营收的大概分布情形。31海之滨的营业收入32單位:百元统计分组技术(1)确定全距全距 = 最大值 最小值33海之滨的营业收入34單位:百元全距 = 8921=68统计分组技术(1)确定全距。 (2)确定组数。 一般常用公式: 35k:组数 n: 观察值个数 海之滨

9、的营业收入36單位:百元统计分组技术(1)确定全距。 (2)确定组数。 (3)确定组距。37组距全距 组数组距一般採整數原則。最好是2、5或10的倍数 。 各组组距最好相等(并非绝对)海之滨的营业收入38單位:百元组距统计分组技术(1)确定全距。 (2)确定组数。 (3)确定组距。 (4)确定组限,亦即各组的上下限。39(4)确定组限。n穷举原则 最大组的上限应大于最大标志值,最小组 的下限应小于最小标志值。 要根据变量的性质,保持相邻组之间的连 续性。40(4)确定组限。n互斥原则 重点要注意相邻组之间重叠组限上的单位 归属问题,这就是统计上的一般处理方法 : 重叠组限的上限归入下限组,或者

10、叫做“上 限不在内”原则。41(4)确定组限。n1)连续型变量作等距分组时,相邻组的组限 必须重叠。n分组方式表為组下限 组上限。如 。42(4)确定组限。n2)离散型变量作等距分组时,相邻组的组限 可以断开。n分组方式表為组下限 组上限。如 。43海之滨的营业收入44连续变量,最小值是21,因此以20为组下限统计分组技术(1)确定全距。 (2)确定组数。 (3)确定组距。 (4)确定组限,亦即各组的上下限。 (5)计算各组的组中值。45组中值上限+下限海之滨的营业收入46第1組: 组中值统计分组技术(1)确定全距。 (2)确定组数。 (3)确定组距。 (4)确定组限,亦即各组的上下限。 (5

11、)计算各组的组中值。 (6)计算各组的次数。47海之滨营业收入的次数分配表48相对次数分配n频率是用各组次数与总体单位总个数相比,其 计算公式为:49频率某一组次数 总体单位总个数海之滨收入的相對次數分配表50累计次数分布n(1)向上累计。又称为以下累计。从变量值低的组开始,将各组 频数(频率)逐次向变量值高的组累计,说明某一 组上限以下各组的累计频数(频率)。(2)向下累计。51海之滨营业收入的累加次数分配表52海之滨收入的累加相对次数分配表53统计图n直方图n线图n次数多边图54海之滨每日营业收入的次数分配直 方图55次數多邊圖n连结次數直方图或相对次数直方图各组的组中 值,并前后各延伸半

12、个组距单位即为次数多边 图。56海之滨春季营业收入的次数多边图57海之滨夏季营业收入的次数分配图 (左偏)58海之滨冬季营业收入的次数分配图 (右偏)59極端值茎叶图n将观察值分成二部份,一部份为茎,另一部份 为叶。茎的部份为高位数字,叶的部份为低位 数字。60经济学学期成绩n假設X大經濟學上學期的學期成績如下: 56 57 58 64 65 66 67 69 71 72 73 74 74 75 75 77 78 78 79 84 85 85 86 86 87 88 89 90 92 94 95 61经济学学期成绩的茎叶图6263帕累托(areto)图n假设大荣百貨公司客服部想了解顧客對公司服

13、 務的意見,以作為改進的參考。現抽樣調查了 100个顾客,发现有50个顾客不满意公司的服 务。不满意的项目依照抱怨人数的多寡依序为 : 等待结账时间太长、专柜标示不清、洗手间 不够清洁、休息位置太少等,整理如下表:64顾客抱怨项目65顾客抱怨的areto图66总结1.熟悉统计整理的步骤和方法。1.统计整理方案设计2.数据预处理 审核、订正67练 .78三、练题368总结1.熟悉统计整理的步骤和方法。1.统计整理方案设计2.数据预处理 审核、订正3.对调查资料进行分组、汇总、计算4.对汇总后调查资料的审核5.编制统计表、绘制统计图69总结1.熟悉统计整理的步骤和方法。 2.了解统计分组的概念和次数分配的统计方法。 3.学整理数据并以适当的统计图表来表现。70练n试根据下列洪诊所兩天内病人等待看病时间之 资料(单位:分钟)编制次数分配表,并请说 明编制步骤。2 6 10 13 45 5 18 11 99 9 12 24 67 7 14 18 471答案n求全距: 242=22。n決定組數: 。n決定組距,取整數5。n決定組上下限,計算各組次數。最小值為2 ,因此以0為第一組之組下限。得次數分配表 如下:72答案组别组限次数1043259931014541519252024173

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号