用样本频率分布估计总体分布

上传人:豆浆 文档编号:26266986 上传时间:2017-12-24 格式:PPT 页数:34 大小:2.30MB
返回 下载 相关 举报
用样本频率分布估计总体分布_第1页
第1页 / 共34页
用样本频率分布估计总体分布_第2页
第2页 / 共34页
用样本频率分布估计总体分布_第3页
第3页 / 共34页
用样本频率分布估计总体分布_第4页
第4页 / 共34页
用样本频率分布估计总体分布_第5页
第5页 / 共34页
点击查看更多>>
资源描述

《用样本频率分布估计总体分布》由会员分享,可在线阅读,更多相关《用样本频率分布估计总体分布(34页珍藏版)》请在金锄头文库上搜索。

1、用样本估计总体,用样本的频率分布估计总体分布,了解分析数据的方法,知道估计总体频率分布的方法会画频率分布直方图和茎叶图理解频率直方图和茎叶图及其应用,学习目标导航,例 某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定个居民月用水量标准a ,用水量不超过a的部分按平价收费,超过a的部分按议价收费。,如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?,为了较合理地确定这个标准,你认为需要做哪些工作?,例题探究,思考:由上表,大家可以得到什么信息?,通过抽样,我们获得了100位居民某年的月平均用水量(单位:t) ,如下表:,最小值,最大值,讨论:如何分析数据?,

2、分析数据的一种基本方法是用图将它们画出来,或者用紧凑的表格改变数据的排列方式,作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息。表格则是通过改变数据的构成形式,为我们提供解释数据的新方式,返,1.求极差(即一组数据中最大值与最小值的差),2.决定组距与组数,组数=,4.3 - 0.2 = 4.1,3.将数据分组,0,0.5 ),0.5,1 ),4,4.5,组数:将数据分组,当数据在100个以内时, 按数据多少常分5-12组。组距:指每个小组的两个端点的距离,,因此,分成九组,我们以0.5为组距时,分成以下九组,4.列频率分布表,100位居民月平均用水量的频率分布表,5.画频率分

3、布直方图,小长方形的面积,组距,频率,=,思考:所有小长方形的面积之和等于?,0.08,0.16,0.30,0.44,0.50,0.28,0.12,0.08,0.04,注意:,这里的纵坐标不是频率,而是频率/组距;,某个区间上的频率用这个区间的面积表示;,如果当地政府希望85%以上的居民每月的用水量不超出标准,根据频率分布表和频率分布直方图,你能对制定月用水量提出建议吗?,你认为3吨这个标准一定能够保证85%以上的居民用水量不超过标准吗?,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02,一、求极差,即数据中最大值与最小值的差,二、决定组距与组数 :组距

4、=极差/组数,三、分组,通常对组内数值所在区间,取左闭右开区间 , 最后一组取闭区间,四、登记频数,计算频率,列出频率分布表,画一组数据的频率分布直方图,可以按以下的步骤进行:,五、画出频率分布直方图(纵轴表示频率组距),频率分布直方图如下:,连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图,总体密度曲线,当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近一条光滑曲线总体密度曲线它反映了总体在各个范围内的取值的百分比,它比频率直方图提供更精确的信息。,总体在区间 内取值的频率,S,总体密度曲线,思考:可以用样本的频率分布折线图得到准确的总体密度曲线吗?,高考题型

5、:,茎叶图,情境:某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:,(1)甲运动员得分:13,51,23,8,26,38,16,33,14,28,39,(2)乙运动员得分: 49,24,12,31,50,31,44,36,15,37,25,36,39,问题:如何有条理地列出这些数据,分析该运动员的整体水平及发挥的稳定程度?,茎叶图,甲,乙,012345,2 55 41 6 1 6 7 94 9 0,84 6 33 6 83 8 9 1,注:,1、重复出现的数据要重复记录,不能遗漏;特别是“叶”部分;,2、所有的信息都可以从这个茎叶图中得到;,3、茎叶图便于记录和表示;,4、不足的是其分析

6、只是粗略的,对差异不大的两组数据不易分析;表示三位数以上的数据时不够方便;,为了了解各自受欢迎的程度,甲、乙两个网站分别随机选取了14天,记录下上午8:0010:00间各自的点击量:甲:73,24,58,72,64,38,66, 70,20,41,55,67, 8,25;乙:12,37,21, 5,54,42,61, 45,19, 6,19,36,42,14.你能用茎叶图表示上面的数据吗?你认为甲、乙两个网站哪个更受欢迎?,练习:,(一)众数、中位数、平均数,2.2.2 用样本的数字特征估计总体的数字特征,中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)

7、叫做这组数据的中位数.,众数:在一组数据中,出现次数最多的数据叫做这组数据的众数,平均数: 一组数据的算术平均数,即,一 . 众数、中位数、平均数的概念,问题1:众数、中位数、平均数这三个数一般都会来自于同一个总体或样本,它们能表明总体或样本的什么性质?,平均数:反映所有数据的平均水平,众数:反映的往往是局部较集中的数据信息,中位数:是位置型数,反映处于中间部位的 数据信息,1、求下列各组数据的众数,(1)、1 ,2,3,3,3,5,5,8,8,8,9,9,众数是:3和8,(2)、1 ,2,3,3,3,5,5,8,8,9,9,众数是:3,2、求下列各组数据的中位数,(1)、1 ,2,3,3,3

8、,4,6,8,8,8,9,9,(2)1 ,2,3,3,3,4,8,8,8,9,9,中位数是:5,中位数是:4,二、众数、中位数、平均数与频率分布 直方图的关系,0.1,0.2,0.3,0.4,0.5,O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t),众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。,1.如何在频率分布直方图中估计众数,可将众数看作直方图中面积最大长方形的“中心”,0.5,2.5,2,1.5,1,4,3.5,3,4.5,频率组距,0.04,0.08,0.15,0.22,0.25,0.14,0.06,0.04,0.02,前四个小矩形的面积

9、和=0.49,后四个小矩形的面积和=0.26,2.02,2.如何在频率分布直方图中估计中位数,在样本中中位数的左右各有50%的样本数,条形面积各为0.5,所以反映在直方图中位数左右的面积相等.,,,中位数,),可将中位数看作整个直方图面积的“中心”,思考讨论以下问题:1、2.02这个中位数的估计值,与样本的中位数值2.0不一样,你能解释其中原因吗?,答:2.02这个中位数的估计值,与样本的中位数值2.0不一样,这是因为样本数据的频率分布直方图,只是直观地表明分布的形状,但是从直方图本身得不出原始的数据内容,直方图已经损失一些样本信息。所以由频率分布直方图得到的中位数估计值往往与样本的实际中位数

10、值不一致.,3.如何在频率分布直方图中估计平均数,=2.02,=2.02,平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和。,可将平均数看作整个直方图面积的“重心”,思考讨论以下问题:2、样本中位数不受少数极端值的影响,这在某些情况下是一个优点,但它对极端值的不敏感有时也会成为缺点。你能举例说明吗?,答:优点:对极端数据不敏感的方法能够有效地预防错误数据的影响。对极端值不敏感有利的例子:例如当样本数据质量比较差,即存在一些错误数据(如数据录入错误、测量错误等)时,用抗极端数据强的中位数表示数据的中心值更准确。,缺点:(1)出现错误的数据也不知道;(2)对极端值不

11、敏感有弊的例子:某人具有初级计算机专业技术水平,想找一份收入好的工作。这时如果采用各个公司计算机专业技术人员收入的中位数作为选择工作的参考指标就会冒这样的风险:,很可能所选择公司的初级计算机专业技术水平人员的收入很低,其原因是中位数对极小的数据不敏感。这里更好的方法是同时用平均工资和中位数作为参考指标,选择平均工资较高且中位数较大的公司就业.,例1、下表是七位评委给某参赛选手的打分,总分为10分,你认为如何计算这位选手的最后得分才较为合理?,提问:1、电视里评委是怎样给选手打分的? 2、为什么这么做?直接取中位数和众数的值不好么?,三、众数、中位数、平均数的简单应用,例2 某工厂人员及工资构成如下:,(1)指出这个问题中周工资的众数、中位数、平均数,(2)这个问题中,工资的平均数能客观地反映该厂的工资水平吗?为什么?,分析:众数为200,中位数为220,平均数为300。因平均数为300,由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平。,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号