用样本估计整体用样本的数字特征估计总体的数字特征

上传人:w****i 文档编号:91859426 上传时间:2019-07-02 格式:PPT 页数:27 大小:265.50KB
返回 下载 相关 举报
用样本估计整体用样本的数字特征估计总体的数字特征_第1页
第1页 / 共27页
用样本估计整体用样本的数字特征估计总体的数字特征_第2页
第2页 / 共27页
用样本估计整体用样本的数字特征估计总体的数字特征_第3页
第3页 / 共27页
用样本估计整体用样本的数字特征估计总体的数字特征_第4页
第4页 / 共27页
用样本估计整体用样本的数字特征估计总体的数字特征_第5页
第5页 / 共27页
点击查看更多>>
资源描述

《用样本估计整体用样本的数字特征估计总体的数字特征》由会员分享,可在线阅读,更多相关《用样本估计整体用样本的数字特征估计总体的数字特征(27页珍藏版)》请在金锄头文库上搜索。

1、2.2.2 用样本的数字特征估计总体的数字特征,平均数: 一组数据的算术平均数,即 x=,一 众数、中位数、平均数的概念,中位数:将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数,众数:在一组数据中,出现次数最多的数据叫做这组数据的众数,二 、 众数、中位数、平均数与频率分布直方图的关系,1、众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。 例如,在上一节调查的100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25t.如图所示:,0.1,0.2,0.3,0.4,0.5,O 0.5 1

2、 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t),2、在样本中,有50的个体小于或等于中位数,也有50的个体大于或等于中位数,因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可以估计中位数的值。下图中虚线代表居民月均用水量的中位数的估计值,此数据值为2.02t.,0.1,0.2,0.3,0.4,0.5,O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t),2.02这个中位数的估计值,与样本的中位数值2.0不一样,这是因为样本数据的频率分布直方图,只是直观地表明分布的形状,但是从直方图本身得不出原始的数据内容,所以由频率分布直方图得

3、到的中位数估计值往往与样本的实际中位数值不一致.,2.02这个中位数的估计值,与样本的中 位数值2.0不一样,你能解释其中的原因吗?,3、平均数是频率分布直方图的“重心”. 是直方图的平衡点. n 个样本数据的平均数由公式:,X=,给出.下图显示了居民月均用水量的平均数: x=1.973,0.1,0.2,0.3,0.4,0.5,O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量(t),三 三种数字特征的优缺点,1、众数体现了样本数据的最大集中点,但它对其它数据信息的忽视使得无法客观地反映总体特征.如上例中众数是2.25t,它告诉我们,月均用水量为2.25t的居民数比月均用

4、水量为其它数值的居民数多,但它并没有告诉我们多多少.,2、中位数是样本数据所占频率的等分线,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点。如上例中假设有某一用户月均用水量为10t,那么它所占频率为0.01,几乎不影响中位数,但显然这一极端值是不能忽视的。,3、由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众数、中位数都不具有的性质。也正因如此 ,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计时可靠性降低。,平均数向我们提供了样本数据的重要信

5、息,但是平均数有时也会使我们作出对总体的片面判断因为这个平均数掩盖了一些极端的情况,而这些极端情况显然是不能忽视的因此,只有平均数还难以概括样本数据的实际状态,如:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:,甲: ,乙: ,如果你是教练,你应当如何对这次射击作出评价?,如果看两人本次射击的平均成绩,由于,两人射击 的平均成绩是一样的.那么两个人的水平就没有什么差异吗?,四.标准差,4,5,6,7,8,9,10,环数,频率,0.1,0.2,0.3,(甲),4,5,6,7,8,9,10,0.1,0.2,0.3,0.4,环数,频率,(乙),直观上看,还是有差异的.如:甲成绩比

6、较分散,乙成绩相对集中(如图示).因此,我们还需要从另外的角度来考察这两组数据.例如:在作统计图表时提到过的极差. 甲的环数极差=10-4=6 乙的环数极差=9-5=4. 它们在一定程度上表明了样本数据的分散程度,与平均数一起,可以给我们许多关于样本数据的信息.显然,极差对极端值非常敏感,注意到这一点,我们可以得到一种“去掉一个最高分,去掉一个最低分”的统计策略.,考察样本数据的分散程度的大小,最常用的统计量是标准差 标准差是样本平均数的一种平均距离,一般用s表示,所谓“平均距离”,其含义可作如下理解:,由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差,一个样本中的个体与平

7、均数之间的距离关系可用下图表示:,考虑一个容量为2的样本:,显然,标准差越大,则a越大,数据的离散程度越大;标准差越小,数据的离散程度越小.,用计算器可算出甲,乙两人的的成绩的标准差,由 可以知道,甲的成绩离散程度大,乙的成绩离散程度小.由此可以估计,乙比甲的射击成绩稳定.,上面两组数据的离散程度与标准差之间的关系可用图直观地表示出来.,题1:画出下列四组样本数据的条形图,说明它们的异同点.,解:四组样本数据的条形图是:,四组数据的平均数都是5.0,标准差分别是0.00,0.82,1.49,2.83.虽然它们有相同的平均数,但是它们有不同的标准差,说明数据的分散程度是不一样的.,2 甲乙两人同

8、时生产内径为25.40mm的一种零件.为了对两人的生产质量进行评比,从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm),甲 25.46, 25.32, 25.45, 25.39, 25.36 25.34, 25.42, 25.45, 25.38, 25.42 25.39, 25.43, 25.39, 25.40, 25.44 25.40, 25.42, 25.35, 25.41, 25.39,乙 25.40, 25.43, 25.44, 25.48, 25.48 25.47, 25.49, 25.49, 25.36, 25.34 25.33, 25.43, 25.43, 25.32, 25.47 25.31, 25.32, 25.32, 25.32, 25.48,从生产的零件内径的尺寸看,谁生产的质量较高?,解:用计算器计算可得:,从样本平均数看,甲生产的零件内径比乙生产的更接近内径标准(25.40mm),但是差异很小;从样本标准差看,由于,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号