《《用样本数字特征分布估计总体数字特征》课件2》由会员分享,可在线阅读,更多相关《《用样本数字特征分布估计总体数字特征》课件2(26页珍藏版)》请在金锄头文库上搜索。
1、 在一次射击比赛中在一次射击比赛中,甲、乙两名运动员各射击甲、乙两名运动员各射击10次,命中环数如下次,命中环数如下甲运动员甲运动员7,8,6,8,6,5,8,10,7,4;乙运动员乙运动员9,5,7,8,7,6,8,6,7,7. 观察上述样本数据,你能判断哪个运动员发挥观察上述样本数据,你能判断哪个运动员发挥的更稳定些吗?的更稳定些吗? 问题问题 为了从整体上更好地把握总体的规律,我们要通过为了从整体上更好地把握总体的规律,我们要通过样本的数据对总体的数字特征进行研究。样本的数据对总体的数字特征进行研究。用样本用样本的数字特征估计总体的数字特征。的数字特征估计总体的数字特征。1、众数众数 在
2、一组数据中,在一组数据中,出现次数最多出现次数最多的数据的数据叫做这一组数据的众数叫做这一组数据的众数.2、中位数中位数 将一组数据按大小依次排列,把将一组数据按大小依次排列,把处在最中间位置的一个数据处在最中间位置的一个数据(或两个数据的平(或两个数据的平均数)叫做这组数据的中位数均数)叫做这组数据的中位数.3、平均数平均数 (1) x = (x1+x2+xn) /n (2) x = x1f1+x2f2+xkfk1.甲在一次射击比赛中的得分如下甲在一次射击比赛中的得分如下: ( 单位单位:环环).7, 8, 6, 8, 6, 5, 9, 10, 7, 5,则他则他命中的平均数是命中的平均数是
3、_,中位数是中位数是 众数是众数是_ 2.某次数学试卷得分抽样中得到某次数学试卷得分抽样中得到:90分的分的有有3个人个人,80分的有分的有10人人,70分的有分的有5人人,60分分的有的有2人人,则这次抽样的平均分为则这次抽样的平均分为_.7.177分分 练习练习75,6,7,8 众数众数 若有两个或两个以上的数据出现的若有两个或两个以上的数据出现的次数一样,则这些数据都叫众数;若一组数次数一样,则这些数据都叫众数;若一组数据中每个数据出现的次数一样多,则没有众据中每个数据出现的次数一样多,则没有众数。数。 中位数中位数 唯一确定的。不受极端值的影唯一确定的。不受极端值的影响,仅利用了数据中
4、排在中间数据的信息。响,仅利用了数据中排在中间数据的信息。当样本数据质量比较差,即存在一些错误信当样本数据质量比较差,即存在一些错误信息时,应该用抗极端性很强的中位数表示数息时,应该用抗极端性很强的中位数表示数据的中心值。据的中心值。平均数平均数 任何一个样本数据的改变都会任何一个样本数据的改变都会引起平均数的改变。引起平均数的改变。 如何从频率分布直方图中估计众数、如何从频率分布直方图中估计众数、中位数、平均数呢?中位数、平均数呢? 思考思考众数:众数:最高矩形的中点的横坐标最高矩形的中点的横坐标2.25中位数:中位数:左右两边直方左右两边直方图的面积相等图的面积相等.2.02平均数:平均数
5、:频率分布直方频率分布直方图中每个小矩形的面图中每个小矩形的面积乘以小矩形底边中积乘以小矩形底边中点的横坐标之和点的横坐标之和.2.020.160.160.5 1 1.5 2 2.5 3 3.5 4 4.5 月均用水量月均用水量/t频率频率组距组距0.080.08O0.30.30.440.440.50.50.280.28 应该采用应该采用平均数平均数来表示每一个国家项目的平来表示每一个国家项目的平均金额,因为它能反映所有项目的信息均金额,因为它能反映所有项目的信息.但但平均数平均数会受到极端数据会受到极端数据2200万元的影响,所以大多数项万元的影响,所以大多数项目投资金额都和平均数相差比较大
6、目投资金额都和平均数相差比较大. 练习练习课本课本P74 练习练习三种数字特征的优缺点三种数字特征的优缺点特征数特征数优优 点点缺缺 点点众数众数体现了样本数据的最大体现了样本数据的最大集中点集中点无法客观反映总体无法客观反映总体特征特征中位数中位数不受少数极端值的影响不受少数极端值的影响不受少数极端值的不受少数极端值的影响有时也是缺点影响有时也是缺点平均数平均数与每一个数据有关,更与每一个数据有关,更能反映全体的信息能反映全体的信息.受少数极端值的影受少数极端值的影响较大,使其在估响较大,使其在估计总体时的可靠性计总体时的可靠性降低降低.探究探究 一个企业中,一个企业中, 有职工的人数很多,
7、他们有职工的人数很多,他们的月收入是两千左右,然后有少数人员是经的月收入是两千左右,然后有少数人员是经理以上层次的人,他们的月收入是三万左右。理以上层次的人,他们的月收入是三万左右。如果是你老板,去招聘时,回答有关工资待如果是你老板,去招聘时,回答有关工资待遇方面的问题,你更愿意用哪个数字特征来遇方面的问题,你更愿意用哪个数字特征来回答这个问题呢?如果你是应聘者,你更愿回答这个问题呢?如果你是应聘者,你更愿意希望老板是用哪个特征数字来回答?意希望老板是用哪个特征数字来回答? 平均数向我们提供了样本数据的重要信平均数向我们提供了样本数据的重要信息,但是,有时它也会影响我们,使我们对息,但是,有时
8、它也会影响我们,使我们对总体作出片面判断。总体作出片面判断。平均数反映数据的集中平均数反映数据的集中趋势趋势,但是,只有平均数还难以概况样本数,但是,只有平均数还难以概况样本数据的实际状态。当样本的平均数相等或相差据的实际状态。当样本的平均数相等或相差无几时,就要用样本数据的离散程度来估计无几时,就要用样本数据的离散程度来估计总体的数字特征。这时,我们引进了一个概总体的数字特征。这时,我们引进了一个概念:标准差!念:标准差!标准差标准差 有两位射击运动员在一次射击测试中各射有两位射击运动员在一次射击测试中各射靶十次,每次命中的环数如下靶十次,每次命中的环数如下: 如果你是教练,你应当如何对这次
9、射击情况作出如果你是教练,你应当如何对这次射击情况作出评价?如果这是一次选拔性考核,你应当如何作出选评价?如果这是一次选拔性考核,你应当如何作出选择?择?标准差标准差 标准差标准差是样本数据到平均数的一种平均距是样本数据到平均数的一种平均距离离.它用来描述样本数据的离散程度它用来描述样本数据的离散程度.在实际应在实际应用中,标准差常被理解为稳定性用中,标准差常被理解为稳定性.1、平均距离、平均距离标准差标准差 标准差是样本数据到平均数的一种平均距离标准差是样本数据到平均数的一种平均距离.它它用来描述样本数据的离散程度用来描述样本数据的离散程度.在实际应用中,标准在实际应用中,标准差常被理解为稳
10、定性差常被理解为稳定性.规律:标准差越大,规律:标准差越大,大则大则a越大,数据的越大,数据的离散程度越大;反离散程度越大;反之,数据的离散程之,数据的离散程度越小度越小.计算标准差的算法:计算标准差的算法:1、算出样本数据的平均数2、算出每个样本数据与样本平均数的差3、算出 ,这n个数的平均数,即为样本方差4、算出方差的算术平均值,即为样本标准差s。 注意:注意:1、标准差、方差的取值范围:、标准差、方差的取值范围: 当标准差,方差为当标准差,方差为0时,样本各数据全相等,表明时,样本各数据全相等,表明数据没有波动幅度,数据没有离散性。数据没有波动幅度,数据没有离散性。2、因为方差与原始数据
11、的单位不同,且平方后可能、因为方差与原始数据的单位不同,且平方后可能增大了偏差的程度,所以虽然方差与标准差在刻增大了偏差的程度,所以虽然方差与标准差在刻画样本数据的离散程度上是一样的,但在解决实画样本数据的离散程度上是一样的,但在解决实际问题时,一般采用标准差。际问题时,一般采用标准差。例例1:画出下列四组样本数据的直方图,说画出下列四组样本数据的直方图,说明它们的异同点明它们的异同点.(1)(2)(3)(4)例例2:甲乙两人同时生产内径为甲乙两人同时生产内径为25.40mm的一种零件的一种零件.为为了对两人的生产质量进行评比,从他们生产的零件中各了对两人的生产质量进行评比,从他们生产的零件中
12、各抽出抽出20件,量得其内径尺寸如下(单位:件,量得其内径尺寸如下(单位:mm )甲甲乙乙从生产的零件内径的尺寸来看,谁生产的质量较高?从生产的零件内径的尺寸来看,谁生产的质量较高?X甲甲25.401X乙乙25.406s甲甲0.037S乙乙0.068 从样本平均数看,甲生产的零件内径比从样本平均数看,甲生产的零件内径比乙更接近内径标准,但是差异很小;乙更接近内径标准,但是差异很小; 从样本标准差看,由于从样本标准差看,由于s甲甲S乙,因此乙,因此甲生产的零件内径比乙的稳定程度高很多。甲生产的零件内径比乙的稳定程度高很多。于是,可以作出判断,甲生产的零件的质于是,可以作出判断,甲生产的零件的质量
13、比乙的高一些。量比乙的高一些。X甲甲25.401 X乙乙25.406s甲甲0.037 S乙乙0.068 拓展拓展1、若 的平均数是 ,则 平均数为2、数据 与数据 的方差相等。3、若 的方差为 ,则 的方差为 。4、若 的方差为 ,则 的方差为1 1、对划艇运动员甲乙二人在相同的条件下进行了、对划艇运动员甲乙二人在相同的条件下进行了6 6次测试,测次测试,测得他们最大速度的数据如下:得他们最大速度的数据如下:甲:甲:27,38,30,37,35,3127,38,30,37,35,31; 乙:乙:33,29,38,34,28,3633,29,38,34,28,36根据以上数据,试判断他们谁更优秀
14、。根据以上数据,试判断他们谁更优秀。2 2、若数据、若数据 的平均数为的平均数为 ,方差,方差为为 ,则,则 的的平均数和方差分别为:(平均数和方差分别为:( ) 乙比甲更稳乙比甲更稳定,所以乙定,所以乙比甲更优秀比甲更优秀 练习练习课本课本P79 练习练习解解: 依题意计算可得依题意计算可得 x1=900 x2=900 s123.8 s2 42.6 甲乙两种水稻甲乙两种水稻6年平均产量的平均数相同年平均产量的平均数相同,但甲的标准差比乙的小但甲的标准差比乙的小,所以甲的生产比较稳所以甲的生产比较稳定定.解解 : (1) 平均重量约为平均重量约为496.86 g , 标准差约为标准差约为6.5
15、5(2)重量位于重量位于(x-s , x+s)之间有之间有14袋白糖袋白糖,所占所占百分比为百分比为66.67%.1.用样本的数字特征估计总体的数字特征分两类:用样本的数字特征估计总体的数字特征分两类:a.用样本平均数估计总体平均数。用样本平均数估计总体平均数。b.用样本标准差估计总体标准差。样本容量越大,用样本标准差估计总体标准差。样本容量越大,估计就越精确。估计就越精确。2.平均数对数据有平均数对数据有“取齐取齐”的作用,代表一组数据的作用,代表一组数据的平均水平。的平均水平。3.标准差描述一组数据围绕平均数波动的大小,反标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度。映了一组数据变化的幅度。 小结小结 作业作业课本课本71页练习页练习