高中数学 2.2.2 用样本的数字特征估计总体的数字特征课件2 新人教A版必修3

上传人:工**** 文档编号:567919013 上传时间:2024-07-22 格式:PPT 页数:19 大小:508.01KB
返回 下载 相关 举报
高中数学 2.2.2 用样本的数字特征估计总体的数字特征课件2 新人教A版必修3_第1页
第1页 / 共19页
高中数学 2.2.2 用样本的数字特征估计总体的数字特征课件2 新人教A版必修3_第2页
第2页 / 共19页
高中数学 2.2.2 用样本的数字特征估计总体的数字特征课件2 新人教A版必修3_第3页
第3页 / 共19页
高中数学 2.2.2 用样本的数字特征估计总体的数字特征课件2 新人教A版必修3_第4页
第4页 / 共19页
高中数学 2.2.2 用样本的数字特征估计总体的数字特征课件2 新人教A版必修3_第5页
第5页 / 共19页
点击查看更多>>
资源描述

《高中数学 2.2.2 用样本的数字特征估计总体的数字特征课件2 新人教A版必修3》由会员分享,可在线阅读,更多相关《高中数学 2.2.2 用样本的数字特征估计总体的数字特征课件2 新人教A版必修3(19页珍藏版)》请在金锄头文库上搜索。

1、 第二章第二章 统计统计2.2.2 2.2.2 用样本的数字特征估计用样本的数字特征估计 总体的数字特征总体的数字特征(一):众数、中位数和平均数(一):众数、中位数和平均数 思考思考1 1:在初中我们学过众数、中位数和平均数的概念,:在初中我们学过众数、中位数和平均数的概念,这些数据都是反映样本信息的数字特征,对一组样本数据这些数据都是反映样本信息的数字特征,对一组样本数据如何求众数、中位数和平均数?如何求众数、中位数和平均数? 思考思考2 2:在城市居民月均用水量样本数据的频率分布直方:在城市居民月均用水量样本数据的频率分布直方图中,你认为众数应在哪个小矩形内?由此估计总体的众图中,你认为

2、众数应在哪个小矩形内?由此估计总体的众数是什么?数是什么? 月月 均均 用用 水水量量/t频率频率组距组距0.50.50.40.40.30.30.20.20.10.10.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O取最高矩形下端取最高矩形下端中点的横坐标中点的横坐标2.252.25作为众数作为众数. . 思考思考4 4:在城市居民月均用水量样本数据的频率分布直方:在城市居民月均用水量样本数据的频率分布直方图中,从左至右各个小矩形的面积分别是图中,从左至右各个小矩形的面积分别是0.040.04,0.080.08,0.150.15,

3、0.220.22,0.250.25,0.140.14,0.060.06,0.040.04,0.02.0.02.由此估计由此估计总体的中位数是什么?总体的中位数是什么? 月均用水量月均用水量/t频率频率组距组距0.50.50.40.40.30.30.20.20.10.10.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O O0.5-0.04-0.08-0.15-0.22=0.010.5-0.04-0.08-0.15-0.22=0.01,0.010.010.5=0.020.5=0.02,中位,中位数是数是2+0.02=2.02. 2+0

4、.02=2.02. 思考思考3 3:在频率分布直方图中,每个小矩形的面积表示什:在频率分布直方图中,每个小矩形的面积表示什么?中位数左右两侧的直方图的面积应有什么关系?么?中位数左右两侧的直方图的面积应有什么关系?思考思考5 5:平均数是频率分布直方图的:平均数是频率分布直方图的“重心重心”,在城市居,在城市居民月均用水量样本数据的频率分布直方图中,各个小矩形民月均用水量样本数据的频率分布直方图中,各个小矩形的重心在哪里?从直方图估计总体在各组数据内的平均数的重心在哪里?从直方图估计总体在各组数据内的平均数分别为多少?分别为多少?0.250.25,0.750.75,1.251.25,1.751

5、.75,2.252.25, 2.752.75,3.253.25,3.753.75,4.25.4.25. 月均用水量月均用水量/t频率频率组距组距0.50.50.40.40.30.30.20.20.10.10.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 O O思考思考6 6:根据统计学中数学期望原理,将频率分布直方图:根据统计学中数学期望原理,将频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积相加,中每个小矩形的面积与小矩形底边中点的横坐标之积相加,就是样本数据的估值平均数就是样本数据的估值平均数. . 由此估计总体的平

6、均数是什由此估计总体的平均数是什么?么?0.250.250.04+0.750.04+0.750.08+1.250.08+1.250.15+1.750.15+1.750.22+2.250.22+2.250.25+2.750.25+2.750.14+3.250.14+3.25 0.06+3.750.06+3.750.04+4.250.04+4.250.02=2.020.02=2.02(t t). . 平均数是平均数是2.02. 2.02. 思考思考7 7:从居民月均用水量样本数据可知,该样本的众数:从居民月均用水量样本数据可知,该样本的众数是是2.32.3,中位数是,中位数是2.02.0,平均数是

7、,平均数是1.9731.973,这与我们从样本,这与我们从样本频率分布直方图得出的结论有偏差,你能解释一下原因吗频率分布直方图得出的结论有偏差,你能解释一下原因吗? 频率分布直方图损失了一些样本数据,得到的是一频率分布直方图损失了一些样本数据,得到的是一个估计值,且所得估值与数据分组有关个估计值,且所得估值与数据分组有关. . 注注: :在只有样本频率分布直方图的情况下,我们可以在只有样本频率分布直方图的情况下,我们可以按上述方法估计众数、中位数和平均数,并由此估计总按上述方法估计众数、中位数和平均数,并由此估计总体特征体特征. .思考思考8:一组数据的中位数一般不受少数几个极端值的影:一组数

8、据的中位数一般不受少数几个极端值的影响,这在某些情况下是一个优点,但它对极端值的不敏响,这在某些情况下是一个优点,但它对极端值的不敏感有时也会成为缺点,你能举例说明吗?样本数据的平感有时也会成为缺点,你能举例说明吗?样本数据的平均数大于(或小于)中位数说明什么问题?你怎样理解均数大于(或小于)中位数说明什么问题?你怎样理解“我们单位的收入水平比别的单位高我们单位的收入水平比别的单位高”这句话的含义?这句话的含义? 如:样本数据收集有个别差错不影响中位数;大学如:样本数据收集有个别差错不影响中位数;大学毕业生凭工资中位数找单位可能收入较低毕业生凭工资中位数找单位可能收入较低. . 平均数大于(或

9、小于)中位数,说明样本数据平均数大于(或小于)中位数,说明样本数据中存在许多较大(或较小)的极端值中存在许多较大(或较小)的极端值. . 这句话具有模糊性甚至蒙骗性,其中收入水平这句话具有模糊性甚至蒙骗性,其中收入水平是员工工资的某个中心点,它可以是众数、中位数是员工工资的某个中心点,它可以是众数、中位数或平均数或平均数. .(二):标准差(二):标准差 样本的众数、中位数和平均数常用来表示样本样本的众数、中位数和平均数常用来表示样本数据的数据的“中心值中心值”,其中众数和中位数容易计算,不,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的受少数几个极端值的影响,但只

10、能表达样本数据中的少量信息少量信息. . 平均数代表了数据更多的信息,但受样本平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也中每个数据的影响,越极端的数据对平均数的影响也越大越大. .当样本数据质量比较差时,使用众数、中位数或当样本数据质量比较差时,使用众数、中位数或平均数描述数据的中心位置,可能与实际情况产生较平均数描述数据的中心位置,可能与实际情况产生较大的误差,难以反映样本数据的实际状况,因此,我大的误差,难以反映样本数据的实际状况,因此,我们需要一个统计数字刻画样本数据的离散程度们需要一个统计数字刻画样本数据的离散程度. . 思考思考1 1:在一次射

11、击选拔赛中,甲、乙两名运动员各射击:在一次射击选拔赛中,甲、乙两名运动员各射击1010次,每次命中的环数如下:次,每次命中的环数如下:甲:甲:7 8 7 9 5 4 9 10 7 47 8 7 9 5 4 9 10 7 4乙:乙:9 5 7 8 7 6 8 6 7 79 5 7 8 7 6 8 6 7 7 甲、乙两人本次射击的平均成绩分别为多少环?甲、乙两人本次射击的平均成绩分别为多少环?思考思考2 2:甲、乙两人射击的平均成绩相等,观察两人成绩:甲、乙两人射击的平均成绩相等,观察两人成绩的频率分布条形图,你能说明其水平差异在那里吗?的频率分布条形图,你能说明其水平差异在那里吗?环数环数频率频

12、率0.40.40.30.30.20.20.10.14 5 6 7 8 9 10 4 5 6 7 8 9 10 O O(甲)(甲)环数环数频率频率0.40.40.30.30.20.20.10.14 5 6 7 8 9 10 4 5 6 7 8 9 10 O O(乙)(乙)甲的成绩比较分散,极差较大,乙的成绩相对集中,甲的成绩比较分散,极差较大,乙的成绩相对集中,比较稳定比较稳定. .环数环数思考思考3 3:对于样本数据:对于样本数据x x1 1,x x2 2,x xn n,设想通过各数,设想通过各数据到其平均数的平均距离来反映样本数据的分散程度,据到其平均数的平均距离来反映样本数据的分散程度,那

13、么这个平均距离如何计算?那么这个平均距离如何计算? 思考思考4 4:反映样本数据的分散程度的大小,最常用的统:反映样本数据的分散程度的大小,最常用的统计量是标准差,一般用计量是标准差,一般用s s表示表示. .假设样本数据假设样本数据x x1 1,x x2 2,x xn n的平均数为的平均数为 ,则标准差的计算公式是:,则标准差的计算公式是: 那么标准差的取值范围是什么?标准差为那么标准差的取值范围是什么?标准差为0 0的样本数据的样本数据有何特点?有何特点? s0s0,标准差为,标准差为0 0的样本数据都相等的样本数据都相等. . 思考思考5 5:对于一个容量为:对于一个容量为2 2的样本:

14、的样本:x x1 1,x x2 2(x(x1 1x x2 2) ),则,则 , , 在数轴上,这两个统计数据有什么几何意义?由此说明标在数轴上,这两个统计数据有什么几何意义?由此说明标准差的大小对数据的离散程度有何影响?准差的大小对数据的离散程度有何影响? 标准差越大离散程度越大,数据较分散;标准差越小离标准差越大离散程度越大,数据较分散;标准差越小离散程度越小,数据较集中在平均数周围散程度越小,数据较集中在平均数周围. . 知识补充知识补充1.1.标准差的平方标准差的平方 称为方差,有时用方差代替标准差测称为方差,有时用方差代替标准差测量样本数据的离散度量样本数据的离散度. .方差与标准差的

15、测量效果是一致的,方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差在实际应用中一般多采用标准差. .2.2.现实中的总体所包含的个体数往往很多,总体的平均现实中的总体所包含的个体数往往很多,总体的平均数与标准差是未知的,我们通常用样本的平均数和标准数与标准差是未知的,我们通常用样本的平均数和标准差去估计总体的平均数与标准差,但要求样本有较好的差去估计总体的平均数与标准差,但要求样本有较好的代表性代表性. .例例1 1 画出下列四组样本数据的条形图,画出下列四组样本数据的条形图,说明他们的异同点说明他们的异同点. .(1) (1) ,;,;(2) (2) ,;,;O O频率频率1.0

16、0.80.60.40.21 2 3 4 5 6 7 81 2 3 4 5 6 7 8 (1)O O频率频率1.00.80.60.40.21 2 3 4 5 6 7 81 2 3 4 5 6 7 8 (2)(3) (3) ,;,;(4) (4) ,. .频率频率1.01.00.80.80.60.60.40.40.20.21 2 3 4 5 6 7 81 2 3 4 5 6 7 8 O O(3 3)频率频率1.01.00.80.80.60.60.40.40.20.21 2 3 4 5 6 7 81 2 3 4 5 6 7 8 O O(4 4)例例2 2 甲、乙两人同时生产内径为甲、乙两人同时生产内

17、径为25.40mm25.40mm的一种零件,为的一种零件,为了对两人的生产质量进行评比,从他们生产的零件中各了对两人的生产质量进行评比,从他们生产的零件中各随机抽取随机抽取2020件,量得其内径尺寸如下(单位:件,量得其内径尺寸如下(单位:mmmm):):甲甲 :25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.46 25.32 25.45 25.39 25.36 25.34 25.42 25.45 25.38 25.42 25.39 25.43 25.39 25.40 25.45 25.38 25.42 25.39 25.43 25.39 25.40

18、25.44 25.40 25.42 25.35 25.41 25.3925.44 25.40 25.42 25.35 25.41 25.39乙:乙:25.40 25.43 25.44 25.48 25.48 25.47 25.49 25.40 25.43 25.44 25.48 25.48 25.47 25.49 25.49 26.36 25.34 25.33 25.43 25.43 25.32 25.49 26.36 25.34 25.33 25.43 25.43 25.32 25.47 25.31 25.32 25.32 25.32 25.4825.47 25.31 25.32 25.32

19、 25.32 25.48 从生产零件内径的尺寸看,谁生产的零件质量较高?从生产零件内径的尺寸看,谁生产的零件质量较高? 甲生产的零件内径更接近内径标准,且稳定程度较高,甲生产的零件内径更接近内径标准,且稳定程度较高,故甲生产的零件质量较高故甲生产的零件质量较高. . 说明:说明:1.1.生产质量可以从总体的平均数与标准差两个生产质量可以从总体的平均数与标准差两个角度来衡量,但甲、乙两个总体的平均数与标准差都角度来衡量,但甲、乙两个总体的平均数与标准差都是不知道的,我们就用样本的平均数与标准差估计总是不知道的,我们就用样本的平均数与标准差估计总体的平均数与标准差体的平均数与标准差. . 2. 2

20、.问题中问题中25.40mm25.40mm是内径的标准值,而不是总体是内径的标准值,而不是总体的平均数的平均数. .例例3 3 以往招生统计显示,某所大学录取的新生高考总分以往招生统计显示,某所大学录取的新生高考总分的中位数基本稳定在的中位数基本稳定在550550分,若某同学今年高考得了分,若某同学今年高考得了520520分,他想报考这所大学还需收集哪些信息?分,他想报考这所大学还需收集哪些信息?要点:(要点:(1 1)查往年录取的新生的平均分数)查往年录取的新生的平均分数. .若平均数小于中位数若平均数小于中位数很多,说明最低录取线较低,可以报考;很多,说明最低录取线较低,可以报考;(2 2

21、)查往年录取的新生高考总分的标准差)查往年录取的新生高考总分的标准差. .若标准差较大,说明若标准差较大,说明新生的录取分数较分散,最低录取线可能较低,可以考虑报考新生的录取分数较分散,最低录取线可能较低,可以考虑报考. .例例4 4 在去年的足球甲在去年的足球甲A A联赛中,甲队每场比赛平均失球数联赛中,甲队每场比赛平均失球数是是1.51.5,全年比赛失球个数的标准差为,全年比赛失球个数的标准差为1.11.1;乙队每场比赛;乙队每场比赛平均失球数是平均失球数是2.12.1,全年比赛失球个数的标准差为,全年比赛失球个数的标准差为0.4.0.4.你你认为下列说法是否正确,为什么?认为下列说法是否

22、正确,为什么? (1 1)平均来说甲队比乙队防守技术好;()平均来说甲队比乙队防守技术好;(2 2)乙队比甲队)乙队比甲队技术水平更稳定;(技术水平更稳定;(3 3)甲队有时表现很差,有时表现又)甲队有时表现很差,有时表现又非常好;(非常好;(4 4)乙队很少不失球)乙队很少不失球. .小结作业小结作业1.1.对同一个总体,可以抽取不同的样本,相应的平均数对同一个总体,可以抽取不同的样本,相应的平均数与标准差都会发生改变与标准差都会发生改变. .如果样本的代表性差,则对总如果样本的代表性差,则对总体所作的估计就会产生偏差;如果样本没有代表性,则体所作的估计就会产生偏差;如果样本没有代表性,则对总体作出错误估计的可能性就非常大,由此可见抽样对总体作出错误估计的可能性就非常大,由此可见抽样方法的重要性方法的重要性. .2.2.在抽样过程中,抽取的样本是具有随机性的,如从一在抽样过程中,抽取的样本是具有随机性的,如从一个包含个包含6 6个个体的总体中抽取一个容量为个个体的总体中抽取一个容量为3 3的样本就有的样本就有2020中可能抽样,因此样本的数字特征也有随机性中可能抽样,因此样本的数字特征也有随机性. . 用样本的数字特征估计总体的数字特征,是一用样本的数字特征估计总体的数字特征,是一种统计思想,没有惟一答案种统计思想,没有惟一答案. .

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 大杂烩/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号