28.2用样本估计总体课件

上传人:公**** 文档编号:578659611 上传时间:2024-08-24 格式:PPT 页数:33 大小:1.82MB
返回 下载 相关 举报
28.2用样本估计总体课件_第1页
第1页 / 共33页
28.2用样本估计总体课件_第2页
第2页 / 共33页
28.2用样本估计总体课件_第3页
第3页 / 共33页
28.2用样本估计总体课件_第4页
第4页 / 共33页
28.2用样本估计总体课件_第5页
第5页 / 共33页
点击查看更多>>
资源描述

《28.2用样本估计总体课件》由会员分享,可在线阅读,更多相关《28.2用样本估计总体课件(33页珍藏版)》请在金锄头文库上搜索。

1、2021/3/101讲解:XX复习回顾1 1、算术平均数的概念:、算术平均数的概念:一般地,对于n个数, 我们把叫做这n个数的算术平均数,简称平均数.2、加权平均数的定义一般说来,如果n个数据中,x1出现f1次,x2出现f2次, xk出现fk次,且f1 + f2 + +fk =n则这n个数的平均数可表示为x=(x1f1+x2f2+xkfk)n。其中fi/n是xi的权重(i=1,2k)。其中f1 、 f2 、 、fk叫做权。n个数按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.3、中位数的概念:的概念:注意:1.求中位数时必须将这组数据从大到小(或从小到

2、大)顺序排列;2.当所给数据为奇数时,中位数在数据中;当所给数据为偶数时,中位数不在所给数据中,而是最中间两个数据的平均数;3.一组数据的中位数是唯一的2021/3/102讲解:XX4、众数的概念:一组数据中出现次数最多的数据叫做这组数据的众数。注意:1.众数一定在所给数据中。 2.众数可能不唯一。1、如何理解“中位数”?中位数与数据排列有关,且一组数据的中位数是唯一的,它可以是该组数据中的某个数,也可能不是这组数据的数,中位数和平均数一样也反映了一组数据的“平均水平”,不过考虑角度不同。2、如何理解“众数”?众数是指一组数据中出现次数最多的那个数据,它的大小只与一组一组数据中的部分数据有关,

3、一组数据的众数可能有一个或几个,也可能没有。3、如何合理地选用平均数、中位数和众数?平均数、中位数和众数都是一组数据的代表,分别代表这组数据的“一般水平”、“中等水平”和“多数水平”,平均数涉及所有的数据,中位数和众数只涉及部分数据,它们表示的意义各不相同。平均数、中位数与众数都有哪些自己的特点?平均数:充分利用数据所提供的信息,应用最为广泛,但中位数:计算简单,受极端值影响较小,但众数:当一组数据中有些数据多次重复出现时,众数往往是人们尤为关心的一个量2021/3/103讲解:XX4 4、总结反思:、总结反思:在实际问题中,平均数是最常用的指标,但不能一味的使用平均数来确定数据的特征,根据不

4、同的实际需要,确定用平均数、中位数还是众数反映数据的特征。平均数、中位数、和众数各有所长,也各有其短。1、用平均数作为一组数据的代表,比较可靠和稳定,它与这组数据中的每一个数都有关系,对这组数据所包含的信息的反映最为充分,因而其应用也最为广泛,特别是在进行统计推断时有最要的作用,但计算时比较繁琐,并且容易受到极端数据的影响。2、用众数作为一组数据的代表,着眼于对数据出现的频数的考察,其大小只与这组数据中的部分数据有关,可靠性比较差,但众数不受极端数据的影响。当一组数据中有不少数据多次重复出现时,其众数往往是我们关心的一种统计量。3、用中位数作为一组数据的代表,可靠性也比较差,但中位数也不受极端

5、数据的影响,当一组数据中的个别数据变动较大时,可用他来描述其集中趋势。5、什么样的指标可以反映一组数据变化范围的大小? 我们可以用一组数据中的最大值减去最小值所得的差来反映这组数据的变化范围用这种方法得到的差称为极差极差( (rangerange) ) 极差最大值最小值2021/3/104讲解:XX6.6.方差方差: :各数据与平均数的差的平方的平均数叫做这批数据的方差各数据与平均数的差的平方的平均数叫做这批数据的方差. .7 7. .方差方差用来衡量一批数据的用来衡量一批数据的波动大小波动大小( (即这批数即这批数 据偏离平均数的大小据偏离平均数的大小).).在样本容量相同的情况下在样本容量

6、相同的情况下, ,方差越大方差越大, ,说明数据的说明数据的波动越大波动越大, ,越不稳定越不稳定. .方差越小方差越小, ,说明说明数据的数据的波动越小波动越小, ,越稳定越稳定. .S S2 2= (x= (x1 1-x)-x)2 2+(x+(x2 2-x)-x)2 2+ +(x+ +(xn n-x)-x)2 2 注意注意 : 极差和方差都是表示一组数据离散程度的指标,极差大只能说明这组极差和方差都是表示一组数据离散程度的指标,极差大只能说明这组数据中的最大值与最小值的离散程度大数据中的最大值与最小值的离散程度大, ,但不表示其他数据的波动大小。但不表示其他数据的波动大小。极差不能极差不能

7、准确的衡量数据中的波动程度。准确的衡量数据中的波动程度。方差反映一组数据的整体波动大小的指标数方差反映一组数据的整体波动大小的指标数, ,反映反映的是一组数据偏离平均值的大小。因此极差大的一组数据的方差并不一定大的是一组数据偏离平均值的大小。因此极差大的一组数据的方差并不一定大. .我们可以用“先平均,再求差,然后平方,最后再平均”得到的结果表示一组数据偏离平均值的情况这个结果通常称为方差。2021/3/105讲解:XX 极差、方差和标准差的区别与联系:极差、方差和标准差的区别与联系:联系:联系:极差、方差和标准差都是用来衡量(或描述)一组数据极差、方差和标准差都是用来衡量(或描述)一组数据偏

8、离平均数的大小偏离平均数的大小(即波动(即波动大小)的指标,常用来比较两组数大小)的指标,常用来比较两组数据的波动情况。据的波动情况。区别:区别:极差极差是用一组数据中的最大值与最小值的差来反映数据的变化范围,主要反映是用一组数据中的最大值与最小值的差来反映数据的变化范围,主要反映一组数据中两个极端值之间的差异情况,对其他的数据的波动不敏感。一组数据中两个极端值之间的差异情况,对其他的数据的波动不敏感。 方差方差是用是用“先平均,再求差,然后平方,最后再平均先平均,再求差,然后平方,最后再平均”的方法得到的结果,主的方法得到的结果,主要反映整组数据的波动情况,是反映一组数据与其平均值离散程度的

9、一个重要指标,要反映整组数据的波动情况,是反映一组数据与其平均值离散程度的一个重要指标,每个数年据的变化都将影响方差的结果,是一个对整组数据波动情况更敏感的指标。每个数年据的变化都将影响方差的结果,是一个对整组数据波动情况更敏感的指标。在实际使用时,往往计算一组数据的方差,来衡量一组数据的波动大小。在实际使用时,往往计算一组数据的方差,来衡量一组数据的波动大小。标准差实际是方差的一个变形标准差实际是方差的一个变形,只是方差的单位是原数据单位的平方,而标准差的,只是方差的单位是原数据单位的平方,而标准差的单位与原数据单位相同。单位与原数据单位相同。从方差的计算过程,可以看出从方差的计算过程,可以

10、看出S S 2 2 的数量单位与原数据的不一致的数量单位与原数据的不一致,因此在实际应,因此在实际应用时常常将求出的用时常常将求出的方差再开平方方差再开平方,这就是,这就是标准差标准差。用符号表示为用符号表示为标准差标准差= = ,方差,方差= =标准差标准差2 22021/3/106讲解:XX1、扇形统计图可以清楚地告诉我们各部分数量占总数量的百分比,所以我们在表示数据时常常会用到它。制作扇形统计图的步骤吗?第一步 计算各类数据在总数中所占的百分比;第二步 按百分比计算在扇形统计图中所对应的圆心角的度数;第三步 绘制扇形统计图2021/3/107讲解:XX条形统计图,它能清楚地表示出每个项目

11、的具体数目。能看出大学生3611人、高中生11146人,初中生33961人,小学生357201人,其他15581人。2021/3/108讲解:XX折线统计图,从上面可看出1964年416人,1982年615人,1990年1422人,2000年3611人,折线统计图能清楚地反映事物的变化情况。2021/3/109讲解:XX频数:每个对象出现的次数叫做频数频率:每个对象出现的次数与总次数的比值叫做频率频数总数频率各频数之和总数各频率之和注意注意:一般情况一般情况(1 1)可以由组距来求组数;)可以由组距来求组数;(2 2)当数据个数小于)当数据个数小于4040时,组数为时,组数为6 68 8组;组

12、; 当数据个数当数据个数4010040100个时,组数为个时,组数为7 71010组;组;画频数分布直方图的一般步骤:(1) (1) 计算最大值与最小值的差计算最大值与最小值的差( (极差极差).). 极差: (2) (2) 决定组距与组数决定组距与组数: : 极差/组距=_数据分成_组.(4)(4)列频数分布表列频数分布表. . 数出每一组频数(5)(5)绘制频数分布直方图绘制频数分布直方图. . 横轴表示各组数据,纵轴表示频数, 该组内的频数为高,画出一个个矩形。(3) (3) 决定分点决定分点. .2021/3/1010讲解:XX根据频数分布表制作直方图的要点:分别以横轴上每组别两边界点

13、为端点的线段为底边,做高为相应频数的矩形,就得到所求的频数分布直方图。用来表示频数分布的基本统计图叫做频数分布直方图,简称直方图绘制频数折线图绘制频数折线图将直方图中每个小将直方图中每个小长方形上面一条边的中点顺次连结长方形上面一条边的中点顺次连结起来起来, ,即可得到频数折线图即可得到频数折线图 2021/3/1011讲解:XX 28.2 28.2 用样本估计总体用样本估计总体 2021/3/1012讲解:XX 在上节课中,我们知道在选在上节课中,我们知道在选取样本时应注意的问题,其一是取样本时应注意的问题,其一是所选取的样本必须具有代表性,所选取的样本必须具有代表性,其二是所选取的样本的容

14、量应该其二是所选取的样本的容量应该足够大,这样的样本才能反映总足够大,这样的样本才能反映总体的特性,所选取的样本才比较体的特性,所选取的样本才比较可靠可靠. . 2021/3/1013讲解:XX 随机抽样调查随机抽样调查是了解总是了解总体情况的一种重要的数学方法,体情况的一种重要的数学方法,抽样是它的一个关键,抽样是它的一个关键,上节课上节课介介绍了绍了简单的随机抽样简单的随机抽样方法,即用方法,即用抽签的方法来选取样本,这使每抽签的方法来选取样本,这使每个个体都有个个体都有相等的机会相等的机会被选入样被选入样本本2021/3/1014讲解:XX判断下面这些抽样调查选取样本的方法是否判断下面这

15、些抽样调查选取样本的方法是否合适,若不合适,请说明理由合适,若不合适,请说明理由(1)(1)为调查江苏省的环境污染情况,调查了长为调查江苏省的环境污染情况,调查了长江以南的南京市、常州市、苏州市、镇江市、江以南的南京市、常州市、苏州市、镇江市、无锡市的环境污染情况无锡市的环境污染情况(2)(2)从从100100名学生中,随机抽取名学生中,随机抽取2 2名学生,测量名学生,测量他们的身高来估算这他们的身高来估算这100100名学生的平均身高名学生的平均身高(3)(3)从一批灯泡中随机抽取从一批灯泡中随机抽取5050个进行试验,个进行试验,估算这批灯泡的使用寿命估算这批灯泡的使用寿命(4)(4)为

16、了解观众对中央电视台第一套节目的收为了解观众对中央电视台第一套节目的收视率,对所有上英特网的家庭进行在线调查视率,对所有上英特网的家庭进行在线调查2021/3/1015讲解:XX解解: :(1)(1)不合适因为调查对象在总体中必须有代表性,不合适因为调查对象在总体中必须有代表性,现在所调查的这些地方的环境污染情况仅仅代表现在所调查的这些地方的环境污染情况仅仅代表了长江以南地区,并不能代表整个江苏省的环境了长江以南地区,并不能代表整个江苏省的环境污染情况污染情况(2)(2)不合适因为抽样调查时所抽取的样本要足够不合适因为抽样调查时所抽取的样本要足够大,现在只抽取了大,现在只抽取了2 2名学生的身

17、高,不能用来估算名学生的身高,不能用来估算100100名学生的平均身高名学生的平均身高(3)(3)合适合适(4)(4)不合适虽然调查的家庭很多,但仅仅增加调不合适虽然调查的家庭很多,但仅仅增加调查的数量不一定能够提高调查质量,本题中所调查的数量不一定能够提高调查质量,本题中所调查的仅代表上英特网的家庭,不能代表不上英特查的仅代表上英特网的家庭,不能代表不上英特网的家庭,因此这样的抽样调查不具有普遍代表网的家庭,因此这样的抽样调查不具有普遍代表性性 2021/3/1016讲解:XX让我们仍以上一节让我们仍以上一节300300名学生的考试成名学生的考试成绩为例,考察一下抽样调查的结果是绩为例,考察

18、一下抽样调查的结果是否可靠。上一节中,老师选取的一个否可靠。上一节中,老师选取的一个样本是:样本是:随机数随机数(学号)学号)11125416794276成成绩绩80866691672021/3/1017讲解:XX它的频数分布直方图、平均它的频数分布直方图、平均成绩和标准差分别如下:成绩和标准差分别如下:2021/3/1018讲解:XX另外,同学们也分别选取了一些样本,另外,同学们也分别选取了一些样本,它们同样也包含五个个体,如下表:它们同样也包含五个个体,如下表:随机数随机数(学号)(学号)1321322452455 598988989成绩成绩78787373767669697575同样,也

19、可以作出这两个样本的频同样,也可以作出这两个样本的频数分布直方图、计算它们的平均成数分布直方图、计算它们的平均成绩和标准差,如下图所示:绩和标准差,如下图所示: 随机数随机数(学号)(学号)901678627554成成绩绩72868382822021/3/1019讲解:XX样本平均成绩样本平均成绩为为80.880.8分,分,标准差为标准差为6.56.5分分样本平均成绩为样本平均成绩为74.274.2分,分,标准差为标准差为3.83.8分分2021/3/1020讲解:XX从以上三张图比较来看,它们之间存在明显从以上三张图比较来看,它们之间存在明显的差异,平均数和标准差与总体的平均数与的差异,平均

20、数和标准差与总体的平均数与标准差也相去甚远,显然这样选择的样本不标准差也相去甚远,显然这样选择的样本不能反映总体的特性,是不可靠的。能反映总体的特性,是不可靠的。2021/3/1021讲解:XX2 2、选择恰当的样本个体数目、选择恰当的样本个体数目样本平均成绩为样本平均成绩为75.775.7分,分,标准差为标准差为10.210.2分分样本平均成绩为样本平均成绩为77.177.1分,分,标准差为标准差为10.710.7分分2021/3/1022讲解:XX 当样本中个体太少时,当样本中个体太少时,样本的平均数、标准差往往样本的平均数、标准差往往差距较大,如果选取适当的差距较大,如果选取适当的样本的

21、个体数,各个样本的样本的个体数,各个样本的平均数、标准差与总体的标平均数、标准差与总体的标准差相当接近。准差相当接近。 2021/3/1023讲解:XX 随着样本容量(样本中包含的个体随着样本容量(样本中包含的个体的个数)的增加,由样本得出的平均数的个数)的增加,由样本得出的平均数往往会更接近总体的平均数,数学家已往往会更接近总体的平均数,数学家已经证明随机抽样方法是科学而可靠的经证明随机抽样方法是科学而可靠的. . 对于估计总体特性这类问题,数学上的对于估计总体特性这类问题,数学上的一般做法是给出具有一定可靠程度的一一般做法是给出具有一定可靠程度的一个估计值的范围个估计值的范围 . .202

22、1/3/1024讲解:XX3 3、加权平均数的求法、加权平均数的求法问题问题1 1:在计算:在计算2020个男同学平均身高时,个男同学平均身高时,小华先将所有数据按由小到大的顺序小华先将所有数据按由小到大的顺序排列,如下表所示:排列,如下表所示:然后然后, ,他这样计算这他这样计算这2020个学生的平均身高:个学生的平均身高:小华这样计算平均数可以吗?为什么?小华这样计算平均数可以吗?为什么?2021/3/1025讲解:XX问题问题2 2:假设你们年级共有四个班级,:假设你们年级共有四个班级,各班的男同学人数和平均身高如表所示各班的男同学人数和平均身高如表所示. .小强这样计算全年级男同学的平

23、均身高:小强这样计算全年级男同学的平均身高:小强这样计算平均数可以吗?为什么?小强这样计算平均数可以吗?为什么?2021/3/1026讲解:XX为了检查一批手榴弹的杀伤半径,抽为了检查一批手榴弹的杀伤半径,抽取了其中取了其中2020颗做试验,得到这颗做试验,得到这2020颗手颗手榴弹的杀伤半径,并列表如下:榴弹的杀伤半径,并列表如下:练习练习1:2021/3/1027讲解:XX(1)(1)在这个问题中,总体、个体、在这个问题中,总体、个体、样本和样本容量各是什么?样本和样本容量各是什么?(2)(2)求出这求出这2020颗手榴弹的杀伤半颗手榴弹的杀伤半径的众数、中位数和平均数,径的众数、中位数和

24、平均数,并估计这批手榴弹的平均杀伤并估计这批手榴弹的平均杀伤半径半径2021/3/1028讲解:XX解解: :(1)(1)总体是要检查的这批手榴弹的杀伤半径的全体;总体是要检查的这批手榴弹的杀伤半径的全体;个体是每一颗手榴弹的杀伤半径;样本是所抽取个体是每一颗手榴弹的杀伤半径;样本是所抽取的的2020颗手榴弹的杀伤半径;样本容量是颗手榴弹的杀伤半径;样本容量是2020(2)(2)在在2020个数据中,个数据中,1010出现了出现了6 6次,次数最多,所以次,次数最多,所以众数是众数是1010(米)(米) 2020个数据从小到大排列,第个数据从小到大排列,第1010个和第个和第1111个数据是个

25、数据是最中间的两个数,分别为最中间的两个数,分别为9 9(米)和(米)和1010(米),(米),所以中位数是所以中位数是9.5 9.5 (米)样本平均数(米)样本平均数9.49.4(米)(米)2021/3/1029讲解:XX在一个班的在一个班的4040学生中,学生中,1414岁岁的有的有5 5人,人,1515岁的有岁的有3030人,人,1616岁的有岁的有4 4人,人,1717岁的有岁的有1 1人,人,求这个班级学生的平均年龄。求这个班级学生的平均年龄。2021/3/1030讲解:XX小结小结: : 一般来说,用样本估计总体时,一般来说,用样本估计总体时,样本容量越大,样本对总体的估计样本容量越大,样本对总体的估计也就越精确,相应地,搜集、整理、也就越精确,相应地,搜集、整理、计算数据的工作量也就越大,因此,计算数据的工作量也就越大,因此,在实际工作中,样本容量既要考虑在实际工作中,样本容量既要考虑问题本身的需要,又要考虑实现的问题本身的需要,又要考虑实现的可能性和所付出的代价的大小。可能性和所付出的代价的大小。2021/3/1031讲解:XX 随机抽样是经过数学随机抽样是经过数学证明了的可靠的方法,它证明了的可靠的方法,它对于估计总体特征是很有对于估计总体特征是很有帮助的。帮助的。2021/3/1032讲解:XX感谢您的阅读收藏,谢谢!2021/3/1033

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 资格认证/考试 > 自考

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号