随机抽样、正态分布培训讲学

上传人:yulij****0329 文档编号:141040574 上传时间:2020-08-03 格式:PPT 页数:40 大小:1.02MB
返回 下载 相关 举报
随机抽样、正态分布培训讲学_第1页
第1页 / 共40页
随机抽样、正态分布培训讲学_第2页
第2页 / 共40页
随机抽样、正态分布培训讲学_第3页
第3页 / 共40页
随机抽样、正态分布培训讲学_第4页
第4页 / 共40页
随机抽样、正态分布培训讲学_第5页
第5页 / 共40页
点击查看更多>>
资源描述

《随机抽样、正态分布培训讲学》由会员分享,可在线阅读,更多相关《随机抽样、正态分布培训讲学(40页珍藏版)》请在金锄头文库上搜索。

1、新课标高中一轮总复习,随机抽样、正态分布,1.数据的基本数字特征 (1)平均数:一组数据的平均数,记为.设有n个数据x1,x2,xn,则平均数为 = . (2)中位数:一组数据按照从小到大或从大到小的顺序进行排列时,处于中间位置的数.当这组数据的个数为奇数时,中位数为中间一个数;当这组数据的个数为偶数时,中位数为中间的两个数的平均数.,(2)频率分布直方图的画图步骤: ()求极差;()决定组距与组数;()将数据分组;()列频率分布表;()画频率分布直方图(以频率组距为纵坐标). (3)频率分布折线图:连接频率分布直方图中各小长方形上端的中点所得的折线. (4)总体密度曲线:随着样本容量的增加,

2、作频率分布折线图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,则称这条光滑曲线为总体密度曲线.,(5)茎叶图:中间的数字表示数据的十位数字,旁边的数字分别表示两组数据中各个数据的个位数字. 3.抽样方法 (1)简单随机抽样:从含有N个个体的总体中逐个不放回地抽取n个个体作为样本(nN),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做 .有两种常用方法:,简单随机抽样,() :就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中取出一个号签,连续抽取n次,就得到一个容量为n的样本. () :利用随机数表、随机数

3、骰子或计算机产生的随机数进行抽样. (2)系统抽样:按下列步骤进行抽样: ()先将总体的N个个体编号;()确定分段间隔k,对编号进行分段;()在第1段用简单随机抽样确定第一个个体编号l(lk);()按照一定的规则抽取样本.,抽签法,随机数表法,(3)分层抽样:即 . . . . 4.正态分布 (1)如果随机变量的概率密度为 ,(x)= . 其中、分别表示总体的平均数与标准差,称服从参数为、的正态分布,记作N(,2),函数图象称为正态密度曲线,简称正态曲线.,在抽样时,将总体分成,互不交叉的层,然后按照一定的比例,从各层,独立地抽出一定数量的个体,将各层取出的,个体合在一起作为样本,(x(-,+

4、),一般的,如果对于任何实数ab,随机变量满足P(ab)= ,(x)dx,则称的分布为 . (2)标准正态分布 在正态分布中,当= ,= 时,正态总体称为标准正态总体,正态分布N(0,1),称为标准正态分布,记作N(0,1). (3)正态曲线的性质 ()曲线在x轴的上方,与x轴不相交; ()曲线关于直线x=对称;,正态分布,0,1,()曲线在x=时位于最高点; ()当x时,曲线下降,并且当曲线向左、右两边无限延伸时,以x轴为渐近线向它无限靠近; ()当一定时,曲线的形状由确定,越大,曲线越“矮胖”,表示总体的分布越分散;越小,曲线越“瘦高”,表示总体的分布越集中. (4)若N(,2),则E=,

5、D=2.,(5)若XN(,2), 则P(-X+)=0.6826, P(-2X+2)=0.9544, P(-3X+3)=0.9974. (6)通常认为服从正态分布N(,2)的随机变量X只取 ,并简称之为3原则.,(-3,+3)之间的值,题型一 抽样方法,例1,在我国东南沿海有60个人均GDP在3万元以上的城市,其中人均GDP在34万元之间的有36个,在45万元之间的有18个,在5万元以上的有6个.国家环保总局欲用分层抽样从中随机抽取部分城市进行环境调查,若抽取的人均GDP在45万元之间的城市个数为3,则抽取的人均GDP在34万元之间的城市个数为.,根据分层抽样的特征,在各层抽取的比例是相同的,故

6、可先依据已知求出这个比例,再求解.,抽取的人均GDP在45万元之间的城市的比例为 ,故抽取的人均GDP在34万元之间的城市的比例也是 ,则抽取的城市个数为36 .,分层抽样在各层抽取样本的比例是相等的,这是解决分层抽样计算问题的主要依据.,题型二 正态分布,例2,某批材料的强度服从正态分布N(200,182),任取一件这种材料,强度在164236的概率是多少?,依题意,得=200,=18. 则P(164236)=P(200-218200+218) P(-2+2) =0.9544. 故任取一件材料,其强度在164236的概率是0.9544.,设在一次数学考试中,某班学生的分数服从N(110, )

7、,且已知满分为150分,这个班的学生共50人,求这个班在这次考试中不小于90分的人数和超过130分以上的人数.,因为N(110, ),则=110,=20, P(110-20130)=1/2*(1-0.6826)=0.1587. P(90)=0.6826+0.1587=0.8413. 故不小于90分的人数为500.841342(人). 超过130分以上的人数为500.15878(人).,求此概率需将问题化为正态随机变量的几种特殊值的概率形式,然后利用对称性求解.,题型三 频率分布表与频率分布直方图,例3,在生产过程中,测得纤维产品的纤度(表示纤维粗细的一种量)共有100个数据,数据分组如下表,(

8、1)完成频率分布表,并在给定的坐标系中画出频率分布直方图;,(2)估计纤度落在1.38,1.50)中的概率及纤度小于1.40的概率是多少? (3)统计方法中,同一组数据常用该组区间的中点值(例如区间1.30,1.34)的中点值是1.32)作为代表.据此,估计纤度的期望.,(1)频率分布表为:,(2)纤度落在1.38,1.50)中的概率约为0.30+0.29+0.100.69,纤度小于1.40的概率约为0.04+0.25+120.300.44. (3)总体数据的期望约为1.320.04+1.360.25+1.400.30+1.440.29+1.480.10+1.520.02=1.4088.,1.

9、解答本题时,第(1)问首先需计算出每组的频率(利用频数100);第(2)问注意1.38,1.42)中既有小于1.40,又有大于1.40的,可以认为各一半;第(3)问先计算出中点的概率,然后根据期望的定义求解. 2.本题主要考查频率分布直方图、频率、期望等概念和用样本频率估计整体分布的统计方法,考查运用概率、统计知识解决实际问题的能力.,题型三 样本的数字特征估计总体,例3,对甲、乙两名自行车赛手在相同条件下进行了6次测试,测得他们的最大速度(m/s)的数据如下表: (1)画出茎叶图,由茎叶图你能获得哪些信息? (2)分别求出甲、乙两名自行车赛手最大速度(m/s)数据的平均数、中位数、标准差,并

10、判断选谁参加比赛更合适.,(1)画茎叶图,中间数为数据的十位数字: 从这个茎叶图上可以看出,甲、乙的最大速度情况都是分布均匀的,只是乙更好一些;乙的中位数是33.5,甲的中位数是33.因此,乙发挥比较稳定,总体情况比甲好. (2) =33, =33;s甲=3.96,s乙=3.56; 甲的中位数是33,乙的中位数是33.5. 综合比较,选乙参加比赛较为合适.,在某篮球比赛中,根据甲和乙两人的得分情况得到如图所示的茎叶图. (1)从茎叶图的特征来说明他们谁发挥得更稳定; (2)用样本的数字特征验证他们谁发挥得更好.,茎叶图的直观形状像横放的频率分布直方图,且保留了所有原始数据的信息,所以从数与形的

11、特征来看,甲和乙的得分都是对称的,叶的分布是“单峰”的,但甲全部的叶都集中在茎2上,而乙只有57的叶集中在茎2上,这说明甲发挥得更稳定.,(2) = =25, = =25, = (20-25)2+(21-25)2+(25-25)2+(26-25)2+(27-25)2+(28-25)2+(28-25)29.14, = (17-25)2+(23-25)2+(24-25)2+(25-25)2+(26-25)2+(29-25)2+(31-25)217.43. 因为 = , ,所以甲发挥得更好.,1.统计的基本思想方法是用样本估计总体,即用局部推断整体,这就要求样本应具有很好的代表性,而样本良好客观的代

12、表性,完全依赖抽样方法,弄清简单随机抽样和分层抽样的客观合理性,从而会在不同的情况下采用适当的抽样方法.掌握三种抽样方法的抽样步骤.,三种抽样方法的比较:,2.频率分布直方图会使样本的一些数字特征更明显,绘制频率分布直方图时,要合理分组,以便使数据中的特征能更好地反映出来. 总体分布估计中,(1)先确定分组的组数,其方法是:最大数据与最小数据之差除组距得组数.(2)计算每组中的频数及频率,其中频率= .(3)画出直方图. 3.画茎叶图的步骤如下: (1)将每个数据分为茎(高位)和叶(低位)两部分;,(2)将最小茎和最大茎之间数按大小次序排成一列,写在左(右)侧; (3)将各个数据的叶按大小次序

13、写在其茎右(左)侧; 4.用样本的数字特征(众数、中位数、平均数)估计总体数字特征. 5.正态分布应用十分广泛,应用正态分布的关键是通过数形结合,利用正态分布曲线分析求解,或转化为“,2,3原则”问题求解.,6.由正态曲线过点(a,0)和点(b,0)的两条x轴的垂线,及x轴所围成的平面图形的面积,就是随机变量落在区间(a,b)的概率的近似值. 7.正态曲线与x轴之间的面积为1.,1.某初级中学共有30个班,其中初一有12个班,初二有12个班,初三有6个班.现从中抽出5个班进行调查,则应在初三6个班中抽取 个班.,1,2.把数据x1,x2,xn分成若干组,已知某数xi的频数和频率分别为4和0.1

14、25,则n的值是( ),C,A.16 B.24 C.32 D.64,3.数据5,10,73,1,3,105,111的中位数与极差的差为 .,-100,因为中位数是10,极差是111-1=110,故所求的值为10-110=-100.,4.将一组数据同时减去3.1,得到一组新数据,若原数据的平均数、方差分别为 、s2,则新数据的平均数是 ,方差是 .,-3.1,s2,设= (x1+x2+xn), 则 = (x1-3.1)+(x2-3.1)+(xn-3.1) =-3.1. s2= (xi- )2 = (xi-3.1)-(-3.1)2 = (xi- )2=s2.,5.随机变量的概率密度函数为 (x)= x(-,+).若N(0,1),且=a+b(a0),则=( ),A. B. C. D.,A,因为E=0,D=1,E=-5,D=4, 而E=E(a+b)=aE+b,D=D(a+b)=a2D. -5a+b=0 a= 4a2=1 b= , 所以= + ,故选A.,又a0,所以,解得,6.已知正态曲线,(x)= ,当=时,曲线最高点的纵坐标是标准正态曲线最高点的纵坐标的 倍.,当= 时,正态曲线最高点的纵坐标为 ,而标准正态曲线最高点的纵坐标为 ,故答案是 .,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号