随机抽样、正态分布.ppt

上传人:cn****1 文档编号:569562997 上传时间:2024-07-30 格式:PPT 页数:46 大小:1.54MB
返回 下载 相关 举报
随机抽样、正态分布.ppt_第1页
第1页 / 共46页
随机抽样、正态分布.ppt_第2页
第2页 / 共46页
随机抽样、正态分布.ppt_第3页
第3页 / 共46页
随机抽样、正态分布.ppt_第4页
第4页 / 共46页
随机抽样、正态分布.ppt_第5页
第5页 / 共46页
点击查看更多>>
资源描述

《随机抽样、正态分布.ppt》由会员分享,可在线阅读,更多相关《随机抽样、正态分布.ppt(46页珍藏版)》请在金锄头文库上搜索。

1、新课标高中一轮总复习新课标高中一轮总复习新课标高中一轮总复习新课标高中一轮总复习第七单元计算原理、概率与统计第第54讲讲随机抽样、正态分布随机抽样、正态分布1.了了解解分分布布的的意意义义和和作作用用,会会列列频频率率分分布布表表,会会画画频频率率分分布布直直方方图图、频频率率折线图、茎叶图,理解它们各自的特点折线图、茎叶图,理解它们各自的特点.2.理理解解样样本本数数据据标标准准差差的的意意义义和和作作用,会计算数据标准差用,会计算数据标准差.3.能能从从样样本本数数据据中中提提取取基基本本的的数数字字特特征征(如如平平均均数数、标标准准差差),并并做做出出合合理的解释理的解释.4.会会用用

2、样样本本的的频频率率分分布布估估计计总总体体分分布布,会会用用样样本本的的基基本本数数字字特特征征估估计计总总体体的的基基本本数字特征数字特征,理解用样本估计总体的思想理解用样本估计总体的思想.5.会会用用随随机机抽抽样样的的基基本本方方法法和和样样本本估估计总体的思想,解决一些简单的实际问题计总体的思想,解决一些简单的实际问题.6.通通过过实实际际问问题题,借借助助直直观观(如如实实际际问问题题的的直直方方图图),认认识识正正态态分分布布曲曲线线的的特特点及曲线所表示的意义点及曲线所表示的意义.1.某某初初级级中中学学共共有有30个个班班,其其中中初初一一有有12个个班班,初初二二有有12个

3、个班班,初初三三有有6个个班班.现现从从中中抽抽出出5个个班班进进行行调调查查,则则应应在在初初三三6个个班班中中抽取抽取 个班个班.12.把数据把数据x1,x2,xn分成若干组分成若干组,已知某数已知某数xi的频的频数和频率分别为数和频率分别为4和和0.125,则则n的值是的值是( )CA.16 B.24C.32 D.643.数数据据5,10,73,1,3,105,111的的中中位位数与极差的差为数与极差的差为 .-100 因因为为中中位位数数是是10,极极差差是是111-1=110,故所求的值为故所求的值为10-110=-100.4.将一组数据同时减去将一组数据同时减去3.1,得到一组新数

4、据,得到一组新数据,若原数据的平均数、方差分别为、若原数据的平均数、方差分别为、s2,则新则新数据的平均数是数据的平均数是 ,方差是方差是 .-3.1s2 设设= (x1+x2+xn),则则 = (x1-3.1)+(x2-3.1)+(xn-3.1) =-3.1.s2= (xi- )2= (xi-3.1)-(-3.1)2= (xi- )2=s2.5.随机变量随机变量的概率密度函数为的概率密度函数为 (x)= x(-,+).若若N(0,1),且,且=a+b(a0),则则=( )A. B.C. D.A 因为因为E=0,D=1,E=-5,D=4,而而E=E(a+b)=aE+b,D=D(a+b)=a2D

5、. -5a+b=0 a= 4a2=1 b= ,所以所以= + ,故选,故选A.又又a0,所以所以,解得解得6.已知正态曲线已知正态曲线,(x)= ,当当=时,曲时,曲线最高点的纵坐标是标准正态曲线最高点的线最高点的纵坐标是标准正态曲线最高点的纵坐标的纵坐标的 倍倍. 当当= 时时,正正态态曲曲线线最最高高点点的的纵纵坐坐标标为为 ,而而标标准准正正态态曲曲线线最最高高点的纵坐标为点的纵坐标为 ,故答案是,故答案是 .1.数据的基本数字特征数据的基本数字特征(1)平平均均数数:一一组组数数据据的的平平均均数数,记记为为.设设有有n个数据个数据x1,x2,xn,则平均数为,则平均数为 = .(2)

6、中中位位数数:一一组组数数据据按按照照从从小小到到大大或或从从大大到到小小的的顺顺序序进进行行排排列列时时,处处于于中中间间位位置置的的数数.当当这这组组数数据据的的个个数数为为奇奇数数时时,中中位位数数为为中中间间一一个个数数;当当这这组组数数据据的的个个数数为为偶偶数数时时,中中位数为中间的两个数的平均数位数为中间的两个数的平均数.(3)众数众数:一组数据中出现次数最多的数一组数据中出现次数最多的数.(4)极差极差:一组数据中最大数与最小数的差一组数据中最大数与最小数的差.(5)方方差差:一一组组数数据据中中所所有有数数与与平平均均数数的的差差的平方和的平均数的平方和的平均数,记为记为s2

7、,即即s2= .(6)标准差:方差的算术平方根标准差:方差的算术平方根,记作记作s.2.主要统计图表主要统计图表(1)基基本本统统计计图图表表:象象形形、条条形形、折折线线、扇形统计图扇形统计图.(2)频率分布直方图的画图步骤:频率分布直方图的画图步骤:()求求极极差差;()决决定定组组距距与与组组数数;()将将数数据据分分组组;()列列频频率率分分布布表表;()画画频频率率分分布布直直方图方图(以频率组距为纵坐标以频率组距为纵坐标).(3)频频率率分分布布折折线线图图:连连接接频频率率分分布布直直方方图图中各小长方形上端的中点所得的折线中各小长方形上端的中点所得的折线.(4)总总体体密密度度

8、曲曲线线:随随着着样样本本容容量量的的增增加加,作作频频率率分分布布折折线线图图时时所所分分的的组组数数增增加加,组组距距减减小小,相相应应的的频频率率折折线线图图会会越越来来越越接接近近于于一一条条光光滑曲线滑曲线,则称这条光滑曲线为总体密度曲线则称这条光滑曲线为总体密度曲线.(5)茎茎叶叶图图:中中间间的的数数字字表表示示数数据据的的十十位位数数字字,旁旁边边的的数数字字分分别别表表示示两两组组数数据据中中各各个个数据的个位数字数据的个位数字.3.抽样方法抽样方法(1)简简单单随随机机抽抽样样:从从含含有有N个个个个体体的的总总体体中中逐逐个个不不放放回回地地抽抽取取n个个个个体体作作为为

9、样样本本(nN),如如果果每每次次抽抽取取时时总总体体内内的的各各个个个个体体被被抽抽到到的的机机会会都都相相等等,就就把把这这种种抽抽样样方方法法叫叫做做 .有两种常用方法:有两种常用方法:简单随机抽样简单随机抽样() :就就是是把把总总体体中中的的N个个个个体体编编号号,把把号号码码写写在在号号签签上上,将将号号签签放放在在一一个个容容器器中中,搅搅拌拌均均匀匀后后,每每次次从从中中取取出出一一个个号号签签,连连续续抽抽取取n次次,就得到一个容量为就得到一个容量为n的样本的样本.() :利利用用随随机机数数表表、随随机机数数骰子或计算机产生的随机数进行抽样骰子或计算机产生的随机数进行抽样.

10、(2)系统抽样:按下列步骤进行抽样:系统抽样:按下列步骤进行抽样:()先先将将总总体体的的N个个个个体体编编号号;()确确定定分分段段间间隔隔k,对对编编号号进进行行分分段段;()在在第第1段段用用简简单单随随机机抽抽样样确确定定第第一一个个个个体体编编号号l(lk);()按按照照一定的规则抽取样本一定的规则抽取样本.抽签法抽签法随机数表法随机数表法 (3)分层抽样分层抽样:即即 . . . . 4.正态分布正态分布 (1)如果随机变量如果随机变量的概率密度为的概率密度为 ,(x)= . 其其中中、分分别别表表示示总总体体的的平平均均数数与与标标准准差差,称称服服从从参参数数为为、的的正正态态

11、分分布布,记记作作N(,2),函函数数图图象象称称为为正正态态密密度度曲曲线线,简简称称正态曲线正态曲线.在抽样时在抽样时,将总体分成将总体分成互不交叉的层互不交叉的层,然后按照一定的比例然后按照一定的比例,从各层从各层独立地抽出一定数量的个体独立地抽出一定数量的个体,将各层取出的将各层取出的个体合在一起作为样本个体合在一起作为样本(x(-,+)一一般般的的,如如果果对对于于任任何何实实数数ab,随随机机变变量量满满 足足 P(ab)= ,(x)dx, 则则 称称 的的 分分 布布 为为 .(2)标准正态分布标准正态分布在在正正态态分分布布中中,当当= ,= 时时,正正态态总总体体称称为为标标

12、准准正正态态总总体体,正正态态分分布布N(0,1),称称为标准正态分布,记作为标准正态分布,记作N(0,1).(3)正态曲线的性质正态曲线的性质()曲线在曲线在x轴的上方,与轴的上方,与x轴不相交;轴不相交;()曲线关于直线曲线关于直线x=对称;对称;正态分布正态分布01()曲线在)曲线在x=时位于最高点;时位于最高点;()当当x时时,曲曲线线下下降降,并并且且当当曲曲线线向向左左、右右两两边边无无限限延延伸时伸时,以以x轴为渐近线向它无限靠近;轴为渐近线向它无限靠近;()当当一一定定时时,曲曲线线的的形形状状由由确确定定,越越大大,曲曲线线越越“矮矮胖胖”,表表示示总总体体的的分分布布越越分

13、分散散;越越小小,曲曲线线越越“瘦瘦高高”,表表示示总总体的分布越集中体的分布越集中.(4)若若N(,2),则则E=,D=2.(5)若若XN(,2),则则P(-X+i)=0.6826,P(-2X+2)=0.9544,P(-3X+3)=0.9974.(6)通通常常认认为为服服从从正正态态分分布布N(,2)的的随随机机变变量量X只只取取 ,并简称之为并简称之为3原则原则.(-3,+3)之间的值之间的值1111题型一题型一 抽样方法抽样方法例例1 在在我我国国东东南南沿沿海海有有60个个人人均均GDP在在3万万元元以以上上的的城城市市,其其中中人人均均GDP在在34万万元元之之间间的的有有36个个,

14、在在45万万元元之之间间的的有有18个个,在在5万万元元以以上上的的有有6个个.国国家家环环保保总总局局欲欲用用分分层层抽抽样样从从中中随随机机抽抽取取部部分分城城市市进进行行环环境境调调查查,若若抽抽取取的的人人均均GDP在在45万万元元之之间间的的城城市市个个数数为为3,则则抽抽取取的的人人均均GDP在在34万万元元之之间间的的城市个数为城市个数为. 根根据据分分层层抽抽样样的的特特征征,在在各各层层抽抽取取的的比比例例是是相相同同的的,故故可可先先依依据据已已知知求求出出这个比例,再求解这个比例,再求解. 抽抽取取的的人人均均GDP在在45万万元元之之间间的的城城市市的的比比例例为为 ,

15、故故抽抽取取的的人人均均GDP在在34万万元元之之间间的的城城市市的的比比例例也也是是 ,则则抽抽取的城市个数为取的城市个数为36 . 分层抽样在各层抽取样本的比例是相分层抽样在各层抽取样本的比例是相等的等的,这是解决分层抽样计算问题的主要依据这是解决分层抽样计算问题的主要依据.题型二题型二 正态分布正态分布例例2 某某 批批 材材 料料 的的 强强 度度 服服 从从 正正 态态 分分 布布N(200,182),任任取取一一件件这这种种材材料料,强强度度在在164236的概率是多少?的概率是多少? 依题意,得依题意,得=200,=18.则则P(164236)=P(200-218200+218)

16、P(-2+2)=0.9544.故故任任取取一一件件材材料料,其其强强度度在在164236的的概概率率是是0.9544. 求求此此概概率率问问题题需需化化为为服服从从正正态态分分布布的随机变量的几种特殊值的概率形式的随机变量的几种特殊值的概率形式. 设设在在一一次次数数学学考考试试中中,某某班班学学生生的的分分数数服服从从N(110,202),且且已已知知满满分分为为150分分,这这个个班班的的学学生生共共50人人,求求这这个个班班在在这这次次考考试试中中不不小小于于90分分的的人人数和超过数和超过130分以上的人数分以上的人数. 因为因为N(110,202),则则=110,=20,P(110-

17、20130)=12(1-0.6826)=0.1587.P(90)=0.6826+0.1587=0.8413.故不小于故不小于90分的人数为分的人数为500.841342(人人).超过超过130分以上的人数为分以上的人数为500.15878(人人). 求此概率需将问题化为正态随机变求此概率需将问题化为正态随机变量的几种特殊值的概率形式,然后利用对量的几种特殊值的概率形式,然后利用对称性求解称性求解.题型三题型三 频率分布表与频率分布直方图频率分布表与频率分布直方图例例3 在在生生产产过过程程中中,测测得得纤纤维维产产品品的的纤纤度度(表表示示纤纤维维粗粗细细的的一一种种量量)共共有有100个个数

18、数据据,数据分组如下表数据分组如下表分组1.30,1.34)1.34,1.38)1.38,1.42)1.42,1.46)1.46,1.50)1.50,1.54)合计频数4253029102100(1)完完成成频频率率分分布布表表,并并在在给给定定的的坐坐标标系系中画出频率分布直方图;中画出频率分布直方图;分组频数频率1.30,1.34)41.34,1.38)251.38,1.42)301.42,1.46)291.46,1.50)101.50,1.54)2合计100(2)估估计计纤纤度度落落在在1.38,1.50)中中的的概率及纤度小于概率及纤度小于1.40的概率是多少?的概率是多少?(3)统统

19、计计方方法法中中,同同一一组组数数据据常常用用该该组组 区区 间间 的的 中中 点点 值值 ( 例例 如如 区区 间间1.30,1.34)的的中中点点值值是是1.32)作作为为代代表表.据此,估计纤度的期望据此,估计纤度的期望.分组频数频率1.30,1.34)40.041.34,1.38)250.251.38,1.42)300.31.42,1.46)290.291.46,1.50)100.101.50,1.54)20.02合计1001.00(1)频率分布表为:频率分布表为:(2)纤纤度度落落在在1.38,1.50)中中的的概概率率约约 为为 0.30+0.29+0.10 0.69, 纤纤 度度

20、 小小 于于1.40的概率约为的概率约为0.04+0.25+120.300.44.(3)总总 体体 数数 据据 的的 期期 望望 约约 为为1.320.04+1.360.25+1.400.30+1.440.29+1.480.10+1.520.02=1.4088. 1.解解答答本本题题时时,第第(1)问问首首先先需需计计算算出出每每组组的的频频率率(利利用用频频数数100);第第(2)问问注注意意1.38,1.42)中中既既有有小小于于1.40,又又有有大大于于1.40的的,可可以以认认为为各各一一半半;第第(3)问问先先计计算算出出中中点点的的概概率率,然然后后根根据据期期望的定义求解望的定义

21、求解. 2.本本题题主主要要考考查查频频率率分分布布直直方方图图、频频率率、期期望望等等概概念念和和用用样样本本频频率率估估计计整整体体分分布布的的统统计计方方法法,考考查查运运用用概概率率、统统计知识解决实际问题的能力计知识解决实际问题的能力.题型三题型三 样本的数字特征估计总体样本的数字特征估计总体例例3 对对甲甲、乙乙两两名名自自行行车车赛赛手手在在相相同同条条件件下下进进行行了了6次次测测试试,测测得得他他们们的的最最大大速速度度(m/s)的的数数据据如下表:如下表:(1)画出茎叶图画出茎叶图,由茎叶图你能获得哪些信息由茎叶图你能获得哪些信息?(2)分分别别求求出出甲甲、乙乙两两名名自

22、自行行车车赛赛手手最最大大速速度度(m/s)数数据据的的平平均均数数、中中位位数数、标标准准差差,并并判判断选谁参加比赛更合适断选谁参加比赛更合适.甲273830373531乙332938342836 (1)画画茎茎叶叶图图,中中间间数数为为数数据据的的十十位位数数字字: 从从这这个个茎茎叶叶图图上上可可以以看看出出,甲甲、乙乙的的最最大大速速度度情情况况都都是是分分布布均均匀匀的的,只只是是乙乙更更好好一一些些;乙乙的的中中位位数数是是33.5,甲甲的的中中位位数数是是33.因因此此,乙发挥比较稳定乙发挥比较稳定,总体情况比甲好总体情况比甲好.(2) =33, =33;s甲甲=3.96,s乙

23、乙=3.56;甲的中位数是甲的中位数是33,乙的中位数是,乙的中位数是33.5.综合比较,选乙参加比赛较为合适综合比较,选乙参加比赛较为合适. 在某篮球比赛中,根据甲和乙两人的得分在某篮球比赛中,根据甲和乙两人的得分情况得到如图所示的茎叶图情况得到如图所示的茎叶图. (1)从茎叶图的特征来说明他们谁发挥得更稳定从茎叶图的特征来说明他们谁发挥得更稳定; (2)用样本的数字特征验证他们谁发挥得更好用样本的数字特征验证他们谁发挥得更好. 茎茎叶叶图图的的直直观观形形状状像像横横放放的的频频率率分分布布直直方方图图,且且保保留留了了所所有有原原始始数数据据的的信信息息,所所以以从从数数与与形形的的特特

24、征征来来看看,甲甲和和乙乙的的得得分分都都是是对对称称的的,叶叶的的分分布布是是“单单峰峰”的的,但但甲甲全全部部的的叶叶都都集集中中在在茎茎2上上,而而乙乙只只有有57的的叶叶集集中中在在茎茎2上,这说明甲发挥得更稳定上,这说明甲发挥得更稳定.(2) = =25, = =25, = (20-25)2+(21-25)2+(25-25)2+(26-25)2+(27-25)2+(28-25)2+(28-25)29.14, = (17-25)2+(23-25)2+(24-25)2+(25-25)2+(26-25)2+(29-25)2+(31-25)217.43.因为因为 = , ,所以甲发挥得更好所

25、以甲发挥得更好.1.统统计计的的基基本本思思想想方方法法是是用用样样本本估估计计总总体体,即即用用局局部部推推断断整整体体,这这就就要要求求样样本本应应具具有有很很好好的的代代表表性性,而而样样本本良良好好客客观观的的代代表表性性,完完全全依依赖赖抽抽样样方方法法,弄弄清清简简单单随随机机抽抽样样和和分分层层抽抽样样的的客客观观合合理理性性,从从而而会会在在不不同同的的情情况况下下采采用用适适当当的的抽抽样样方方法法.掌掌握握三三种种抽抽样样方方法法的抽样步骤的抽样步骤.三种抽样方法的比较:三种抽样方法的比较:类别共同点各自特点相互联系适用范围简单随机抽样抽样过程中每个个体被抽取的概率是相等的

26、;均属于不放回抽样从总体中逐个抽取最基本的抽样方法总体中的个体数较少分层抽样将总体分成几层进行抽取各层抽样时采用简单随机抽样总体由差异明显的几部分组成系统抽样将总体均分成几部分,按事先确定的规则在各部分抽取在起始部分抽样时采用简单随机抽样总体中的个体数较多2.频频率率分分布布直直方方图图会会使使样样本本的的一一些些数数字字特特征征更更明明显显,绘绘制制频频率率分分布布直直方方图图时时,要要合合理理分分组组,以便使数据中的特征能更好地反映出来以便使数据中的特征能更好地反映出来.总总体体分分布布估估计计中中,(1)先先确确定定分分组组的的组组数数,其其方方法法是是:最最大大数数据据与与最最小小数数

27、据据之之差差除除组组距距得得组组数数.(2)计计算算每每组组中中的的频频数数及及频频率率,其其中中频频率率= .(3)画出直方图画出直方图.3.画茎叶图的步骤如下:画茎叶图的步骤如下:(1)将将每每个个数数据据分分为为茎茎(高高位位)和和叶叶(低低位位)两两部分部分;(2)将将最最小小茎茎和和最最大大茎茎之之间间数数按按大大小小次序排成一列,写在左次序排成一列,写在左(右右)侧;侧;(3)将将各各个个数数据据的的叶叶按按大大小小次次序序写写在在其茎右其茎右(左左)侧;侧;4.用用样样本本的的数数字字特特征征(众众数数、中中位位数数、平均数平均数)估计总体数字特征估计总体数字特征.5.正正态态分

28、分布布应应用用十十分分广广泛泛,应应用用正正态态分分布布的的关关键键是是通通过过数数形形结结合合,利利用用正正态态分分布布曲曲线线分分析析求求解解,或或转转化化为为“,2,3原则原则”问题求解问题求解.6.由由正正态态曲曲线线过过点点(a,0)和和点点(b,0)的的两两条条x轴轴的的垂垂线线,及及x轴轴所所围围成成的的平平面面图图形形的的面面积积,就就是是随随机机变变量量落落在在区区间间(a,b)的概率的近似值的概率的近似值.7.正态曲线与正态曲线与x轴之间的面积为轴之间的面积为1.学例1 (2009浙浙江江卷卷)某某个个容容量量为为100的的样样本本的的频频率率分分布布直直方方图图如如下下,

29、则则在在区区间间4,5)上上的数据的频数为的数据的频数为 .30 区区间间4,5)上上的的频频率率/组组距距的的数数值值为为1-(0.05+0.10+0.15+0.40)=0.3, 而而 总总 数数 为为100,因此所求的频数为,因此所求的频数为30. (2008上上海海卷卷)已已知知总总体体的的各各个个体体的的值值由由小小到到大大依依次次为为2,3,3,7,a,b,12,137,183,20,且且总总体体的的中中位位数数为为105.若若要要使使该该总总体体的的方方差差最最小小,则则a、b的取值分别是的取值分别是 .学例2 由中位数的定义知由中位数的定义知 =10.5, =10.s2= 22+32+32+72+a2+b2+122+13.72+18.32+202-10102,当当a=b时,时,s2有最小值,此时有最小值,此时a=10.5,b=10.5.10.5、10.5本节完,谢谢聆听立足教育,开创未来立足教育,开创未来

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号