《概率与统计问题的题型与方法.doc》由会员分享,可在线阅读,更多相关《概率与统计问题的题型与方法.doc(22页珍藏版)》请在金锄头文库上搜索。
1、高中数学辅导网http:/第7讲 概率与统计问题的题型与方法(4课时)一、考试内容离散型随机变量的分布列,离散型随机变量的期望值和平方差,抽样方法,总体分布的估计,正态分布,总体特征数的估计,线性回归。二、考试要求了解随机变量、离散型随机变量的意义,会求出某些简单的离散型随机变量的分布列。 了解离散型随机变量的期望值、方差的意义,会根据离散型随机变量的分布列求出期望值、方差。 会用抽机抽样,系统抽样,分层抽样等常用的抽样方法从总体中抽取样本。 会用样本频率分布去估计总体分布。 了解正态分布的意义及主要性质。 了解假设检验的基本思想。 会根据样本的特征数估计总体。 了解线性回归的方法。三、复习目
2、标1 了解典型分布列:01分布,二项分布,几何分布。2 了解离散型随机变量的期望值、方差的意义,会根据离散型随机变量的分布列求出期望值、方差。3 在实际中经常用期望来比较两个类似事件的水平,当水平相近时,再用方差比较两个类似事件的稳定程度。4 了解正态分布的意义,能借助正态曲线的图像理解正态曲线的性质。5 了解标准正态分布的意义和性质,掌握正态总体转化为标准正态总体N(0,1)的公式及其应用。6 通过生产过程的质量控制图,了解假设检验的基本思想。7 了解相关关系、回归分析、散点图等概念,会求回归直线方程。8 了解相关系数的计算公式及其意义,会用相关系数公式进行计算。9 了解相关性检验的方法与步
3、骤,会用相关性检验方法进行检验。四、双基透视随机事件和统计的知识结构:随机事件和统计的内容提要1主要内容是离散型随机变量的分布列、期望与方差,抽样方法,总体分布的估计,正态分布和线性回归。2随机变量的概率分布(1)离散型随机变量的分布列:P两条基本性质);P1+P2+=1。(2)连续型随机变量概率分布:由频率分布直方图,估计总体分布密度曲线y=f(x);总体分布密度函数的两条基本性质:f(x) 0(xR);由曲线y=f(x)与x轴围成面积为1。3随机变量的数学期望和方差(1)离散型随机变量的数学期望:;反映随机变量取值的平均水平。(2)离散型随机变量的方差:;反映随机变量取值的稳定与波动,集中
4、与离散的程度。(3)基本性质:;。4三种抽样方法。5二项分布和正态分布(1)记是n次独立重复试验某事件发生的次数,则B(n,p);其概率。期望E=np,方差D=npq。(2)正态分布密度函数:期望E=,方差。(3)标准正态分布:若,则,。6线性回归:当变量x取值一定时,如果相应的变量y的取值带有一定的随机性,那么就说变量y与x具有相关关系。对于它们的一组观测值来说,如果与之相应的在平面直角坐标系中的点大体上集中在一条直线的附近,就说变量y与x之间具有线性相关关系。相关系数用来检验线性相关显著水平,通常通过查表取显著水平0.05自由度n-2的,若为显著;否则为不显著。离散型随机变量的分布列随机变
5、量:如果随机试验的结果可以用一个变量来表示,那么这样的变量叫做随机变量。随机变量最常见的两种类型,即离散型随机变量和连续型随机变量。如果对于随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量;如果随机变量可以取某一区间内的一切值,这样的随机变量叫做连续型随机变量。离散型随机变量的分布列:如果离散型随机变量的可能取值为xi(i1,2,),由于试验的各个结果的出现有一定的概率,于是随机变量取每一个值也有一定的概率P(xi)pi,人们常常习惯地把它们写成表格的形式,如:x1x2xiPp1p2pi这种表即为随机变量的概率分布,简称为的分布列。分布列的表达式可有如下几种:(1)
6、表格形式;(2)一组等式;(3)压缩为一个带“i”的等式。1在实际问题中,人们常关心随机变量的特征,而不是随机变量的具体值。离散型随机变量的期望和方差都是随机变量的特征数,期望反映了随机变量的平均取值,方差与标准差都反映了随机变量取值的稳定与波动、集中与离散的程度。其中标准差与随机变量本身有相同的单位。2离散型随机变量期望和方差的计算公式设离散型随机变量的分布列为P(xi)pi,i1,2,则:Ei pi,DiE)2 pii2 pi(E)2E(2)(E)2。3离散型随机变量期望和方差的性质E (ab)aEb,D (ab)a2 D。4二项分布的期望与方差若B (n,p),则Enp,Dnp (1p)
7、。抽样方法三种常用抽样方法:1简单随机抽样:设一个总体的个数为N。如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样。实现简单随机抽样,常用抽签法和随机数表法。2系统抽样:当总体中的个数较多时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取1个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样)。系统抽样的步骤可概括为:(1)将总体中的个体编号;(2)将整个的编号进行分段;(3)确定起始的个体编号;(4)抽取样本。3分层抽样:当已知总体由差异明显的几部分组成时,常将总体分成几部分,然后按照各部分所占的比进行抽
8、样,这种抽样叫做分层抽样,其中所分成的各部分叫做层。总体分布的估计总体分布:总体取值的概率分布规律通常称为总体分布。总体密度曲线:当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,即总体密度曲线。正态分布正态分布:如果总体密度曲线是以下函数的图象:, 式中的实数、(0)是参数,分别表示总体的平均数与标准差,这个总体是有无限容量的抽象总体。其分布叫做正态分布,常记作N(,2)。的图象被称为正态曲线。特别地,在函数中,当=0,=1时,正态总体称为标准正态总体,这时,相应的函数表达式是, 相应的曲线称为标准正态曲线。当我们不知道一个总体的分布时,往往总是从总体中抽
9、取一个样本,并用样本的频率分布去估计总体的分布,而且随着样本容量越大分组的组距越小,样本的频率分布就更加接近总体分布。当样本容量无限增大且分组的组距无限缩小时,频率分布直方图就会演变成一条光滑曲线,即反映总体分布的总体密度曲线。可以知道,反映总体分布的总体密度曲线的形状是形形色色的,不同形状的总体密度曲线是不同总体分布的反映,而正态分布以及反映这种分布的正态曲线是异彩纷呈的总体分布及总体密度曲线中的一类重要分布。1正态分布的重要性正态分布是概率统计中最重要的一种分布,其重要性我们可以从以下两方面来理解:一方面,正态分布是自然界最常见的一种分布。一般说来,若影响某一数量指标的随机因素很多,而每个
10、因素所起的作用都不太大,则这个指标服从正态分布。例如,产品尺寸是一类典型的总体,对于成批生产的产品,如果生产条件正常并稳定,即工艺、设备、技术、操作、原料、环境等可以控制的条件都相对稳定,而且不存在产生系统误差的明显因素,那么,产品尺寸的总体分布就服从正态分布。又如测量的误差;炮弹落点的分布;人的生理特征的量:身高、体重等;农作物的收获量等等,都服从或近似服从正态分布。另一方面,正态分布具有许多良好的性质,很多分布可以用正态分布来近似描述,另外,一些分布又可以通过正态分布来导出,因此在理论研究中正态分布也十分重要。2正态曲线及其性质对于正态分布函数:,x(-,+)由于中学知识范围的限制,不必去
11、深究它的来龙去脉,但对其函数图像即正态曲线可通过描点(或计算机中的绘图工具)画出课本图1-4中的图(1)、(2)、(3),由此,我们不难自己总结出正态曲线的性质。3标准正态曲线标准正态曲线N(0,1)是一种特殊的正态分布曲线,它是本小节的重点。由于它具有非常重要的地位,已专门制作了“标准正态分布表”。对于抽像函数,课本中没有给出具体的表达式,但其几何意义非常明显,即由正态曲线N(0,1)、x轴、直线所围成的图形的面积。再由N(0,1)的曲线关于y轴对称,可以得出等式,以及标准正态总体在任一区间(a,b)内取值概率。4一般正态分布与标准正态分布的转化由于一般的正态总体其图像不一定关于y轴对称,所
12、以,研究其在某个区间的概率时,无法利用标准正态分布表进行计算。这时我们自然会思考:能否将一般的正态总体转化成标准的正态总体N(0,1)进行研究。人们经过探究发现:对于任一正态总体,其取值小于x的概率。对于这个公式,课本中不加证明地给出,只用了“事实上,可以证明”这几个字说明。这表明,对等式的来由不作要求,只要会用它求正态总体在某个特定区间的概率即可。5“小概率事件”和假设检验的基本思想“小概率事件”通常指发生的概率小于5%的事件,因为对于这类事件来说,在大量重复试验中,平均每试验20次,才能发生1次,所以认为在一次试验中该事件是几乎不可能发生的。这种认识便是进行推断的出发点。关于这一点我们要有
13、以下两个方面的认识:一是这里的“几乎不可能发生”是针对“一次试验”来说的,因为试验次数多了,该事件当然是很可能发生的;二是当我们运用“小概率事件几乎不可能发生的原理”进行推断时,我们也有5%的犯错误的可能。就是说,这里在概率的意义上所作的推理与过去确定性数学中的“若a则b”式的推理有所不同。课本是借助于服从正态分布的有关零件尺寸的例子来介绍假设检验的基本思想。进行假设检验一般分三步:第一步,提出统计假设。课本例子里的统计假设是这个工人制造的零件尺寸服从正态分布。第二步,确定一次试验中的取值a是否落入范围(-3,+3)。 第三步,作出推断。如果a(-3,+3),接受统计假设;如果,由于这是小概率
14、事件,就拒绝统计假设。上面这种拒绝统计假设的推理,与我们过去学习过的反证法有类似之处。事实上,用反证法证明一个问题时,先否定待证命题的结论,这本身看成一个新的命题,从它出发进行推理,如果出现了矛盾,就把这个矛盾归因于前述新命题不正确,从而将它否定。否定了新命题,也就等于证明了原命题的结论。线性回归回归分析:对于两个变量,当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫相关关系或回归关系。回归直线方程:设x与y是具有相关关系的两个变量,且相应于n个观测值的n个点大致分布在某一条直线的附近,就可以认为y对x的回归函数的类型为直线型:。其中,。我们称这个方程为y对x的回归直线方程。 1相关关系研究两个变量间的相关关系是学习本节的目的。对于相关关系我们可以从下三个方面加以认识:(1)相关关系与函数关系不同。函数关系中的两个变量间是一种确定性关系。例如正方形面积S与边长x之间的关系就是函数关系。即对于边长x的每一个确定的值,都有面积S的惟一确定的值与之对应。相关关系是一种非确定性关系,即相关关系是非随机变量与随机变量之间的关系。例如人的身高与年龄;商品的销售额与广告费等等都是相关关系。(2)函数关系是一种因果关系,而相关关系不