概率论 样本和抽样分布

上传人:hu****a8 文档编号:87503445 上传时间:2019-04-07 格式:PPT 页数:92 大小:3.26MB
返回 下载 相关 举报
概率论 样本和抽样分布_第1页
第1页 / 共92页
概率论 样本和抽样分布_第2页
第2页 / 共92页
概率论 样本和抽样分布_第3页
第3页 / 共92页
概率论 样本和抽样分布_第4页
第4页 / 共92页
概率论 样本和抽样分布_第5页
第5页 / 共92页
点击查看更多>>
资源描述

《概率论 样本和抽样分布》由会员分享,可在线阅读,更多相关《概率论 样本和抽样分布(92页珍藏版)》请在金锄头文库上搜索。

1、Chapter 6 样本和抽样分布,(Sample and Statistic Distribution ),引例,一公司欲采购某类产品,假设该类产品不合格率为P。 P的大小决定产品的质量,影响公司的经济效益。,概率论,特点:应用面广,分支较多.,著名统计软件: SAS,SPSS,STAT,S-plus 等,数理统计,理论基础,实际应用,数理统计的任务就是研究有效地收集、整理、分析所获得的有限的资料,对所研究的问题, 尽可能地作出精确而可靠的结论.,在数理统计中,不是对所研究的对象全体 ( 称为总体)进行观察,而是抽取其中的部分(称为样本)进行观察获得数据(抽样),并通过这些数据对总体进行推断

2、.,数理统计方法具有“部分推断整体”的 特征 ., 对随机现象进行观测、试验, 以取得有代表性的观测值, 对已取得的观测值进行整理、 分析,作出推断、决策,从而 找出所研究的对象的规律性,参数估计 (第七章),假设检验 (第八章),回归分析 (第九章),方差分析 (第九章),推断 统计学, 6.1 随机样本,一个统计问题总有它明确的研究对象.,1.总体,研究对象的全体称为总体(母体),,2. 个体 总体中每个成员称为个体.,总体,一、总体和样本,然而在统计研究中,人们关心总体仅仅是关心其每个个体的一项(或几项)数量指标. 这时,每个个体具有的数量指标的全体就是总体.,例如:研究某批灯泡的寿命时

3、,关心的数量指标就是寿命,那么,此总体就可以用随机变量X表示,或用其分布函数F(x)表示.,某批 灯泡的寿命,总体,寿命X可用一概 率分布来刻划,鉴于此,常用随机变量的记号 或用其分布函数表示总体. 如 说总体X或总体F(x) .,类似地,在研究某地区中学生的营养状况时,若关心的数量指标是身高和体重,我们用X和Y分别表示身高和体重,那么此总体就可用二维随机变量(X,Y)或其联合分布函数F(x,y)来表示.,统计中,总体这个概念 的要旨是:总体就是一个 概率分布.,例2:用一把尺子测量一件物体的长度。 假定 n 次测量值分别为X1,X2 ,Xn。显然,在该问题中,我们把测量值X1,X2 ,Xn看

4、成样本。但总体是什么呢?,事实上,这里没有一个现实存在的个体的集合可以作为上述问题的总体。可是,我们可以这样考虑,既然 n 个测量值 X1,X2,Xn 是样本,那么,总体就应该理解为一切所有可能的测量值的全体。,又如:为研究某种安眠药的药效,让 n 个病人同时服用这种药,记录服药者各自服药后的睡眠时间比未服药时增加睡眠的小时数 X1,X2,Xn, 则这些数字就是样本。 那么,什么是总体呢? 设想让某个地区(或某国家,甚至全世界)所有患失眠症的病人都服用此药,则他们所增加睡眠的小时数之全体就是研究问题的总体。,对一个总体,如果用X表示其数量指标,那么,X的值对不同的个体就取不同的值。因此,如果我

5、们随机地抽取个体,则X的值也就随着抽取个体的不同而不同。 所以,X是一个随机变量! 既然总体是随机变量X,自然就有其概率分布。我们把X的分布称为总体分布。 总体的特性是由总体分布来刻画的。因此,常把总体和总体分布视为同义语。.,总体分布,为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息,这一抽取过程称为 “抽样”,所抽取的部分个体称为样本.,3. 样本,4.样本容量 样本中所包含的个体数目称为样本容量.,但是,一旦取定一组样本,得到的是n个具体的数 (X1,X2,Xn),称为样本的一次观察值,简称样本值 .,样本是随机变量.,抽到哪5辆是随机的,容量为

6、n的样本可以看作n维随机变量.,2. 独立性:,最常用的一种抽样方法叫作“简单随机抽样”:,1. 随机性:,二、简单随机样本,由简单随机抽样得到的样本称为简单随机样本,它可以用与总体独立同分布的n个相互独立的随机变量X1,X2,Xn表示.,由简单随机抽样得到的样本称为简单随机样本,它可以用与总体独立同分布的n个相互独立的随机变量X1,X2,Xn表示.,简单随机样本是应用中最常见的情形,今后,当说到“X1,X2,Xn是取自某总体的样本”时,若不特别说明,就指简单随机样本.,若总体的分布函数为F(x),则其简单随机样本的联合分布函数为,F(x1) F(x2) F(xn),设总体 X 的分布函数为F

7、 (x),则样本,若总体X 的概率密度为 f( x),则样本,的联合 d.f.为,的联合分布函数为,三. 总体、样本、样本值的关系,统计是从手中已有的资料-样本值,去推断总体的情况-总体分布F(x)的性质.,如我们从某班大学生中抽取10人测量身高,得到样本值.,小结,研究对象的全体称为总体,总体中每个成员称为个体,由样本值去推断总体情况,需要对样本值进行“加工”,这就要构造一些样本的函数,它把样本中所含的(某一方面)的信息集中起来.,1. 统计量,这种不含任何未知参数的样本的函数称为统计量. 它是完全由样本决定的量.,一、统计量,定义,请注意 :,例 是未知参数,若 , 已知,则为统计量,是一

8、样本,是统计量, 其中,则,2.常用的统计量,为样本均值,为样本方差,为样本标准差,它反映了总体均值 的信息,它反映了总体方差 的信息,为样本的k 阶原点矩,为样本的k 阶中心矩,例如,统计量的观察值(样本值),注 样本方差 与样本二阶中心矩 的不同,故,推导,2),例1 从一批机器零件毛坯中随机地抽取10件, 测得其重量为(单位: 公斤): 210, 243, 185, 240, 215, 228, 196, 235, 200, 199 求这组样本值的均值、方差、二阶原点矩与二阶中心矩.,解,令,例1,则,例2 在总体 中,随机抽取一个容量 为36的样本,求样本均值 落在50.8到53.8

9、之间的概率.,解,故,例2,二、 抽样分布,统计量既然是依赖于样本的,而后者又是随机变量,故统计量也是随机变量,因而就有一定的分布,这个分布叫做统计量的“抽样分布” .,确定统计量的分布是数理统计的基本问题之一,正态总体是最常见的总体, 本节介绍 的几个抽样分布均对正态总体而言.,复习: 正态分布,则,特别地,则,标准正态分布的 分位数,分布的上 分位数.,若 ,则称z 为标准正态,定义,正态分布的双侧 分位数.,若 , 则称 为标准,统计三大分布,记为,定义: 设 相互独立, 都服从正态 分布N(0,1), 则称随机变量: 所服从的分布为自由度为 n 的 分布.,分布是由正态分布派生出来的一

10、种分布.,分布的密度函数为,例如,分布的性质,n = 10,性质 讲解:,进一步,由中心极限定理可以推出, n 充 分大时,近似于标准正态分布 N(0,1)。,E(X)=n, D(X)=2n.,t 分布 (Student 分布),定义,则称 T 服从自由度为 n 的T 分布. 其密度函数为,t 分布,t 分布的图形(红色的是标准正态分布),t 分布的性质,1f n(t)是偶函数,2T 分布的上 分位数 t 与双侧 分位数 t/2 均 有表可查.,性质,t,-t,t/2,-t/2,由定义可见,,3、F分布,F(n2,n1),m = 10, n = 4 m = 10, n = 10 m = 10,

11、 n = 15,m = 4, n =10 m = 10, n = 10 m = 15, n = 10,F 分布的性质,例如,事实上,故,求,性质,例1 证明,证,例1,四、几个重要的抽样分布定理,当总体为正态分布时,教材上给出了几个重要的抽样分布定理.,定理 1 (样本均值的分布),n取不同值时样本均值 的分布,定理 2 (样本方差的分布),n取不同值时 的分布,定理 3,定理 4 (两总体样本均值差的分布),定理 5 (两总体样本方差比的分布), 样本均值分布函数的近似计算,定理1的应用,总有, 样本均值与 的偏差在一定范围内的概率的 近似计算,从上式可以看出:对给定的2和给定的 c0, 当

12、样本大小 n 增大时,上面的概率也随之增大;n 趋于无穷时,上式趋近于 1。,任给c 0,总有,的概率不小于90%,则样本容量至少取多少?,例3设,为使样本均值大于70,解 设样本容量为 n , 则,故,令,得,即,所以取,例3,n = 20的样本,(1) 求,(2) 求,解 (1),即,例4,故,(P.386),(2),故,例5 设r.v. X 与Y 相互独立,X N(0,16), Y N(0,9) , X1, X2 , X9 与Y1, Y2 , Y16 分别是取自 X 与 Y 的简单随机样本, 求 统计量,所服从的分布.,解,例5,从而,简单随机样本,是样本均值,则服从自由度为n - 1的

13、t 分布的随机变量为,例7,故应选 (B),解,第二节 样本及抽样分布,统计三大抽样分布 几个重要的抽样分布定理 课堂练习,几个常见统计量,样本平均值,它反映了 总体均值 的信息,样本方差,它反映了总体 方差的信息,样本标准差,它反映了总体k 阶矩的信息,样本k阶原点矩,样本k阶中心矩,k=1,2,它反映了总体k 阶 中心矩的信息,请注意 :,二、统计三大抽样分布,记为,分布,1、,定义: 设 相互独立, 都服从正态分布 N(0,1), 则称随机变量: 所服从的分布为自由度为 n 的 分布.,分布是由正态分布派生出来的一种分布.,c2 分布,请看演示,1. 设 相互独立, 都服从正态分布,则,这个性质叫 分布的可加性.,2设 且X1,X2相互独立,,2、t 分布,由定义可见,,3、F分布,F(n2,n1),三、几个重要的抽样分布定理,定理 1 (样本均值的分布),定理 3 (样本均值的分布),解,定理 2 (样本方差的分布),n取不同值时统计量 的分布,例2,解,例4,解,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号