样本及抽样分布概述

上传人:F****n 文档编号:95993985 上传时间:2019-08-23 格式:PPT 页数:58 大小:4.34MB
返回 下载 相关 举报
样本及抽样分布概述_第1页
第1页 / 共58页
样本及抽样分布概述_第2页
第2页 / 共58页
样本及抽样分布概述_第3页
第3页 / 共58页
样本及抽样分布概述_第4页
第4页 / 共58页
样本及抽样分布概述_第5页
第5页 / 共58页
点击查看更多>>
资源描述

《样本及抽样分布概述》由会员分享,可在线阅读,更多相关《样本及抽样分布概述(58页珍藏版)》请在金锄头文库上搜索。

1、第一章 样本及抽样分布,本章转入课程的第二部分 数理统计,数理统计的特点是应用面广,分支较多。社会的发展不断向统计提出新的问题。,从历史的典籍中,人们不难发现许多关于钱粮、户口、地震、水灾等等的记载,说明人们很早就开始了统计的工作。但是当时的统计,只是对有关事实的简单记录和整理,而没有在一定理论的指导下,作出超越这些数据范围之外的推断。,到了十九世纪末二十世纪初,随着近代数学和概率论的发展,才真正诞生了数理统计学这门学科。,数理统计学是一门应用性很强的学科。 它是研究怎样以有效的方式收集、 整理和分析受随机影响的数据,并对所考察的问题作出推断和预测,直至为采取决策和行动提供依据和建议。,数理统

2、计不同于一般的资料统计,它更侧重于应用随机现象本身的规律性进行资料的收集、整理和分析。,在数理统计中,不是对所研究的对象全体(称为总体)进行观察,而是抽取其中的部分(称为样本)进行观察获得数据(抽样),并通过这些数据对总体进行推断。,由于推断是基于抽样数据,抽样数据又不能包括研究对象的全部信息。因而由此获得的结论必然包含不肯定性。所以,在数理统计中必然要用到概率论的理论和方法。,由此也可以说:,概率论是数理统计的基础,而数理统计是概率论的重要应用。但它们是并列的两个学科,并无从属关系。,需要强调说明一点:,统计方法具有“部分推断整体”的特征 。,因为我们是从一小部分样本观察值去推断该全体对象(

3、总体)情况,即由部分推断全体。 这里使用的推理方法是“归纳推理”。,这种归纳推理不同于数学中的“演绎推理”。,它在作出结论时,是根据所观察到的大量个别情况,“归纳”起来所得,而不是从一些假设、命题、已知的事实等出发,按一定的逻辑推理去得出来的。,如果这一切都建立在可靠的科学基础上,则对总体下结论是可能的也是可靠的。 因为这里存在着样品(随机抽取的一个个体)个性 (特殊性) 和总体共性(普遍性)之间的一种内在的、对立统一的辩证关系。,但此时还应记住毕竟是由“局部”推断“整体”,因而仍可能犯错误,结论往往又是在某个“可靠性水平”之下得出的。,1.1 随机样本,1.总体与个体,一个统计问题总有它明确

4、的研究对象。,研究对象的全体称为总体(母体),,总体中每个成员称为个体。,然而在统计研究中,人们关心总体仅仅是关心其每个个体的一项(或几项)数量指标和该数量指标在总体中的分布情况。这时,每个个体具有的数量指标的全体就是总体。,该批灯泡寿命的全体就是总体,某品牌轿车百公里耗油量的全体就是总体,某批灯泡的寿命,某品牌轿车百公里 耗油量,由于每个个体的出现是随机的,所以相应的数量指标的出现也带有随机性。从而可以把这种数量指标看作一个随机变量,因此随机变量的分布就是该数量指标在总体中的分布。,这样,总体就可以用一个随机变量及其分布来描述。,统计的任务,是根据从总体中抽取的样本,去推断总体的性质。,由于

5、我们关心的是总体中的个体的某项指标(如人的身高、体重,灯泡的寿命,汽车的耗油量) ,所谓总体的性质,无非就是这些指标值的集体的性质。,而概率分布正是刻划这种集体性质的适当工具。因此在理论上可以把总体与概率分布等同起来。,在数理统计中,总体这个概念的要旨是:,总体就是一个概率分布。,2. 样本,为推断总体分布及各种特征,按一定规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息,这一抽取过程称为 “抽样”,所抽取的部分个体称为样本。样本中所包含的个体数目称为样本容量。,从某品牌轿车中抽5辆进行耗油量试验,样本容量为5,但是,一旦取定一组样本,得到的是n个具体的数 ( x1 , x2 , ,

6、 xn ),称为样本的一次观察值,简称样本观察值 。,由于抽样的目的是为了对总体进行统计推断,为了使抽取的样本能很好地反映总体的信息,必须考虑抽样方法。,最常用的一种抽样方法叫作“简单随机抽样”,它要求抽取的样本满足下面两点:,1. 代表性: X1 , X2 , , Xn 中每一个与所考察的总体有相同的分布。,2. 独立性: X1 , X2 , , Xn 是相互独立的随机变量。,由简单随机抽样得到的样本(子样)称为简单随机样本(子样)。 用( X1 , X2 , , Xn )表示。,简单随机样本是应用中最常见的情形,今后,当说到( X1 , X2 , , Xn )是取自某总体的样本时,若不特别

7、说明,就指简单随机样本。,3. 总体、样本、样本值的关系,总体(理论分布),样本,样本值,总体分布决定了样本取值的概率规律,也就是样本取到样本值的规律,因而可以由样本值去推断总体。,2.2 抽样分布,1. 统计量及其抽样分布,由样本值去推断总体情况,需要对样本值进行“加工”,这就要构造一些样本的函数,它把样本中所含的(某一方面)的信息集中起来。,这种不含任何未知参数的样本的函数称为统计量。它是完全由样本决定的量。统计量的分布称为抽样分布。,2. 样本均值及其抽样分布,样本均值,反映了总体均值的信息,分组样本场合:,其中 k 为组数;xi 为第 i 组的组中值; fi 为第 i 组的频率。,定理

8、: 设 是来自某总体的样本, 为 样本均值。,若总体分布为 N( ,2), 则 的精确分布为 N(, 2/n ) ;,若总体分布未知或不是正态分布,则 的渐近分布为 N(, 2/n ) ;,样本方差与样本标准差,它反映了总体方差 的信息,定理 设总体X具有二阶矩,EX=, DX=2 +,设X1, X2, , Xn 是从该总体得到的样本,则:,样本k阶原点矩,它反映了总体k 阶矩 的信息,样本k阶中心矩,k=1,2,它反映了总体k 阶 中心矩的信息,统计量既然是依赖于样本的,而后者又是随机变量,故统计量也是随机变量,因而就有一定的分布,这个分布叫做统计量的“抽样分布” .,抽样分布,精确抽样分布

9、,(小样本问题中使用),渐近分布,(大样本问题中使用),三大抽样分布,定义: 设 相互独立, 都服从正态 分布N(0,1), 则称随机变量: 所服从的分布为自由度为 n 的 分布.,记为:,Person,分布的密度函数为:,c2 分布演示,由 分布的定义,不难得到:,2. 设 且X1,X2相互 独立,则,这个性质叫 分布的可加性.,若,则可以求得, EX = n, DX= 2n,应用中心极限定理可得,若,的分布近似正态分布N(0,1).,2、t 分布,记为: T t (n).,Student,T 的密度函数为:,具有自由度为n的t分布的随机变量T的数学期望和方差为: E ( T ) = 0 ;

10、 D ( T ) = n / (n-2) , 对 n 2,t分布的密度函数关于x=0对称,且,当n充分大时,其图形类似于标准正态分布密度函数的图形。,请看演示,t 分布,不难看到,当n充分大时,t 分布近似N (0,1)分布。 但对于较小的n,t分布与N (0,1)分布相差很大。,3、F分布,Fisher,由定义可见,, F ( n2, n1),若XF(n1,n2), X的概率密度为,X的数学期望为:,若n22,即它的数学期望并不依赖于第一自由度n1.,F分布演示,分位数演示,例如:,1.645,2.326,-2.326,2.4469,-2.4469,14.449,1.237,9.20,一般地,,证:,令:,则,=0.1605,四、几个重要的抽样分布定理,定理 1 (样本均值的分布),n取不同值时样本均值 的分布,定理 2 ( 样本方差的分布 ),说明:,n取不同值时 的分布,定理 3,证明:,独立,定理 4 (两总体样本均值差的分布),其中,证明:,定理 5 (两总体样本方差比的分布),证明:,独立,课 间 休 息,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号