概率统计基础3随机变量及抽样分布final

举报
资源描述
第第 3 章章 随机变量及抽样分布随机变量及抽样分布李芳凤李芳凤 email:概率论与统计学都是从数量关系上研究随机现象的统计规律性。在概率论中,所研究随机变量的分布是已知的;在统计中,所研究的随机变量的分布是未知或不完全知道,需要通过对所研究的随机变量进行重复独立的观察,得到观察值,分析并推断整体分布。研究对象的全体称为总体问题:这样定义的总体和个体是具体的对象,不符合数学研究的特点-抽象例 考察某班级学生的英语课程学习成绩,则全体学生构成了一个总体,每个同学就是一个个体.例 考察某工厂生产的某批灯泡的寿命,则该厂生产的该批灯泡构成了一个总体,每个灯泡就是一个个体.总体中的一个具体对象称为个体随机变量随机变量这些数量指标是服从某种分布的这些数量指标是服从某种分布的这些数量指标是服从某种分布的这些数量指标是服从某种分布的r.vr.vr.vr.v研究对象的全体称为总体研究对象的全体称为总体 考考察察某某班班级级学学生生的的英英语语课课程程学学习习成成绩绩,则则全全体体学学生生构构成了一个总体,每个同学就是一个个体成了一个总体,每个同学就是一个个体.考考察察某某工工厂厂生生产产的的某某批批灯灯泡泡的的寿寿命命,则则该该厂厂生生产产的的该该批灯泡构成了一个总体,每个灯泡就是一个个体批灯泡构成了一个总体,每个灯泡就是一个个体.总体中的一个具体对象称为个体总体中的一个具体对象称为个体不是研究它们不是研究它们不是研究它们不是研究它们而是研究数量指标而是研究数量指标而是研究数量指标而是研究数量指标随机变量随机变量研究对象的全体称为总体研究对象的全体称为总体例例例例 考考察察某某班班级级学学生生的的英英语语课课程程学学习习成成绩绩,则则全全体体学学生生构构成了一个总体,每个同学就是一个个体成了一个总体,每个同学就是一个个体.例例例例 考考察察某某工工厂厂生生产产的的某某批批灯灯泡泡的的寿寿命命,则则该该厂厂生生产产的的该该批灯泡构成了一个总体,每个灯泡就是一个个体批灯泡构成了一个总体,每个灯泡就是一个个体.总体中的一个具体对象称为个体总体中的一个具体对象称为个体总体总体总体总体:研究对象的数量指标研究对象的数量指标研究对象的数量指标研究对象的数量指标 个体个体个体个体:随机变量随机变量随机变量随机变量X X X X的值的值的值的值以随机变量以随机变量X X代表总体的特征代表总体的特征总体个体特征一批产品每件产品等级一批灯泡每个灯泡 寿命一年的日平均气温每天日平均气温 度数数轴上某一线段 线段中每一点坐标一批彩票每张彩票号码人们感兴趣的是总体的某一个或几个数量指标的分布情况。每个个体所取的值不同,但它按一定规律分布。如何收集数据如何收集数据如何收集数据如何收集数据这一过程称为这一过程称为这一过程称为这一过程称为抽样抽样抽样抽样从研究对象中任取从研究对象中任取n n个个“个体个体”,观察它们的数量指标观察它们的数量指标每次取出的样品与总体有相同的分布每次取出的样品与总体有相同的分布称为称为容量容量为为n n的的样本样本.要求各次取样的结果互不影响要求各次取样的结果互不影响在相同条件下对总体在相同条件下对总体X X进行进行n n次重复、独立观察次重复、独立观察抽样的特点抽样的特点是相互独立是相互独立,与总体同分布的随机与总体同分布的随机变量变量观察前观察前:观察后观察后:样本值样本值为为n n个具体的观察数据个具体的观察数据样本的特点样本的特点样本的特点样本的特点例例 某某厂厂生生产产了了一一大大批批灯灯泡泡,现现从从中中随随机机抽抽取取5 5只只进进行行检测检测,测得其寿命测得其寿命(小时小时)分别为分别为总体为灯泡的寿命总体为灯泡的寿命样本容量为样本容量为5,5,样本为样本为样本观察值为样本观察值为简单随机样本1.若X1,X2,Xn是相互独立的2.每一个Xi(i=1,2,n)的分布都与总体X的分布相同则称X1,X2,Xn为容量为n的样本为简单随机样本。10样本是总体的代表和反映,但在我们抽取样本之后,并不直接利用样本进行推断,而需要对样本进行一番“加工”和“提炼”,把样本所包含的关于我们所关心的事物的信息集中起来,这便是针对不同的问题构造出样本的某种函数,这种函数在统计学中称为统计量。统计量统计量引进统计量的目的是为了将杂乱无序的样本值归结为一个便于进行统计推断和研究分析的形式,集中样本所含信息,使之更易揭示问题实质,从而解决问题。统计量中应该不含有未知参数统计量中应该不含有未知参数;如果如果统计量中仍含有未知参数,就无法依靠样本观测统计量中仍含有未知参数,就无法依靠样本观测值求出未知参数的估计值,值求出未知参数的估计值,因而失去利用统计量估计未知参数的意义,这是违背我们引进统计量的初衷的。常用的统计量常用的统计量1.样本统计量的概率分布,是一种理论分布q在重复选取容量为n的样本时,由该统计量的所有可能取值形成的相对频数分布 2.随机变量是样本统计量样本统计量q样本均值,样本比例,样本方差等3.结果来自容量相同容量相同的所有所有可能样本4.提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据抽样分布(sampling distribution)抽样分布的形成过程(sampling distribution)总体总体样本样本计算样本统计量计算样本统计量计算样本统计量计算样本统计量如:样本均值、如:样本均值、比例、方差比例、方差1.由阿贝(Abbe)于1863年首先给出,后来由海尔墨特(Hermert)和卡皮尔逊(KPearson)分别于1875年和1900年推导出来几个重要分布几个重要分布2-分布(2-distribution)记记为为定义:设 相互独立,都服从正态分布N(0,1),则称随机变量:所服从的分布为自由度为 n 的 分布.其中,的密度函数的密度函数为为自由度为自由度为 n 的的n=2n=3n=5n=10n=15则设1.分布的变量值始终为正 2.分布的形状取决于其自由度n的大小,通常为不对称的右偏分布,但随着自由度的增大逐渐趋于对称.2-分布(性质和特点)2 2 2 22 2n n=1=1n n=4=4n n=10=10n n=20=201.期望为:E(2)=n,方差为:D(2)=2n(n为自由度)2.可加性:若U和V为两个独立的2分布随机变量,U2(n1),V2(n2),则U+V这一随机变量服从自由度为n1+n2的2分布 2-分布(性质和特点)n=1020.05(10)分布的分位点分布的分位点2-分布(用Excel计算2分布的概率)1.利用Excel提供的【CHIDIST】统计函数,计算2分布右单尾的概率值l语 法:CHIDIST(x,degrees_freedom),其中df为自由度,x是随机变量的取值2.利用【CHIINV】函数则可以计算给定右尾概率和自由度时相应的反函数值l语法:lCHIINV(probability,degrees_freedom)计算计算计算计算c c c c2 2 分布的概率分布的概率分布的概率分布的概率t-分布(t-distribution)1.提出者是William Gosset,也被称为学生分布(students t)2.t 分布是类似正态分布的一种对称分布,通常要比正态分布平坦和分散。一一个个特特定定的的分分布布依依赖赖于于称称之之为为自自由由度度的的参参数数。随着自由度的增大,分布也逐渐趋于正态分布 x x xt t 分布与标准正态分布的比较分布与标准正态分布的比较分布与标准正态分布的比较分布与标准正态分布的比较t t 分布分布分布分布标准正态标准正态标准正态标准正态分布分布分布分布t t不同自由度的不同自由度的不同自由度的不同自由度的t t分布分布分布分布标准正态分布标准正态分布标准正态分布标准正态分布t t(dfdf=13)=13)t t(dfdf=5)=5)z zt t 分布分布 (Student 分布)定义定义则称 T 服从自由度为 n 的t 分布.记为其概率密度函数为X,Y相互独立相互独立,设t 分布的性质分布的性质1f n(t)是偶函数,n=1n=20t 分布的图形分布的图形(红色的是标准正态分布红色的是标准正态分布)分布的分位点分布的分位点n=10t-t例如:例如:t分布的分位点的性质用用Excel计算计算t分布的概率和临界值分布的概率和临界值1.利用Excel中的【TDIST】统计函数,可以计算给定值和自由度时分布的概率值l语法:语法:lTDIST(x,degrees_freedom,tails)2.利用【TINV】函数则可以计算给定概率和自由度时的相应 l语法:语法:lTINV(probability,degrees_freedom)计算计算计算计算t t分布的临界值分布的临界值分布的临界值分布的临界值1.为纪念统计学家费希尔(R.A.Fisher)以其姓氏的第一个字母来命名2.定义若XX2(m),YX2(n),X,Y相互独立,则称随机变量为服从第一自由度为n1,第二自由度为n2的F分布,记为F-分布(F distribution)不同自由度的F分布F F F(1,10)(1,10)(5,10)(5,10)(10,10)(10,10)m=n=10分布的分位点分布的分位点F 分布的性质分布的性质例如解求F(n,m)(用Excel计算F分布的概率和临界值)1.利用Excel提供的【FDIST】统计函数,计算分布右单尾的概率值l语法:lFDIST(x,degrees_freedom1,degrees_freedom2)2.利用【FINV】函数则可以计算给定单尾概率和自由度时的相应分位数分位数l语法:lFINV(probability,degrees_freedom1,degrees_freedom2)计算计算计算计算F F分布的概率分布的概率分布的概率分布的概率1.在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布2.一种理论概率分布3.推断总体均值的理论基础样本均值的分布样本均值的分布(例题分析)【例例】设一个总体,含有4个元素(个体),即总体单位数N=4。4 个个体分别为x1=1,x2=2,x3=3,x4=4。总体的均值、方差及分布如下总体分布总体分布总体分布总体分布1 14 42 23 30 0.1.1.2.2.3.3均值和方差均值和方差均值和方差均值和方差样本均值的分布 现从总体中抽取n2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二个观察值第二个观察值第一个第一个观察值观察值所有可能的所有可能的n=2 的样本(共的样本(共16个)个)计算出各样本的均值,如下表。并给出样本均值的抽样分布3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二个观察值第二个观察值第一个第一个观察值观察值16个样本的均值(个样本的均值(x)x x样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布样本均值的抽样分布1.01.00 00.10.10.20.20.30.3P P (x x)1.51.53.03.04.04.03.53.52.02.02.52.5样本均值的分布与总体分布的比较 =2.5 2=1.25总体分布总体分布总体分布总体分布样本均值分布样本均值分布样本均值分布样本均值分布样本均值的分布与中心极限定理 =50=50=50 =10=10=10X X X总体分布总体分布总体分布总体分布总体分布总体分布n n=4=4抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布xn n=16=16当总体服从正态分布N(,2)时,来自该总体的所有容量为n的样本的均值x也服从正态分布,x 的期望值为,方差为2/n。即即 xN(,2/n)中心极限定理(central limit theorem)当样本容量当样本容量足够大时足够大时(n n
展开阅读全文
温馨提示:
金锄头文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
相关资源
正为您匹配相似的精品文档
相关搜索

当前位置:首页 > 高等教育 > 大学课件


电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号