数理统计CH抽样分布培训讲学

上传人:yuzo****123 文档编号:137607912 上传时间:2020-07-10 格式:PPT 页数:64 大小:916.50KB
返回 下载 相关 举报
数理统计CH抽样分布培训讲学_第1页
第1页 / 共64页
数理统计CH抽样分布培训讲学_第2页
第2页 / 共64页
数理统计CH抽样分布培训讲学_第3页
第3页 / 共64页
数理统计CH抽样分布培训讲学_第4页
第4页 / 共64页
数理统计CH抽样分布培训讲学_第5页
第5页 / 共64页
点击查看更多>>
资源描述

《数理统计CH抽样分布培训讲学》由会员分享,可在线阅读,更多相关《数理统计CH抽样分布培训讲学(64页珍藏版)》请在金锄头文库上搜索。

1、2020/7/10,王玉顺:数理统计02_抽样分布,1,第2章 抽样分布 Sample Distribution,2020/7/10,王玉顺:数理统计02_抽样分布,2,使用随机变量X,首先要弄清它的概率分布 而实际上往往对X的概率分布一无所知,或者只知分布类型却不知分布参数 探明概率分布的唯一方法是相同条件下对X做n次独立重复试验,获得一个称作样本的试验结果序列X1,X1,Xn;样本分量的某种组合(函数)称作统计量;统计量的分布函数和概率密度称作抽样分布。,引言(Foreword),2 抽样分布,2020/7/10,王玉顺:数理统计02_抽样分布,3,本章内容,2 抽样分布,2.1 总体与样

2、本 2.2 抽样分布 2.3 统计量分位数 2.4 抽样分布定理 2.5 中心极限定理,2020/7/10,王玉顺:数理统计02_抽样分布,4,随机试验(Random Experiment),复习两个概念,2 抽样分布,满足下述三个条件的试验称为随机试验: (1)试验可在相同条件下重复进行; (2)试验的所有可能结果是明确可知的,并且不止一个; (3)每次试验总是恰好出现这些可能结果中的一个,但在试验之前却不能肯定会出现哪一个结果。 随机试验在统计学里可简称为试验。,2020/7/10,王玉顺:数理统计02_抽样分布,6,2.1 总体和样本 Population and Sample,2 抽样

3、分布,2020/7/10,王玉顺:数理统计02_抽样分布,7,2.1 总体和样本,研究对象的全部或集合(对象整体) 随机试验所有可能结果的集合(样本空间) 随机变量X的所有可能观察值(数值集合) 总体亦称作母体 总体可划分为有限和无限两大类,有限总体可扩展为无限总体,(1)总体(Population),2020/7/10,王玉顺:数理统计02_抽样分布,8,理解下面的总体: 研究中国的电视机寿命:中国的全部电视机产品或其寿命观察值的集合; 研究山西农业大学大学生的数学水平:山西农业大学的全部学生或其数学成绩的集合; 研究山西农业大学班级的运动成绩:山西农业大学的全部学生班或其运动成绩的集合。,

4、2.1 总体和样本,(1)总体(Population),总体的构成元素和疆域由问题界定,2020/7/10,王玉顺:数理统计02_抽样分布,9,2.1 总体和样本,由于随机变量X代表所有可能的观察值,即它代表所研究问题的总体,故常称总体X 今后,所研究问题的总体常用随机变量X来指代,即采用下面的陈述:,(1)总体(Population),2020/7/10,王玉顺:数理统计02_抽样分布,10,2.1 总体和样本,构成研究对象整体的一个分割单位(单位) 随机试验的一个可能结果(样本点) 随机变量X的一个可能观察值(变量值) 个体有数值型和非数值型两种,(2)个体(Individual, Uni

5、t),总体和个体是彼此对立的两个概念,2020/7/10,王玉顺:数理统计02_抽样分布,11,理解下面的个体: 一台电视机或一台电视机的寿命观测 一个学生或一个学生的数学成绩 一个学生班或一个学生班的运动成绩,2.1 总体和样本,(2)个体(Individual, Unit),个体的大小和疆域由问题界定,2020/7/10,王玉顺:数理统计02_抽样分布,12,2.1 总体和样本,(3)抽样(Sampling),从总体中选取或抽取若干个个体称作抽样。总体中每个个体被抽到的概率都一样,称作机会均等。按机会均等原则选取若干个个体的行为或过程,称作随机抽样(sampling )。,2020/7/1

6、0,王玉顺:数理统计02_抽样分布,13,2.1 总体和样本,对总体X实施n次随机抽样,可视作对1个随机变量X做n次独立重复试验。 试验序号做下标,随机变量X的n次试验或抽样记作X1,X2,Xn或(X1,X2,Xn),即随机变量系或随机向量,称该随机变量系或随机向量为样本(sample),称n为样本容量(sample size)。,(4)样本(Sample),样本是总体的一个子集,样本是n次抽样n个随机变量的合称,2020/7/10,王玉顺:数理统计02_抽样分布,14,2.1 总体和样本,试验或抽样后,获得随机变量系X1,X2,Xn的一组试验结果,或随机变量X的n次试验结果,它们就合称为样本

7、观察值(observation); 样本观察值记作实数向量 (x1,x2,xn) 或一组实数x1,x2,xn; 注意:样本是随机变量系或随机向量,每个分量都是随机变量;样本观察值是实数向量,每个分量都是实数数值。,(5)样本观察值(Observation),样本观察值是样本的一次实现,2020/7/10,王玉顺:数理统计02_抽样分布,15,2.1 总体和样本,样本X1,X2,Xn被视作对随机变量X实施n次重复独立的随机试验; n次重复独立随机试验的可能样本观察值不止一组,每次试验恰好出现所有可能观察值的一组,但试验前并不知道会出现哪一组; 样本和样本观察值常不加区分统称为样本,(6)从随机试

8、验角度看样本,注意样本的随机性,2020/7/10,王玉顺:数理统计02_抽样分布,16,2.1 总体和样本,满足下面三个条件称作简单随机样本: 对总体X的抽样是随机抽样(等概抽样); 样本X1,X2,Xn各个分量彼此相互独立,即每次抽样的事件概率与以往抽样无关; 样本 X1,X2,Xn各个分量的分布相同。对一个总体的重复抽样自然满足同分布。,等概、独立、同分布抽样获得简单随机样本 以后不加特别声明“样本”指简单随机样本,(7)简单随机样本(SimpleRandom Sample),2020/7/10,王玉顺:数理统计02_抽样分布,17,2.1 总体和样本,若样本X1,X2,Xn的函数Y=f

9、(X1,X2,Xn )不含任何未知参数,则称Y为统计量。 统计量有三个特征: 统计量仍是随机变量; 统计量不含任何未知参数; 统计量有相应的概率分布(称作抽样分布),统计量是样本各个分量的某种组合,(8)统计量(Statistic),2020/7/10,王玉顺:数理统计02_抽样分布,18,2.1 总体和样本,若未知但已知,试判断右方所示的样本函数是否是统计量?,(8)统计量(Statistic),2020/7/10,王玉顺:数理统计02_抽样分布,19,2.1 总体和样本,几个常用的统计量:,(8)统计量(Statistic),2020/7/10,王玉顺:数理统计02_抽样分布,20,总体、

10、样本和统计量构成统计学最基本的概念和关系; 统计量是样本的函数; 统计量也是随机变量,引入这个术语只不过是特别强调它产生的过程,总体-样本-统计量。因此,统计量也有概率分布,特别地称作抽样分布。,2.1 总体和样本,(9)小结(Summary),2020/7/10,王玉顺:数理统计02_抽样分布,21,2.2 抽样分布 Sample Distribution,统计量的概率分布称作抽样分布,2 抽样分布,2020/7/10,王玉顺:数理统计02_抽样分布,22,许多研究问题可归结为对随机变量X的观测。X是研究对象,表示全部可能的试验结果,称其为总体X(population),X的分布称作总体分布

11、。从总体X中随机地抽取若干个个体(unit)称作抽样(sampling),抽取的n个个体X1,X2,Xn称作样本(sample),构建样本的某种函数即统计量(statistic),统计量的分布称作抽样分布(sample distribution)。统计量可用于推断总体的统计规律及特征。,2.2 抽样分布,为什么研究抽样分布?,样本是总体的近似或代表,2020/7/10,王玉顺:数理统计02_抽样分布,23,2.2 抽样分布,对正态总体抽样获得容量为n的样本,由样本构造Z、2、T、和F四种统计量,分别服从Z、2、T和F四种分布,称作数理统计学的四大概率分布或抽样分布。 对于正态总体抽样获得的样本

12、统计量,可由四大分布构造出精确的小样本统计方法;所谓小样本统计方法,是指样本容量n无论多小也能精确计算抽样观测事件的概率;,为什么研究抽样分布?,正态总体抽样的四大分布,2020/7/10,王玉顺:数理统计02_抽样分布,24,2.2 抽样分布,对于非正态总体抽样获得的样本统计量,当n充分大时,某些统计量的分布趋近正态分布(极限分布为正态分布),可由四大分布构造出近似的大样本统计方法。 所谓大样本统计方法,是指样本容量n需要足够大,由正态总体抽样的四大分布近似计算抽样观测事件的概率;,为什么研究抽样分布?,正态总体抽样的四大分布,2020/7/10,王玉顺:数理统计02_抽样分布,25,2.2

13、.1 分布 Chi-Square Distribution,2.2 抽样分布,2020/7/10,王玉顺:数理统计02_抽样分布,26,为检验实际分布与理论分布的吻合程度,即拟合优度检验(goodness-of-fit test),英国统计学家Karl Pearson(卡尔皮尔逊)于1899年提出一个新统计量(Pearsons Chi-Square Statistic),从而创立了卡方分布(Chi-square distribution); 卡方分布衍生自正态分布; 由卡方分布创建了许多重要的统计方法,如适合性检验、方差检验、列联表分析等。,(1)2分布简史,2.2.1 分布,2020/7/1

14、0,王玉顺:数理统计02_抽样分布,27,(2) 统计量,2.2.1 分布,设样本X1,X2,Xn来自正态总体N(,2),即各个样本分量独立同分布且是正态分布,则它们标准化随机变量的平方和,服从自由度df=n的卡方分布(Chi-square distribution),记作,2020/7/10,王玉顺:数理统计02_抽样分布,28,若统计量的表达式仅含有df个独立随机变量,亦即该统计量是df个独立随机变量的函数,则该统计量的“自由度”为df; 确定统计量自由度的方法是:若统计量表达式不仅包含n个独立的随机变量,还包含由该n个独立随机变量所构成的k个样本统计量,则统计量的自由度df=n-k。,(

15、3) 统计量的自由度,2.2.1 分布,2020/7/10,王玉顺:数理统计02_抽样分布,29,2.2.1 分布,(4) 统计量的概率密度,统计量的概率密度是观测x和自由度n的函数,2020/7/10,王玉顺:数理统计02_抽样分布,30,2.2.1 分布,(4) 统计量的概率密度,其中,卡方分布概率密度中的函数具有下面的取值规律:,2020/7/10,王玉顺:数理统计02_抽样分布,31,2.2.1 分布,(4) 统计量的概率密度,正态概率积分,2020/7/10,王玉顺:数理统计02_抽样分布,32,2.2.1 分布,(4) 统计量的概率密度,2分布是一种左倾的偏态分布,自由度n是它的唯

16、一分布参数; n愈小2观察值愈集中于左侧,峰值升高而右尾收缩变细; n愈大2观察值愈向右分散,峰值降低而右尾扩伸变粗;概率密度曲线愈来愈对称。,2020/7/10,王玉顺:数理统计02_抽样分布,33,2.2.1 分布,(5) 统计量概率密度的证明,引用浙大概率统计教材P63例3所证明的标准正态随机变量平方Y=Z2的分布:,引用分布定义:,2020/7/10,王玉顺:数理统计02_抽样分布,34,2.2.1 分布,(5) 统计量概率密度的证明,比较分布可知,Z2服从(1/2,1/2):,2020/7/10,王玉顺:数理统计02_抽样分布,35,2.2.1 分布,(5) 统计量概率密度的证明,引用教材P97-P99例3所证明的分布可加性,2020/7/10,王玉顺:数理统计02_抽样分布,36,2.2.1 分布,(6) 分布的性质,期望和方差:,2020/7/10,王玉顺:数理统计02_抽样分布,37,2.2.1 分布,(6) 分布的性质,设ZN(0,1),则概率密度为,2020/7/10,王玉顺:数理统计02_抽样分布,38,2

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号