统计数的分布与统计推断

上传人:luobi****88888 文档编号:94012816 上传时间:2019-07-31 格式:PPT 页数:79 大小:1.61MB
返回 下载 相关 举报
统计数的分布与统计推断_第1页
第1页 / 共79页
统计数的分布与统计推断_第2页
第2页 / 共79页
统计数的分布与统计推断_第3页
第3页 / 共79页
统计数的分布与统计推断_第4页
第4页 / 共79页
统计数的分布与统计推断_第5页
第5页 / 共79页
点击查看更多>>
资源描述

《统计数的分布与统计推断》由会员分享,可在线阅读,更多相关《统计数的分布与统计推断(79页珍藏版)》请在金锄头文库上搜索。

1、本资料来源,正态分布,记作,决定了图形的中心位置, 决定了图形中峰的陡峭程度.,正态分布 的图形特点,标准正态分布,(1) P( U u) 或 P(U -u) (u 0),直接查表,设u服从正态分布N(0,1),试求: (1)P(u2.12) ( 2 ) P (u2.12),(2) P( U -u) 或 P(U u),查表,正态分布,(3) P( a U b),或,设x服从正态分布N(4,16),试求: (1)P(x2.44) ( 2 ) P (-3x 4),正态分布,P( -1 U 1) = 68.26% P( -2 U 2) = 95.45% P( -3 U 3) = 99.73% P(

2、-1.96 U 1.96) = 95% P( -2.58 U 2.58) = 99%,几个特殊的标准正态分布概率,正态分布,68.3%,95.5%,99.7%,正态分布,P( - X + ) = 68.26% P( - 2 X + 2 ) = 95.45% P( - 3 X + 3 ) = 99.73% P( - 1.96 X + 1.96 ) = 95% P( - 2.58 X + 2.58 ) = 99%,几个特殊的一般正态分布概率,正态分布,-3 -2 - + +2 +3,x,68.3%,95.5%,99.7%,对于给定的两尾概率求标准正态分布在x轴上的分位点,/2,/2,用2 查附表2

3、,可得一尾概率为 时的分位点u,对于给定的一尾概率求标准正态分布在x轴上的分位点,总体,样本,样本,样本,样本,统计推断:从样本到总体方向,抽样分布:从总体到样本方向,第三节 统计数的分布,抽样分布的概念,原总体,样本1,样本2,样本n,新总体,n ,统计量,随机抽样 对于大总体,可以随机性的抽取一部分样本进行研究 对于小的有限总体,进行放回式抽样(因总体不会耗尽而视作无限容量),例:设有一个 N=4 的有限总体,变数为2、3、3、4。现分别以n=2,n=4作独立的有放回的抽样。求总体的、2和样本平均数抽样总体的平均数、方差之间的关系。,N=4, n=2和n=4时的次数分布,解:该总体的、2、

4、为=3, 2=12, = =0.707 从有限总体作返置随机抽样,所有可能的样本数为Nn。其中n为样本含量。以上述总体而论,如果从中抽取n=2的样本,共可得 42=16 个样本;如果样本含量n为4,则 一 共 可 抽 得44=256个样本。分别求这些样本的平均数,其次数分布如上表所示。 根据表数据,在n=2的试验中,样本平均数抽样总体的平均数、方差与标准差分别为:,同理可得,在n=4的试验中,样本平均数抽样总体的平均数、方差与标准差分别为:,样本来自均数为,方差为 2的总体,正态总体样本平均数的分布 设样本来自正态总体 N( , 2),则样本平均数也服从正态分布,其总体均数为 ,方差为 2/n

5、。,不同样本容量的平均数的抽样分布形状为:,中心极限定理,无论样本所来自的总体是否服从正态分布, 只要样本足够大,样本平均数就近似服从正态分布,样本越大,近似程度越好。 所需的样本含量随原总体的分布而异,但只要样本含量 30,无论原总体是何分布,都足以满足近似的要求。 设原总体的平均数为,方差为 2,则样本平均数的平均数为,方差为 2 /n。,标准差 (Standard deviation) 标准误 ( Standard error),样本标准差与标准误之间的区别,样本标准差S是反映样本中各观测值 , , 变 异 程 度大小的一个指标,它的大小说明了 对 该 样本代表性的强弱。 样本标准误是样

6、本平均数 的标准差,它是抽样误差的估计值,其大小说明了样本间变异程度的大小及精确性的高低。,二、样本平均数差数的分布,(1) 样本平均数差数的平均数等于总体平均数的差数,即 (2) 样本平均数差数的方差等于两样本平均数(总体方差除以各样本容量之和) (3) 从两个正态总体中抽出的样本平均数差数的分布是正态分布, 记作,三、t分布,当总体标准差未知时,且样本数小于30时, 以样本标准差S代替所得到的统计量 记为t。在计算时,由于采用S来代替,使得t 变量不再服从标准正态分布,而是服从t分布,服从自由度为n-1的t分布,例如:当df=15时,查t分布表得两尾概率等于0.05的临界t值为 =2.13

7、1,其意义是: P(-t-2.131)= P(2.131t+)=,F t (df),1-F t (df),t分布的特征 1、t分布受自由度的制约,每一个自由度都有一条t分布密度曲线 2、t分布密度曲线以纵轴为对称轴,左右对称,且在t0时,分布密度函数取得最大值 3、与标准正态分布曲线相比,t分布曲线顶部略低,两尾部稍高而平.df越小这种趋势越明显.df越大,t分布越趋近于标准正态分布.当n 30时,t分布与标准正态分布的区别很小;n 100时,t分布基本与标准正态分布相同;n时,t分布与标准正态分布完全一致,正态分布曲线与t分布曲线的比较,四、分布,设从一正态总体 中随机抽取样本容量为n,m的

8、两个独立样本,其样本的方差为 ,则定义 两者的比值为F,-服从自由度为n-1,m-1的F分布,F分布特征 1)F分布的平均数1,F的取值区间为0,+) 2)F分布曲线的形状仅决定于df1和df2.在df1l或2时,F分布曲线呈严重倾斜的反向J型,当df1=3时转为左偏曲线(在平均值的左边),不同自由度下的F分布曲线,第四章 统计推断,统计推断:根据抽样分布律和概率理论,由样本结果(统计数)来推论总体特征(参数)。 假设检验 参数估计,假设检验(显著性检验):根据于某种实际需要,对未知的或不完全知道的统计总体提出一些假设;然后由样本的实际结果,经过一定的计算,作出在概率意义上应当接受那种假设的检

9、验。 参数估计:由样本结果对总体参数作出点估计或者区间估计。,假设检验的基本原理,问题的提出 例 :某农场江南桤木4龄植株的平均胸径可达9cm。 问题:此说法是否正确?有4种可能性(假设) 1)正确: 9 2)不正确: 9(| 9| 0) 3)不正确: 9 三对假设: 9 vs 9, 9 vs 9,如何回答 随机抽取一个样本 计算该样本的平均数 比较样本平均数与9cm 难题 存在抽样误差 当样本平均数与9cm之差达到多大时可否定 9,解决的思路 针对要回答的问题提出一对对立的假设,并对其中的一个进行检验 找到一个样本统计量,它与提出的假设有关,其抽样分布已知 根据这个统计量观察值出现的概率,利

10、用小概率事件原理对假设是否成立做出推断,这个过程称为假设检验 (hypothesis testing),这里用到人们在实践中普遍采用的一个原则:,小概率事件在一次试验中基本上不会发生 .,小概率原理,下面我们用一例说明这个原则.,这里有两个盒子,各装有100个球.,现从两盒中随机取出一个盒子,问这个盒子里是白球99个还是红球99个?,我们不妨先假设:这个盒子里有99个白球.,现在我们从中随机摸出一个球,发现是,此时你如何判断这个假设是否成立呢?,假设其中真有99个白球,摸出红球的概率只有1/100,这是小概率事件.,小概率事件在一次试验中竟然发生了,不能不使人怀疑所作的假设.,小概率事件在一次

11、试验中基本上不会发生.,小概率事件原理 小概率事件在一次试验中几乎不会发生 如果某事件在一次试验中发生了,我们可认为它不是一个小概率事件 如果在某个假设下应当是小概率的事件在一次试验中发生了,可认为该假设不能成立,在假设检验中,我们称这个小概率为 显著性水平用 表示.,常取,的选择要根据实际情况而定。,假设检验的基本步骤 1)提出一对对立的假设 2)确定显著水平 3)构造并计算检验统计量 4)对所作的假设进行推断,例 设由该农场随机抽取了10株江南桤木,测得它们在4龄时的平均胸径为8.7cm。已知江南桤木的胸径服从正态分布,总体方差为 2 2.5cm2 1)提出假设 零假设(null hypo

12、thesis): H0: = 9cm 备择假设(alternative hypothesis): HA: 9cm,2)确定(显著水平)否定域 在检验统计量抽样分布的尾部(1侧或2侧)中划定一小概率区域,一旦计算的检验统计量的实际值落入此区域,就否定原假设,接受备择假设。 这个小概率也称为显著性水平,用 表示 通常取 5或 1,若取 5,则,接受域 95%,否定域 2.5%,1.96,-1.96,否定域:U 1.96 或 U 1.96,否定域 2.5%,3) 构造并计算检验统计量 检验统计量:用于检验原假设能否成立的统计量,满足以下条件 必须利用原假设提供的信息 抽样分布已知,4)对所作的假设进

13、行推断 差异不显著:在 5水平下,检验统计量的观察值落在接受域中 差异显著:在 5水平下,检验统计量的观察值落在否定域中 差异极显著:在 1水平下,检验统计量的观察值落在否定域中,U = -3.162 -1.96 (落入否定域) 否定原假设,结论:该场4龄南桤木的平均胸径与9cm差异 显著。,若取小概率为1%,可得否定域为 U 2.58 或 U -2.58 仍有 U = -3.162 -2.58,结论:该场4龄南桤木的平均胸径与9cm差异 极显著。,几个相关概念 1)双尾检验和单尾检验 双尾检验:否定域在检验统计量分布的两尾 单尾检验:否定域在检验统计量分布的一侧 左尾检验:否定域在检验统计量

14、分布的左侧 右尾检验:否定域在检验统计量分布的右侧,例(续) 左尾检验 1)假设: H0: = 9, HA: 9 2)检验统计量:同双侧检验, U = -3.162 3)否定域: 取 = 0.05 4)推断:,5%,-1.64, U = -3.162 -1.64 否定原假设,例(续) 右尾检验 1)假设: H0: = 9, HA: 9 2)检验统计量:同双侧检验, U = -3.162 3)否定域: 取 = 0.05 4)推断:,5%,1.64, U = -3.162 1.64 接受原假设,拒绝域 的概率是小概率. 如果统计量的实测值落入拒绝域 ,也就是说, H0 成立下的小概率事件发生了,那

15、么就认为H0不可信而否定它. 否则我们就不能否定H0 (只好接受它).,这里所依据的逻辑是:,不否定H0并不是肯定H0一定对,而只是说差异还不够显著,还没有达到足以否定H0的程度 .,所以假设检验又叫,“显著性检验”,Overwhelming Evidence (Highly Significant),Strong Evidence (Significant),Weak Evidence (Not Significant),No Evidence (Not Significant),0 .01 .05 .10,p=.0069,F 检验 用 F分布,一般说来,按照检验所用的统计量的分布,U 检验 用正态分布,t 检验 用 t 分布,分为,u检验,适用条件 (1)总体方差已知时样本平均数的检验 (2)总体方差未知但样本为大样本(n=30)

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > IT计算机/网络 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号