统计数的分布与统计推断

资源描述

《统计数的分布与统计推断》由会员分享，可在线阅读，更多相关《统计数的分布与统计推断（79页珍藏版）》请在金锄头文库上搜索。

1、本资料来源,正态分布,记作,决定了图形的中心位置，决定了图形中峰的陡峭程度.,正态分布的图形特点,标准正态分布,(1) P( U u) 或 P(U -u) (u 0),直接查表,设u服从正态分布N（0，1），试求：（1）P（u2.12) ( 2 ) P (u2.12),(2) P( U -u) 或 P(U u),查表,正态分布,(3) P( a U b),或,设x服从正态分布N（4，16），试求：（1）P（x2.44) ( 2 ) P (-3x 4),正态分布,P( -1 U 1) = 68.26% P( -2 U 2) = 95.45% P( -3 U 3) = 99.73% P(

2、-1.96 U 1.96) = 95% P( -2.58 U 2.58) = 99%,几个特殊的标准正态分布概率,正态分布,68.3%,95.5%,99.7%,正态分布,P( - X + ) = 68.26% P( - 2 X + 2 ) = 95.45% P( - 3 X + 3 ) = 99.73% P( - 1.96 X + 1.96 ) = 95% P( - 2.58 X + 2.58 ) = 99%,几个特殊的一般正态分布概率,正态分布,-3 -2 - + +2 +3,x,68.3%,95.5%,99.7%,对于给定的两尾概率求标准正态分布在x轴上的分位点,/2,/2,用2 查附表2

3、，可得一尾概率为时的分位点u,对于给定的一尾概率求标准正态分布在x轴上的分位点,总体,样本,样本,样本,样本,统计推断:从样本到总体方向,抽样分布:从总体到样本方向,第三节统计数的分布,抽样分布的概念,原总体,样本1,样本2,样本n,新总体,n ,统计量,随机抽样对于大总体,可以随机性的抽取一部分样本进行研究对于小的有限总体,进行放回式抽样(因总体不会耗尽而视作无限容量),例：设有一个 N=4 的有限总体，变数为2、3、3、4。现分别以n=2,n=4作独立的有放回的抽样。求总体的、2和样本平均数抽样总体的平均数、方差之间的关系。,N=4, n=2和n=4时的次数分布,解：该总体的、2、

4、为=3, 2=12, = =0.707 从有限总体作返置随机抽样，所有可能的样本数为Nn。其中n为样本含量。以上述总体而论，如果从中抽取n=2的样本，共可得 42=16 个样本；如果样本含量n为4，则一共可抽得44=256个样本。分别求这些样本的平均数，其次数分布如上表所示。根据表数据，在n=2的试验中，样本平均数抽样总体的平均数、方差与标准差分别为：,同理可得，在n=4的试验中，样本平均数抽样总体的平均数、方差与标准差分别为：,样本来自均数为，方差为 2的总体,正态总体样本平均数的分布设样本来自正态总体 N( , 2)，则样本平均数也服从正态分布，其总体均数为，方差为 2/n

5、。,不同样本容量的平均数的抽样分布形状为：,中心极限定理,无论样本所来自的总体是否服从正态分布，只要样本足够大，样本平均数就近似服从正态分布，样本越大，近似程度越好。所需的样本含量随原总体的分布而异，但只要样本含量 30，无论原总体是何分布，都足以满足近似的要求。设原总体的平均数为，方差为 2，则样本平均数的平均数为，方差为 2 /n。,标准差（Standard deviation) 标准误 ( Standard error),样本标准差与标准误之间的区别,样本标准差S是反映样本中各观测值，，变异程度大小的一个指标，它的大小说明了对该样本代表性的强弱。样本标准误是样

6、本平均数的标准差，它是抽样误差的估计值,其大小说明了样本间变异程度的大小及精确性的高低。,二、样本平均数差数的分布,(1) 样本平均数差数的平均数等于总体平均数的差数,即 (2) 样本平均数差数的方差等于两样本平均数（总体方差除以各样本容量之和） (3) 从两个正态总体中抽出的样本平均数差数的分布是正态分布，记作,三、t分布,当总体标准差未知时，且样本数小于30时, 以样本标准差S代替所得到的统计量记为t。在计算时，由于采用S来代替，使得t 变量不再服从标准正态分布，而是服从t分布,服从自由度为n-1的t分布,例如:当df=15时，查t分布表得两尾概率等于0.05的临界t值为 =2.13

7、1，其意义是： P(-t-2.131)= P(2.131t+)=,F t (df),1-F t (df),t分布的特征 1、t分布受自由度的制约，每一个自由度都有一条t分布密度曲线 2、t分布密度曲线以纵轴为对称轴，左右对称，且在t0时，分布密度函数取得最大值 3、与标准正态分布曲线相比,t分布曲线顶部略低，两尾部稍高而平.df越小这种趋势越明显.df越大，t分布越趋近于标准正态分布.当n 30时，t分布与标准正态分布的区别很小；n 100时，t分布基本与标准正态分布相同；n时，t分布与标准正态分布完全一致,正态分布曲线与t分布曲线的比较,四、分布,设从一正态总体中随机抽取样本容量为n,m的

8、两个独立样本,其样本的方差为 ,则定义两者的比值为F,-服从自由度为n-1,m-1的F分布,F分布特征 1)F分布的平均数1，F的取值区间为0，+) 2)F分布曲线的形状仅决定于df1和df2.在df1l或2时,F分布曲线呈严重倾斜的反向J型，当df1=3时转为左偏曲线(在平均值的左边),不同自由度下的F分布曲线,第四章统计推断,统计推断：根据抽样分布律和概率理论，由样本结果(统计数)来推论总体特征(参数)。假设检验参数估计,假设检验（显著性检验）：根据于某种实际需要，对未知的或不完全知道的统计总体提出一些假设；然后由样本的实际结果，经过一定的计算，作出在概率意义上应当接受那种假设的检

9、验。参数估计：由样本结果对总体参数作出点估计或者区间估计。,假设检验的基本原理,问题的提出例：某农场江南桤木4龄植株的平均胸径可达9cm。问题：此说法是否正确？有4种可能性（假设） 1）正确： 9 2）不正确： 9（| 9| 0） 3）不正确： 9 三对假设： 9 vs 9， 9 vs 9,如何回答随机抽取一个样本计算该样本的平均数比较样本平均数与9cm 难题存在抽样误差当样本平均数与9cm之差达到多大时可否定 9,解决的思路针对要回答的问题提出一对对立的假设，并对其中的一个进行检验找到一个样本统计量，它与提出的假设有关，其抽样分布已知根据这个统计量观察值出现的概率，利

10、用小概率事件原理对假设是否成立做出推断,这个过程称为假设检验 (hypothesis testing),这里用到人们在实践中普遍采用的一个原则：,小概率事件在一次试验中基本上不会发生 .,小概率原理,下面我们用一例说明这个原则.,这里有两个盒子，各装有100个球.,现从两盒中随机取出一个盒子，问这个盒子里是白球99个还是红球99个？,我们不妨先假设：这个盒子里有99个白球.,现在我们从中随机摸出一个球，发现是,此时你如何判断这个假设是否成立呢？,假设其中真有99个白球，摸出红球的概率只有1/100，这是小概率事件.,小概率事件在一次试验中竟然发生了，不能不使人怀疑所作的假设.,小概率事件在一次

11、试验中基本上不会发生.,小概率事件原理小概率事件在一次试验中几乎不会发生如果某事件在一次试验中发生了，我们可认为它不是一个小概率事件如果在某个假设下应当是小概率的事件在一次试验中发生了，可认为该假设不能成立,在假设检验中，我们称这个小概率为显著性水平用表示.,常取,的选择要根据实际情况而定。,假设检验的基本步骤 1）提出一对对立的假设 2）确定显著水平 3）构造并计算检验统计量 4）对所作的假设进行推断,例设由该农场随机抽取了10株江南桤木，测得它们在4龄时的平均胸径为8.7cm。已知江南桤木的胸径服从正态分布，总体方差为 2 2.5cm2 1）提出假设零假设(null hypo

12、thesis)： H0: = 9cm 备择假设(alternative hypothesis)： HA: 9cm,2）确定（显著水平）否定域在检验统计量抽样分布的尾部（1侧或2侧）中划定一小概率区域，一旦计算的检验统计量的实际值落入此区域，就否定原假设，接受备择假设。这个小概率也称为显著性水平，用表示通常取 5或 1,若取 5，则,接受域 95%,否定域 2.5%,1.96,-1.96,否定域：U 1.96 或 U 1.96,否定域 2.5%,3) 构造并计算检验统计量检验统计量：用于检验原假设能否成立的统计量，满足以下条件必须利用原假设提供的信息抽样分布已知,4）对所作的假设进

13、行推断差异不显著：在 5水平下，检验统计量的观察值落在接受域中差异显著：在 5水平下，检验统计量的观察值落在否定域中差异极显著：在 1水平下，检验统计量的观察值落在否定域中,U = -3.162 -1.96 （落入否定域）否定原假设,结论：该场4龄南桤木的平均胸径与9cm差异显著。,若取小概率为1%，可得否定域为 U 2.58 或 U -2.58 仍有 U = -3.162 -2.58,结论：该场4龄南桤木的平均胸径与9cm差异极显著。,几个相关概念 1）双尾检验和单尾检验双尾检验：否定域在检验统计量分布的两尾单尾检验：否定域在检验统计量分布的一侧左尾检验：否定域在检验统计量

14、分布的左侧右尾检验：否定域在检验统计量分布的右侧,例（续）左尾检验 1）假设： H0: = 9， HA: 9 2）检验统计量：同双侧检验， U = -3.162 3）否定域：取 = 0.05 4）推断：,5%,-1.64, U = -3.162 -1.64 否定原假设,例（续）右尾检验 1）假设： H0: = 9， HA: 9 2）检验统计量：同双侧检验， U = -3.162 3）否定域：取 = 0.05 4）推断：,5%,1.64, U = -3.162 1.64 接受原假设,拒绝域的概率是小概率. 如果统计量的实测值落入拒绝域，也就是说， H0 成立下的小概率事件发生了，那

15、么就认为H0不可信而否定它. 否则我们就不能否定H0 （只好接受它）.,这里所依据的逻辑是：,不否定H0并不是肯定H0一定对，而只是说差异还不够显著，还没有达到足以否定H0的程度 .,所以假设检验又叫,“显著性检验”,Overwhelming Evidence (Highly Significant),Strong Evidence (Significant),Weak Evidence (Not Significant),No Evidence (Not Significant),0 .01 .05 .10,p=.0069,F 检验用 F分布,一般说来，按照检验所用的统计量的分布,U 检验用正态分布,t 检验用 t 分布,分为,u检验,适用条件 (1)总体方差已知时样本平均数的检验 (2)总体方差未知但样本为大样本(n=30)

展开阅读全文

统计数的分布与统计推断

最新文档