社会统计学课件第七章假设检验

资源描述

《社会统计学课件第七章假设检验》由会员分享，可在线阅读，更多相关《社会统计学课件第七章假设检验（50页珍藏版）》请在金锄头文库上搜索。

1、2019/6/21,1,第七章假设检验,我们在第一章就已经知道，推论统计有两个基本内容：假设检验；参数估计。有了概率和概率分布的知识，接下来我们要逐步掌握统计检验的一般步骤。既然按照数学规则得到的概率都不能用经验方法准确求得，于是，理论概率和经验得到的频率之间肯定存在某种差别，这就引出了实践检验理论的问题。随机变量的取值状态不同，其概率分布的形式也就不同。本章我们不仅要引出二项分布和正态分布这两个著名的概率分布，并且要将它们与抽样调查联系起来，以领会统计检验，并逐步拓宽其应用面。,2019/6/21,2,第一节二项分布,二项分布是从著名的贝努里试验中推导而来。所谓贝努里

2、试验，是指只有两种可能结果的随机试验。在实际问题中，有许多随机现象只包含两个结果，如男与女，是与非，生与死，同意与不同意，赞成与反对等等。通常，我们把其中比较关注那个结果称为“成功”，另一个结果则称为“失败”。每当情况如同贝努里试验，是在相同的条件下重复n次，考虑的是“成功”的概率，且各次试验相互独立，就可利用与二项分布有关的统计检验。虽然许多分布较之二项分布更实用，但二项分布简单明了，况且其他概率分布的使用和计算逻辑与之相同。所以要理解统计检验以及它所涉及的许多新概念，人们几乎都乐意从二项分布的讨论入手。,2019/6/21,3,1. 二项分布的数学形式从掷硬币的试验入

3、手。假定二项试验由重复抛掷n次硬币组成，已知硬币面朝上(成功)的概率是p，面朝下(失败)的概率是q (显然有 q1p)。这样，对试验结果而言，成功的次数（即硬币面朝上的次数）X是一个离散型随机变量，它的可能取值是0，1，2，3，n。而对X的一个具体取值x而言，根据乘法规则，我们立刻可以就试验结果计算出一种特定排列方式(先x次面朝上，而后nx 次面朝下)实现的概率，即 ppppqqqqpxqn-x,2019/6/21,4,由于正确解决概率问题，光考虑乘法规则是不够的，还要考虑加法规则，于是就x次成功和（nx）次失败这个宏观结果而言所包含的所有排列的方式数，用符号表示这样，我们

4、就得到了二项试验中随机变量X的概率分布，即,2019/6/21,5,譬如，二项试验是将一枚硬币重复做8次抛掷，假设这枚硬币是无偏的，即pq0.5，那么恰好得到5次面朝上的概率是,同理，我们也可以求出这个二项试验中硬币刚好为 0，1，2，8次面朝上的各种宏观结果的概率，全部写出来就是右表。,2019/6/21,6,2. 二项分布讨论, 二项分布为离散型随机变量的分布。每当试验做的是在相同的条件下n次重复的贝努利试验时，随机变量X共有n+1个取值。二项分布可以用分布律(见上表)和折线图(见右图)来表示。当P=0.5时二项分布的图形是对称的。,2019/6/21,7, E(X)=np，

5、D(X)= 2= npq 二项分布受 p 和 n 变化的影响，只要确定了 p和 n，成功次数 X 的分布也随之确定。因此，二项分布还可简写作 B(x;n,p)。二项分布的概率值除了根据公式直接进行计算外，还可查表求得。二项分布表的编制方法有两种：一种依据概率分布律 P(x) 编制(见附表2)；另一种依据分布函数 F(x) 编制(见附表3)。其中,2019/6/21,8,例某特定社区人口的10%是少数民族，现随机抽取6人，问其中恰好2人是少数民族的概率是多少？解解法一：根据(7.3)式直接计算解法二：根据附表2中纵列n6和横行p0.1所对应x值，可直接查得B(x；6，0.1)的概

6、率值 B (2；6，0.1)00984 解法三：根据附表3求得 B (2；6，0.1)F(2) F(3 ) 0.11430.01590.0984,2019/6/21,9,第二节统计检验的基本步骤,二项分布是用数学或演绎推理的方法求得的一种理论分布。认识到概率分布是先验的理论分布这一点很重要，因为我们不禁要问，既然试验或抽样调查的结果仅与随机变量可能取值中的一个相联系，那么实际试验或样本调查对结果的概率分布及前提假设有没有一个检验的问题？具体来讲，对于一枚硬币被重复抛掷8次的二项试验，经验告诉我们，一共有9种可能的结果，而且实现这些结果的机会是大不相同的。研究者实际上从来不用经验的

7、方法求得概率分布，因为通常我们只对一项试验进行一次或几次，抽取样本也是一个或至多不过几个。既然二项分布是按照数学规则得到的，那么对这9种结果的可能性我们应该作出何种评价呢? 如果实际试验（或抽样）得到的结果偏巧就是先验概率预示的最不可能出现的结果，那么我们是认定纯属巧合，还是开始对用数学或演绎推理方法求得的概率以及理想试验的种种前提假设产生怀疑?更准确地说，在一枚硬币被重复抛掷8次的这个二项试验中，究竟出现什么结果时，我们应该对二项分布及其前提假设产生怀疑呢?是不是只要不是得到4次成功4 次失败这个最大可能性结果就开始怀疑，还是仅当出现8次成功或一次也不成功这两个极端情况时才产生

8、怀疑呢?这就是统计检验的核心问题。,2019/6/21,10,大数定理表明：就大量观察而言，事件的发生具有一定的规律性。根据概率的大小，人们处理的态度和方式很不一样。在日常生活中，人们往往习惯于把概率很小的事件，当作一次观察中是极不可能看到的事件。例如，人们出门做事就有可能遇到不测事故，但却很少人因此而不敢出门。原因是：小概率事件极不可能发生。,统计检验是指先建立一个关于总体情况的假设，继而抽取一个随机样本，然后以样本的统计量或者统计性质来检定假设。,统计检验的依据是小概率原理：一是认为小概率事件在一次观察中是极少出现的；二是如果在一次观察中出现了小概率事件，那么应该否定原有

9、事件具有小概率的说法或者假设。,2019/6/21,11,(1)建立假设,(2)求抽样分布,(4)计算检验统计量,(3)选择显著性水平和否定域,(5)判定,所所包有含统的计步检骤验,根据以往多年的统计表明，上海财大英语的平均成绩为90分，随机抽取100个学生，其平均成绩为80分，问今年财大学生的英语成绩是否下降？,2019/6/21,12,1建立假设统计检验是将抽样结果和抽样分布相对照而作出判断的工作。取得抽样结果，依据描述性统计的方法就足够了。抽样分布则不然，它无法从资料中得到，非利用概率论不可。而不对待概括的总体和使用的抽样程序做某种必要的假设，这项工作将无法进行。比

10、如通过掷硬币的实验得到二项分布，必须假设：样本是随机的，试验中各次抛掷相互独立；硬币是无偏的(或称是诚实的)，即pq05。概括地说，必须首先就研究总体和抽样方案都做出假设，再加上概率论，我们就可以对各种可能结果做具体的概率陈述了。,2019/6/21,13,2求抽样分布在做了必要的假设之后，我们就能用数学推理过程来求抽样分布了。比如在这一章开头，在硬币重复抛掷n次的理想实验中，我们计算了成功次数为x的宏观结果所具有的概率，得到二项分布。如果前提假设变动了，还可以求出其他形式的概率分布，如正态分布、泊松分布、卡方分布等等，它们都有特定的方程式。由于数学上已经取得的成果，实

11、际上统计工作者要做的这项工作往往并不是真的去求抽样分布的数学形式，而是根据具体需要，确定特定问题的统计检验应该采用哪种分布的现成的数学用表。,2019/6/21,14,3选择显著性水平和否定域在统计检验中，那些不大可能的结果称为否定域。如果这类结果真的发生了，我们将否定假设；反之就不否定假设。在统计检验中，通常把被检验的那个假设称为零假设（用符号H0表示），并用它和其他备择假设(用符号 H1表示)相对比。,零假设与备择假设,否定域,2019/6/21,15,在统计检验中，无论是拒绝或者接受原假设，都不可能做到百分之百的正确，都有一定的错误。第一类错误是，零假设H0实际上是正

12、确的，却被否定了。第二类错误则是，H0实际上是错的，却没有被否定。遗憾的是，不管我们如何选择否定域，都不可能完全避免第一类错误和第二类错误，也不可能同时把犯两类错误的危险压缩到最小。对任何一个给定的检验而言，第一类错误的危险越小，第二类错误的概率就越大；反之亦然。一般来讲，不可能具体估计出第二类错误的概率值。第一类错误则不然，犯第一类错误的概率是否定域内各种结果的概率之和。,两类错误及其关系,2019/6/21,16,被我们事先选定的可以犯第一类错误的概率，叫做检验的显著性水平(用表示)，它决定了否定域的大小。因此，有人也把第一类错误称之错误。相应地第二类错误被人称为

13、错误。在原假设成立的条件下，统计检验中所规定的小概率标准一般取为=0.05或=0.01。由所决定的否定域与接受域之间的分界值被称为临界值，如Z 。如果抽样分布是连续的，否定域可以建立在想要建立的任何水平上，否定域的大小可以和显著性水平的要求一致起来（后面的正态检验就如此）。如果抽样分布是非连续的，就要用累计概率的方法找出一组构成否定域的结果。,显著性水平,2019/6/21,17,根据否定域位置的不同，可以将假设检验分为双侧检验和单侧检验。,在统计中，必须把否定域分配到抽样分布的两端的检验，被称为双侧检验。,在统计中，可以事先能预测偏差方向，因而可以把否定域集中到抽样

14、分布更合适的一端的检验，被称为单侧检验。,双侧检验和单侧检验,2019/6/21,18,奈曼皮尔逊 (NeymanPearson)提出了一个原则 “在控制犯第一类错误的概率不超过指定值的条件下, 尽量使犯第二类错误小”按这种法则做出的检验称为“显著性检验”, 称为显著性水平或检验水平。,在同样显著性水平的条件下，单侧检验比双侧检验更合适。因为否定域被集中到抽样分布更合适的一侧，这样在犯第一类错误的危险不变的情况下，减少了犯第二类错误的危险。,2019/6/21,19,4计算检验统计量在完成了上述工作之后，接下来就是做一次与理想试验尽量相同的实际抽样(比如实际做一次重复抛掷硬

15、币的试验)，并从获取的样本资料算出检验统计量。检验统计量是关于样本的一个综合指标，但与我们后面参数估计中将要讨论的统计量有所不同，它不用作估测，而只用作检验。 5判定假设检验系指拒绝或保留零假设的判断，又称显著性检定。在选择否定域并计算检验统计量之后，我们完成最后一道手续，即根据试验或样本结果决定假设的取与舍。如果结果落在否定域内，我们将在已知犯第一类错误概率的条件下，否定零假设。反之，如果结果落在否定域外，则不否定零假设，与此同时，我们就有了犯第二类错误的危险。,2019/6/21,20,例若想通过抛掷10次硬币的实验来检验这个硬币无偏的零假设，通过双侧检验0.10显著

16、性水平，请指出否定域。如果单侧检验（p0.4),2019/6/21,21,第三节正态分布,如果说二项分布是离散型随机变量最具典型意义的概率分布，那么连续型随机变量最具典型意义的概率分布就是正态分布了。一般地讲，若影响某一变量的随机因素很多，而每个因素所起的作用不太大且相互独立，则这个变量服从正态分布。更为重要的是，不论总体是否服从正态分布，只要样本容量n足够大，样本平均数的抽样分布就趋于正态分布。正态分布是最重要的概率分布：（1）许多自然现象和社会现象，都可用正态分布加以叙述；（2）当样本足够大时，都可用正态近似法解决变量的概率分布问题；（3）许多统计量的抽样分布呈正态分布。,2019/6/21,22,1. 正态分布的数学形式,正态分布性质：（1）正态曲线以x=呈钟型对称均值=中位数=众数（2）在x=处，概率密度最大；当区间离

展开阅读全文