第二部分单样本和双样本假设检验课件

上传人:我*** 文档编号:140963708 上传时间:2020-08-03 格式:PPT 页数:74 大小:233KB
返回 下载 相关 举报
第二部分单样本和双样本假设检验课件_第1页
第1页 / 共74页
第二部分单样本和双样本假设检验课件_第2页
第2页 / 共74页
第二部分单样本和双样本假设检验课件_第3页
第3页 / 共74页
第二部分单样本和双样本假设检验课件_第4页
第4页 / 共74页
第二部分单样本和双样本假设检验课件_第5页
第5页 / 共74页
点击查看更多>>
资源描述

《第二部分单样本和双样本假设检验课件》由会员分享,可在线阅读,更多相关《第二部分单样本和双样本假设检验课件(74页珍藏版)》请在金锄头文库上搜索。

1、第五章 假设检验导论:单样本的z检验,A基本概念,零假设检验 统计决定 一类错误和二类错误 单侧检验和双侧检验,在前四章中,我们对描述性统计做了介绍。特别是通过z分数我们可以计算个体在总体分布中的位置和样本在抽样分布中的位置。换句话说,我们可以描述个体或者样本的特殊性。 那么处于怎样的位置才算是特殊呢?这种特殊性有怎么来验证呢? 这些问题是假设检验所要解决的问题。,最简单的假设检验是将一组被试与总体进行比较,且总体均数和标准差已知。 举个例子,硕士研究生考试包含笔试和面试,面试在最终录取中起到了很大的作用,因为导师更看重素质而不是分数。 有个导师声称,他的眼光很准,他可以看一下学生的眼睛,就能

2、找到好的学生。我们要对他的说话进行验证。,如果我们用智商来代表一个学生的素质(尽管可能并不合适),那么刚才的问题就变成了那个导师可以通过看学生的眼睛来判断他的智商。 我们可以通过如下方式进行检验:让他通过自己的方式挑出25个学生,然后比较这些学生的智商是否真的较高。,被试组选择,要验证该导师的说法,我们要让他选25个他认为高智商的同学,但是这种选择需要加以限制。 如果该导师直接奔向基地班,那这种选择显然是无效的。可选择的办法是,把学校所有学生的照片都找来,让其通过相貌来确定。 这样学校的每一个学生都有相同的机会被选到,而且每一次选取独立于其他的选取。也就是遵循随机取样的原则。,如果该导师选出的

3、学生的平均智商确实高于总体平均,我们能否确认他确实眼光很准呢? 答案是不能。原因在于,我们随便找一个人去选,选出的学生的平均智商都不太可能等于总体平均数。从均数的抽样分布,我们可以得知,高于总体平均数的可能占50%。 也就是说该导师选出的学生平均智商高于总体均数的原因可能是随机因素。,这时,我们可以先做出一个假设,对其进行验证:选取学生的平均智商并不显著高于总体均数,其差异是随机抽样产生的,并不涉及一个特别的选择过程。这就是零假设检验。 接下来,我们要做的就是随机选取25个学生测其智商,重复n次,看有多少次能选到比那个导师选取的学生平均智商更高。也就是确定其概率。,上述的做法会得到智商均数的一

4、个分布,由于这个分布显示的是零假设(没有特殊操作,随机选取)为真时发生的情况,因此被称为零假设分布。 在单样本检验且总体标准差已知的情况下,这个零假设分布就是均数的抽样分布。,通过这个零假设分布,我们可以算出选出比那个导师选择的学生组平均智商更高的概率是多少。 通过z分数来计算,比如该导师选取的25个学生平均智商为104,总体均数为100,标准差为15.那么 查表可知,对应的概率为0.0918。这个概率是通过随机选择而得到该分数的概率,被称为p值。,统计决定,算出其概率之后,我们要做的是做出个统计推断。 因为推断的做出是基于概率的,如果要得到该导师的选择是无效的,也就是说该组学生的平均智商高于

5、总体是随机抽样造成的,我们需要冒一定的风险。小概率事件也时有发生。 我们需要承担的这个风险量被称为水平。 是我们愿意承担的零假设成立的概率。如果实际算出的概率要低于,那么我将会拒绝零假设。,心理学中,每20次中有1次机会能抽到的水平被认为是能接受的最大风险值。也就是0.05. 如果采用0.05的水平,且实验p值小于0.05,那么我们可以再0.05的显著水平上拒绝零假设。也就说,那位导师的眼光显著好于一般人。 如果p大于0.05,我们会认为那位导师的挑选完全无效吗?一般情况下,我们会说没能拒绝零假设(证据不足)。这是数学家Fisher的观点:认为我们要么拒绝零假设,要么保留做出决定的权利。 而N

6、eyman和Pearson则认为,应该提出与零假设互补的备择假设,因此拒绝其中一个就表明倾向于接受另一个。,在上边的例子中,我们把智商转换成了z分数,然后进行统计检验。这种情况下,z分数被称为检验统计量。(后边我们还会讲到t分布)。 检验统计量的分布被认为是零假设分布。 Z分数越大,p值越小,差异越显著。,一类错误和二类错误,前面提到,如果p值远小于0.05,我们拒绝了零假设,但我们还是要承担一定的风险。 比如,我们通过考试来评估学生能力,90分对应着p=0.05,那么我们则会认为90分以上的学生为好学生。但是如果一些学生参加了考试辅导,老师帮他们赌到了一些考试题,使得他们平均分高于90。在统

7、计检验中,我们发现p小于0.05,那我们会得到结论,这些同学能力高于一般水平。 这时,我们显然犯了一个错误。也就是我们拒绝了这些学生水平的一般的假设(零假设),而零假设才是真的,这种错误称为一类错误。虚报、存伪,如果另一组学生平时学习很好,但是由于考试当天集体食物中毒,拉肚子,导致考试成绩不高,p大于0.05,统计推断结果接受零假设,这些学生成绩一般。 这种情况下,我们就犯了二类错误,即零假设为假而我们却接受了它。漏报、去真,一类错误会产生误导。 比如你的实验结果证明你的某种训练可以提高注意力,而注意力的集中有利于学习成绩的提高。那么别人就可能认为你的训练有利于提高学习成绩。 但是如果在你的实

8、验中犯了一类错误,那么其他人用你的训练方法时并不能提高学生的成绩。 降低一类错误的方法就是多次重复实验或者测量,反复证明训练对注意力提高的有效性。,另一种降低一类错误的方法就是选取更低的水平。 但是降低水平会导致更多的二类错误。 水平人为地设为0.05实际上在一类错误和二类错误的可能负性后果之间寻求一种妥协。 在某些特殊的研究中,比如治疗癌症的药物研发中,应选取较大的值。因为这种情况下犯二类错误的后果是相当严重的。,单侧检验和双侧检验,如果前面提到的那位导师挑选的学生平均智商是90,这时我们不会拒绝零假设。 那此时我们是不是就接受零假设,认为这个导师眼光一般呢? 我们不能,因为还有另一种可能,

9、该导师眼光很差。 这样问题就修正为要验证该导师眼光特殊(很好或者很差)。,在之前的检验中,我们要验证该导师的眼光很好,用的单侧(单尾)检验,也就是在Z大于0的一侧。 现在的问题就变成了双侧(双尾)检验,也就是要看分布的两端。 计算样本z分数,单侧和双侧无区别,差别在于p值,双侧是单侧的2倍。,在刚才的例子中,我们犯了一个错误,那就是我们先假设那个导师眼光好,用了单侧检验,发现不能拒绝零假设;然后我们改变主意做了双侧检验。这样做增大了一类错误的概率。单侧的0.05加上双侧中另一侧的0.025。 正确的做法是在做假设检验之前确定是做单侧(操作导致更好或者更差)检验,还是双侧检验(操作会引起差异,不

10、管好坏)。,B基本统计过程,提出假设 选择统计检验和显著性水平 选择样本和收集数据 求拒绝区域 计算检验统计量 做出统计推断 解释结果 单样本z检验的前提条件,提出假设,首先给定一个希望推翻的零假设。 以IQ作为因变量,总人口的平均IQ为100 零假设H0:=100 备择假设HA:双侧:100,单侧; 100或者100,选择统计检验和显著水平,如果我们把单一样本的均数和总体均数比较,且已知研究变量的标准差,则适合的统计检验是单样本z检验。 水平如无特殊要求,设为0.05,选择样本和收集数据,为了保证检验的有效性,必须从所要研究的总体中随机抽取一个样本。 样本越大,假设检验的结果越准确。降低二类

11、错误 基于实际操作的考虑,样本大小会受到必要的限制。,求拒绝区间,拒绝区间可依据临界z分数确定。 临界z分数指z分数之外的面积正好等于值所对应的那个z分数。 双侧:临界z分数为1.96和-1.96,两侧各对应0.025;单侧:临界z分数分别为1.65或-1.65. 单侧比双侧更容易拒绝零假设。,计算假设检验量,做出统计推断,单侧:如果z大于或小于临界z分数,则拒绝零假设; 双侧:如果z的绝对值大于正的临界z分数,则拒绝零假设。 有时也可给出p值,特别是边缘显著。,单样本z检验的前提条件,因变量以等距或等比量尺测量 样本通过随机抽样获得 所测量变量在总体中为正态分布 所抽样总体的标准差与所比较总

12、体的标准差相同,单样本检验的多样性,检验一个已经存在的群体 完成一个单样本实验,为什么单样本检验很少采用,单样本检验的主要问题在于很难从研究的总体中抽取一个真随机的样本; 实验处理加到某一样本上,由于没有对照组很难排除混淆变量。,练习: 一个精神分析师正在检验一种新的抗焦虑药物,这种药物有降低心率的副作用。50个学生服药六周后的平均心率为70,。如果总体的平均心率为72,标准差为12,那么这个精神分析师可以下结论说新药物会显著降低心率吗?,一个心理学家测量了一个班级25个孩子的智商,想看其是否与同龄人有差异,已知智商平均数为100,标准差为15. (1)如果事先对该班孩子不了解,后测得其平均智

13、商为105,这群孩子智商特殊吗? (2)如果事先知道这班孩子是快班的,后测得其平均智商为105,这群孩子智商特殊吗?,第六章 区间估计和t分布,A基本概念,总体标准差未知的大样本z检验 t分布 单样本t检验 估计总体均数,上边我们讲到,如果我们把单一样本的均数和总体均数比较,且已知研究变量的标准差,则适合的统计检验是单样本z检验。 但是如果总体标准差未知呢? 举例,已知上个世纪九十年代中国人均寿命为70岁(这样的信息从网上很容易查到,但是标准差往往查不到),现在你想调查一下目前中国人是否人均寿命增长了。随机抽取了100个今年死亡的人,发现平均寿命为73,标准差为15。那么中国人比以前长寿了吗?

14、,如果总体标准差已知,我们可以轻松计算 现在未知,怎么办? 我们可以用样本的无偏标准差来代替 这就是大样本z检验,前提条件样本要足够大。,对上边提到的问题进行运算:总体均数70,样本数目100,均数73,标准差15,z(0.05)=1.65, z(0.025)=1.96 提出假设 选择统计检验和显著性水平 求拒绝区域 计算检验统计量 做出统计推断,练习:已知去年大学教师人均收入为50000元,现在随机抽取16名大学教师,调查得知他们今年的平均收入为60000元,标准差为10000元,问大学教师今年比去年待遇提高了吗?,很显然,上边的练习中样本数目不够大,其均数的抽样分布不符合正态分布,因此不适

15、用大样本的z检验。 值得庆幸的是,当样本数目较少时,其均数的抽样也满足一个比较规律的分布,即t分布。 t分布类似于标准正态分布。它也是呈钟形、对称、向两端无限延伸,且均值为零。t分布也是一个完全遵从某个数学公式的抽象数学概念。,t分布,由于均数的抽样分布为t分布,所以假设检验量不再是z分数,而是t分数。 公式和大样本z检验一样,也会得到一样的数值,那么大样本z检验和t检验的不同在哪里? 不同在于,服从不同的分布,相同的值会得到不同的拒绝区间。,与标准正态分布不同,t分布依赖于其所采样本的自由度,df=N-1 随着df增加,t分布越来越接近正态分布。 从图中可以看到,对于位于尾端区域的任何一个z

16、值,t分布的p都要大于正态分布,且df越小,p越大。也就是,样本较小时更难达到显著性水平。,前例中,总体均数为50000,样本量为16,样本均数为60000,标准差为10000 查表可知df=16-1=15时,单侧t(0.05)=1.753, tt(0.05),拒绝零假设,大学教师待遇确实提高了。,大样本z检验和单样本t检验中的样本量,在前边讲到的大样本z检验和单样本t检验中都存在的一个问题是样本量究竟要取多少? 我们通过样本来估计总体,取的样本量越大,越能代表总体,而且样本量越大,越容易得到统计显著性结果。 第一,对于t检验,样本量意味着自由度,自由度越大,t的临界值越小; 第二,增加样本量会增加计算所得的t值或z值。 但是也要注意,太大的样本量会使得即使在实验效应本身很微小或缺乏实际意义的情况下统计结果达到显著。,练习: 医院有25名失眠病人,测其焦虑抑郁指数平均为70,标准差为10,已知一般人的焦虑抑郁指数平均为65,问失眠病人比一般人更焦虑吗?,估计总体均数,前边我们讲到了几种情况:总体均数和标准差已知;或者总体均数已知,标准差未知。这

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号