《心理学统计第二部分单样本和双样本假设检验》由会员分享,可在线阅读,更多相关《心理学统计第二部分单样本和双样本假设检验(75页珍藏版)》请在金锄头文库上搜索。
1、第五章 假设检验导论:单样本的z检验A根本概念零假设检验统计决定一类错误和二类错误单侧检验和双侧检验在前四章中,我们对描述性统计做了介绍。特别是通过z分数我们可以计算个体在总体分布中的位置和样本在抽样分布中的位置。换句话说,我们可以描述个体或者样本的特殊性。那么处于怎样的位置才算是特殊呢?这种特殊性有怎么来验证呢?这些问题是假设检验所要解决的问题。最简单的假设检验是将一组被试与总体进行比较,且总体均数和标准差。举个例子,硕士研究生考试包含笔试和面试,面试在最终录取中起到了很大的作用,因为导师更看重素质而不是分数。有个导师声称,他的眼光很准,他可以看一下学生的眼睛,就能找到好的学生。我们要对他的
2、说话进行验证。如果我们用智商来代表一个学生的素质尽管可能并不适宜,那么刚刚的问题就变成了那个导师可以通过看学生的眼睛来判断他的智商。我们可以通过如下方式进行检验:让他通过自己的方式挑出25个学生,然后比较这些学生的智商是否真的较高。被试组选择要验证该导师的说法,我们要让他选25个他认为高智商的同学,但是这种选择需要加以限制。如果该导师直接奔向基地班,那这种选择显然是无效的。可选择的方法是,把学校所有学生的照片都找来,让其通过相貌来确定。这样学校的每一个学生都有相同的时机被选到,而且每一次选取独立于其他的选取。也就是遵循随机取样的原那么。如果该导师选出的学生的平均智商确实高于总体平均,我们能否确
3、认他确实眼光很准呢?答案是不能。原因在于,我们随便找一个人去选,选出的学生的平均智商都不太可能等于总体平均数。从均数的抽样分布,我们可以得知,高于总体平均数的可能占50%。也就是说该导师选出的学生平均智商高于总体均数的原因可能是随机因素。这时,我们可以先做出一个假设,对其进行验证:选取学生的平均智商并不显著高于总体均数,其差异是随机抽样产生的,并不涉及一个特别的选择过程。这就是零假设检验。接下来,我们要做的就是随机选取25个学生测其智商,重复n次,看有多少次能选到比那个导师选取的学生平均智商更高。也就是确定其概率。上述的做法会得到智商均数的一个分布,由于这个分布显示的是零假设没有特殊操作,随机
4、选取为真时发生的情况,因此被称为零假设分布。在单样本检验且总体标准差的情况下,这个零假设分布就是均数的抽样分布。通过这个零假设分布,我们可以算出选出比那个导师选择的学生组平均智商更高的概率是多少。通过z分数来计算,比方该导师选取的25个学生平均智商为104,总体均数为100,标准差为15.那么查表可知,对应的概率为0.0918。这个概率是通过随机选择而得到该分数的概率,被称为p值。统计决定算出其概率之后,我们要做的是做出个统计推断。因为推断的做出是基于概率的,如果要得到该导师的选择是无效的,也就是说该组学生的平均智商高于总体是随机抽样造成的,我们需要冒一定的风险。小概率事件也时有发生。我们需要
5、承担的这个风险量被称为水平。 是我们愿意承担的零假设成立的概率。如果实际算出的概率要低于,那么我将会拒绝零假设。心理学中,每20次中有1次时机能抽到的水平被认为是能接受的最大风险值。也就是0.05.如果采用0.05的水平,且实验p值小于0.05,那么我们可以再0.05的显著水平上拒绝零假设。也就说,那位导师的眼光显著好于一般人。如果p大于0.05,我们会认为那位导师的挑选完全无效吗?一般情况下,我们会说没能拒绝零假设证据缺乏。这是数学家Fisher的观点:认为我们要么拒绝零假设,要么保存做出决定的权利。而Neyman和Pearson那么认为,应该提出与零假设互补的备择假设,因此拒绝其中一个就说
6、明倾向于接受另一个。在上边的例子中,我们把智商转换成了z分数,然后进行统计检验。这种情况下,z分数被称为检验统计量。后边我们还会讲到t分布。检验统计量的分布被认为是零假设分布。Z分数越大,p值越小,差异越显著。一类错误和二类错误前面提到,如果p值远小于0.05,我们拒绝了零假设,但我们还是要承担一定的风险。比方,我们通过考试来评估学生能力,90分对应着p=0.05,那么我们那么会认为90分以上的学生为好学生。但是如果一些学生参加了考试辅导,老师帮他们赌到了一些考试题,使得他们平均分高于90。在统计检验中,我们发现p小于0.05,那我们会得到结论,这些同学能力高于一般水平。这时,我们显然犯了一个
7、错误。也就是我们拒绝了这些学生水平的一般的假设零假设,而零假设才是真的,这种错误称为一类错误。虚报、存伪如果另一组学生平时学习很好,但是由于考试当天集体食物中毒,拉肚子,导致考试成绩不高,p大于0.05,统计推断结果接受零假设,这些学生成绩一般。这种情况下,我们就犯了二类错误,即零假设为假而我们却接受了它。漏报、去真研究者的决定实际情况零假设为真零假设非真接受零假设正确决定p=1- 二类错误p=拒绝零假设一类错误p= 正确决定p=1-一类错误会产生误导。比方你的实验结果证明你的某种训练可以提高注意力,而注意力的集中有利于学习成绩的提高。那么别人就可能认为你的训练有利于提高学习成绩。但是如果在你
8、的实验中犯了一类错误,那么其他人用你的训练方法时并不能提高学生的成绩。降低一类错误的方法就是屡次重复实验或者测量,反复证明训练对注意力提高的有效性。另一种降低一类错误的方法就是选取更低的水平。但是降低水平会导致更多的二类错误。水平人为地设为0.05实际上在一类错误和二类错误的可能负性后果之间寻求一种妥协。在某些特殊的研究中,比方治疗癌症的药物研发中,应选取较大的值。因为这种情况下犯二类错误的后果是相当严重的。单侧检验和双侧检验如果前面提到的那位导师挑选的学生平均智商是90,这时我们不会拒绝零假设。那此时我们是不是就接受零假设,认为这个导师眼光一般呢?我们不能,因为还有另一种可能,该导师眼光很差
9、。这样问题就修正为要验证该导师眼光特殊很好或者很差。在之前的检验中,我们要验证该导师的眼光很好,用的单侧单尾检验,也就是在Z大于0的一侧。现在的问题就变成了双侧双尾检验,也就是要看分布的两端。计算样本z分数,单侧和双侧无区别,差异在于p值,双侧是单侧的2倍。在刚刚的例子中,我们犯了一个错误,那就是我们先假设那个导师眼光好,用了单侧检验,发现不能拒绝零假设;然后我们改变主意做了双侧检验。这样做增大了一类错误的概率。单侧的0.05加上双侧中另一侧的0.025。正确的做法是在做假设检验之前确定是做单侧操作导致更好或者更差检验,还是双侧检验操作会引起差异,不管好坏。B根本统计过程提出假设选择统计检验和
10、显著性水平选择样本和收集数据求拒绝区域计算检验统计量做出统计推断解释结果单样本z检验的前提条件提出假设首先给定一个希望推翻的零假设。以IQ作为因变量,总人口的平均IQ为100零假设H0:=100备择假设HA:双侧:100,单侧; 100或者t(0.05),拒绝零假设,大学教师待遇确实提高了。大样本z检验和单样本t检验中的样本量在前边讲到的大样本z检验和单样本t检验中都存在的一个问题是样本量究竟要取多少?我们通过样本来估计总体,取的样本量越大,越能代表总体,而且样本量越大,越容易得到统计显著性结果。第一,对于t检验,样本量意味着自由度,自由度越大,t的临界值越小;第二,增加样本量会增加计算所得的
11、t值或z值。但是也要注意,太大的样本量会使得即使在实验效应本身很微小或缺乏实际意义的情况下统计结果到达显著。练习:医院有25名失眠病人,测其焦虑抑郁指数平均为70,标准差为10,一般人的焦虑抑郁指数平均为65,问失眠病人比一般人更焦虑吗?估计总体均数前边我们讲到了几种情况:总体均数和标准差;或者总体均数,标准差未知。这些情况下,我们可以分别运用单样本z检验以及大样本z检验或者单样本t检验来解决问题。但在实际的心理学研究中更多的情况是,总体的均数和标准差都未知。这个时候,我们可以用随机样本来估计总体的均数。样本量越大,样本均数就越可能接近总体均数。通过随机样本来估计总体均数,有两种估计方法:点估
12、计:用单个数字来估计总体均数,比方样本均数;区间估计:通过一个区间数值范围来估计总体均数,置信区间。以均数为中心,占据面积95%或99%的区间。估计大学生一个月的生活费,点估计平均生活费700元,区间估计平均生活费在600到800之间。B根本统计过程求总体均数的置信区间选择样本量:样本量越大,置信区间越小越精确;选择置信水平:95%;选择随机样本和收集数据:置信区间的准确度依赖于样本的真随机程度;计算区间的上下限:大样本: 小样本:练习:在华师随机抽取了100个学生,测得平均智商为110,标准差为10,计算华师学生总体的平均智商是多少?如随机选取的学生是25个,那华师学生总体的平均智商是多少?
13、区间估计和零假设检验很相似,主要的区别在于样本均数和总体均数的角色互换。单样本t检验和针对总体均数置信区间的前提假设:独立随机抽样正态分布或者t分布抽样总体和对照总体的标准差相等第七章 两独立样本均数t检验前面我们讲到了几种样本均数和总体均数比较的假设检验:当总体均数和标准差的情况下,用单样本z检验;当总体均数,标准差未知的情况下:如果样本数目足够大,用大样本z检验;如果样本数目较小,用单样本t检验;如果总体均数和标准差均未知,就要用样本来对总体均数进行点估计和区间估计。前面讲的都是一个样本均数与总体均数的比较,在心理学的研究中,较少会碰到这样的情况。更多的情况是对两组人男女、聪明人和笨人或实
14、验中变量的两个水平吃药与否、真假字进行比较。比方,我们想知道男性和女性在记忆力上是否具有显著的差异。我们可以随机抽取男性n1和女性n2名,对其进行短时记忆广度测验,来比较他们的得分均数之间是否有显著性差异,其差值是否足够大。首先我们要提出零假设,也就是男女记忆力无差异,即备择假设即为对该假设进行检验,我们需要构造一个差值的零假设分布,也就是说随机选男女两组进行记忆力比较m次趋近无穷大,我们就可以得到m个差值,这些差值的分布就构成了零假设分布。要看男女在记忆力是否有差异,也就是要看如果随机选取两组样本有多大的概率能够选到差值为由于是零假设分布,所以其平均值为零。那么它的标准差是多少呢?这个差值分
15、布的标准差被称为差值的标准误我们知道均数抽样分布的标准误为如果两个样本的标准差均,那么差值的标准误也具有类似的形式总体标准差的单样本统计检验公式为两样本的统计检验公式也相似由于我们的零假设是 ,因此这局部可以省略。在很多心理学研究中的零假设都是两组均数无差异。但是,也存在这样的状况,比方想要了解某种增高药物的效果是否具有性别差异,男女身高及其增量本来就是有差异的,这时要考察的是这个增量有没变化,那么零假设应该是如果男女记忆力的总体标准差未知,这样就需要通过样本来估计总体。如果样本足够大,那么可以进行针对两个独立均数的大样本检验。和前边检验的差异在于用无偏估计的样本标准差来代替总体标准差如果样本
16、数量较小,那么采用t检验。上边的公式由于每一个样本方差被它的样本数单独相除,因此被称为单独方差t检验。不幸的是,这个公式并不简单遵循t分布。这种情况下,我们可对上述公式进行修正,使之适用于t分布。这个修正的前提是假定两个总体方差相等,也就是方差齐性。这个修正涉及的是估计差值的标准误由于这一估计 的修正方式涉及两个样本方差的联合问题,所以称之为联合方差t检验。由于修正的前提是两个总体方差相等,这样对两个总体方差的估计就变成了对一个总体方差的估计。修正的方法就是把两个样本的方差联合起来形成一个对总体方法的单一估计。这个联合产生的方差称为联合方差样本方差的无偏估计是平方和除以自由度联合方差为差值的标
17、准误为用联合方差来估计总体方差就可以得到带入针对两样本均数的t分布公式可得这就是联合方差t检验的公式,它服从t分布,可以通过查表来做假设检验。练习:研究颜色辨识力好坏对颜色记忆的影响。把50名被试按颜色辨识力排序后平均分配到两组,要求被试从短暂呈现的画面中回忆物体是由哪些颜色组成的。高辨识力组被试回忆颜色均数为12,标准差为4;低辨识力组被试回忆颜色均数为9,标准差为5.那么结论如何?B根本统计过程两样本t检验:提出假设选择统计检验和显著水平选择样本和收集数据求拒绝区域计算t值统计推断两独立样本t检验的前提假设两独立随机抽样t检验的假设前提:独立随机抽样: “独立性针对每一个样本而选出的任一个
18、体应该独立于另一个样本的所有个体;“随机真随机几乎不可能,可将选定的被试随机分到两个实验组。正态分布方差齐性: 联合方差t检验只有在两个总体方差相等方差齐性时才严格有效。以下情况进行两样本假设检验可不考虑方差齐性:两个样本数量很大大于100,可用z临界值来检验;当两个样本数量相等时,可用单独方差t检验;当两个样本方差很相近小于2倍时,可不做方差齐性检验就进行联合方差分析。可以把方差不齐性作为实验结果来处理。两样本t检验适用范围:可用于分析从两个已经存在的总体抽取样本数据准实验或者分析两个随机分配样本的数据数据。适用条件:t检验只有在因变量为等距或者等比量尺时才适用。练习:z(0.05)=1.6
19、5, z(0.025)=1.966个小学生的IQ分数分别为111,103,100,107,114,102,请计算其有偏方差和无偏方差;假设智商服从均数为100,标准差为15的正态分布,当样本量为20时,详细描述一下均数的抽样分布均数、标准误、分布类型;某个老师认为他的学生要比一般学生聪明,36名学生的平均智商为105,假设总体均数为100,标准差为16,这个老师的说法对吗?某个快班的25名学生的平均智商是105,标准差是14,总体均数为100,那么这些学生进快班是因为聪明呢还是勤奋呢?对7例急性精神分裂症患者和10个慢性患者进行思维清晰性检测,其中急性组均数为52,标准差为12,慢性组均数为44,标准差为11,那么两组有差异吗?单侧t(24,0.05)=1.711,双侧t(24,0.05)=2.046;单侧t(15,0.05)=1.753,双侧 t(15,0.05)=2.131第八章 统计检验力和效应量本章只介绍一个概念效应量: