北大心理学课件-第四周课程(下)

上传人:wt****50 文档编号:50762289 上传时间:2018-08-10 格式:PPT 页数:40 大小:335.50KB
返回 下载 相关 举报
北大心理学课件-第四周课程(下)_第1页
第1页 / 共40页
北大心理学课件-第四周课程(下)_第2页
第2页 / 共40页
北大心理学课件-第四周课程(下)_第3页
第3页 / 共40页
北大心理学课件-第四周课程(下)_第4页
第4页 / 共40页
北大心理学课件-第四周课程(下)_第5页
第5页 / 共40页
点击查看更多>>
资源描述

《北大心理学课件-第四周课程(下)》由会员分享,可在线阅读,更多相关《北大心理学课件-第四周课程(下)(40页珍藏版)》请在金锄头文库上搜索。

1、Chapter8 假设检验初步 *1假设检验要解决的问题l处理组之间的平均数差异l处理组之间的平均数差异是偶然造成的,处理本 身没有效应l处理组之间的平均数差异是由处理的效应造成的l假设检验用来发现属于哪种情况l标准误l概率Date2假设检验的定义l假设检验是用样本的数据来评估对于一个总体 参数的假设l步骤l先提出一个关于一个总体的假设。例如考研(心 理学)的人智商都要高于普通人。l从考研的总体中,得到一个100人的随机样本l用样本的数据来检验假设。两种结果:支持或者 反对Date3假设检验 l假设检验 (Hypothesis testing)是一种用样本数据来评价有关总体 的某一假设的可置信

2、性的推论程序。 l换句话说, 我们以样本为依据,对总体作出判断. l例: 我们想知道心理学的学习成绩和性别的关系. l假定女性要好于男性. l取本课程中的女性和男性. l在期末考察他们的学习成绩. l这里的总体是什么? l1)学心理学的女性 2) 学心理学的男性l- 这里的问题是, 两个总体是否不同? 或者说, 女性学心理学的成绩是否好于 男性l女性的平均成绩84分,男性79分l-问题: 这 5 的差异是 “真实的“ 还是由于取样误差造成的? l如果差异是 “真实的”,那么我们可以得出结论:这两个总体是不同的, 女性的 学习心理学的成绩好于男性。 如果差别是由于取样误差造成的, 那么我们应 该

3、得出结论:两个总体其实没有什么差别, 男女在学习心理学的成绩上没有 差异。Date4基本逻辑l假设检验背后的基本逻辑是:总存在两个假设:虚无假设(null hypothesis)备择假设 (alternative hypothesis)l虚无假设 (H0) 预测总体中自变量(处理)对于因变量不产生效应。l备择假设 (H1) 预测总体中自变量(处理)对于因变量产生效应。 l假设检验的逻辑是假定我们尝试拒绝虚无假设, 即我们要尝试证明 备择假设 .为什么? l一般说来, 显示一件事不是真的比证明这件事是真的容易些。尤其 是在考察样本时,我们根本无法了解整个总体中, 除样本之外的 个体的情况。 Da

4、te5为什么尝试拒绝虚无假设?l一般说来, 显示一件事不是真的比证明这件事 是真的容易些。尤其是在考察样本时,我们根 本无法了解整个总体中, 除样本之外的个体 的情况。 l假设: 所有的狗都有 4 条腿. l要拒绝这个假设: 只需拿出一个包括至少1只不是4 条腿的狗的样本l要接受这个假设: 需要检查总体中的所有狗,逐个 数腿的个数 Date6例子一l做蛋糕的方子的例子l方子上的做蛋糕的一种原料看不清了l先假设它为鸡蛋l做出蛋糕以后看味道是否和原来一样l说明那个原料不是鸡蛋Date7例子二l法庭上对于罪犯的无罪假设( H0 )l基于无罪假设的推论和证据之间在常理上出现 矛盾l推翻H0,H1成立l

5、从而推出有罪Date8假设检验的逻辑 l假设检验的步骤 lstep1: 作出假设,选择一个决策标准l- 所做的假设是对于某一事件/处理/因素的效应(其导致总体间的 差异)的有根据的推测或预测- 所做的假设可以是一般的 (如., 统 计课程会改变阅读理解能力), 或者具体的(如., 统计课程会使阅读 理解能力增加10%). lstep2: 收集一个 样本 l从总体中随机选取个体- 随机分配所选取的个体到特定的处理组 l处理后, 主要问题是, 是所有的个体都属于同一总体, 还是因为处 理个体就属于一个新的总体。lstep3: 计算出考验统计量 l- 如z分数, t-考验, f-考验 (ANOVA)

6、 lstep4: 将考验统计量与某个发表比较以得出有关参数的推论,然后对 样本作出结论. l- 所观察到的差别有多大可能性是因为取样误差? 给出这个概率, 如何下结论? Date9拒绝虚无假设的标准 l现在我们面临的问题是. 我们由一个样本,其描述统计量与总体的 参数 (由 控制组的样本统计量反映出来)不同. 我们如何能决定发 现的差异是由于两总体间存在真实的差异还是由于取样误差所造 成? l要解决这一问题,研究者必须事先设定一个标准. l例如, 有一个总体 = 65 = 10, 取到一个均值是80的样本 (容量 为 n)的概率是多大? l“取到一个均值是80的样本的概率是0.0002. 这已

7、经很小了. 我有把 握说这个样本不是从这个总体中来, 它是来自另一个总体。“ l事先设定一个标准会为我们说“这已经很小了”提供更客观的依据. 这个事先设定的标准会限定概率有多小才足够拒绝虚无假设. 换言 之, 发现的差别有多大才可以拒绝虚无假设. l注意: 这惯例常常随学科不同而不同.例如, 一些领域认为 p Z临界, 那么,我们可以拒 绝 H0 l在这个例子中, 我们假设处理会在某一特定方向上造成差异 ( 即,处理会使均值增加). l但是,假设检验最提出的方式是作一个更一般的假设:处理应当 改变均值, 或增加或减少. Date23双尾考验 Date24假设检验的前提 随机样本 - 样本必须对

8、总体有代表性。随机取样有助于确保取样的代表 性.独立观察 也与样本代表性有关, 每个观察应该与所有其它观察是独立的 。一个特定的观察的概率应当保持恒定. 掷硬币 赌徒错误研究一 研究儿童的电视节目偏好 选了20个儿童,来自A家庭4,来自B家庭3 ,来自C家庭5,来自E家庭220个被试在一个房间里按照顺序判断纽约到曼阿密的距离从众群体压力已知且保持恒定 - 原总体的标准差必须保持恒定. 为什么? 一般的说,处 理就是假定对总体中的每一个个体都加上(或减去) 一个常数。所以总体 的均值可能因处理而导致变化。但是, 记住对每一个个体都加上(或减去) 一个常数并不改变其标准差. 取样样本是相对正态的

9、或者因为原始观察的样本是相对正态的, 或者因 为中心极限定理(或二者都有). l违反以上任何一个前提会严重地危及依据样本对总体作出推论的有效性( 应付种种违反前提的情况, 其它类型的推论统计需要用到)。Date25统计效力ltype II error()-H0 实际上是错误的, 但是实验结果没 有拒绝它。l当H0错误的时候必然有两种结果(概率相加为1)l错误的接受H0l正确的拒绝H0l统计考验的效力是该考验能够正确地拒绝一个错误的 虚无假设的概率. 所以效力是 1 - . l所以, 考验的“效力” 越高,侦察到处理效应的能力越大.l为了考察效力, 我们需要考虑H0错误的情形。当有两 个总体存在

10、时, 被处理的总体和虚无总体,效力就是 当虚无假设不正确时,获得落在临界区域内的样本数 据的概率. Date26l两个总体间差异大 l注意阴影区域 很大 l正确地拒绝虚无假设的 计划机会很大 l两个总体间差异小l注意阴影区域 很小l正确地拒绝虚无假设的 计划机会不大 Date27影响效力的因素 l增加 会增加效力. l单尾考验比双尾考验的效力高, 如果能够设定 正确的尾端。l增加样本容量会减少标准误从而增加效力。 Date28增加 会增加效力. Date29单尾考验比双尾考验的效力高, 如果 能够设定正确的尾端。 l单尾 考验 a = 0.05 l临界区域 (a) 全部在 样本的一边 l双尾

11、考验 a = 0.05 l临界 区域 (a)平均分 布在 样本的两边l结果是效力较小 Date30增加样本容量会减少标准误从而 增加效力。 ln 小 a = 0.05 l相对大的标准误 lN 大 a = 0.05 l相对小的标准误 l结果是效力较高 Date31本章回顾l什么是假设检验l假设检验的步骤lI 类错误和II 类错误l单尾和双尾检验l统计效力Date32t 统计量简介*33t 统计量 l与前面章节的重大差别:l前面章节:总体 m 和 s 均为已知l本章:处理总体s 未知的情况 (实际情况大部分是 这样),必须用 s 的估计值 某教师教授普通心理学已十个学期,期末考试分数总体上呈正态分

12、 布=42 ,=9。现在这班学生100人,尝试了新的教学方法,得到 期末考试分数的均值Xbar=46.5。新的教学方法有显著的效应吗( 用=0.05)?Date34t 统计量 某教师教授普通心理学,上学期期末考试分数总体上 呈正态分布=42 。学期有学生100人,尝试了新的教 学方法,得到期末考试分数的均值Xbar=46.5,s=9。 新的教学方法有显著的效应吗(用=0.05)?Date35Z 统计量 l一位研究者编制问卷来测量抑郁水平。他使用了一个非常多的“正 常”个体作标准化群体。其在这一测验上的均值和标准差为=55 ,=12。分数分布呈正态。测验中,高分表示抑郁程度高。为确 定测验是否对

13、那些有严重抑郁的个体有足够的敏感性,随机抽取了 一个抑郁症病人样本,对其进行测试。得到一组数据如下:59,60,60,67,65,90,89,73,74,81,71,71,83,83 ,88,83,84,86,85,78,79l病人在这一测验上的分数与正常人显著不同吗?用 Alpha = .01 的 标准作双尾的假设检验。Date36Z 统计量适用的情形举例l应用多年的标准化成就测验lLife Satisfaction ,GREl已确立常模的标准化心理测验lIQl二项分布Date37t 统计量 l什么可以作为 s 的估计值? l样本标准差=s =sqrt(SS/n-1) (第四章)lt = 样样本均值值 - 总总体均值值 (估计计) 标标准误误 Date38t 与 z 的不同适用条件l标准误的公式几乎是同样,计算出的考验统计 量也就非常接近. Date39t 与 z 的适用规则 l当 s2值已知, 用z分数 l当 s2值未知, 用s2 来估计 s2 ,则用 t-统计量. l同样的规则在对总体均值(如 置信区间)进行估 计时也适用. Date40

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号