SPSS在教育与心理统计学的应用【心理辅导】

上传人:夏** 文档编号:568240794 上传时间:2024-07-23 格式:PPT 页数:431 大小:3.26MB
返回 下载 相关 举报
SPSS在教育与心理统计学的应用【心理辅导】_第1页
第1页 / 共431页
SPSS在教育与心理统计学的应用【心理辅导】_第2页
第2页 / 共431页
SPSS在教育与心理统计学的应用【心理辅导】_第3页
第3页 / 共431页
SPSS在教育与心理统计学的应用【心理辅导】_第4页
第4页 / 共431页
SPSS在教育与心理统计学的应用【心理辅导】_第5页
第5页 / 共431页
点击查看更多>>
资源描述

《SPSS在教育与心理统计学的应用【心理辅导】》由会员分享,可在线阅读,更多相关《SPSS在教育与心理统计学的应用【心理辅导】(431页珍藏版)》请在金锄头文库上搜索。

1、SPSS浙江师范大学教育学院心理系康春花1身心健康课程框架v一、教育统计与测量预备知识v二、相关分析v三、假设检验(独立总体)v四、假设检验(相关总体)v五、方差分析基础v六、一元线性回归分析v七、多元统计分析v八、问卷的质量分析v九、卡检验v十、复选题的处理与分析2身心健康教材与参考资料v教材:v张敏强 著 教育与心理统计学人民教育出版社v参考资料:v1.张厚粲 著 心理与教育统计学北京师范大学出版社v2.金瑜 著 心理测量华东师范大学出版社3身心健康教学目标v1.明白教育与心理统计学在教育与心理科学研究中的地位与作用;v2.掌握各种统计分析法的使用条件,能依据不同的研究问题选择正确的统计分

2、析法;v3. 根据研究目的,能正确解释各种统计分析结果;v4.理解各种统计分析法的相同与不同,结合研究问题,能巧妙地运用多种统计分析法为研究服务。4身心健康一、教育统计与测量的预备知识v(一)教育与心理统计学的研究对象与性质5身心健康v教育与心理统计学:是把数理统计的理论与方法应用到教育与心理领域,研究教育与心理现象的一门应用统计学,它是我们正确认识教育与心理现象数量特征的重要工具。6身心健康v(二)统计方法在教育领域中的作用v1.教育与心理统计是教育科学研究的工具v2.学习教育与心理统计有利于教育行政和管理工作者正确掌握情况,进行科学决策v3.教育与心理统计是教育评价不可缺少的工具v4.学习

3、教育与心理统计有利于训练科学的推理与思维方法7身心健康v1.教育与心理统计是教育科学研究的工具v(1)研究范式与方法v 在社会科学研究中,其方法从总体上讲可以概括为质的研究方法(qualitative research)和量的研究方法(quantitative research)两种,这两种方法是不能相互取代的,而是相互补充的。8身心健康研究范式与方法9身心健康 图1-1心理与教育研究的一般过程10身心健康v(2)心理、教育科学研究与理论构建v a 归纳理论的构建v 归纳理论是从对研究数据的观察和分析中发展出来的能够解释现象或变量之间关系的概括性理论。归纳理论构建的逻辑基础是归纳推理,即从特殊

4、到一般,从事实到理论。v 研究者要观测、分析大量的事实,更主要的是要善于从复杂的数据中寻找具有普遍意义的模式或规律。11身心健康v如:美国社会心理学家格罗克1967年进行的关于宗教信仰的大规模调查,从大量数据事实中探讨了四个变量(性别、婚姻状况、年龄、家庭收入)与宗教信仰程度的关系,最后得出结论:在社会生活中最大程度地被剥夺了成功感和满足感的人倾向于信仰宗教,以获得慰藉和补偿(宗教的社会剥夺理论)。12身心健康vb 演绎理论的构建v 演绎理论是从某些一般性的规律出发对于某些特殊事件建立的理论。演绎理论的逻辑基础是演绎推理,即从一般到特殊,从理论到特殊事件。13身心健康v演绎理论的一般步骤是:v

5、a 选择研究课题,并确定一般性理论的应用范围;vb 确定研究的变量并使之操作化;vc 收集和分析有关变量之间关系的命题;vd 从命题出发进行逻辑推理,得出逻辑推理。14身心健康v如:从社会心理学中“人际交往对个人价值取向与行为方式的影响”理论出发来考察独生子女的心理和行为特点。v当然这些分析还需要调查和实验的研究来加以验证。天然的无选择的人际关系社会的个人选择的人际关系独生子女可能成长为较有独立性、自我定向以及灵活应付社会的能力较强的人少多15身心健康v c 机能理论的构建v 机能理论是指综合了归纳与演绎的成分,既强调数据,又强调解释的理论。v 事实上,在具体的研究中,归纳和演绎经常是结合在一

6、起的。16身心健康 图1-2心理与教育研究中的归纳和演绎17身心健康天然的无选择的人际关系社会的个人选择的人际关系独生子女可能成长为较有独立性、自我定向以及灵活应付社会的能力较强的人少多调查或实验比较独生子女与非独生子女在独立性、自我定向和应付社会等方面的能力强弱独生子女心理与行为理论归纳演绎18身心健康vd 模型理论的构建 v 模型理论的构建以类比为基础,在认知心理学中运用比较多。19身心健康v 教育工作者对教育问题的研究不仅从定性的角度去认识,而且越来越注意从定量的角度去分析。v 而教育与心理统计学正是为实证主义研究(量的研究)服务的。这可以从以下量的研究的流程图中看出。20身心健康教育与

7、心理学量化研究流程图撰写研究成果21身心健康v如:v研究课题: 中学生时间管理倾向、心理健康与学业成绩之间的关系研究。v研究假设1:中学生的时间管理倾向、心理健康与学业成绩之间存在显著的相关关系;v研究假设2:对中学生时间管理倾向的训练能提高中学生的时间管理技能、心理健康程度和学业成绩。22身心健康v研究方法:v 收集资料的方法:问卷调查法v 实验法v 分析资料的方法:利用SPSS对数据资料进行统计分析(相关分析、t检验)v研究工具:时间管理倾向量表v MHT量表v 学业测量量表(考试卷)v实验设计:实验组、对照组前后测设计23身心健康v2.学习教育统计有利于教育行政和管理工作者正确掌握情况,

8、进行科学决策24身心健康v3.教育统计是教育评价不可缺少的工具v 教育评价质量的获取、整理、解释及评价结果的质量分析,都离不开统计方法。25身心健康v4.学习教育统计有利于训练科学的推理与思维方法v 统计研究是以大量数据并通过严密的逻辑推理去说明事物的本质,而不是靠个别事实。26身心健康v(三)教育与心理统计学的内容v1.描述统计v 描述统计,主要研究如何将实验或调查得到的大量数据简缩成有代表性的数字,使其能客观、全面地反映这组数据的全貌,将其所提供的信息充分显现出来,为进一步统计分析和推论提供可能。27身心健康v例如:v 描述学业考试中全校或班级的考试状况(平均成绩)、描述学生的升学率、及格

9、率或优秀率等。28身心健康v2.推断统计v 推断统计是以描述统计为基础,以解决由局部到全体的推论问题,即通过对一组统计量的计算分析,推论该组数据所代表的总体特征。 29身心健康v例如:v 随机抽取某校若干名学生的考试成绩,推断该校学生成绩与全市该类学生考试成绩的差异性。30身心健康v(四)统计概念和术语v1.随机现象与随机变量v 随机现象是一种不确定性现象.如考试、心理测验等。存在随机误差。v 我们把具有变化规律的表示随机现象各种结果的变量称为随机变量。如学生的身高、体重、性别、智商、成绩等等。v 随机变量具有离散性、变异性与规律性的特点。 31身心健康v2.变量的类型(1)连续变量与非连续变

10、量(间断变量、离散变量) (2)因变量与自变量随机变量按性质分有如下四种:(1)称名变量(Nominal)如性别、年级等。(2)顺序(等级)变量(ordinal) 如名次、等级评定、喜爱程度、品质等级、能力等级等。(3)等距变量(interval) 如天气温度、各种能力分数、智商等。(4)比率变量(ratio) 如身高、体重、反应时等。32身心健康v3.总体 个体 样本 v 总体是某一类所欲研究的对象的全体 。N v 构成总体的每个基本单元称为个体。x v 从总体中抽取的一部分个体,称为总体的一个样本。n总体(population)样本(sample)33身心健康v4.统计量与参数v统计量是描

11、述样本情况的统计指标。如 ,S,r等。v参数又称总体参数,是指描述一个总体情况的统计指标,用希腊字母表示。如 等34身心健康总体总体样本样本抽取部分个体抽取部分个体 统计量统计量统计量统计量 参参参参 数数数数 推断统计推断统计如:样本平均数如:样本平均数 样本标准差样本标准差S 样本相关系数样本相关系数r 如:总体平均数如:总体平均数 总体标准差总体标准差 总体相关系数总体相关系数描述统计描述统计各种概念之间的关系35身心健康v5.平均数、标准差v(1)平均数的概念v(2)方差与标准差的概念36身心健康v(1)平均数的概念v 观测值的总和除以观测值的总次数所得的商,总体平均数用表示,样本平均

12、数用 表示。37身心健康v(2)方差与标准差的概念v总体方差与标准差:v样本方差与标准差:38身心健康v如:数据(三位射击手的射击成绩) v A:7 7 8 8 8 9 9 R=2v B:4 5 7 8 9 11 12 R=8v C:1 4 7 8 9 12 15 R=14v谁的成绩更稳定?8对于谁的代表性更好?39身心健康v在心理学中,常用平均数与标准差建立量表的常模。v如:在SCL-90中,抑郁分量表的均值为1.50,标准差SD为0.59,如果某人的得分偏离常模团体平均数达到两个标准差时0.32,2.68 ,则可认为是异常。40身心健康v6.正态分布与t分布v(1)正态分布v 正态分布也称

13、为常态分布或常态分配,是连续随机变量的概率分布的一种。其概率分布是一种呈钟型的对称曲线,叫正态曲线或高斯曲线。v 某变量服从正态分布写作: X N( ) 41身心健康不聪明的人人数很多人很少人中等聪明的人聪明的人矮的人中等高矮的人高的人正态分布42身心健康100130120110908070 0 3 2 1-1-2-3( )原始分标准差正态曲线下的面积被分成不同的区域( =100, =10)43身心健康平均数决定曲线在横坐标上的位置(总体水平的高低)低分高分A的平均数B的平均数C的平均数y44身心健康标准差决定总体的离散程度(分布形态)低分高分平均数y分布A分布B分布C45身心健康v在正态分布

14、曲线下,标准差与概率(面积)有一定的数量关系。v 如:离开平均数正负1个标准差之间包含总面积的68.26%。其他见下表: 46身心健康100130120110908070 0 3 2 1-1-2-3(平均数)原始分标准差34.13% 34.13%13.59%13.59%2.15%2.15%.13%.13%47身心健康区域包括分数的范围(如果平均数为100,标准差为10)平均数和1个标准差曲线下包括所有个体的34.13%100-1101和2个标准差曲线下包括所有个体的13.59%110-1202和3个标准差曲线下包括所有个体的2.15%120-130超过平均数3个标准差以上曲线下包括所有个体的0

15、.13%130以上48身心健康同样区域包括分数的范围(如果平均数为100,标准差为10)平均数和-1个标准差曲线下包括所有个体的34.13%90-100-1和-2个标准差曲线下包括所有个体的13.59%80-90-2和-3个标准差曲线下包括所有个体的2.15%70-80超过平均数-3个标准差以上曲线下包括所有个体的0.13%70以下49身心健康v 正负1.96个标准差之间,包含总面积的95%;正负2个标准差之间包含总面积的95.44%;正负2.58个标准差之间包含总面积的99%;正负1.64个标准差之间包含总面积的90%;正负3个标准差之间包含总面积的99.74%。50身心健康v 任何正态分布

16、都可以通过 v 转换成标准正态分布。转化成标准正态分布后,所有的原始分数都变成了标准分数,所有的普通正态分布曲线下横坐标上的数据都转变成了标准正态分布下的标准分数,因而把不等单位的原始数据转变成了可以比较(加减乘除)的标准分数。 51身心健康v如上述正态分布XN vX为110的标准分为: 52身心健康 0 3 2 1-1-2-3标准分34.13% 34.13%13.59%13.59%2.15%2.15%.13%.13%v所有学生分数中84%的学生的分数低于1个标准分,即P(Z1)=0.84。即16%的学生的分数高于1个标准分。53身心健康v(2)t分布v t分布也是钟形对称的分布,与正态分布相

17、比,中间稍低而尖翘,两头高而平缓。v t分布因自由度的不同而形成不同的形态,而正态分布是由平均数和方差决定的分布,标准正态分布只有一条曲线,而t分布随着自由度的增大,曲线形态会越来越接近正态分布,当df趋近无穷时,t分布曲线与正态分布曲线重合。54身心健康55身心健康案例呈现1(仅作教学使用)v研究题目:“浙江省大学生人格状况调查研究”。v研究工具:“大五”人格问卷。v研究问题:v(一)该抽样调查的样本结构如性别、年级、学校人数结构v(二)浙江省大学生的人格现状描述v(三)浙江省大学生人格的性别差异研究56身心健康v(四)浙江省大学生人格的年级差异研究v(五)浙江省大学生人格的学校差异研究v(

18、六)浙江省大学生人格在性别与年级上是否存在交互作用v(七)浙江省大学生人格在性别与学校上是否存在交互作用v(八)浙江省大学生人格在学校与年级上是否存在交互作用v(九)高低人格类型与性别、年级、学校的关系57身心健康v收集资料的方法:问卷调查法。v分析资料的方法:v 问题(一)、(二):描述统计分析v 问题(三)、(四)、(五):一元推断统计分析v 问题(六)、(七)、(八):多元推断统计分析v 问题(九):卡方检验58身心健康案例呈现2(仅作教学使用)v研究题目:私立高中学生心理健康水平与其父母教养方式的相关研究。v研究工具:周步成的“学生心理健康综合测量(mht)”、“父母教养方式评价量表”

19、 。 v研究问题:v(一)私立高中学生心理健康水平的总体描述59身心健康v(二)独生与非独生子女MHT的差异v(三)学生MHT的文理科、性别差异v(四)学生MHT的年级差异v(五)父亲教养方式与学生MHT的相关分析v(六)母亲教养方式与学生MHT的相关分析v(七)父亲文化程度与学生MHT的关系v(八)母亲文化程度与学生MHT的关系60身心健康v收集资料的方法:问卷调查法v分析资料的方法:v问题(一)描述统计分析:平均数、标准差v问题(二)(三):假设检验v问题(五)(六):相关分析v问题(四)(七)(八):方差分析61身心健康 实证研究(量的研究)的论文格式:(一)题目 题目最好能表现研究的变

20、量关系(即关系是可验证的假设) 。如“学习困难儿童友谊质量、定向、孤独感的研究”(心理科学 2003年 第2期 P236。)(二)引言或前言 说明该研究的意义以及题目产生的过程;提出问题的背景材料;提出问题的假设并加以一定的阐述。62身心健康(三)研究方法 1.被试选择 被试的选择方式,被试的年龄、性别及相关信息,被试的数目、如何分组(实验研究)等体现被试总体的大概信息。(可用文字、描述统计分析图或表来说明) 2.研究材料(仪器材料) 63身心健康量表研究(如本例) 智力量表、学业成绩、孤独问卷、友谊质量问卷、定向问卷(交代问卷的效度及信度资料);如果是自编问卷应交代问卷质量分析过程。实验研究

21、 呈现自变量或测量因变量用的。如眼动仪 还应写明自变量如何呈现,呈现的时间和速度等。64身心健康 3.研究程序(实验程序)量表研究:指导语、如何进行测试。实验研究:实验设计,进行实验的原则、方法和步骤,指导语是什么,用什么措施控制了哪些条件等。(四)结果(对研究问题进行统计分析的结果) 以图或表的形式表示的统计结果。客观结果。65身心健康(五)讨论 这部分主要是要根据研究结果对所要解决的问题给予回答并指出假设是否得到证实。 如果研究(实验)结果不能充分说明问题或者各部分有矛盾,就要进行讨论,找出原因。 如果研究(实验)结果与其他研究者的同类研究结果不一致时,要进行讨论,提出自己的看法。 如果研

22、究(实验)得到意外结果,也要进行讨论。 还应对本研究的程序、所用仪器材料以及进一步研究提出修改意见和建议。66身心健康以上具体过程可参见:刘在花 许燕 学习困难儿童友谊质量、定向、孤独感的研究 心理科学 2003年,第2期, P236(六)结论 以概括的形式说明实验结果证实了或否定了什么问题。结论应确切地反映整个实验的收获。(七)参考文献 文献的作者、题目、出处、出版日期等。(八)附录 另外,有的研究(实验)还要求写“摘要”。“摘要”应写在题目下,正文前。200字左右。包括所解决的问题、方法、结果或结论等内容。67身心健康二、相关分析及其应用v案例案例1 对语文与教学成绩关系的统计处理对语文与

23、教学成绩关系的统计处理v 设想语文成绩与数学成绩之间有一定的相关,在小学阶段,语文成绩好的学生,可以更好的理解数学题目,在低年级更加明显。某些小学老师对这个问题很感兴趣,他们对参加考试的同学中,抽取10名学生,其成绩如下:68身心健康 学生 语文 数学 1 59 47 2 35 40 3 59 42 4 57 55 5 50 49 6 71 63 7 62 55 8 47 42 9 43 42 10 68 5769身心健康v【问题与思考】v 1.相关分析的原理是什么?v 2.相关分析的类别有什么?v 3.对于本案例该用何种相关来进行分析?70身心健康相关分析(描述两变量关系的量数)v1.什么是

24、相关关系v 变量之间的关系可以分为两类:v 一类是确定的函数关系,比如销售额(M)、价格(P)和销售量(Q)之间的关系为:M=P*Q;它们之间为一一对应的关系,知道其中两个变量,就可以确定第三个变量。71身心健康v另一类是统计相关关系。相关关系指的是变量之间有联系,但其密切程度又没有达到一一确定的因果关系。比如不同地区家庭的人均食品支出与人均收入的关系,收入高的地区,往往食品支出也高,但是相同收入的地区,食品支出不一定相同,这是因为后者还与地区物价以及不易测量的消费习惯等随机因素有关。72身心健康v 变量之间相关的密切程度可以用相关系数r来表示,其取值范围为-1,+1,绝对值r越接近1表明相关

25、密切程度越高,或者说一变量受另一变量的影响程度越高。可见具有函数关系的两变量,其相关系数一定为+1或-1。v 正相关:方向一致,如身高与体重成正相关。v 负相关:方向相反,如初学打字,练习次数越多,错误越少。v 零相关:不存在线性相关,如成绩好坏与身高无关,不是不相关,因为有可能是曲线相关。73身心健康图图7 74 4 相关系数示意图相关系数示意图 散点呈椭圆形分布,散点呈椭圆形分布,X X、Y Y 同时同时增减增减-正相关(正相关(positive positive correlation)correlation); X X、Y Y 此增彼减此增彼减-负相关负相关(negative corr

26、elation) (negative correlation) 。 散点在一条直线上,散点在一条直线上, X X、Y Y 变变化趋势相同化趋势相同-完全正相关完全正相关; ;反反向变化向变化-完全负相关完全负相关。 X X、Y Y 变化互不影响变化互不影响-零相关零相关(zero correlation)(zero correlation)零相关零相关74身心健康v2.相关系数的计算v 计算相关系数一般要求成对的数据,即若干个个体中的个体要有两种不同的观测值。例如每个学生的数学和语文成绩;每个学生的智力分数与学习成绩;每个学生的英语听力水平和口语水平。75身心健康v积差相关(积矩相关) v适用

27、条件: 连续变量 成对出现 正态分布 76身心健康v定义公式:v计算公式:77身心健康v例如,被试的身高(cm)和体重(公斤)均服从正态分布,求其相关密切程度。(r=0.792)被试12345678910身高170173160155173188178183180165体重5045474450535049524578身心健康vspearman等级相关v 适用条件: 两列变量都是等级或顺序变量的时候。 确定不了数据的分布形态的时候。 积差相关运算太繁,转用等级相关。79身心健康v 计算公式:v D为等级相减之差 例:学习 1 2 3 4 5 6 7 8 9 10纪律 1 4 3 2 9 5 6 8

28、 10 7 D 0 -2 0 2 -4 1 1 0 -1 380身心健康v3.对于本案例的分析v 由于语文和数学考试都是采用百分制,故可把它们都看作是连续变量,因而其相关分析可用积差相关来做。v =0.8381身心健康以上数据统计分析也可在以上数据统计分析也可在SPSS10.0中进行中进行v具体操作过程如下:v(1)菜单选择:Analyze/Correlate/Bivariate v(2)统计结果:v (3)结果说明:数学和语文成绩相关显著,相关系数为r=0.83(p0.01)。82身心健康三、假设检验及其应用1v案例案例2 对独生和非独生子女社会认知能力数据的统对独生和非独生子女社会认知能力

29、数据的统计处理计处理v 随着计划生育基本国策的推广,有越来越多的独生子女出现,独生子女问题一直是大家比较关心的问题。设想独生子女与非独生子女在社会性方面存在差异,有些研究者对这个问题很感兴趣,他们随机抽取独生子女7人,非独生子女12人,进行社会认知测验,测验题目共200题,在规定时间内答对算1分。测验成绩的数据如下:83身心健康非独生子女 独生子女 83 70 146 118 119 101 104 75 120 107 161 132 107 94 134 115 129 99 12384身心健康v【问题与思考】v 1.平均数差异显著性检验的原理是什么?v 2.平均数假设检验的类别有什么?v

30、 3.对本例的分析。85身心健康v1.平均数差异显著性检验的原理v 均值比较就是看两个样本中某变量均值不同,其差异是否具有统计意义,即能否通过样本平均数之间的差异去推论总体之间确实存在差异.86身心健康v 要解决这个问题,其步骤为:建立假设检验假设作出结论。v(1)关于假设v :两者在社会认知能力上无差异v :两者在社会认知能力上有显著性差异87身心健康v 虚无假设是统计推论的出发点,人们在进行研究时,总是从虚无假设出发,通过计算某一检验统计量来推翻虚无假设,从而得到希望证实的研究假设。88身心健康v(2)统计决策的原理v 统计决策的原理是“小概率事件原理”。v 在一次随机抽样中小概率事件不会

31、也不可能发生,小概率事件的小概率记为 ,称为显著性水平(Level of significant),所谓显著性水平就是研究者拒绝真的虚无假设时犯错误之最大概率值,通常取0.05,0.01三个值比较多。 v 在spss中,如果sig0.05或带有*(在文章中写作p0.05),就可以拒绝原假设,从而接受研究假设。89身心健康v 差异显著性检验的原理v 从样本(我们实际观察)的统计量的差异能否作出一般性结论总体参数之间确实存在差异。要检验这种差异,必须建立与之对立的虚无假设(不存在差异,是误差因素引起的),经过检验如果所得到差异超过了统计学规定的某一误差限度(横坐标上的界限值),则表明差异已经不属于

32、抽样误差,而是总体确实有差异,这种情况叫做差异显著,应拒绝虚无假设 。90身心健康v(3)检验统计量值(t检验与t值)v 平均数差异的检验均可以采用t检验,t值的计算为:t=(平均数之差)/SEv t值计算出来后,应该与临界值比较,如果t值大于临界值,此时sig0.05(p0.05),则拒绝原假设,接受研究假设,即认为平均数之间存在显著性差异。91身心健康 .95.05.05/2.05.05/2保留区域保留区域t值落在拒绝区域(发生了小概率事件) t(df) /2-t(df) /292身心健康v2.平均数假设检验的内容(Analyze/Compare Means/)v(一)单总体平均数差异显著

33、性检验(one sample t test)v(二)两独立总体平均数差异显著性检验(independent-samples t test)v(三)两相关总体平均数差异显著性检验(paired-samples t test)v(四)单因素方差分析(One-Way ANOVA)93身心健康v3.对本例的分析v 对本案例数据分析的统计学原理是什么?当然是双总体平均数假设检验,因为实验中有两组被试,其行为表现水平分别用各组被试测量值的平均数作为代表值,则其行为表现的差异性当然就是两组被试平均数差异的显著性检验的问题。94身心健康v 那么,该用独立总体平均数假设检验的方法还是用相关总体平均数假设检验的方

34、法呢?让我们来看看两相关总体的判断方法:其一、同一批被试的两列测量值是相关的;其二、一一严格配对的两组被试是相关的。故对本例而言,毫无疑问是两独立总体平均数差异显著性检验的问题。95身心健康v检验统计量为:v t=v服从df= 的t分布。96身心健康v检验过程:检验过程:v(1)作统计假设:)作统计假设: v(2)计算检验统计量)计算检验统计量 v 120 101v v =445.82v v v由于由于 、 差不多,故可认为两总体方差相等。差不多,故可认为两总体方差相等。97身心健康v 1.91v(3)由)由 =1.912.001,发生了小概率事件,应拒绝原假设,即认为实验班与对照班成绩存在显

35、著性差异。实验取得了显著效果。109身心健康 .95.05.05/2.05.05/2保留区域保留区域拒绝区域(发生了小概率事件) 110身心健康. .0505/2. .0505/2保留区域保留区域(0.95)拒绝区域 2.56111身心健康vSPSS操作:数据见“自主学习教学方式.sav”。vAnalyze/compare means/ Independent- samples T test,把“成绩”送入test variable中,把“group”送入grouping variable中,点击define groups按钮定义组别(1和2),ok。112身心健康113身心健康v结果说明:实

36、验班成绩显著好于对照班成绩t=2.56(p0.05),实验效应显著。114身心健康你是否能读懂这个表格?变量性别N平均数 标准差t值(P)学习压力男312 2.3892 .6561 2.324(*)女394 2.2774 .6175 社交压力男312 2.2668 .7318 2.934(*)女394 2.1095 .6883 生活压力男312 2.1982 .6451 3.530(*)女394 2.0332 .5936 自我发展与择业压力男312 2.4135 .7252 .603女394 2.3823 .6438 总体压力感男284 2.74 1.02 2.651(*)女377 2.54

37、.84 *P0.05 *P.01 *P.001115身心健康四、假设检验及其应用2v案例4:对对“品酒实验品酒实验”数据的统计处理数据的统计处理v 设想酒的颜色可以影响一个人对酒的喜爱程度,某些实验者对这个问题很感兴趣,他们研制了一种装置,这种装置可以在不改变酒味的情况下改变酒的颜色。在这个实验中,酒的颜色是深红色,它可以变成绿色。实验的因变量是愉悦评价。可以通过一个5等级量表来测量出被试的愉悦程度,自变量是酒的颜色。116身心健康v 下面是研究者在实验中涉及到的自变量、因变量及无关变量。 自变量酒的颜色 因变量评价(1-5个等级),1 2 3 4 5 v 没有愉悦 中等愉悦 非常愉悦v无关变

38、量控制:酒的温度应该保持恒定;光线不应太暗也不应太亮;顺序即第一种酒的品尝可能会影响对后一种酒的品尝;环境和他人的注视,主试对被试进行独立测验,而不应该分组进行,因为组内其他人的注视压力可能会影响一个人的评价。117身心健康v研究者在这个实验中采用了被试匹配设计被试匹配设计。因为主试认为被试变量如品酒经验可能对结果有很大影响。因此在品酒经验上对被试进行匹配,这样每对相匹配的被试就有相同的经验水平。v 自变量:酒的颜色;v 因变量:质量评价;v 匹配变量(无关变量):品酒经验;v 被试分配:把16名被试按照品酒经验分成8个区组,每区组内2个被试,每个被试接受一个处理。这样每组内的两个被试是一一匹

39、配的。 118身心健康实验数据如下:v 实验组(人工酒色)控制组(原色) dS11 2S21 3S31 2S41 1S51 1S61 2S71 3S81 1S12 4S22 5S32 5S42 5S52 4S62 4S72 5S82 4-2-2-3-4-3-2-2-3119身心健康v【问题与思考】v 1.平均数差异显著性检验的原理是什么?v 2.双总体平均数假设检验的类别有什么?v 3.对本例的分析。120身心健康v 平均数差异显著性检验的原理与前案例相同,那么,该用独立总体平均数假设检验的方法还是用相关总体平均数假设检验的方法呢?v 让我们来看看两相关总体的判断方法:其一、同一批被试的两列测

40、量值是相关的;其二、一一严格配对的两组被试是相关的。故对本例而言,毫无疑问是两相关总体平均数差异显著性检验的问题。121身心健康v 检验统计量为t= v服从df=n-1的t分布。其中,(d=X-Y)。122身心健康v t= =-10v接下来我们用软件把结果计算出来。123身心健康vSPSS过程:数据见“品酒实验.sav”。v(1)菜单选择:Analyze/Compare Means/Paried Samples T Testv(2)统计结果见:“品酒.spo” 124身心健康125身心健康v(3)结果说明:表一是描述统计量值;表二是t检验的结果,可以看出被试对人工酒色的评价显著低于对原色酒的评

41、价v(t=-9.979,P0.001)。126身心健康五、方差分析及其应用v案例5:三种自习指导方法的实验效果三种自习指导方法的实验效果v一位初中数学老师的困惑:v 在自习课上,采用不同指导方法对学生进行指导所产生的效果是否存在显著差异?为此,该老师设计了一个教学实验。 自变量自习指导方法,有三个水平: (a1:指导10分钟;a2:指导20分钟;a3:指导30分钟) 因变量:被试的数学测试成绩。 控制变量:学生本身的数学水平、作业量、教学方法等127身心健康v被试分配程序:该教师抽取3个平行班,每个班级随机接受一种自习指导方法的指导,对其它因素加以控制。v一个月后实验结束,进行数学测试。从每一

42、班级中随机抽出5名学生,他们的测验成绩如下,试分析三种自习指导方法的效果是否一致? 128身心健康三种自习指导方法的教学实验 指导方法被试 a1 a2 a3 1 2 3 4 5 69 73 71 67 70 76 81 78 69 76 74 76 70 76 74 70 76 74129身心健康v【问题与思考】v1.什么是方差分析,它与t检验有什么区别和联系?v2.方差分析的原理和步骤是什么?v3.对本例该如何进行分析?130身心健康v1.方差分析的原理v(1)方差分析的目的v 三个或多个平均数差异检验,采用的手段是用两个方差之比来作决策。例如,在本例中,就是比较三种自习指导方法的实验效果是

43、否一致,即三个样本所代表的总体平均数是否相等。131身心健康v(2)方差分析中常用的术语 因素(factor) 、水平(level) 因素指的是实验当中的一个自变量,如本例中的自习指导方法就是一个因素。 水平指的是因素的具体取值,如本例中的a1(10分钟)、a2(20分钟)、a3(30分钟)就是因素的三个水平。 132身心健康v比较(comparisons) 对各处理水平平均数之间差异的估计叫比较。当经过方差分析发现多个平均数之间存在显著性差异时,且因素的水平数多于2时,需要两两之间进行比较,进一步揭示出到底哪些水平之间比较是差异显著的,这就是比较的主要任务。133身心健康v(3)方差分析的基

44、本原理v 方差分析作为一种统计方法,是把实验数据的总变异分解为若干个不同来源的分量。因而它所依据的基本原理是变异的可加性(可分解性)。v 具体地讲,它是将总平方和分解为几个不同来源的平方和(这里的平方和指实验数据与平均数离差的平方和)。134身心健康v因变量受到两方面影响:自变量与随机因素(误差)135身心健康理解方差分析的逻辑v 把总变异分解为组间变异和组内变异。组间差异是由于实验处理效应造成的,因此也可将组间离差平方和记为SSA,组内差异是由于实验误差造成的,因此可将组内离差平方和记为SSE,E表示误差。v 如果实验数据的总变异主要是由实验因素(处理或自变量)造成的,那么在总变异中组间差异

45、将占较大比例,组内差异将占较小比例,这时有充分理由认为不同自习指导方法的实验效果不同,三平均数之间有显著性差异,拒绝原假设。 136身心健康137身心健康v(4)方差分析的基本过程 建立假设 目的是检验几种实验处理是否有显著差异,因此: 至少有一对 不等138身心健康求平方和 = = = = 139身心健康确定自由度和求均方 = , (组间自由度) = , (组内自由度)进行F检验140身心健康列出方差分析表,作出结论变异来源平方和 自由度均方F组间SSAK-1MSAF=MSA/MSE组内SSEN-kMSE总变异SStN-1141身心健康v2.对本例的方差分析v(1)建立假设v Ho:不同的自

46、习指导方法的效果不存在显著差异,即 v H1:至少有两种方法产生的效果存在显著差异v(2)平方和分解与计算v 平方和分解:SSt = SSw + SSb142身心健康v计算平方和:143身心健康v(3)确定自由度,求均方v 已知k=3, N=15,则 ,v v 各均方为: 144身心健康v(4)进行F检验 v(5)列出方差分析表变异来源平方和自由度均方F组间93.33246.67 4.59*组内1221210.17总变异215.3314 145身心健康v(6)做出结论v查附表:v则可以拒绝Ho,即三种自习指导方法的效果存在显著差异。146身心健康vSPSS过程:数据见“三种自习指导方法.sav

47、”。v(1)菜单选择:Analyze/Compare Means/One-Way ANOVA v(2)统计结果:147身心健康148身心健康v(3)结果说明v 表一是方差分析方差分析的结果,结果表明三种自习指导方法的效果存在显著差异的(F=4.59,P0.05)。v 表二是多重事后比较的结果,以进一步了解差异的实质。由结果知:指导20分钟比指导10分钟的效果更好,而指导20分钟和30分钟的效果差别不显著,指导10分钟和30分钟的效果差别也不显著。149身心健康六、 一元线性回归分析(Analyze/Regression/Linear)v案例6:识字率与城市化率关系的确定v 现有107个国家的城

48、市化率和识字率的数据。将识字率作为自变量,城市化率作为因变量,分析和建立识字率与城市化率之间的线性函数关系。150身心健康v【问题与思考】v1.相关分析与回归分析的区别与联系?v2.方差分析与回归分析的区别与联系,回归分析的原理与步骤?v3.对本例的分析。151身心健康v1.回归分析的意义回归分析的意义v 表示变量之间的不确定性关系以及关系的密切程度,统计学上可以用相关关系来表达。但对于不确定性关系的变量,如何通过自变量的值去估计和预测因变量的发展变化,相关系数却无能为力。v 这就需要引进一种新方法:回归分析。152身心健康v 回归分析:v 如果把其中的一个或一些因素作为自变量,而另一些随自变

49、量的变化而变化的变量作为因变量,研究他们之间的非确定性因果关系,看自变量对因变量是否有显著的预测作用,这种分析就称为回归分析。153身心健康v 回归分析的目的:v 就是确定变量之间数量关系的可能形式,并用一个数学模型来表示这种关系形式。154身心健康v2.回归分析的基本原理回归分析的基本原理v 回归分析的数学模型:v 这个模型假设因变量y受到k个自变量影响,同时还受到一些未知因素或随机误差影响,其中,自变量的影响用函数 来表示,而 表示随机误差。由于f是函数,对于自变量的每一组确定的值 是确定的,但由于 不确定,所以y也是不确定的。155身心健康v回归模型中的 虽然不确定,但是在每一组确定的自

50、变量值之下,所有的 都服从均数为0的正态分布,因而对于每一组自变量确定的值,因变量y也服从正态分布,其平均数就是:v 也称为回归的主值(回归方程),回归分析的一个重要任务就是求取回归方程。156身心健康v3.回归分析的主要内容(任务)回归分析的主要内容(任务)v 回归分析包括三大部分内容:建立回归方程、检验和评价所建立回归方程的有效性、利用所建立回归方程进行预测和控制。157身心健康v4.一元线性回归的模型及模型的建立一元线性回归的模型及模型的建立v(1)一元线性回归模型 v 一元线性回归研究的是具有线性相关关系的因变量和一个自变量之间的回归问题。v 其模型为: 其中 称一元线性回归方程, 称

51、为变量y对变量x的一元线性回归方程。158身心健康v 上述模型是针对总体而言的,但实际上我们经常调查的仅仅是从总体中抽取的样本,因而样本的回归方程为v 要建立回归方程实际上就是求a和b的值,其中a为常数,b为自变量的回归系数。v 例如:研究数学(x)与物理(y)的关系;识字率(x)与城市化率(y)的关系。159身心健康v 如研究问题:现有107个国家的城市化率和识字率的数据。将识字率作为自变量,城市化率作为因变量,分析和建立识字率与城市化率之间的线性函数关系。“一元线性回归.sav”v 就这个问题而言就是要建立一个这样的方程:城市化率=a+b识字率。160身心健康v(2)回归方程的有效性检验

52、v 回归方程有效性检验的原假设是:所求回归方程无效。v 假设的实际上是由自变量决定的回归方差并不显著大于剩余方差。但是如果经过F检验发现回归方差远远大于剩余方差(由误差解释的方差)则必须拒绝原假设,即所建立的回归方程有效。SPSS结果体现在方差分析表中。v 161身心健康v(3)回归方程有效性高低的指标v 在回归分析中衡量回归方程有效性高低的指标称决定系数或测定系数 162身心健康v 在一元线性回归中决定系数是因变量与自变量积差相关系数的平方。回归分析对所建立回归方程进行的有效性检验,其本质还是对变量相关显著性的检验。v 决定系数表明了自变量对因变量的解释量,或者说因变量中有百分之多少是由自变

53、量决定的,当然其值越大越好。163身心健康结合实例进行讲解(1)研究问题见(2)操作过程:我们要建立的是线性回归方程,那么在分析之前有必要看看因变量与自变量之间是否具有线性关系,作出一散点图便知,其操作为:Graphs/scatter/选择simple点击Difine按钮,把“城市化率”送入y轴,“识字率”送入x轴即可。通过散点图可以看出两变量之间具有很好的线性关系,因而可以进一步进行回归分析。 164身心健康 Analyze/regression/linear,把 “城市化率”作为因变量送入Dependent框中,“识字率”作为自变量送入independent框中,点击save,在predi

54、cted values中选中unstandardized和standardized要求建立含有未标准化和标准化的回归系数的回归方程。其他只要按默认的即可。165身心健康v(3)结果说明v 表格一表明我们是采用enter法进行的回归分析;v 表格二模型解释:R=0.657, =0.432,自变量对因变量的解释量为43.2%;166身心健康v 表格三回归方程有效性检验:F=78.185,p0.05,表明方程常数项应该为0,回归系数为0.678,p0.001。v 因而所求方程为y=0.678x;标准化回归方程为y=0.657x。169身心健康 由于方程可以不包括常数项,因此,我们重新进行回归分析,在

55、“option”中不选择“Include constant in equation”。 这时输出结果为:R为0.956,决定系数 为 =0.915; F=1113.633,p0.05;v年级存在主效应,F=4.698,P0.01;v性别*年级存在交互效应,F=5.058,P0.01.187身心健康性别与年级交互效应图188身心健康v 在因素实验中,一个因素的水平在另一个因素的某个水平上的变异叫简单效应(simple effects)。当方差分析中发现一个两次交互作用时,需要进一步做简单效应检验,以说明两个因素之间交互作用的实质。v 通过上图可以看出,各年级适应性水平在性别为1的大学生中可能存在

56、显著性差异。(是否正确?需进行简单效应检验)189身心健康 v 简单效应检验:分别在性别各水平上做年级的差异性检验。 v 分析过程:在(Data/select cases)中选择样本if sex=1和 if sex=2分别对“适应性”进行年级的单因素方差分析。v 结果发现:在性别为1上,适应性存在年级简单效应,而在性别为2上并不存在。190身心健康 性别为1时(F=7.539,P0.05)192身心健康 既然在性别为1上,年级之间存在显著性差异,我们可以进一步做事后比较。这样交互效应的实质就可以挖掘出来了。193身心健康性别为1时,年级效应的多重比较194身心健康结论如何写?v v 这样,在适

57、应性人格方面,年级主效应及性别*年级交互效应的实质就挖掘出来了,即大学生的适应性人格存在年级差异,这种差异主要表现在性别为1的大学生身上。195身心健康v 具体而言,在性别为1的大学生中,其适应性得分:v 大一低于大二和大四v(t=-1.79,p0.001;t=-2.48,p0.01);v大二高于大三(t=2.52,p0.05);v大三低于大四(t=-3.20,p0.05)。196身心健康v练习1:v 检验在其他分量表上是否存在性别与年级的交互作用?v练习2:v 检验3种小学语文实验教材,在4种不同教学方法中的教学效果。197身心健康教材*教学方法实验数据a1a1a1a1a2a2a2a2a3a

58、3a3a3b1b2b3b4b1b2b3b4b1b2b3b4839098697084869590547887808692636178839094537989198身心健康第二章 多元线性回归(Analyze/Regression/Linear)v案例8:多个自变量与因变量关系的确定。v 初始工资、工作经验、受教育年限(自变量)与当前工资(因变量)之间的关系预测。v【问题与思考】 v1.多元回归分析与多元方差分析的区别与联系?v2. 多元线性回归与一元线性回归的联系?v3.对本例的分析。199身心健康v 根据多个自变量的最优组合建立回归方程来预测因变量的回归分析称为多元线性回归分析。多元线性回归分

59、析的模型为:v 偏回归系数表示在控制其他自变量的情况下,某一个自变量变化引起因变量变化的比率。v 多元回归方程建立后,也需对方程有效性检验,采用的也是F检验。也要给出方程有效性高低的指标即多元决定系数 。200身心健康多元线性回归中的统计指标v1复相关系数 复相关系数R表示n个自变量组合与因变量y之间线性关系密切程度的指标。v2多元测定系数(决定系数、判定系数) 复相关系数的平方叫多元测定系数,在多元回归中也使用测定系数 来解释回归模型中自变量的变异在因变量中所占的比率。为了消除自变量的个数以及样本容量的大小对测定系数的影响,引进经调整的测定系数(Adjusted R Squre) 。 201

60、身心健康v 3零阶相关系数、部分相关与偏相关系数 v 零阶相关系数(Zero-Order)表示自变量与因变量之间的简单相关系数。v 部分相关(Part Correlation)表示在排除了其他自变量对 的影响后,当一个自变量进入回归方程模型后,复相关系数的平方增加量。 202身心健康v 偏相关系数(Partial Correlation)表示在排除了其他变量 的影响后,自变量与因变量y之间的相关程度。v 部分相关系数小于偏相关系数。偏相关系数也可以用来作为筛选自变量的指标,即通过比较偏相关系数的大小,判别哪些自变量具有较大的影响力,从而决定哪些自变量进入回归方程。因此回归方程有效性检验后,还要

61、对每个自变量与y的偏回归系数进行检验。 203身心健康多元回归分析的检验v1方差分析 多元回归方程也采用方差分析对回归方程进行检验,使用检验统计量为F。原理与一元回归分析同。 值得注意的是,经方差分析是对回归方程的整体的检验,回归方程有效,但回归方程中每个偏回归系数不一定都显著,或者说,某一个回归系数不显著时回归方程可能仍然显著,因此还需进行偏回归系数显著性检验。204身心健康v2偏回归系数与常数项的检验 偏回归系数是表示各个自变量与因变量y关系密切程度的指标,实际上也可以看出各个自变量对因变量的解释量。偏回归系数检验的目的就是剔除对因变量影响不显著的自变量。 检验的假设是:总体中回归方程各个

62、自变量偏回归系数为0,常数项为0。检验使用t统计量。 205身心健康v3.共线性问题 在回归方程中,虽然各自变量对因变量都有意义,但某些自变量彼此相关,即存在共线性的问题。因此,需要对回归方程中的变量进行共线性(collinarity)诊断。所谓共线性指的是由于自变量间的相关太高,造成回归分析之情境困扰。两变量间的相关系数越接近1,表明变量间的共线性越强。206身心健康v 方程的确定系数很高,且y与各自变量的相关系数也很高,但自变量的回归系数均不显著,表明自变量之间可能存在共线性问题。v 见下图207身心健康有多元共线性(自变量间非直交关系) 无多元共线性(自变量间直交关系)208身心健康v

63、在回归分析中,最好先呈现预测变量间相关矩阵,以探讨变量间的相关情形,如果某些变量间的相关系数太高,可考虑只挑选其中一个较重要的变量投入多元回归分析。209身心健康v 自变量间是否存在共线性问题,可以由以下指标判断:v1容忍度(Tolerance)。容忍度的值界于0至1之间,如果一个自变量的容忍度太小,表示此变量与其他自变量间有共线性问题 。v2.方差膨胀因子(variance inflation factor; VIF)。为容忍度的倒数,它的值越大,自变量间存在共线性的可能性越大。210身心健康v3.条件指数(condition index; CI) CI= ,在自变量相关矩阵之因素分析中,特

64、征值可作为变量间有多少个层面的指数,如果有数个特征值接近0,表示原始变量间有高的内在相关存在,条件指数如果在15以上,则表示可能有共线性问题,条件指数如果在30以上,则表示有严重的共线性问题,CI值越大,越有共线性问题。 211身心健康v补救多重共线性影响的办法v(1)去掉与y相关程度低、而与其他自变量高度相关的变量。v(2)去掉可以被其余自变量线性表现出的变量。v(3)增加样本规模。v(4)采用新的样本数据。v(5)利用先验信息组合变量。212身心健康多元线性回归的方法v(1)逐步回归法(stepwise)是运用较广泛的回归法。它结合向前回归法或顺向选择法(forward selection

65、)与向后回归法或反向剔除法(backward elimination)两中方式的优点。根据在option对话框中所设定的判据,首先根据方差分析结果选择对因变量贡献最大的自变量进入回归方程。然后根据向后剔除法,将模型中F值最小的且符合剔除判据的变量剔除出模型重复进行直到回归方程中的自变量均符合进入模型的判据,模型外的自变量都不符合进入模型的判据为止。213身心健康v (2)向前回归法或顺向选择法(forward selection)。是自变量一个一个进入回归模式中。从模型中无自变量开始,根据option中所设定的判据,在第一个步骤中,首先进入方程式的自变量是与因变量关系最密切者,亦即与因变量间有

66、最大正相关或最大负相关的自变量;第二个步骤(以后每一个步骤中)则选取与因变量偏相关为最大之自变量进入模型。在每个步骤中,使用F统计(t统计的平方)检验进入回归模型的自变量。214身心健康v(3)向后回归法或反向剔除法(backward elimination)。先建立全模型即将所有自变量均纳入模型,之后根据option中所设定的判据每次剔除一个对因变量贡献最小的自变量。有两个标准:一是最小之F值SPSS中默认是2.71(可以自己设定);二是最大之F概率值,SPSS默认是0.10,也可以设定为0.05。215身心健康v(4)消去法(remove)。建立回归方程时,根据设定的条件剔除部分自变量。v

67、(5)强行进行法(enter)。这也是一种常见的方法,强迫所有自变量有顺序进入回归模型。在研究设计中,如果研究者事先建立假设,决定变量重要性层次,则应该使用强迫进入法。强迫进入法又称“层次进入法”(hierarchical enter)。216身心健康多元线性回归实例v(1)线性回归的数据要求:自变量与因变量应该是数值型变量(连续型变量)。象宗教、研究方向、性别等分类变量,需要被重新编码为哑变量(虚拟变量)或者其他类别的对比变量。 217身心健康v(2)研究问题:建立一个以初始工资、工作经验、受教育年限等为自变量,当前工资为因变量的回归模型。数据见“多元线性回归.sav”。v(3)操作过程:

68、Analyze/Regression/Linear,在Model中选择“stepwise”,在statistics中选择Estimates,Model fit,Rsquared change,part and partial correlation,共线性诊断collinearity diagnostics。218身心健康v(4)结果说明v 表格二中的R为自变量与因变量的复相关系数,R square为总解释量即为模型中自变量组合对因变量的总解释量,为消除自变量个数及样本容量影响有一个校正后的Adjusted R square ,R square change下的系数实际上是被加入的这个自变量对

69、因变量的单独解释量。219身心健康1.表格二复相关与解释量220身心健康v 初始工资、工作经验、受教育年限与当前工资的复相关系数为0.895,对当前工资的总解释量为0.800。其中初始工资的解释量为0.775,工作经验的解释量为0.019,受教育年限的解释量为0.008。221身心健康2.表格三方程有效性检验(方程有效,F=632.607,P0.05;v 三个偏回归系数均达到了显著性水平;v 三个自变量的容忍度均较高,.554、.866、.520可以认为不存在共线性问题。225身心健康v 由于本方程不应包含常数项,因此需重新进行线性回归分析,其它操作与前同,只是在opitions命令选择项中不

70、选中include constant in equation。226身心健康这时结果发生了变化v1.总解释量为0.960,比前提高了;v2.方程是有效的,但F值变化了;v3.三个自变量的偏回归系数也是显著的;v4.发现了共线性问题,即第一个自变量初始工资与第三个自变量受教育年限的容忍度特别低(.108、.109)表明这两个变量存在共线性问题。227身心健康解决共线性问题 选择贡献大的“初始工资”进入方程,把“受教育年限”删除,再一次进行回归分析。228身心健康确定最后结果v 因为这时,方程是有效的(F=904.752,P0.001);偏回归系数也是显著的;两个自变量的容忍度均非常高(.998)

71、,即不存在共线性问题,则建立的回归方程如下:v 未标准化 Y=3850.781+1.923x1-22.445x2v 标准化y=0.886x1-0.137x2v 两自变量对因变量的总解释量为0.793,其中第一个自变量为0.775,第二个为0.019。229身心健康八、问卷(量表)的质量分析v案例9:工作倦怠感问卷进行质量分析。数据文件为“工作倦怠感.sav”。v 说明:该问卷由22个项目组成,其中9-16题为反向计分题(从反面提问,分数强弱方向与其他题目相反),对其质量分析包括以下几个方面:v(1)这22个题目是否都有效(有区分度)?v(2)如果有效,则这22个题目测量了工作倦怠感的哪些方面(

72、问卷的结构如何?)或者说可以用几个因素来解释该问卷?v(3)总问卷及分问卷(每一个因素所包含的题目组成一个分问卷)的信度如何? 230身心健康v 问卷质量分析涉及到的统计分析法:v问题(1):要进行的是项目区分度分析;v问题(2):要进行的是问卷的结构效度分析(因素分析);v问题(3):要进行的是问卷的信度分析。231身心健康v分析前的准备:v 由于9-16题为反向计分题,故在具体分析之前必须对其进行重编码。transform/recode/into same variable)把a9-a16送入右边的框,点击old and new value按钮,在old value的value中分别输入4

73、、3、2、1,对应的在new value的value中输入1、2、3、4,每操作一次,均要点击一下add键。232身心健康v(一)项目分析(区分度分析)v 进行项目分析的目的是删除没有区分力,效度不高的项目。项目分析可分为质的分析和量的分析,所谓质的分析是指分析测题的内容和形式。量的分析是采用统计方法来分析试题的质量,在设计态度量表时,剔除那些不合要求的项目,这样才能提高整个量表的信度和效度,因此,可以用项目分析的结果来作为筛选和修改测题的依据。233身心健康v(1)项目分与总分相关法v 也可以用来测量量表的内容效度。具体做法是计算每个项目分数和总分的相关,如果相关系数不显著,表明该项目鉴别力

74、低,应剔除;如果相关系数的显著程度高,则该项目的鉴别力大,应保留,也可认为量表的效度越高。其操作与相关分析中的操作相同。当然求相关之前需求出量表总分。经过分析发现22道题目与总分相关均显著,故均有较高的区分度,可以保留。234身心健康v(2)高低组平均数差异检验法v 其求法是将所有受试者在预试量表的得分总和依高低排列,得分在前25%或27%者为高分组,得分在后25%或27%者为低分组求出高低二组被试在每题得分平均数差异的显著性检验,如果题项的sig达到显著性水平(0.05或0.01),即表示这个项目能鉴别不同受试者的反应程度。因此,可以看每个项目有无达到显著性水平而作为该题是否删除的条件。23

75、5身心健康v操作过程:v 1对被试总分按高到低排序(Data/sort cases),把高分组即从最高分开始总人数25%处(100*25%)被试对应的分数56分记下。v 2再对被试总分按低到高排序,把低分组即从最低分开始总人数25%处(100*25%)被试对应的分数41分记下。v 3对被试总分sum分组即重编码后存为新变量group,从最高分到56分作为高分组1,从最低分到41分作为低分组2。(Transform/Recode/Into Different Variables)v 4以group作为分组变量,对被试在每一题上的得分平均数作差异显著性检验。(Analyze/Compare Mea

76、ns/Independent Samples T Test),差异显著则表明该项目具有区分度,可以保留,否则要剔除。经过检验所有题目都有效。236身心健康v(二)效度分析v 项目分析完后,为检验量表的结构效度(construct validity),应进行因素分析。所谓结构效度是指态度量表能测量理论的概念或特质之程度。因素分析目的即在找出量表潜在的结构,减少题项的数目,使之变为一组较少而彼此相关较大的变量,此种分析方法是“探索性的因素分析”(exploratory factor analysis ;EFA)。 237身心健康v 因素分析的目的是找出共同因素并对每个因素进行命名。即因素分析的目的

77、在因素结构的简单化,希望以最少的共同因素,能对总变异量作最大的解释,因而抽取的因素越少越好,但抽取因素之累积解释量则越大越好。238身心健康v 因素分析的过程:Analyze/Data Reduction/Factor。把有效的22个变量送入右边框,点击第一个按钮,选择KMO and Bartletts看看本量表是否适合进行因素分析;点第二个按钮,在extract中有两种抽取因素个数的方法,可以任选一个,方法一为特征根大于一,方法二为自定义因子数目 ;点击rotation,在其中任选一种因子旋转的方法,一般有varimax正交旋转和promax斜交旋转法,因子选择的目的是为了便于因子归类;点击

78、opitions在format中选中这两中形式,即按大小顺序排列和低于某个值就不必显示出来。 239身心健康结果说明:表一表一中KMO系数是0.857,sig=.000说明这个量表可以进行因素分析;240身心健康表二241身心健康v表二Total Variance explained中显示按照特征根大于1的方法抽取了5个因子,因子的累积解释量为65.913%;242身心健康表三243身心健康v表三rotaled component matrix是每个因子所包含的题目,以及这些题目在因子上的负荷量,可以看出:因子一(a1-a8);因子二(a10-a15);因子三(a20-a22);因子四(a16

79、,a18,a19);因子五(a9,a17)。244身心健康v 由于一般而言,每个因子所包含的题目数至少应该在3个以上,故把因子五删除了。理论上说,删除了题目以后,最好再进行一次因素分析,因为有可能问卷结构会发生变化。经过第二次因素分析,最终本问卷有四个因子因子一(a1-a8);因子二(a10-a15);因子三(a20-a22);因子四(a16,a18,a19),累积解释量为63.564%.245身心健康v因素分析仅为手段,重要的是要根据一定的理论进行因素命名因素命名。只有命名的结果和一定的理论相符,我们才可以认为该量表具有良好的结构效度。246身心健康v(三)信度分析v 信度又叫可靠性,是指测

80、验的可信程度。它主要表现测验结果的一贯性、一致性、再现性和稳定性。一个好的测量工具,对同一事物反复多次测量,其结果应该始终保持不变才可信。v 因素分析完后,继续要进行分析的是量表各层面(分量表)与总量表的信度检验。信度有外部信度(external reliability)和内部信度(internal reliability),外部信度一般用“再测信度”(test-retest reliability),内部信度一般用“cronbach ”系数及“折半信度”(split-half reliability)。247身心健康v 态度量表常用的检验信度的方法是“cronbach ”系数。系数值在0.6

81、0-0.65之间最好不要;在0.65-0.70间是最小可接受值;在0.70-0.80间相当好;在0.80-0.90之间非常好。v 操作过程:Analyze/Scale/Reliability,只要把总量表所包含的题目及各分量表所包含的题目分别送入右边框框即可。经过分析发现总量表及各分量表信度值为:0.9120,.9040,.8816,.7117,.4997(分量表四a16,a18,a19信度太低,故删除了)。248身心健康249身心健康v 由于在信度分析中删除了题目,这时总问卷只剩17道题,因而可以对其再进行一次因素分析,结果发现,问卷KMO=0.869,更适合进行因素分析。本问卷可以有3个因

82、子,因子一为题1,2,3,4,5,6,8;因子二为题10-15;因子三为题7,20,21,22。大家可以根据题目的意思对每个因子进行命名。v 再次信度分析,总问卷及各分问卷为:.9113,.90,.8816,.7287.v 至此,问卷的质量分析结束了,正式问卷也就形成了,可以对数据进行统计分析了。250身心健康v(一)工作倦怠感的总体描述v(二)员工工作倦怠的性别差异v(三)员工工作倦怠的工作类型差异251身心健康综合应用1v案例:浙江省大学生人格状况的调查研究v数据见“bigfive.sav”。v(一)该抽样调查的样本结构如性别、年级、学校人数结构v(二)浙江省大学生的人格现状描述v(三)浙

83、江省大学生人格的性别差异研究v(四)浙江省大学生人格的年级差异研究v(五)浙江省大学生人格的学校差异研究252身心健康综合应用2v案例:私立高中学生心理健康水平与其父母教养方式的相关研究v数据见“父母教养方式与心理健康.sav”。253身心健康v(一)私立高中学生心理健康水平的总体描述v(二)独生与非独生子女MHT的差异v(三)学生MHT的文理科、性别差异v(四)学生MHT的年级差异v(五)父亲教养方式与学生MHT的相关分析v(六)母亲教养方式与学生MHT的相关分析v(七)父亲文化程度与学生MHT的关系v(八)母亲文化程度与学生MHT的关系254身心健康九、 非参数检验v 推断统计学中的假设检

84、验可以分为两类:一是参数检验;一是非参数检验。v 如果假设只对总体分布中的若干个参数指定取值范围,则称这种假设为参数性假设,而对这种假设所作的检验就称为参数检验,如前面所讲的平均数的z检验、t检验、F检验等 。 255身心健康v也就是说,在已知总体分布的具体函数形式的前提下,只是其中若干个参数未知,则称这种检验问题为参数检验问题;否则,称为非参数性假设,对这种假设所作的检验就称为非参数检验。 256身心健康v因此参数检验问题中的原假设和研究假设都是参数假设;而非参数检验问题的前提中并没有指定总体分布的具体函数形式,故原假设和研究假设都可以是参数性假设也可以是非参数性假设。非参数检验是指在总体分

85、布情况不明时,用来检验数据资料是否来自同一总体假设的一类检验方法。257身心健康v在心理与教育研究和调查中,经常会得到很多有多项分类的计数数据,对于这些资料的统计分析,一般用 检验的方法。v 检验是非参数检验的一种。258身心健康v案例10:性别与态度的关系研究(另一种数据形式)。v研究人员随机抽取了170名青年男女大学生的样本,对他们进行心理测验。在对测验结果进行深入分析时,发现这批大学生对该心理测验中最后一个题目的反应态度见下表,问在该心理测验最后这个项目的反应上,青年大学生的性别与态度之间是否存在着某种连带关系?259身心健康 态度 性别 肯定 否定 小计 男生 22 88 110 女生

86、 18 42 60 小计 40 130 170260身心健康v【问题与思考】v1.参数的假设检验与非参数检验区别?v2.卡方检验的原理与步骤?v3.卡方检验的类别有哪些,对于本例应用何种检验?261身心健康v SPSS中进行非参数检验由Analyze/Nonparametric Test来执行。包括8项检验,即Chi-square test(卡方检验) 和其它的非参数检验。262身心健康 卡方检验v 检验解决两类问题:一是通过时间调查与观测所得到的一批数据,其次数分布是否服从理论上所假定的某一概率分布;二是对一批观测数据进行双向多项分类后,检验这两类特征之间是独立无关的还是具有相依相从、连带相

87、关。 v =263身心健康v 检验的计算公式: = , 是实际观测数据, 是理论次数;v 因而 检验是衡量实际测量数据与理论数据差异程度的指标;v 仅用于计数资料;v 值永远是非负的。 264身心健康v(一)总体分布的假设检验(拟合良度检验)v 解决“从实际调查与观测所得到的一批数据,其次数分布是否服从理论上所假定的某一概率分布”的问题。265身心健康v(1)某实际观测次数是否服从正态分布的检验(检验的原假设是:服从正态分布)v例子:v 优 良 中 及格 不及格 总和v 7 25 18 8 2 60v 2 14 28 14 2 60266身心健康(1)建立假设: :服从正态分布 :不服从正态分

88、布(2)计算检验统计量 = =27.29(3)查表,df=k-1=4(k为等级个数) =13.28 =2.1577 故接受原假设,即认为反应态度与性别无关。286身心健康vSPSS过程:数据见“性别与态度关系.sav”。v1、Data/weight cases,选中weight cases by,然后把“人数”送入Frequency Variable框中,OK。v2、Analyze/Analyze/descriptive Statistics/Crosstabs。把“性别”送入rows框、把“态度”送入columns框中;v单击Statistics按纽,选择Chi-square test(卡方

89、检验)。287身心健康v结果:288身心健康289身心健康290身心健康卡方检验的应用1v1.研究问题研究问题:在社交性方面,假设得分为10(其对应的常模分为35)是低社交性(内向),得分为22(其对应的常模分为65)是高社交性(外向),问大学生社交性方面与性别有无关系。291身心健康v 2.问题分析问题分析:这个问题要解决的是,高社交性、低社交型、中间型的人数与性别有无关系。因而是对各类型人数多少与性别有无关系的检验。v3.检验的原假设为检验的原假设为:社交性高低与性别无关。v4.检验统计量值的计算检验统计量值的计算v = 其中 是实际观测数据,是理论次数。因而 检验是衡量实际测量数据与理论

90、数据差异程度的指标。 292身心健康SPSS过程v(1)研究问题见v(2)操作过程:首先必须对社交性变量进行重编码即低于10分的为低社交型用1表示,高于22分的为高社交型用3表示,其他为中间型用2表示。具体操作为:Transform/Recode/Into different Variable,重编码为新变量shej。接下来再进行独立性检验: Analyze/descriptive statistics/crosstabs,把sex送入row框中,shej送入column中;点击statistics选择chi-square(卡方值);点击cells选择observed(观测值)和expecte

91、d(理论值)。293身心健康v(3)结果说明v 表格一表明有效的数据个数即样本容量;v 表格二是性别不同各社交性类型人数的观测次数和理论次数;v 表格三就是用公式计算出来的卡方值=6.978,sig=0.323即p0.05,因而接受原假设,认为社交性各类型人数的多少与性别无关。294身心健康表格三 检验结果295身心健康卡方检验的应用2:儿童类比问题解决策略运用的总体发展特点v 参见:陈英和 赵笑梅 小学三五年级儿童类比问题解决及策略运用发展 心理发展与教育 2007年 第2期 P20。v 根据儿童在靶问题上所使用的类比策略和非类比策略频次及百分比,考察不同年级儿童类比问题解决策略运用总体特点

92、,其频数分布如下表。296身心健康不同年级儿童策略运用总体特点(频次和百分比)SPSS数据文件见“策略运用.sav”三年级四年级五年级类比策略163191245非类比策略377349295297身心健康1表示类比策略,2表示非类比策略vSPSS过程:v1、卡方检验结果;298身心健康从总体上看,不同年级儿童在两类策略运用上存在显著性差异。299身心健康v2、对各年级儿童两类策略运用上作进一步卡方检验;vSPSS过程:v2.1打开Data/select cases/ 命令框,选择if 年级=3的数据进行操作(4、5年级一样操作);300身心健康v2.2打开Analyze/Nonparametri

93、c Test/ Chi-square test(卡方检验)命令框。选择变量“策略运用”进入test variable对话框;在Expected Values栏中选择All categoris equal,采用默认的即可。301身心健康3年级学生在两类策略运用上的差异302身心健康v可见, =84.81,P0.001其差异达到了显著性水平;v同样也可以分析4、5年级学生在两类策略运用上的差异。 =46.23,p0.001; =4.63,p0.05。v所以经进一步卡方检验发现,各年级的非类比策略的运用显著多于类比策略。303身心健康v3、对儿童在两类策略运用上的年级差异进一步卡方检验vSPSS过程

94、:v3.1打开Data/select cases/ 命令框,选择if 策略运用=1的数据进行操作;304身心健康v3.2打开Analyze/Nonparametric Test/ Chi-square test(卡方检验)命令框。选择变量“年级”进入test variable对话框;在Expected Values栏中选择All categoris equal,采用默认的即可。305身心健康各年级儿童在类比策略运用上的卡方检验结果306身心健康v可见,随着年级升高,类比策略运用逐渐增多,而非类比策略明显减少。卡方检验的结果分别为 v =17.40,p0.001; =10.21,p0.01307

95、身心健康v4、由于年级变量多于2个水平,故对在两类策略运用上的年级差异作多重比较。v4.1类比策略运用上的年级多重比较;vSPSS过程:v4.1.1打开Data/select cases/ 命令框,选择if 策略运用=1的数据进行操作;v4.1.2在filter_$变量下年级5所对应的框中选择not select,即只对3,4年级进行比较;308身心健康v4.1.3打开Analyze/Nonparametric Test/ Chi-square test(卡方检验)命令框。选择变量“年级”进入test variable对话框;在Expected Values栏中选择All categoris

96、equal,采用默认的即可。309身心健康3,4年级类比策略比较结果310身心健康4,5年级类比策略比较结果311身心健康3,5年级类比策略比较结果312身心健康v4.2非类比策略运用上的年级多重比较;v (操作过程同前)313身心健康3,4年级非类比策略比较结果314身心健康3,年级非类比策略比较结果315身心健康4,5年级非类比策略比较结果316身心健康3、4步骤检验结果列表3年级4年级5年级 多 重 比 较类比16319124517.40* 35* ( =16.48) 45* ( =10.006) 45* ( =4.528)317身心健康两类策略运用年级发展线形图318身心健康v(2)配

97、对卡方的一致性检验v 例子:两位专家对一批大学独自作出了分级判断,如下表,请问他们的判断结果是否基本一致,判断水平有无差别?数据见EG10-3.sav。v(杨晓明 SPSS在教育统计中的运用 高教出版社 )319身心健康 甲乙一级二级三级合计一级 32 15 0 47二级 1 54 12 67三级 0 7 45 52合计 33 76 57 166320身心健康v 这是一个典型的分类数据配对资料,根据研究目的,可以采用Kappa检验或配对卡方检验。前者重在研究两个专家的判断一致性,希望所有的频数都出现在主对角线上,这样一致性就最好;后者重在两者在哪些地方不一致,即两者的判断结果有怎样的偏好,计算

98、时只用了不在对角线上的数据。321身心健康vSPSS过程:v1、单击“Data”菜单中的“Weight Cases”命令,选择“count”为频数变量;v2、单击“Analyze”菜单中的“Descriptive Statistics”命令,选择“Crosstabs”子命令,把“专家甲”送入Rows框中,把“专家乙”送入Columns框中;单击“Statistics”按钮,在对话框中选择“Chi-square”、“Kappa”、“McNemar”,OK。322身心健康v结果分析:v1、频数统计结果;323身心健康v2、卡方检验结果;324身心健康v 卡方检验表不仅给出了配对卡方结果(McNem

99、ar Test ),也给出了成组卡方结果(Pearson Chi-square等);v 成组卡方用于反映两个专家的判断有无联系。从结果中看出两者是相关的,即被专家甲判断为级别高的学校,专家乙判断级别也较高;v 配对卡方的P值为0.002,显示两为专家判断的结果是不同的,观察原始数据,可以发现专家乙较专家甲容易将大学的级别判断得偏高。325身心健康v3、Kappa检验的结果。326身心健康v Kappa即内部一致性系数。取值在0-1之间,除根据P值判断一致性有无统计意义之外,根据经验, Kappa大于等于0.75表明 一致性较好,小于0.75表明一致性较差。v 从上表中可见,P值小于0.001,

100、认为两位专家的判断结果存在一致性,结合其Kappa值为0.676,可见其一致性为中等。327身心健康v(3)分层卡方检验v例子例子:某校计算机课试行多媒体教学A与正常上课B两种授课方法,观察成绩提高效率,考虑到专业是一个可能的混杂因素,将其也纳入调查,请分析授课方法与成绩提高效率(减少不合格人数)有无关系。数据见“EG10-4.sav”v(杨晓明 SPSS在教育统计中的运用 高教出版社 )328身心健康v两种授课方式的成绩提高效率比较(单位:人)v 理工专业 文科专业v 方法A 方法B 方法A 方法Bv有效 21 26 18 88v无效 17 59 7 95v合计 38 85 25 183 3

101、29身心健康vSPSS过程:v1、单击“Data”菜单中的“Weight Cases”命令,选择“count”为频数变量;v2、单击“Analyze”菜单中的“Descriptive Statistics”命令,选择“Crosstabs”子命令,把“效果”送入Rows框中,把“教学方法”送入Columns框中,把“专业”调入Layer框中;单击“Statistics”按钮,在对话框中选择“Chi-square”、“Cochrans and Mantel-Haenszel statistics”、“Risk”,OK。330身心健康v结果分析:v1、第一部分结果,描述统计表;331身心健康v2、第

102、二部分结果;v 用所有检验方法,对文科、理科来说,P值都小于0.05(第五、六列),所以无论,文科还是理科,不同教学方法与效果相关关系显著。332身心健康333身心健康v3、第三部分结果;v3.1一致性检验结果;v 一致性检验结果Breslow-Day,Tarones的P值为0.987,表明不同层间的OR值相同,即层间同质。334身心健康335身心健康v3.2分层卡方检验和一致性的结果;vMantel-Haenszel卡方值为10.729,P=0.001,表明去除了专业的混杂作用后,成绩效率和教学方法有关。336身心健康v4、第四部分结果 v 给出了调整了专业混杂作用后的综合OR值,OR值的自

103、然对数,可信区间及其相应的P值,可见统计检验结论和前面一致,相应的OR=2.791,即去除了专业的混杂效应后,使用方法A的提高效率可能性大约为使用方法B的2.79倍。337身心健康338身心健康练习v练习1:v 检验大五人格其他分量表上,大学生的人格类型与性别有无关系,与年级有无关系。(人格类型的划分可以依据大五人格因素得分转换表)339身心健康v 练习2:v 要实行一种新学制,就这种新学制作了态度调查,问这些态度受不受经济地位影响?(态度一样不一样?) v 数据见下表:340身心健康 态度 地位 赞同 反对 ? 小计(bij) 上 14 18 20 52 中 22 10 12 44 下 12

104、 7 10 29 小计(aij) 48 35 42 125 341身心健康其它非参数检验v 在这里介绍二项分布的检验、单样本K-S非参数检验、两独立样本非参数检验、多独立样本非参数检验、两配对样本非参数检验、多配对样本非参数检验等。v(杨晓明 SPSS在教育统计中的运用 高教出版社 )342身心健康v 一、二项分布检验v SPSS二项分布检验就是根据收集到的样本数据,推断总体分布是否服从某个指定的二项分布。v H0:样本来自某一分布总体或与某分布无显著差异。343身心健康v例子:例子:某高等教育公平调查,了解城镇学生和农村学生接受高等教育情况。在某地区随机抽取21名大学生,其中城镇学生12名,

105、农村学生9名,问这个地方城镇学生和农村学生比例(总体概率为0.5)是否不同?(数据见“EG9-1.sav”)344身心健康vSPSS过程:过程:v1、单击Analyze/Nonparametric Tests/Binomial命令;v2、弹出Binomial Test对话框,如下图操作;345身心健康v结果分析:结果分析:v 346身心健康v 从检验结果中可以看出,总共21个观察数据中,城镇有12人,农村有9人,分别占的比率为0.57和0.43,最后一列给出的概率为0.664,因此不能拒绝原假设,即认为城镇学生和农村学生的比率均为0.50。347身心健康v二、单样本K-S检验v 单样本K-S检

106、验是由前苏联数学家Kolmogorov和Smirnov提出的,它是一种拟合优度的非参数检验方法,主要利用样本数据推断总体是否服从某一理论分布的方法,适用于探索型随机变量的分布形态。348身心健康v 单样本K-S检验利用样本数据的实际频数分布与正态分布(Normal)、均匀分布(Uniform)、泊松分布(Poisson)、指数分布(Exponential)进行比较,以确定是否服从某一分布。v 单样本K-S检验比较适合连续型数据。v H0:样本来自某一分布总体或与某分布无显著差异。349身心健康v例子:例子:某高校随机抽取144个学生月支出情况,问该校学生月支出频数是否呈正态分布?(数据见“EG

107、9-2.sav”)350身心健康vSPSS过程:v1、单击Analyze/Nonparametric Tests/1-Sample K-S命令;v2、弹出One-Sample K-S Test对话框,如下图;351身心健康352身心健康v3、单击Options按钮,弹出One-Sample K-S: Options对话框。 353身心健康v结果与分析:结果与分析:354身心健康v 从结果中可以看出一些描述统计量,K-S的Z统计量为0.718,P=0.681,因此不能拒绝原假设,即认为144个学生的月支出服从正态分布。355身心健康v三、两独立样本非参数检验v 两独立样本的非参数检验是在对总体分

108、布不很了解的情况下,通过分析样本数据,推断样本来自的两个独立总体分布是否存在显著性差异。一般用来对两个独立样本的均数、中数、离散程度、偏度等进行差异显著性检验。v H0:样本来自的两独立总体的均值或中数无显著性差异。356身心健康v 两个样本是否独立主要看在一个总体中抽取样本对另一个总体中抽取样本有无影响,如果没有影响,则可认为两个总体是独立的。357身心健康v SPSS提供了多种两独立样本的非参数检验方法,在此主要介绍两种:v1、两独立样本的Mann-Whitney U检验v 该检验主要是通过对平均秩的计算来进行推断。实现的方法是:首先将两组样本数据混合并按升序排列,求出每个数据各自的秩,然

109、后分别对两样本数据的秩求平均,如果这两个样本的平均秩相差很大,则零假设不一定成立。U检验主要用于判别两个独立样本所属的总体均值是否相等。358身心健康v2、两独立样本的K-S检验v 该方法是:首先将两组样本数据混合并按升序排列,分别计算两组样本秩的雷计频率和每个点上的累计频率,然后将两个累计频率相减得到差值序列数据,如果这个差值序列数据很大,则零假设不一定成立。K-S Z检验主要推测两个样本是否来自具有相同分布的总体。359身心健康v例子:例子:v 研究两个不同大学学生每月各类支出是否存在显著差异。随机抽取每校各10名学生,调查支出数据见“EG9-3.sav”。360身心健康vSPSS过程:过

110、程:v1、单击Analyze/Nonparametric Tests/2 Independent Samples 命令;v2、弹出Two-Independent-Sample -Tests对话框,如下图;361身心健康362身心健康363身心健康364身心健康v结果与分析:v1、两独立样本的Mann-Whitney U检验结果;365身心健康366身心健康v 结果表明,学校1的平均秩,为10,学校2的平均秩为5,U=7,W=35,Z=-2.246,P=0.025,小于显著性水平,应拒绝原假设,即两个学校的学生支出存在显著差异。367身心健康v2、两独立样本的K-S检验结果。368身心健康v 结

111、果表明,K-S值为1.069,P=0.203,因此不能拒绝原假设,认为两个独立样本的总体分布没有显著的差异。v 通过上面两种检验方法得到不同结果:U检验结果表明两个学校的学生支出存在显著差异,而K-S检验则表明两个学校没有显著性差异。369身心健康v注意:注意:(1)两独立样本K-S检验适合大样本容量情况的检验,因此这里所得到的结果是否合适,需要通过其它检验方法来参考;(2)两总体分布是否相同一般包含了参数(均值、方差)是否相同的问题。如果两个总体的分布函数形式相同,而参数不同,也将被判别为概率分布不同。v 370身心健康v四、多独立样本非参数检验v 多独立样本非参数检验分析样本来自的多个独立

112、总体分布是否存在显著差异。v H0:样本来自的多个独立总体的均值或中数无显著性差异。371身心健康vSPSS提供两种多独立样本非参数检验方法。v1、多独立样本的中位数检验v 其原理是如果多组独立样本的中位数没有显著差异,多组独立样本有共同的中位数,那么这个中位数要处于每组样本的中间位置。372身心健康v 中位数检验首先将多组样本数据混合并按照升序排列,求出混合样本数据的中位数,并假设它是一个共同的中位数。然后计算每组样本中大于或小于这个共同中位数的样本数。如果每组中大于这个中位数的样本数大致等于每组中小于这个中位数的样本数,则认为多个独立总体的中位数没有显著差异。373身心健康v2、多独立样本

113、的K-W检验v 多独立样本的K-W检验是一种推广的平均秩检验。其基本方法是:首先将多组样本数混合按升序排列,并求出每个观察值的秩,然后对多组样本的秩分别求平均值。如果各组样本的平均秩大致相等,则可以认为多个独立总体的分布没有显著差异。374身心健康v例子:例子:v 某学校进行各专业毕业生期望收入调查,随机抽取3个学校的学生,得到22个学生期望收入样本,问3个专业毕业生期望收入是否存在显著差异?(数据见“EG9-4.sav”。)375身心健康vSPSS过程:过程:v1、单击Analyze/Nonparametric Tests/K Independent Samples 命令;v2、弹出Test

114、s for Several Independent Samples对话框,如下图;376身心健康377身心健康v结果与分析:结果与分析:v1、多独立样本的中位数检验;378身心健康379身心健康v2、多独立样本的K-W H检验380身心健康v五、两配对样本非参数检验v 两配对样本非参数检验一般用于同一研究对象(或两配对对象)分别给予两种不同处理的效果比较,以及同一研究对象(或配对对象)处理前后的效果比较。381身心健康v1、两配对样本的McNemar变化显著性检验v 该检验以研究对象自身为对照,检验其两组样本变化是否显著。要求待检验的两组样本的观察值是二值数据。382身心健康v2、两配对样本的

115、Wilcoxon符号平均秩检验v 两配对样本的Wilcoxon符号平均秩检验首先按照符号检验的方法,将第二组样本的各个观察值,如果得到差值是一个正数,则记一正号;差值为负数则记为负号,同时保存差值的绝对值数据。383身心健康v 然后将绝对差值数据升序排列,并求出相应的秩,最后分别计算正号平均秩和负号平均秩如果正号平均秩和负号平均秩大致相当,则可信为两配对样本数据正负变化程度基本相当,分布差距较小。384身心健康v例子:例子:v某地区教育行政部门开展教学评比活动。选取10个学校开展这项活动。收集到这些学校在开展活动前、后教学成绩(原始数据和是否合格)数据,问开展教学评比活动前后学校的教学成绩是否

116、存在显著差异?(数据见“EG9-5.sav”)385身心健康vSPSS过程:过程:v1、单击Analyze/Nonparametric Tests/2 Related Samples 命令;v2、弹出Two-Related-Samples Tests对话框,如下图;386身心健康v(1) Wilcoxon符号平均秩检验387身心健康v(2)McNemar变化显著性检验388身心健康v结果与分析:结果与分析:389身心健康390身心健康v 从以上两种检验中可以看出, Wilcoxon检验的Z=-2.673,p=0.008,拒绝零假设,即认为评比前后学校教学成绩存在显著差异;而McNemar检验计

117、算出的二项分布的概率为0.125,大于显著性水平0.05,因此认为教学评比前后学校的教学成绩没有发生显著性变化。391身心健康v两种检验方法的比较:两种检验方法的比较:v 这两种检验方法的结论刚好相反,这是因为第一种方法认为训练后比训练前成绩有提高,即发生变化(正秩);而第二种方法要求成绩由不合格变成合格才算发生变化,学生成绩如果在评比前后都不合格,即使成绩有了提高也是没有发生变化。392身心健康v六、多配对样本非参数检验v 多配对样本非参数检验是对多个匹配样本的总体分布是否存在显著性差异进行统计分析。一般零假设为:样本来自的多个配对总体的分布无显著差异。393身心健康v1、多配对样本的Fri

118、edman检验v 多配对样本的Friedman检验是利用秩实现多个配对总体分布检验的一种方法,要求数据是定距的。v 检验原理:首先以样本为单位,将各个样本数据按照升序排列,求得各个样本数据在各自行中的秩,然后计算各样本的秩总和及平均秩。394身心健康v如果多个配对样本的分布存在显著的差异,那么数值偏大的组,秩和必然偏大,数值普遍偏小的组,秩和也必然偏小,各组的秩之间就会存在显著差异。如果各样本的平均秩相当,那么可以认为各组的总体分布没有显著差异。395身心健康v2、多配对样本的Kendalls W协同系数检验v 分析评判者的判别标准是否一致公平方面。一个评判对象对不同的被判定对象的分数构成一个

119、样本,检验的零假设为:样本来自的多个配对总体的分布无显著差异,即评判者的评判标准不一致。396身心健康v3、多配对样本的Cochrans Q检验v 对多个相互匹配样本总体分布是否存在显著性差异的检验,处理的数据是二值记分的。397身心健康v例子例子1: Friedman检验检验v为检验某种教学方法在提高学生记忆能力方面的功效,挑选了10个学生在应用方法前以及应用一个月后、两个月后、3个月后的记忆时间。问在这4个时期,10个人的记忆能力有无发生显著的变化。v(数据见“EG9-6.sav”)398身心健康vSPSS过程:过程:v1、单击Analyze/Nonparametric Tests/K R

120、elated Samples 命令;v2、弹出Test for Serveral Related Samples 对话框,如下图;399身心健康400身心健康v结果与分析:结果与分析:401身心健康v例子例子2:Kendalls W和谐系数检验和谐系数检验v某大学硕士论文答辩,5名专家对3篇论文打分,问这5名专家判断标准是否一致。v(数据见“EG9-7 .sav”)402身心健康vSPSS过程:过程:v1、单击Analyze/Nonparametric Tests/K Related Samples 命令;v2、弹出Test for Serveral Related Samples 对话框,如

121、下图;403身心健康404身心健康v结果与分析:结果与分析:405身心健康v例子例子3:Cochrans Q检验检验v某专家组10名专家对3所大学进行合格评估,评价结果数据见“EG9-8.sav”,“1”表示合格,“0”表示不合格。问3所大学之间有无显著性差异?406身心健康vSPSS过程:过程:v1、单击Analyze/Nonparametric Tests/K Related Samples 命令;v2、弹出Test for Serveral Related Samples 对话框,如下图;407身心健康408身心健康v结果与分析:结果与分析:409身心健康十、复选题的数据处理与分析v 前

122、述SPSS分析过程中解决的多数都是连续型数值变量的分析,这些变量在每个观测中都有一个并且只有一个确定的值,即被试在每个项目上的作答只能有一个(只能选择一个)。 v 在社会科学领域,多重回答的情况经常存在,即在每个项目上,被试可以有多种选择,这就是复选题(Multiple response)数据的分析问题。 410身心健康v一、变量定义方式v 在单选题中,每题只能选一个选项,因而可以用一个变量代表一个题号,如T1、T2 v 在复选题中,不能以这种方式定义变量,因为每个选项均有可能被选答,因而,对每个选项均要定义一个变量。 411身心健康v(一)无排序的多选题v 由于每个选项不是被选中,就是没被选

123、中,故对每个选项的量化就可以采用二分变量的方式,在输入数据时,选中了就输入1,没被选中就输入0。v 例如第一题有四个选项,则可以定义四个变量:t1m1、tim2、t1m3、t1m4,其中t1表示第一题,m1-m4表示四个选项,此四个选项所组成的集合,称为“复选题题集”,由于对每个变量都是采用“二值计分”的,故又称为“二分变量集”。 412身心健康v(二)有排序的多选题v 如果测题是要求被试按照重要程度以顺序排列的,则可以采用另一种方式定义变量。例如有这样一个测题:v 作为服装主体颜色,您可以选择最喜欢的三种,在答案前划勾。v 1红 2橙 3黄 4绿 5青 6蓝 7紫 8黑 9 白 10说不清4

124、13身心健康v 这是一个问题,可每个被试可以有三个答案。在建立数据文件时,要建立三个变量,color1、color2、color3表示被试按喜欢程度选择的三个颜色。答案变量的值均按填写的顺序值编码。如果某一被试选择结果为最喜欢的为“黑”、次喜欢的为“红”、再次为“蓝”,则变量color1的值为8,color2的值为1,color3的值为6。414身心健康v二、复选题的数据分析v(1)对变量集进行频数分布分析;v(2)按其它称名变量对变量集进行交叉表分析。 415身心健康v(一)复选题的频数分析v(1)二分复选题变量集的频数分析v 如:一般您在饭后做什么?(可以多选)vA)看电视 B)睡觉 C)

125、做轻微活动 D)打牌 E)散步 F)其他(如看电影、迪斯科、加班、应酬等)416身心健康v 根据答案建立了六个变量V101V106,选择的变量值代码为1,未选择为0。数据见data18-01。v操作过程:Analyze/Multiple Response中对复选题可以进行三项操作:Define Sets;Freqencies;Crosstabs。417身心健康v 在分析处理数据之间必须定义变量集,必须把一组反映同一问题的多个答案变量组合在一个变量集中,方法如下:Analyze/Multiple Response/Define Sets定义变量集, (1)在Set Definition栏中选择属

126、于同一个问题的多个答案变量,送入Variable in Set栏中;(2)在Variables Are Coded as栏内定义这组变量的编码方式:418身心健康v1在Dichotomies Counted Value中定义二分变量的计数值。v2Categories分类变量。v(3)在Name栏内为变量集命名;v(4)在Label栏内输入命名变量的标签;v(5)单击Add按钮将定义好的变量名及其标签送入右边的Mult Response Sets栏内。该栏在命名的变量集前自动加“$”以区别于一般变量;v(6)反复上述操作,定义其他多个变量集。419身心健康v在此例题中,第(2)点中选择1Dich

127、otomies Counted Value即可,因为答案并无顺序要求。v 接下来进行频数分析:Analyze/Multiple Response/Freqencies。 420身心健康vGroup $RESTv (Value tabulated = 1)v Pct of Pct ofvDichotomy label Name Count Responses Casesv看电视 V101 381 47.6 71.8v睡觉 V102 57 7.1 10.7v做轻微活动 V103 127 15.9 23.9v打牌 V104 18 2.2 3.4v散步 V105 174 21.7 32.8v其他 V1

128、06 44 5.5 8.3v - - -v Total responses 801 100.0 150.8v5 missing cases; 531 valid cases421身心健康v结果说明:Count列为对应变量的值为1的发生的频数,即为总答案数。Pct of Responses说明Count中的频数占总答案的(801)的百分比。因此总百分比为100%。Pct of Cases说明Count中的频数占总观测量(536)的百分比。相当于801占总观测量数536的百分比。422身心健康v(2)有排序的复选项变量集的频数分析v 如果问题是:v 按照您的习惯选择三个晚饭后的主要活动,并按照经常

129、性顺序排序。v1看电视 2睡觉 3做轻微活动 4打牌 v 5散步 6其他(如看电影、迪斯科、加班、应酬等)423身心健康v1.建立数据文件,见data18-02,变量vv1vv3分别表示第一选择到第三选择。变量下的数字表示选项的序号。 v2.对这样问题获得的数据进行频数分析有两种方式:424身心健康v1.1一种是对三个变量分别进行频数分布分析。vAnalyze/Descriptive statistics/Frequencies打开频数分析对话框,把三个变量送入右边变量框中,要求输出频数分布表,还可以单击Chart按钮,在Chert Type栏中选择Pie Chart图,在Chart Valu

130、e栏选择Percentage要求以百分比标注饼图的各分块。425身心健康v 1.2组成多分类变量集,对该变量进行频数分布分析。v 首先要做的是定义多分类变量集。操作与前同,只不过在Variables Are Coded as栏中选择Categories,在其后输入vv1vv3的取值范围,最小值为1,最大值为6。所有操作结束后,进行频数分析。结果解释与前同。426身心健康v(二)复选题的交叉表分析v Analyze/Multiple Response/Crosstabs。v(1)复选题二分变量集的交叉表分析v 以data18-01数据为例,现在想分析50岁以下的各年龄段,饭后做什么?为了分析,必

131、须先对年龄这个连续变量进行重编码,编码成分类变量。 427身心健康v 进行交叉表分析如下:v 1.打开Analyze/Multiple Response/Crosstabs。v 2.选择年龄分段变量age送入行变量栏Rows;选择二分变量集rest送入Columns栏。v 3.打开Define Ranges按钮,输入要分析的最小值1,最大值3。v 4.打开Options按钮,选择Rows、Columns、Total,要求每个单元格除显示单元格频数外,都显示行百分比、列百分比和总百分比。计算百分比的基数可以是观测值(人数),也可以是答案数。428身心健康v结果解释:表中每个单元格中的数据自上而下为,该单元格的频数、行百分比、列百分比、总百分比。429身心健康v(2)多分类变量集的交叉表分析v 分析过程与二分变量集的交叉表分析操作方法相同。v 注意:使用多分类变量集交叉表分析功能也可以做单个基本变量间的交叉表。但其功能不如Descriptive Statistics中的交叉表分析功能强。v 如果希望进行卡方检验,或得到表明分布情况的图形,分析原变量的频数分布和得到交叉表,还是应该使用Descriptive Statistics中的Crosstabs项。430身心健康 THE END THANK YOU!431身心健康

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > PPT模板库 > 总结/计划/报告

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号