心理与教育测量考试版

资源描述

《心理与教育测量考试版》由会员分享，可在线阅读，更多相关《心理与教育测量考试版（8页珍藏版）》请在金锄头文库上搜索。

1、心理与教育测量考试版1. 测量就是依据一定的法则使用量具对事物的特征进行定量描述的过程。测量的基本要素：参照物分为绝对参照物（以绝对的零点作为测量的起点），相对参照物（以人为确定的零点为测量的起点）。相对参照点只能进行加减运算，而不能进行乘除运算，因为两个值之间没有倍数关系。测量的单位，要有确定的意义，即对同一单位，所有人的理解都是相同的；要有相等的价值。2. 量表是能够使事物的特征数量化的数字的连续体，有一定参照点和单位。分为命名量表（只是用数字代表事物或用数字对事物进行分类，数字只是事物的符号，而没有任何数量的意义，不能作常用的数量化分析，不能进行代数运算。又细分为名称量表，类别量表）顺序

2、量表（不仅能够指代事物类别，而且能够表明不同类别的大小，等级或事物具有某种特征的程度。这种按照事物的大小，等级，程度而排列数字的量表叫顺序量表。既没有相等的单位，也没有绝对的零点，换言之，既不能表示事物特征的真正的数量，也不表示绝对的数值，不能进行代数运算。）等距量表（不仅能够指代事物的类别，等级，而且具有相等的单位。数字是一个真正的数量，这个数量中各个部分的单位是相等的，可以进行加减运算。没有绝对的零点，不能进行乘除运算）比率量表（具有类别，等级，等距的特征外，还具有绝对的零点，不仅可以知道测量对象之间相差的程度，还可以知道它们之间的比例。）3. 心理与教育测量：依据一定的心理学和教育学理论

3、，使用测验对人的心理特质和教育成就进行定量描述的过程。特征：间接性（行为推论心理）；相对性（平均水平为标准）；客观性（对外在行为的客观测量，不以人的主观意志转移，可重复）4. 心理测验：对行为样本的客观的和标准化的测量。基本要素：行为样本（一组能够代表行为总体，并且借此有效推论所欲测量心理特征的行为）标准化（心理测验质量最关键的保证，测验的一致性程度，是对随机误差控制的过程。具备条件：A测验内容的标准化；B施测条件的标准化相同的测验情境，相同的指导语，相同的测验时限；C评分规则的标准化；D测验常模的标准化。）客观化（各环节不受主观支配，可重复）难度或应答率信度和效度（最基本的指标，最重要的指标

4、）5. 心理测量与心理测验的比较：相同点-都是对人心理活动量化的过程；不同的测量的含义更广泛，包含测验；心理测验具体的测验活动，具体的测验工具。6. 心理与教育测验的种类：按测量对象分为智力测验（斯坦福比内量表，韦克斯勒智力量表，瑞文推理测验），能力倾向测验（在测量个人的潜在才能，预测个人的能力发展倾向。分为一般能力倾向测验，测量个人多方面的潜能；特殊能力强项测验，测量个人的特殊潜在能力），成就测验（旨在测验接受教育后的学业成就，分为学科成就测验，综合成就测验），人格测验（分为自陈人格问卷，如明尼苏达多相人格调查表，16PF，艾森克人格问卷；投射测验，如罗夏克墨迹测验，主题统觉测验）按测量方式

5、分为个别测验（以个别对象作为被试的测验，能准确全面评估特征，但耗时长）和团体测验（以一群人作为被试的测验，效率高，信度效度差一点）。团体测验可用于个别测量，但个别测量不能用于团体测量。按测验内容形式分为文字纸笔测验（呈现符号等刺激，但容易受被试文化背景的影响，降低测验的效度）和非文字操作测验（操作性，通过操作完成，适用于文盲，不同民族文化的人）按测验功能分为成就测验与预测测验；难度测验与速度测验；描述测验与诊断测验按评价所参照的标准分为常模参照测验，与常模比较；目标参照测验，与绝对标准比较；潜力参照测验，与自身潜力比较。7. 心理与教育测验的功能：理论研究功能（收集研究资料，建立和检验理论驾驶

6、，实验分组。共性与个别差异性）；实际应用功能（选拔人才，人员安置，心理诊断，描述评价，心理咨询）8. 心理测量的历史：思想源泉：孔子；历史A萌芽阶段19世纪末20世纪初，奠基者高尔顿（发明测量仪器；应用评定量表，问卷法，自由联想法的先驱；扩充了百分位法，创造了简单的相关系数的计算方法，皮尔逊继承和发展为积差相关公式），卡特尔（心理测验与测量首次提出心理测验的术语）B产生阶段-比内（第一个智力测验量表，1905年）C发展阶段-智力测验的发展推孟（采用比率智商表示智力水平的高低）；陆军甲乙种测验，团体测验，前者文字测验，后者非文字测验；斯皮尔曼（首先运用因素分析方法研究智力结构，提出智力结构的“二

7、因素理论”）；韦克斯勒儿童，成人，幼儿智力量表。能力倾向测验的发展。成就测验的发展桑代克（第一个标准化的教育成就测验，教育测验的鼻祖）凯利，鲁奇和推孟第一个成套成就测验“斯坦福成就测验”。人格测验的发展。9. 我国心理测验发展：1917年，樊炳清首先向国人介绍了比内西蒙智力量表；1931年成立了中国测验学会。10. 心理特质：一个人身上所特有的相对稳定的行为方式为人的心理特质。心理特质的可测性：心理特质行为总体行为样本测验分数心理特质。11. 测量误差：在测量过程中由那些与测量目的无关的变化因素所产生的一种不准确或不一致的测量效应。种类：随机误差（由与测量目的无关，偶然因素引起的而不易控制的误

8、差）；系统误差（由与测量目的无关的变因引起的一种恒定而有规律的效应，稳定存在每一次测量中），系统误差只影响测量的准确性，不影响稳定性，而随机误差既影响稳定性又影响准确性。抽样误差：抽样要有代表性，抽样方法是随机抽样，机械抽样（进行排序，隔一定距离按一个），分层抽样（考虑总体和亚团体及标准差，异质，若亚团体s小，则差异小，则抽取个数少）12. 测量误差来源：测量工具（通常是一套以测验问卷为核心的刺激反应系统，通常称为量表。测题内容，数量，类型，指导语，时间）被测对象（动机，练习效应，生理变化）施测过程（环境变化，主试特点，评分程序）13. 真分数：反映被试某种心理特质真正水平的数值称为该特质的真

9、分数，即测量中不存在随机误差时的值。把实测的分数称为观察分数。数学模型：X观察分数=T真分数+E随机误差。假设公理：若一个人的某种心理特质可以用平行测验反复测量足够多次，则其观察分数的平均值会接近于真分数。真分数和误差分数之间的相关为零。即（T，E）=0各平行测验上的误差分数之间相关为零，（E1，E2）=0。说明E是随机误差，没有包含系统误差在内，说明E是服从均值为零的正态分布的随机变量。根据CTT模型和假设，推导出SX2=ST2+SE2。只涉及随机误差的变异，系统误差的变异包括在真分数的变异之中，即真分数可以分为与测量目的有关的变异SV2和与测量目的无关的变异SL2，即ST2=SV2+SL2

10、，则SX2=SV2+SL2+SE2。这就是说，一次测验中，一个团体的实测分数之间的变异性是由与测量目的有关的变异数SV2，稳定的但出自无关来源的变异数SL2和测量误差的变异数SE2决定的。不足：X观察分数=T真分数+E随机误差本身存在不足；样本的影响测验难度，效度，信度，区分度对不同样本的影响；平行测验是不是真的平行。14. 信度：用同一个测验对同一组被试施测2次所得结果的一致性程度。条件特质本身的稳定性；无练习效应。信度是一个被测团体的真分数的变异数与实得分数的变异数之比；信度是一个被试团体的真分数与实得分数的相关系数的平方；信度是一个测验X（A卷）与它的任意一个“平行测验”（B卷）的相关系

11、数。信度的作用：信度是测量过程中所存在的随机误差大小的反映；信度可以用来解释个人测验分数的意义；信度可以帮助进行不同测验分数的比较。15. 重测信度：用同一个量表对同一组被试施测两次所得结果的一致性程度，大小等于同一组被试在两次测验上所得分数的皮尔逊积差相关系数，信度值较大，说明两次测量结果比较一致。条件：特质本身的稳定性；遗忘和练习的效果基本上相互抵消；在两次施测的间隔期内，被试在索要测查的心理特质方面没有获得更多的学习和训练。16. 复本信度：两个平行的测验测量同一批被试所得结果的一致性程度，大小等于同一批被试在两个复本测验上所得分数的皮尔逊积差相关系数。如果两个复本测验同时连续施测，称这

12、复本信度为等值性系数，大小反映两个复本测验的题目差别所带来的变异情况。如果两个复本测验是相距一段时间两次施测，称为稳定性与等值性系数，是对信度最严格的检验，其值最低。在实际工作中，为抵消施测的顺序效应，一般可以随机选出一半被试先做A卷后做B卷，则另一半被试先做B卷再做A卷。条件：首先构造出两份或两份以上真正平行的测验（即AB卷），平行测验就是那种用不同的题目测量相同的内容而且其测验结果的平均值和标准差都相同的两个测验，严格的平行测验很难构造出来。其次被试要有条件接受两个测验，取决于经费，时间等。另外，被试在第二测验时仍会受到练习和记忆等因素的影响，一些解题的策略等技能技巧也会产生迁移效应。对于

13、稳定性与等值性系数，在报告结果时，也应报告两次施测的间隔，以及在此间隔内被试的有关经历。17. 分半信度：一个测验分成对等的两半后，所有被试在这两半上所得分数的一致性程度。在只有一个测验且施测一次时使用。条件：只能在施测一次或没有复本的情况下使用，而且使用斯皮尔曼-布朗公式时要求全体被试在两半测验上的得分的变异数相等。当一个测验无法分成对等的两半时，分半信度不宜使用。分半的方法-奇偶性，难度，内容。同一个测验通常有多个分半信度。18. 同质性信度：也叫内部一致性系数，是指测验内部所有题目间的一致性程度，一致性含义分为所有题目测的都是同一种心理特质，所有题目得分之间都具有较高的正相关。一句话，同

14、质性信度就是一个测验所测内容或特质的相同程度。测量单一特质是同质性高的必要条件，非充分条件，同质性高是测验测得单一特质的充分条件。使用范围：克隆巴赫系数a=K（K-1）1-（Si2）Sx2。Si2表示所有被试在第i题上的分数变异，K是题目数，Sx2是测验总分的变异。a值大，必有测量信度高，a值小，却不能断定测量信度不高。a值的计算步骤：按一定要求抽取n个被试的试卷，首先算出这几个人测验总分的方差Sx2；这几个人在每一题上都会有一个得分，分别求出这几个人在每道题上得分的方差Si2，并求Si2值；按公式求出a值。19. 评分者信度：多个评分者给同一批人的答卷进行评分的一致性程度。计算详见P5420

15、. 影响信度的主要因素：被试方面主试者方面施测情境方面测量工具方面两次施测的间隔时间。详见P56.课堂讲述是从随机误差，估计方法，样本的角度来看。21. 效度：一个测验或量表实际能测出其所要测的心理特质的程度。特点：相对性，连续性，间接性（体现在评价中）。信度是效度的必要但不充分条件。效度受信度制约。22. 内容效度：一个测验测到的内容与所要测量的内容之间的吻合程度，就是去确定该测验在多大程度上代表了所要测量的行为领域。主要应用于成就测验，也适合某些用于选拔和分类的职业测验，不适合能力倾向测验和人格测验。使用时，要避免与表面效度混淆，表面效度是外行人对某个测验从表面看好像是测某种心理特质的一种

16、现象。最佳行为测验往往表面效度高，其他测验希望表面效度低。确定方法：逻辑分析法（请专家对测验题目与原定内容范围的吻合程度作出判断）-明确预测内容的范围，包括知识范围和能力要求，有代表性。具体详细；确定每个题目所测的内容，并与测验编制者所列的双向细目表对照，逐题比较自己的分类与制卷者的分类，并做记录；制订评定量表，考察题目对所定义的内容范围的覆盖率，判断题目难度与能力要求之间的差异，还要考察各种题目数量和分数的比例以及题目形式对内容的适当性等，对整个测验的有效性作出总的评价。克隆巴赫：从同一教学内容总体重抽取两套独立的平行测验，用这两个测验来测同一批被试，求其相关，相关低，两个测验中至少有一个缺乏内容效度，若相关高，则测验可能有较高的内容效度，除非两个测验取样偏向同一个方面。再测法：在被试学习某种知识之前作一次测验，在学过该知识后再作同样的测验。23. 结构效度

展开阅读全文