研究工具性能的测定

精****档

实名认证

店铺

PPT

283KB

约42页

文档ID:52275532

1/42页

点击查看更多>>

文本预览下载提示常见问题

研究工具性能的测定护理系李鸿艳教学目标§ 掌握信度的概念 § 熟悉计算信度的方法 § 掌握效度的概念 § 熟悉测量效度的方法 § 了解国外量表的翻译步骤一、信度§ 信度(Reliability)是指测量数据(资料)的可靠性程度,即测量工具能否稳定地测量到它要测量的事项的程度. § 信度是指同一或相似母体工具重复进行调查或测验,其所得结果间的一致性的程度. § 信度的特征：稳定性、内在一致性、等同性信度系数§ 大部分信度指标都以相关系数( r )来表示，即用同一样本所得到的两组资料的相关系数作为测量一致性的指标,称为信度系数它在所测对象实得分数的差异中有多大的比例是由测量对象本身的差别决定的，信度系数高表明测量的一致性程度高,测量的误差少一般来说 r ≥ 0.70就可认为该测量是达到了足够的信度.信度的计算类型§ 信度通常以相关系数表示，由于测量中误差变异的来源有所不同，所以，各种信度系数分别说明信度的不同层面而具有不同的意义人们一般是从不同方面来检查和评估调查资料的信度，在实际应用中,信度 (也可以说是信度系数)有如下类型：1、重测信度§ 重测信度(Test-retest Reliability ) 是用同一种试验（量表）对同一组被试，前后测验两次，再根据被试者两次测验分数计算其相关系数，即得出重测信度，这是一种最普遍, 最常用的信度检查方法。

重测信度§ R值越大说明测量工具稳定，被试的特质受被试的状态和环境变化的影响较小 § 短期内使用较好 § 例如：睡眠质量受工作压力、家庭事件、环境等因素影响 § 《自尊量表》？§ 重测信度法具体方法如下：l①选择样本总数1/10的重测对象，先进行第一次测试l②隔一段时间（间隔以可能忘却上次测验内容为宜）以后进行重测l③然后计算两次测试结果的相关系数如用领导潜能量表测量10名护理人员，一周后再次测评，两次测试结果如表2所示，计算其重测信度研究对象第一次测评第二次测评 15557 24946 37874 43735 54446 65056 75855 86266 94850 106763表2 领导潜能量表重测结果经过相关分析，该量表的重测信度为r=0.95 注意事项§ 前后两次测量相隔的时间必须适度（遗忘和练习效应抵消时）,最适宜的相隔时间随测量的目的和性质而异 § 当研究工具用于评估性质相对稳定的问题，如个性、价值观等，可用于重测信度来表示研究工作的信度 § 测量环境的一致性也是关键因素，以减少外来因素的干扰2、复本信度§ 复本信度(Alternate-forms Reliability) ：复本是相对于原本而言的,它使原本的复制品，对一项调查的问题,让被调查者接受问卷测量，并同时接受这份问卷的复本的调查,然后根据调查结果计算其相关系数，就得出了复本信度，复本信度类似于考试的A,B卷，它是根据同一目的编制出两套测量工具一测验同一主题现象。

复本信度§ 两个平行的测验测量同一批被试所得结果的一致性程度 § 复本测验必须在题目内容、数量、形式、难度、区分度、指导语、时限、以及所用的例题、公式和测验等其他方面都相同或相似 § 记忆效应小，但迁移效应大、顺序效应大 § 常用于方法学研究与教育方面：如学生对知识的掌握情况复本信度注意事项§ 两测验必须平行（内容一致、平均分标准差一致） § 信度高可直接下结论，但信度低则不然，可能是其中一个测验信度低 § 消除顺序效应：一半人先A卷后做 B卷，另一半人相反3、折半信度§ 折半信度( Split-half Reliability)：在无复本且不准备重测的情况下，通常采用折半法一估计信度，折半法是将调查来的结果按题目的单双分成两半计分，再根据各个人的这两部分的总分计算其相关系数，就得到折半信度折半信度§ 可了解测验的内部一致性，也叫内部一致性系数 § 如何分成对等的两半：可按题号的奇偶性、题目的难度、题目的内容、前后顺序分半 § 题目多，题分少，比较均匀时分半内部一致性§ 组成研究工具的各项目之间的同质性或内在相关性，内在相关性越大或同质性越好，说明组成研究工具的各项目都在一致地测量同一个问题或指标，内部一致性越好，信度越高。

l优点为应用方便，且最大程度地克服了重测所带来的一系列问题l局限性在于由于折半方法很多，不同折半方法可以得到不同的信度值，研究者可能会不断改变折半方法以期得到较高的信度值折半信度注意事项§ 需要测验项目的奇偶项的难度，内容等特征相似，并不是所有的测验都能计算折半信度 § 整个问卷的信度不是在折半信度上乘以2就可以了，而需要采用校正公式来求的 § Spearman-Brown公式：rxx＝2rhh/（1+rhh）克朗巴哈克朗巴哈 系数系数( (Chronbach‘sChronbach‘s   coefficient coefficient ））：是量表：是量表所有可能的项目划分方法的得到的分半信度系数的平均值系数所有可能的项目划分方法的得到的分半信度系数的平均值系数的一个重要特性是值会随着量表项目的增加而增加的一个重要特性是值会随着量表项目的增加而增加  系数是目前系数是目前最常用的信度系数最常用的信度系数一般认为一般认为 系数应该达到系数应该达到 0.70.7以上，有的学者认为应该达到以上，有的学者认为应该达到0.90.9以上这个指标可以处理任以上。

这个指标可以处理任何测验的内部一致性系数的计算问题何测验的内部一致性系数的计算问题 K—表示量表中的项项目（题题目）总总数 Si2——表示所有被试对试对象在第i项项目上得分的方差 ST2——表示所有被试试分数的方差 i= 1，2，3，·· ·· ··，k例例13 13 对对5050位研究生进行健康状况抽查调查问卷设计位研究生进行健康状况抽查调查问卷设计了如下了如下7 7个问题X1---X1---对自己健康的满意程度对自己健康的满意程度X2---X2---是否注意调养身体是否注意调养身体X3---X3---身体有不适或不舒服感觉身体有不适或不舒服感觉X4---X4---有生病的感觉有生病的感觉X5---X5---有紧张情绪和压力感有紧张情绪和压力感X6---X6---晚间休息感到不能很快入睡晚间休息感到不能很快入睡X7---X7---吃饭有时觉得胃口不好吃饭有时觉得胃口不好每个问题的回答从好到差按每个问题的回答从好到差按4 4个等级记分（分别赋值个等级记分（分别赋值1 1 、、2 2、、3 3、、4 4）调查结果如表）调查结果如表2 2，试计算，试计算克朗巴哈克朗巴哈a a系数系数。

克朗巴哈克朗巴哈a a系数评价举例系数评价举例4、内部一致性信度§ 内部一致性信度（internal consistent reliability） § 内部一致性信度是目前比较流行而且效果较好的信度评定方法，它从测量构思层次化入手，使测量项目形成一定的内部结构，并以内部结构的一致性程度，对测量信度作出评定内部一致性信度§ 内部一致性信度主要有两种：库德 —理查森的公式20（简称KR20）和克劳伯克（Cronbach）的α系数 Cronbach’α系数是目前应用最广泛的信度指标 § 两者测量所有项目间的平均相关程度（同质性信度） 5、评分者信度§ 评分者信度是指不同评分者对同一批人的答卷进行评定时的一致性程度 § 评分者信度 (interrater reliability) 是在测量工具的标准化程度较低的情况下，不同评分者的评分标准也会影响到测量的信度 § 常用与观察法测量对象时例如：护理技能操作考试采用的评分表影响信度的因素 § 被试方面 § 主试方面 § 施测的情境方面 § 测量工具方面 § 测量时间间隔问题提高测量信度的方法§ 增加测量长度 § 选取同质群体 § 严格评判标准 § 作答时间宽裕 § 控制误差：环境因素等当然，编制一份信度高的问卷，更关键在于问卷的内容合理。

小结§ 在计算量表的信度时，应首先用随机抽样的方法选择样本量的1/10，或者至少10～20例样本进行量表的信度测定对于一个公认的好量表信度值至少应达到 0.80，而对于一个新发展的量表，信度0.70即可接受§ 任何一个量表在应用前均应作信度的测定，当信度不够理想时，则需要对量表进行完善和修改介绍量表时，最重要的是要报告出量表信度计算方法和信度值，以使同行判断量表的性能，并根据自己研究的内容和特点进行选用二、效度§ 效度 (Validity)是指正确性程度，即测量工具却能测出其所要测量的特质的程度 § 效度是某一研究工具能真正反映它所期望研究的概念的程度l效度即有效性，指一个测量工具能够测量出其所要测量事件的程度，其中包括两层含义，一是测量了什么特性，二是测量到何种程度如果对于一个焦虑评定量表，评定结果的确可表明是受试者的焦虑特性，而且对于焦虑的严重程度测评准确，说明这一焦虑量表的效度就好，反之则不好§ 效度越高表示测量结果越能显示出所要测量对象的真正特征，信度高是效度高的必要非充分条件效度是任何科学的测量工具所必须具备的条件 § 效度是相对测量目的而言的。

检验效度的类型效度由三个部分构成： § 测试内容(内容效度和表面效度) § 外部标准(效标关联效度,由同时效度和预测效度组成) § 作为工具的理论基础(结构效度) 1、表面效度§ 表面效度（face validity）：人们头脑中的印象与学术界的共识之间的吻合程度，吻合程度越高，表面效度就高，是否有表面效度，基于个人的主观判断实际上是用“有或无”来反映的，而未体现高低 § 外行人看测验2、内容效度§ 内容效度(face Validity) 是指测量内容的适合性和相符性 § 也可以说是指测量所选题目是否符合测量目的和要求测量工具代表概念定义的内容越多，则内容效度就越高 § 是否反映了所要测量的变量、是否包括足够的项目且有恰当的内容分配比例内容效度§ 取决于评价内容是否全面、完整、准确、有代表性;常通过经验判断，故请专家确定（5人，或3-9人） § 内容效度可用内容效度指数来表示 § 适用于成就测验、选拔和分类的职业测验 § 内容效度的确定方法：逻辑分析法、再测法内容效度的测定§ 内容效度指量表中项目反应所测量内容的程度其结果来源有三，即文献、有代表性的相关人群和有相当经验的专家。

§ 具体做法如下请3-10位专家，5位较为合适，将专家进行两两配对，对每一个项目应用4分制方法给予评价其中l“0”代表该项目与研究内容一点都不相关； l“1”代表该项目必须经过修改否则不能和研究内容相关；l“2”代表该项目和研究内容相关但是仍需要小改动；l“3”代表该项目与研究内容非常相关内容效度的测定§ 将专家配对后，计算每对专家对量表中每一项目的内容效度 § 方法为计算每个对子中专家评价项目与内容相关（结果为2或3）与相关和不相关（结果为0或1）之和的百分数然后计算全部专家的平均效度 § 效度为专家的主观判断，没有客观标准，一般认为效度值应为0.75以上，否则该项目应果断剔除或修改表3 应对方式量表内容效度测定说明项目分析结果一点都不相关需经修改否则不相关相关但仍需改动非常相关 1．通过抽烟、喝酒等方式来解除烦恼01232．幻想可能会发生某种奇迹改变现状01233．找出几个不同的解决问题的方法0123…… 如果选择了5名专家（A、B、C、D、E），可配成10对，即AB、AC、AD、AE、BC、BD 、BE、CD、CE、DE，以项目1为例，第1对：A专家评价。

下载提示

点击查看常见问题

相似文档

正为您匹配相似的精品文档