SPSS 缺失值等.doc

上传人:壹****1 文档编号:558332352 上传时间:2022-08-30 格式:DOC 页数:4 大小:29KB
返回 下载 相关 举报
SPSS 缺失值等.doc_第1页
第1页 / 共4页
SPSS 缺失值等.doc_第2页
第2页 / 共4页
SPSS 缺失值等.doc_第3页
第3页 / 共4页
SPSS 缺失值等.doc_第4页
第4页 / 共4页
亲,该文档总共4页,全部预览完了,如果喜欢就下载吧!
资源描述

《SPSS 缺失值等.doc》由会员分享,可在线阅读,更多相关《SPSS 缺失值等.doc(4页珍藏版)》请在金锄头文库上搜索。

1、1数据的采集、录入阶段数据产生差错的原因1. 1被试差错多见于自陈式问卷调查中. 如: 由于社会赞许等原因导致被试对某问题不能真实回答从而造成数据偏态; 由于敏感的问题导致被试拒绝回答从而造成数据不全.1. 2仪器差错多见于使用心理测评仪进行测量的时候.1. 3主试差错由于心理学数据常常非常庞大, 因此在数据录入时难免出错; 另外数据在文本文件、EXCEL、ACCESS、SPSS 等不同格式、不同版本之间转换时, 在心理测评仪向计算机传输数据时也常会发生错行、乱码等错误1 .2数据的检查与筛选保证数据准确的最好方法是将原始数据与计算机所呈现的数据清单进行核对. 但对庞大的数据这几乎是不可能的.

2、 这时就需要应用描述性统计量和统计图来进行筛选和检测. 最重要的是解决三个问题: 所有的数据都在允许的范围内吗? 平均数和标准差都比较合理吗? 有无超出取值范围的数据?2. 1缺失值(missing values) 缺失值是数据分析中一个非常常见的现象, 出现的主要原因有: 设备故障、拒绝回答、测验时走神等, 对此应:2. 1. 1缺失值的检测SPSS 默认缺失值以黑点表示, 可以通过快速浏览数据列表(data view ) 发现, 记录下缺失值所在的变量即数据的列.2. 1. 2对缺失值的处理(1) 剔除有缺失值的观测单位, 即删除SPSS 数据列表中缺失值所在的数据行; 在SPSS 的统计

3、分析程序中, 打开options 按钮, 便会出现缺失值的处理栏(missing values) , 可分别选择下列选项: exclude cases analysis by analysis (剔除正在分析的变量中带缺失值的观察单位) ; exclude case list wise (剔除所有分析变量中带缺失值的观察单位) ; (2) 对缺失值进行估计后补上. 主要有两种方法:一是根据文献报道等知识经验进行估计; 二是用SPSS 提供的工具进行估计. 在“transform ”菜单下的“replace missingvalues”列出了5 种替代的方法: (a) series mean:

4、以列的算术平均值进行替代; (b)mean of nearly point: 以缺失值邻近点的算术平均值进行替代; (c)Median of nearly point: 以缺失值临近点的中位数替代; (d) linear interpolation: 根据缺失值前后的2 个观察值进行线性内查法估计和替代; (e) linear trend atpoint: 用线形回归法进行估计和替代; (3)将缺失值作为常数值, 如: 作为“0”.2. 2奇异值(outliers) 和极端值(extreme values) 奇异值和极端值是指各变量中与整体数据相距太远的极值, 由于它的夸大作用, 常常会歪曲统

5、计结果, 导致犯一类和二类错误. 通常有四种原因可导致奇异值的出现: (1) 数据输入时出错; (2)在不同数据格式之间进行转换时,缺失值处的数码代号被当成了实际观测值; (3) 出现奇异值的样本并非属于所要考察的总体; (4) 考察的样本相对于正态分布有比较多的极值.2. 2. 1奇异值和极端值的检测用柱状图、箱丝图、茎叶图、正态检验的Q 2Q 图等检测有无极端值和奇异值.以箱丝图为例箱丝图中都标有奇异值的行号, 看不清时可拖动边框将箱丝图放大查看.2. 2. 2减少奇异值和极端值影响的方法(1) 将奇异值和极端值作为缺失值处理: 在“variable view ”视图中点击“missing

6、”栏下含有奇异值和极端值的变量, 弹出“missingvalues”对话框, 有3个选项可以使用: (a)“discrete missingvalues”最多可以指定3个数值为缺失值, (b)“range of missing values”指定某一取值范围内的数值为缺失值; (c)“rangeplus one op t ional discrete missing”指定某一取值范围和某一特定数值为缺失值; (2) 根据检测的奇异值和极端值, 用“data select cases”工具中的“if?”对数据的取值范围进行限定,然后再进行统计分析; (3) 对奇异值进行估计. 方法同缺失值的估计

7、; (4) 将原始数据转换成标准Z 分数 或进行其他的转换后再进行统计分析; (5) 删除奇异值所在的观察单位.2. 3统计分析前的假设检验许多统计检验都需要样本数据服从正态分布, 并且相关联的变量之间应方差齐同. 若不符合上述条件便应进行数据转换, 否则便会导致错误2 . 但对于大样本数据, 我们可以近似地认为其为正态分布, 而不用去进行正态性检验. “analyze”下的 “descriptives”, “frequencies”和“explore”可以完成这些工作.2. 3. 1方差齐性检验“descriptives”和“frequencies”的功能基本相同, 都可进行正态性检验和方差

8、齐性检验. 若满足方差齐性, 则可进行下一步工作; 若不满足, 选“power esimetion”进行数据变换来满足方差齐性. 有6 种方法可供选择: (1) natural log: 取自然对数; (2) 1sfquare roo t: 取平方根的倒数; (3) recip rocal: 取倒数; (4) square roo t: 取平方根; (5) square: 取平方; (6) cube: 取立方. 若SPSS 提供的6 种变换均不能满足要求, 应考虑采用非参数统计的方法.2. 3. 2正态检验(no rmality p lo ts w ith tests)在“analyzedes

9、crip t ives stat ist icsexp lo re”中可进行正态检验, 及做出Q 2Q 图. 若不支持正态分布, 则应进行数据变换, 方法同方差齐性检验, 或选用非参数统计的方法.2. 4相关分析前的数据检查相关分析之前应用“descrip2t ives stat ist ics”对数据进行观察. 当一个变量取值范围很窄时, 应做数据变换后再进行相关分析, 否则会使相关的资料得出不相关的结论; 在做连续变量和等级资料的相关或两个等级资料的相关时, 若90% 的被试都选择等级资料中的一种情况(如: 90%的被试都选择“严重”) , 则相关性通常会很低, 对这类数据应用其他方法进行分析; 当均值是一个很大的数, 而同时标准差很小时, 相关系数值通常也会很小, 对这样的资料不宜做相关分析.参考文献: 1 阮桂海, 蔡建瓴, 佟福玲. SPSS fo r w indow s 高级应用教程M . 北京: 电子工业出版社, 1998: 177- 194. 2 郭祖超. 医学统计学M . 北京: 人民军医出版社, 1999: 46-

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号