SPSS在心理数据检查与筛选中的应用[论文设计]

上传人:cc****pp 文档编号:209921015 上传时间:2021-11-12 格式:DOC 页数:13 大小:92KB
返回 下载 相关 举报
SPSS在心理数据检查与筛选中的应用[论文设计]_第1页
第1页 / 共13页
SPSS在心理数据检查与筛选中的应用[论文设计]_第2页
第2页 / 共13页
SPSS在心理数据检查与筛选中的应用[论文设计]_第3页
第3页 / 共13页
SPSS在心理数据检查与筛选中的应用[论文设计]_第4页
第4页 / 共13页
SPSS在心理数据检查与筛选中的应用[论文设计]_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《SPSS在心理数据检查与筛选中的应用[论文设计]》由会员分享,可在线阅读,更多相关《SPSS在心理数据检查与筛选中的应用[论文设计](13页珍藏版)》请在金锄头文库上搜索。

1、SPSS在心理数据检查与筛选中的应用SPSS作为目前最流行的统计软件包,以其功能强大、界面友好而被广泛使用.但很多用户在数据录入完毕后就开始了统计分析,这常常会导致结果 的错误.其实在这之前还有一项重要的工作要做就是数据的检查与筛选(screen2ing data)SPSS在这方面为我们提供了很多有用的功能.但很多用 户常常忽略这些功能,而目前的统计教材.SPSS的教材中几乎没有这方面的 专门论著,我们以SPSS最新的10.0版本为例,就在其中如何利用各种功能 进行数据的检查与筛选进行探讨.SPSS的其他版本及SA S, SPLM等统计软 件与此类似.1数据的采集、录入阶段数据产生差错的原因

2、1. 1被试差错 多见于自陈式问卷调查中.女II:由于社会赞许等原因导致 被试对某问题不能真实回答从而造成数据偏态;由于敏感的问题导致被试拒 绝回答从而造成数据不全.12仪器差错 多见于使用心理测评仪进行测量的时候丄3主试差错 由于心理学数据常常非常庞大,因此在数据录入时难免岀错;另外数据在文 本文件、EXCEL ACCESS. SPSS等不同格式、不同版本之间转换时,在心 理测评仪向计算机传输数据时也常会发生错行、乱码等错误1 .2数据的检查与筛选 保证数据准确的最好方法是将原始数据与计算机所 呈现的数据清单进行核对.但对庞大的数据这儿乎是不可能的.这时就需要 应用描述性统计量和统计图来进行

3、筛选和检测.最重要的是解决三个问题: 所有的数据都在允许的范围内吗?平均数和标准差都比较合理吗?有无超出 取值范围的数据?2. 1缺失值(m issing values)缺失值是数据分析中一个非常常见的现象,出现的主要原因有:设备故障、拒绝回答、测验时走神等,对此应:2. 1. 1缺失值的检测SPSS默认缺失值以黑点表示,可以通过快速浏览数 据列表(data view )发现,记录下缺失值所在的变量即数据的列.2. 1.2对缺失值的处理(1)剔除有缺失值的观测单位,即删除SPSS数据 列表中缺失值所在的数据行;在SPSS的统计分析程序中,打开op t ions按 钮,便会出现缺失值的处理栏(m

4、 issing values),可分别选择下列选项: exclude cases analy2sis by analysis (剔除正在分析的变量中带缺失值的观察单 位);exclude case list w ise (剔除所有分析变量中带缺失值的观察单位);(2) 对缺失值进行估计后补上.主要有两种方法:一是根据文献报道等知识经验 进行估计;二是用SPSS提供的工具进行估计.在“t ransfo rm ”菜单下的“rep lace m issingvalues” 列出了 5 种替代的方法:(a) series mean:以列的算 术平均值进行替代;(b)mean of nearly po

5、int:以缺失值邻近点的算术平均值 进行替代;(c)M edian of nearly po int:以缺失值临近点的中位数替代;(d) linear interpo lat ion:根据缺失值前后的2个观察值进行线性内查法估计和 替代(e) linear t rend atpo int:用线形回归法进行估计和替代; 将缺失值作 为常数值,如:作为“0” .2. 2奇异值(out liers)和极端值(ext reme values) 奇异值和极端值是指各 变量中与整体数据相距太远的极值,由于它的夸大作用,常常会歪曲统计结 果,导致犯一类和二类错误.通常有四种原因可导致奇异值的出现:(1)数据

6、 输入时出错;(2)在不同数据格式之间进行转换时,缺失值处的数码代号被当 成了实际观测值;(3)出现奇异值的样本并非属于所要考察的总体;考察 的样本相对于正态分布有比较多的极值2 2. 1奇异值和极端值的检测用 柱状图、箱丝图、茎叶图、正态检验的Q2Q图等检测有无极端值和奇异值. 以箱丝图为例,箱丝图中都标有奇异值的行号,看不清时可拖动边框将箱丝 图放大查看.2. 2. 2减少奇异值和极端值影响的方法(1)将奇异值和极端值作为缺失 值处理:在variable view 视图中点击“missing栏下含有奇异值和极端 值的变量,弹出“m issingvalues对话框,有3个选项可以使用:(a)

7、 “discrete m issingvalues最多可以指定3个数值为缺失值,(b) range of m iss2ing values”指定某一取值范围内的数值为缺失值;(c) “rangep lus one op t ional discrete m issingv指定某一取值范围和某一特定数值为缺失值;(2)根据检测 的奇异值和极端值,用“data0 select cases”工具中的“if?”对数据的取值范 围进行限定,然后再进行统计分析;(3)对奇异值进行估计.方法同缺失值的 估计;(4)将原始数据转换成标准Z分数(stat ist ics dsum2marize ode scri

8、p t ives osave standardized value as)或进彳亍其他的转换后再进行统计分析;(5)删 除奇异值所在的观察单位.2. 3统计分析前的假设检验许多统计检验都需要样本数据服从正态分布, 并且相关联的变量之间应方差齐同.若不符合上述条件便应进行数据转换, 否则便会导致错误2 .但对于大样本数据,我们可以近似地认为其为正态分 布,而不用去进行正态性检验“ analyze 下的“ descrip t ives ”, “ frequen2cies ” 和“explore”可以完成这些工作.2. 3. 1 方差齐性检验(sp read vs. level w ith leve

9、ne test) descrip t ives” 和 frequencies的功能基本相同,都可进行正态性检验和方差齐性检验.若满 足方差齐性,则可进行下一步工作;若不满足,选“pow er est imet ion”进行 数据变换来满足方差齐性.有6种方法可供选择:(1) natural log:取自然对数;(2) losfquare roo t:取平方根的倒数;(3) recip rocal:取倒数;(4) square roo t: 取平方根;(5) square:取平方;(6) cube:取立方.若SPSS提供的6种变换均 不能满足要求,应考虑采用非参数统计的方法.2. 3. 2 正态

10、检验(no rmality p lo ts w ith tests) 在 analyze0descrip t ives stat ist ics exp lo re”中可进行正态检验,及做出Q 2Q图.若不支持正态分布, 则应进行数据变换,方法同方差齐性检验,或选用非参数统计的方法.2.4相关分析前的数据检查相关分析Z前应用descrip2t ives stat ist ics对数据进行观察.当一个变量取值范围很窄时,应做数据变换后再进行相关 分析,否则会使相关的资料得出不相关的结论;在做连续变量和等级资料的 相关或两个等级资料的相关时,若90%的被试都选择等级资料中的一种情 况(如:90%的

11、被试都选择“严重”),则相关性通常会很低,对这类数据应用 其他方法进行分析;当均值是一个很大的数,而同时标准差很小时,相关系 数值通常也会很小,对这样的资料不宜做相关分析.spss如何求f检验值我国是水域大国,有着丰富的渔业资源以及悠久的渔业养殖历史。在“九五”、 “十五”期间,渔业及其关联产业快速发展,特别是水产品生产和加工产业 发展迅速,有力保障了国民食品需求。对中国水产品供需状况进行系统分析, 并进行“十一五”时期供需预测,能够全面了解我国水产品供需各环节的现 状、问题及发展趋势,从而对“十一五”时期我国渔业产业发展规划具有重 要指导意义。一、水产品供给预测我国水产品供给来自国内外两个市

12、场,国内市场供给主要包括海洋渔业 和内陆渔业两部分。(%1) 国内生产预测 在“九五”和“十五”期间,我国水产品生产得到 了长足发展,如图1所示,20世纪90年代以来,我国水产品生产量持续上 升,10年间水产品产量几乎增长4倍,从1990年不足1300万吨迅速上升到 2002年的4800万吨。从图1中我们还可以观察到国内水产品产量增长具有 阶段性特征,以1996年为拐点,1996年以前以较低水平增长,1996年以后 以较高水平增长,但增长率近乎相同。因此,在预测中考虑到国内水产品产量增长具有阶段性特征,我们采用 含有虚拟变量的时间序列函数来预测“十一五”时期国内水产品生产量,方 程如下:Y=

13、a + 0t+ Yd+ e (tl990=l)其中Y表示国内水产品产量;t为时 间变量,以1990年为基期;d为虚拟变量,当1 WtW6,即19901995年, d=0,当7WtW21,即1996-2010年,d=E运用SPSS软件,得到如下预 测方程:Y=980.446+225.982(+780.201d + e(14.177) (14.553) (6.69)其中剩余 R2=0.994,调整后的 R2=0.993, F=850.653, DW检验值为1.245,从而说明该方程回归效果较好,不存在自 相关性,可以用此方程对2005-2010年国内水产品产量进行预测,其预测结 果见表1(略):(

14、二)进口预测20世纪50年代末至90年代初期,我国水产品贸易一 直以出口为主,这与我国丰富的渔业资源有关,但随着人民生活水平提高以 及对外贸易战略的改变,我国水产品进口从无到有,不仅数量大幅增长,而 且品种日益多样化,极大丰富了国内市场。纵观过去10年我国水产品进口格 局,进口量大致呈不规则上升趋势(见图2)。考虑到我国水产品进口历史较短,初期发展具有不规律性,进口量占总 供给量较小等特点,因此我们用简单的时间序列函数来预测2005-2010年水 产品进口数量:Y=a + Bt+ (tl990=l)其中Y表示水产品进口数量,t为时间变 量,以1990年为基期;运用SPSS软件,得到如下预测方程

15、:Y=-9.765 + 19.698t+ e(-3.503) (8.061)其中剩余 R2=0.855,调整后的 R2=0.842, F=64.979, DW检验值为1.482,从而说明该方程回归效果较好,不存在自相关性,可以 用此方程对2005-2010年水产品进口量进行预测,其预测结果见表2(略)。(三)“十一五”水产品供给预测:基于国内生产与国外供给1.方法一:中期分项预测。根据上面对水产品国内生产和进口数量的预 测,可以得到2005-2010年我国水产品总供给量(总供给量=国内生产量+ 进口量)(见表3(略)。上述这种预测是基于1990-2002年我国水产品供给的中期样本数据进 行的,

16、它的优点在于包含了这12年较多的水产品供给信息,缺点在于预测信 息处理缺乏偏向性。由于1996年是个明显的分界点(对于国内生产部分和进 口部分皆如此),对1996年以前的信息考虑过多可能会淡化1996年之后的重 要信息,从而导致预测失真,另外我们对供给的预测是在两次估计中完成的, 存在多次预测加大误差的可能性。因此我们引进第二种方法,即短期灰色预 测方法,对1996年以后的水产品总供给量进行总体预测,从而矫正第一种中 期分项预测的误差。2方法二:短期灰色预测。我们以1996-2002年我国水产品总供给量为 样本,进行“十一五”时期水产品产量的短期灰色预测。第一步,建立GM (1, 1)模型第二步,模型精度检验。对CM (1, 1)模型精度进行检验,将k= l, 2,6分别代入上述模型中,并将模型计算的累加值还原,与实际供给量进 行比较,结果见表4(略)。第三步

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号