SPSS在心理数据检查与筛选中的应用[论文设计]

资源描述

《SPSS在心理数据检查与筛选中的应用[论文设计]》由会员分享，可在线阅读，更多相关《SPSS在心理数据检查与筛选中的应用[论文设计]（13页珍藏版）》请在金锄头文库上搜索。

1、SPSS在心理数据检查与筛选中的应用SPSS作为目前最流行的统计软件包，以其功能强大、界面友好而被广泛使用.但很多用户在数据录入完毕后就开始了统计分析，这常常会导致结果的错误.其实在这之前还有一项重要的工作要做就是数据的检查与筛选(screen2ing data)SPSS在这方面为我们提供了很多有用的功能.但很多用户常常忽略这些功能，而目前的统计教材.SPSS的教材中几乎没有这方面的专门论著，我们以SPSS最新的10.0版本为例，就在其中如何利用各种功能进行数据的检查与筛选进行探讨.SPSS的其他版本及SA S, SPLM等统计软件与此类似.1数据的采集、录入阶段数据产生差错的原因

2、1. 1被试差错多见于自陈式问卷调查中.女II:由于社会赞许等原因导致被试对某问题不能真实回答从而造成数据偏态；由于敏感的问题导致被试拒绝回答从而造成数据不全.12仪器差错多见于使用心理测评仪进行测量的时候丄3主试差错由于心理学数据常常非常庞大，因此在数据录入时难免岀错；另外数据在文本文件、EXCEL ACCESS. SPSS等不同格式、不同版本之间转换时，在心理测评仪向计算机传输数据时也常会发生错行、乱码等错误1 .2数据的检查与筛选保证数据准确的最好方法是将原始数据与计算机所呈现的数据清单进行核对.但对庞大的数据这儿乎是不可能的.这时就需要应用描述性统计量和统计图来进行

3、筛选和检测.最重要的是解决三个问题: 所有的数据都在允许的范围内吗？平均数和标准差都比较合理吗？有无超出取值范围的数据?2. 1缺失值(m issing values)缺失值是数据分析中一个非常常见的现象,出现的主要原因有：设备故障、拒绝回答、测验时走神等，对此应：2. 1. 1缺失值的检测SPSS默认缺失值以黑点表示，可以通过快速浏览数据列表(data view )发现，记录下缺失值所在的变量即数据的列.2. 1.2对缺失值的处理(1)剔除有缺失值的观测单位，即删除SPSS数据列表中缺失值所在的数据行；在SPSS的统计分析程序中，打开op t ions按钮，便会出现缺失值的处理栏(m

4、 issing values),可分别选择下列选项: exclude cases analy2sis by analysis (剔除正在分析的变量中带缺失值的观察单位);exclude case list w ise (剔除所有分析变量中带缺失值的观察单位);(2) 对缺失值进行估计后补上.主要有两种方法:一是根据文献报道等知识经验进行估计；二是用SPSS提供的工具进行估计.在“t ransfo rm ”菜单下的“rep lace m issingvalues” 列出了 5 种替代的方法：(a) series mean:以列的算术平均值进行替代；(b)mean of nearly po

5、int:以缺失值邻近点的算术平均值进行替代；(c)M edian of nearly po int:以缺失值临近点的中位数替代；(d) linear interpo lat ion:根据缺失值前后的2个观察值进行线性内查法估计和替代(e) linear t rend atpo int:用线形回归法进行估计和替代; 将缺失值作为常数值，如：作为“0” .2. 2奇异值(out liers)和极端值(ext reme values) 奇异值和极端值是指各变量中与整体数据相距太远的极值，由于它的夸大作用，常常会歪曲统计结果，导致犯一类和二类错误.通常有四种原因可导致奇异值的出现：(1)数据

6、输入时出错；(2)在不同数据格式之间进行转换时，缺失值处的数码代号被当成了实际观测值；(3)出现奇异值的样本并非属于所要考察的总体；考察的样本相对于正态分布有比较多的极值2 2. 1奇异值和极端值的检测用柱状图、箱丝图、茎叶图、正态检验的Q2Q图等检测有无极端值和奇异值. 以箱丝图为例，箱丝图中都标有奇异值的行号，看不清时可拖动边框将箱丝图放大查看.2. 2. 2减少奇异值和极端值影响的方法（1）将奇异值和极端值作为缺失值处理：在variable view 视图中点击“missing栏下含有奇异值和极端值的变量，弹出“m issingvalues对话框，有3个选项可以使用：（a）

7、 “discrete m issingvalues最多可以指定3个数值为缺失值，（b） range of m iss2ing values”指定某一取值范围内的数值为缺失值；（c） “rangep lus one op t ional discrete m issingv指定某一取值范围和某一特定数值为缺失值;（2）根据检测的奇异值和极端值，用“data0 select cases”工具中的“if?”对数据的取值范围进行限定，然后再进行统计分析；（3）对奇异值进行估计.方法同缺失值的估计；（4）将原始数据转换成标准Z分数（stat ist ics dsum2marize ode scri

8、p t ives osave standardized value as）或进彳亍其他的转换后再进行统计分析；（5）删除奇异值所在的观察单位.2. 3统计分析前的假设检验许多统计检验都需要样本数据服从正态分布, 并且相关联的变量之间应方差齐同.若不符合上述条件便应进行数据转换, 否则便会导致错误2 .但对于大样本数据，我们可以近似地认为其为正态分布，而不用去进行正态性检验“ analyze 下的“ descrip t ives ”, “ frequen2cies ” 和“explore”可以完成这些工作.2. 3. 1 方差齐性检验（sp read vs. level w ith leve

9、ne test） descrip t ives” 和 frequencies的功能基本相同，都可进行正态性检验和方差齐性检验.若满足方差齐性，则可进行下一步工作；若不满足，选“pow er est imet ion”进行数据变换来满足方差齐性.有6种方法可供选择:(1) natural log:取自然对数;(2) losfquare roo t:取平方根的倒数；(3) recip rocal:取倒数；(4) square roo t: 取平方根；(5) square:取平方;(6) cube:取立方.若SPSS提供的6种变换均不能满足要求，应考虑采用非参数统计的方法.2. 3. 2 正态

10、检验(no rmality p lo ts w ith tests) 在 analyze0descrip t ives stat ist ics exp lo re”中可进行正态检验，及做出Q 2Q图.若不支持正态分布, 则应进行数据变换，方法同方差齐性检验，或选用非参数统计的方法.2.4相关分析前的数据检查相关分析Z前应用descrip2t ives stat ist ics对数据进行观察.当一个变量取值范围很窄时，应做数据变换后再进行相关分析，否则会使相关的资料得出不相关的结论；在做连续变量和等级资料的相关或两个等级资料的相关时，若90%的被试都选择等级资料中的一种情况(如：90%的

11、被试都选择“严重”)，则相关性通常会很低，对这类数据应用其他方法进行分析；当均值是一个很大的数，而同时标准差很小时，相关系数值通常也会很小，对这样的资料不宜做相关分析.spss如何求f检验值我国是水域大国，有着丰富的渔业资源以及悠久的渔业养殖历史。在“九五”、 “十五”期间，渔业及其关联产业快速发展，特别是水产品生产和加工产业发展迅速，有力保障了国民食品需求。对中国水产品供需状况进行系统分析, 并进行“十一五”时期供需预测，能够全面了解我国水产品供需各环节的现状、问题及发展趋势，从而对“十一五”时期我国渔业产业发展规划具有重要指导意义。一、水产品供给预测我国水产品供给来自国内外两个市

12、场，国内市场供给主要包括海洋渔业和内陆渔业两部分。(%1) 国内生产预测在“九五”和“十五”期间，我国水产品生产得到了长足发展，如图1所示，20世纪90年代以来，我国水产品生产量持续上升，10年间水产品产量几乎增长4倍，从1990年不足1300万吨迅速上升到 2002年的4800万吨。从图1中我们还可以观察到国内水产品产量增长具有阶段性特征，以1996年为拐点，1996年以前以较低水平增长，1996年以后以较高水平增长，但增长率近乎相同。因此，在预测中考虑到国内水产品产量增长具有阶段性特征，我们采用含有虚拟变量的时间序列函数来预测“十一五”时期国内水产品生产量，方程如下：Y=

13、a + 0t+ Yd+ e (tl990=l)其中Y表示国内水产品产量；t为时间变量，以1990年为基期；d为虚拟变量，当1 WtW6,即19901995年， d=0,当7WtW21,即1996-2010年，d=E运用SPSS软件，得到如下预测方程：Y=980.446+225.982(+780.201d + e(14.177) (14.553) (6.69)其中剩余 R2=0.994,调整后的 R2=0.993, F=850.653, DW检验值为1.245,从而说明该方程回归效果较好，不存在自相关性，可以用此方程对2005-2010年国内水产品产量进行预测，其预测结果见表1(略)：（

14、二）进口预测20世纪50年代末至90年代初期，我国水产品贸易一直以出口为主，这与我国丰富的渔业资源有关，但随着人民生活水平提高以及对外贸易战略的改变，我国水产品进口从无到有，不仅数量大幅增长，而且品种日益多样化，极大丰富了国内市场。纵观过去10年我国水产品进口格局，进口量大致呈不规则上升趋势（见图2）。考虑到我国水产品进口历史较短，初期发展具有不规律性，进口量占总供给量较小等特点，因此我们用简单的时间序列函数来预测2005-2010年水产品进口数量：Y=a + Bt+ （tl990=l）其中Y表示水产品进口数量，t为时间变量，以1990年为基期；运用SPSS软件，得到如下预测方程

15、：Y=-9.765 + 19.698t+ e（-3.503）（8.061）其中剩余 R2=0.855,调整后的 R2=0.842, F=64.979, DW检验值为1.482,从而说明该方程回归效果较好，不存在自相关性，可以用此方程对2005-2010年水产品进口量进行预测，其预测结果见表2（略）。（三）“十一五”水产品供给预测：基于国内生产与国外供给1.方法一：中期分项预测。根据上面对水产品国内生产和进口数量的预测，可以得到2005-2010年我国水产品总供给量（总供给量=国内生产量+ 进口量）（见表3（略）。上述这种预测是基于1990-2002年我国水产品供给的中期样本数据进行的，

16、它的优点在于包含了这12年较多的水产品供给信息，缺点在于预测信息处理缺乏偏向性。由于1996年是个明显的分界点（对于国内生产部分和进口部分皆如此），对1996年以前的信息考虑过多可能会淡化1996年之后的重要信息，从而导致预测失真，另外我们对供给的预测是在两次估计中完成的, 存在多次预测加大误差的可能性。因此我们引进第二种方法，即短期灰色预测方法，对1996年以后的水产品总供给量进行总体预测，从而矫正第一种中期分项预测的误差。2方法二：短期灰色预测。我们以1996-2002年我国水产品总供给量为样本，进行“十一五”时期水产品产量的短期灰色预测。第一步，建立GM （1, 1）模型第二步，模型精度检验。对CM （1, 1）模型精度进行检验，将k= l, 2,6分别代入上述模型中，并将模型计算的累加值还原，与实际供给量进行比较，结果见表4（略）。第三步

展开阅读全文

SPSS在心理数据检查与筛选中的应用[论文设计]

最新文档