《SPSS中的相关分析及假设检验》由会员分享,可在线阅读,更多相关《SPSS中的相关分析及假设检验(7页珍藏版)》请在金锄头文库上搜索。
1、相关分析及假设检验spss1. 概念变量之间相关,但是又不能由一个或几个变量值去完全和唯一确定另一个变量值的这种关系称为相关关系。相关关系是普遍存在的,函数关系仅仅是相关关系的特例。事物之间有相关关系,不一定是因果关系,也可能仅是伴随关系,但是事物之间有因果关系,则两者必然相关。相关分析用于分析两个随机变量的关系,可以检验两个变量之间的相关度或多个变量两两之间的相关程度,也可以检验两组变量之间的相关程度偏相关分析是指在控制了其他变量的效应以后,对两个变量相关程度的分析。、2. 皮尔逊积差相关系数pearsonproductmomentcorrelationcoefficient变量之间的相关程
2、度由相关系数来度量,Pearson相关系数是应用最广的一种。它用于检验连续型变量之间的线性相关程度前提假设1)正态分布皮尔逊积差相关只适用于双元正态分布的变量,即两个变量都是正态分布,注意只有pearson要求正态分布如果正态分布的前提不满足,两变量间的关系可能属于非线性相关2)样本独立样本必须来自总体的随机样本,而且样本必须相互独立3)替换极值变量中的极端值如极值、离群值对相关系数的影响较大,最好加以删除或代之以均值或中数相关分析的前提假设检验一般情况下是对是否满足正态分布进行检验,对于正态分布的检验有好几种方法,总的可分为非参数检验和图形检验法1)非参数检验法spss中的1sampleKS
3、检验,检验样本数据是否服从某种特定的分布,方法有三种a.Asymptoticonly是一种基于渐进分布的显著性水平的检验指标,通常显著性水平小于则认为显著,适用于大样本。如果样本过小或分布不好,该指标的适用性会降低Carlo精确显著性水平的无偏估计,适用于样本过大无法使用渐进方法估计显著性水平的情况,可以不必依赖渐近方法的假设前提精确计算观测结果的概率值,通常小于即被认为显著,表明横变量和列变量之间存在相关,同时允许用户键入每次检验的最长时间显著,可以键入1到99之间的数字,但只要一次检验超过指定时间的30分钟,就应该用montecarlo假设是服从某种分布所以如果计算出的值比如Asymp.S
4、ig小于,那么拒绝原假设,说明样本为非正态分布,否则值越大越服从某种分布单样本KS首先计算每一阶段实际值与观察值的差异值,再计算每一阶段差异值的绝对值Z,即KS的Z值,Z值越大,样本服从理论分布的可能性越小还有一个是2sampleKolmogorovSmirnov用于检验2个样本的分布是相同的假设2)图形法spss中graphQ正态检验图图中横坐标为实际观测值,纵坐标为正态分布下的期望值,如果实际观测值取自正态分布的整体,那么图中所示的落点应该分布在趋势线的附近,并且应该表现出一定的集中趋势,即平均数附近应该聚集较多的落点,越靠近两个极端落点越少。此外还输出一种无趋势正态检验图,横坐标为观测值
5、,纵坐标为观测值于期望值的差值。在符合正态分布的情况下,图中的落点应该分布在中央横线的附近,甚至完全落到这条横线上,而且也应表现出集中在平均数周围的趋势如果需要正态分布,应该考虑对数据进行必要的变换P图判断方式和qq图相同c. 直方图根据直方图的形状来判断是否为正态分布d. 箱式图boxplot箱式图可用于表现观测数据的中位数、四分位数和两头极端值方框中的粗黑横线为中位数,方框之外的上下两条细横线成为须线,是除了离群值和极值之外的最大值和最小值。符合正态分布的情况下,箱式图应该是以中位线为轴上下对称的,并且上下须线之间的距离应该是盒距(方框上下边缘)的三倍左右,Binomialtest二项分布
6、检验该过程用于检验的假设是一个来自二项分布的总体的变量具有指定事件发生的概率,该变量只能有两个值例如检验组装生产线上一种工件的废品率为1/10即P二可以抽取300个工件,查看并记录每个工件是否是废品,使用本过程检验这个概率中相关分析过程analyzecorrelatebivariate相关分析的检验:检验的假设是总体中两个变量之间的相关系数为0.一般情况下我们给出假设成立概率P的阈值为,当概率P小于时,认为原假设不成立,否则接受原假设,认为两个变量之间的相关系数为0spss中进行相关分析有三种方法积差相关计算相关系数并作显著性检验,适用于两列变量都为正态分布的连续变量或等间距测度的变量taub
7、等级相关计算相关系数并作显著性检验,对数据分布没有严格要求,适用于检验等级变量之间的关联程度(秩相关)等级相关计算相关系数并做显著性检验,对数据分布没有严格要求,适用于等级变量或者等级变量不满足正态分布的情况。对于非等间距测度的连续变量,因为分布不明可以使用等级相关分析,也可以使用Pearson相关分析,对于完全等级的离散变量,必须使用等级相关分析相关性当资料不服从双变量正态分布或总体分布型未知,或原始数据是用等级表示时,宜用Spearman或Kendall相关一般情况下我们都某人数据服从正态分布,采用pearson相关系数等级相关系数等级相关系数,又称顺序相关系数,它也是描述两要素之间相关程
8、度的一种统计指标。等级相关系数是将两要素的样本值按照数值的大小顺序排列为此,以各要素样本值的位次代替实际数据而求得的一种统计量。例如xy有n对样本值,记R1代表x的位次(序号),R2代表y的序号(位次)&=(兔厂RQ1代表Xy同一组样本的位次差的平方和,他们的等级相关系数为6豊n(n2-1)显著性检验类型two-tailed双尾检验选项当事先不知道相关方向(正相关还是负相关)时选择此项Onetailed单尾检验选项如果事先知道相关方向可以选择此项FlagsignificantCorrelations复选项如果选中此项输出结果中在相关系数数值右上方使用*表示显著水平为用*表示其显著水平为计算相关
9、系数是,为了方便起见,通常采用如下公式:(厲在spss中进行相关分析时,自动会输出一个显著性(sig)的值,值越大越显著榜验相关暮數的临界值表P-ra/=aXCLL0轨g匕工0.015.0M1Q.4S76-44.榻竝0.4507a.STMS;7也舸冷0uwG?5W殛和o.nran0.30540.&TS10.9M330-MS73t.9911GC4a蚀ga.ani0Q22QM72Qr406ifl.詁匸Till.a0.8-?JSfi.&sarc0.QIS5.Q.7487ILBM3札K4H星0.JS250-AMIfl.7493C_TM?a.S9S2sQ.0.G319D.71530,7tit387219
10、0.B2U0.G0210.&SS10_73JSaS471M)Wo.sreoa.6581Q,70I0.8233110.i7620.3SZ9a63390_653Ja.soio12nt*屯血+.61200,a.7ooa.hwQin:3(LUllS6C3:4a.c.曲洁o.sn:a.札站m74:aS30.4LZ4G4S21a5377Q.MS3?.7:46IS0.4W0l542So-ssa:a.70S41703387dltaffia52B5CL5-751amsfl.ATS3CL*434a51SS0-5614ft.S:S7IS637乩杓0.503-10.MS7ass52200.-3195G.J22T0.4
11、处丄O.MfiS5.S!2I25厲輻辟0.44UOlUEB0579430o.o.am0.4093C_41Sia33110.2573035750-1932X4S96430.212S仇2S750.33340_3T2134MB500;6让趣0,321B0,3511P.ra=a的意思是当所计算的相关系数r的绝对值大于在a水平下的临界值ra时,两要素不相关(即p=0)的可能性只有a此外还有一个t双侧检验的相关系数阈值AA-2:茶冊亞馆感相臭乐毀国泌帆例t俛计量岭脸卜M%99%99.9%自由匱so%Jfl需S9.?K1oralQ晦0.99730Q.3TI033014120,51120.833畑1很谢370
12、.S67O.31SOJJ073S.S390.919070背0.2W0.3120J02G4391O.09rQ.774口妙094蝕0.5Wo.sou(J轴O.JJJI&O&W0.7270.SM3Q9244QQ却03040392Q.4RBC0.605IN.0.M8JIO.SM0.3000.3S80370.M0.77507。壮0.5310.2470J440.4.76gO.LO0.7J60血1430.2JojgjOJTOO.47Jfl014眞沁QFI9QWSU0.SJ50却Q咖-!-ID04910.6930.80743O.W0.287Q如OM110.171S.MtJam0-WJG0.54100.2403Zu130.43此珈0.6520.767J7.33BO2S|03C4O.4M1304370.33叮40翻0.-2350.27&031O.jUIU0423d说O.BWo.razJ90.2330.2760J370J46150414&.J70.339O-Tiaii23fl0730JJ4心芒苗0禺o.Tto.32C0.10.4SJ170轴0.570曲她o.iia05te0挪了0.377&.4410:70.203O.24J)0J1S|.333