用spss作定序数据分析

资源描述

《用spss作定序数据分析》由会员分享，可在线阅读，更多相关《用spss作定序数据分析（38页珍藏版）》请在金锄头文库上搜索。

1、用SPSS作定序数据分析,定序数据分析,引例9 好礼来蛋糕店老板研制出一种新型口味的生日蛋糕。为确认市场需求情况，老板专门组织研究人员做了一个试验：随机抽取了6位顾客，请其中3位品尝新型口味蛋糕，请另外3 位品尝传统口味蛋糕。6位顾客被告知，品尝结束后根据自己的感觉按下列标准给蛋糕打分：,打分结果汇总如下：,对于定序数据，均值不再是确定位置的合适的统计量。此外，均值比较方法的应用，在小样本的情况下，前提条件是总体服从正态分布，在此问题中，我们对两个打分总体的分布状况一无所知。,威尔科克森秩和检验,符号检验,威尔科克森符号秩和检验,总体1与总体2位置相同,总体1在总体2左侧,传统口味打分总体2

2、,新型口味打分总体1,新口味与传统口味打分总体,问题的实质是：无论打分情况在总体中是何种分布，只要两个总体分布的位置相同，就表明两种口味的蛋糕的受欢迎程度相当；如果新型口味蛋糕打分总体的位置在传统口味的左侧，则表明传统口味蛋糕更受欢迎。,两个总体位置相同,总体1位置在左侧,针对新型口味打分总体与传统口味打分总体的位置比较问题，可以提出检验假设：,总体1,总体2,新型口味蛋糕与传统口味蛋糕打分结果赋秩,如果两个总体位置相同的原假设成立，那么两个样本的秩和与就应当非常接近。与之间的差距越大就越是拒绝原假设的证据。任意选定为检验统计量，则较小的意味着大部分较小的观测值在样本1之中。

3、越小，就越是拒绝原假设的证据。问题归结为：要确定一个标准，以衡量 “足够小”。这个标准要从秩和的抽样分布中寻找和确定。,对两个样本中的6个观测值进行排序，最小的记为1，最大的记为6。通常将这种排序的结果称作秩,2,3,4,5,6,1,9,12,秩和,秩和,样本容量为3时，两个样本的所有可能的排序方式,存在20种排序的可能性，每一种排序出现的概率是相等的，即1/20。其中秩和9、10、11、12各出现3次；秩和为8、13各出现2次；秩和为6、7、14、15各出现一次。,T的抽样分布,0.05,0.10,0.15,0.00,6,8,9,10,11,7,12,14,15,13,T,P(T),样本

4、容量为3时，T的抽样分布,给定显著性水平=0.05，则有：，于是可在此抽样分布下确定拒绝域为T6。因为，所以没有理由拒绝原假设。最终结论为，两个总体的位置相同。两种口味的蛋糕的受欢迎程度相当。,不同样本容量下的检验统计量T的抽样分布是不同的，本例中两个样本容量都是3，这是最简单的一种情况。统计学家已经完成了不同样本容量下的T的抽样分布表计算和编制，供使用时查阅。,威尔科克森秩和检验的临界值（=0.05时的单尾检验； =0.10时的双尾检验）,其中和的取值使得：,理论上可以得出任何样本容量下的检验统计量的抽样分布，但这一过程过于繁琐。统计学家已经证明，当样本容量大于10时，检验统计量T

5、服从均值为E（T），标准差为的正态分布：,标准化的检验统计量,某大学经济学院为配合全校经济学课程的教学改革，打算引进一本新版教材。为确认新版教材的优劣，负责教师做了一个试验：随机抽取30名学生，利用假期给其中15名学生研读新版教材，另外15名学生研读传统教材。30名学生被告知，研读教材完成后，根据自己的感受，按照下列标准给教材打分：5=非常好；4=相当好；3=一般；2=较差；1=非常差。开学后，30名学生的反馈结果如表所示。问：在5%的显著性水平下，是否可以认为新版本教材的学生评价要高于传统教材。,比较两个总体位置。定序数据。样本是相互独立的。适合采用威尔科克森秩和检验。,两个容量为

6、15的样本数据,：两个总体位置相同。：总体1 在总体2 的右侧,威尔科克森秩和检验计算表,拒绝原假设。结论：新版本教材的学生评价要高于传统教材。,威尔科克森秩和检验应用条件1. 问题的目标：比较两个总体的位置。 2. 数据类型：定序数据或非正态分布的数值型数据。 3. 样本特性：独立样本。 4.比较的两个总体除了位置不同外，其它方面的特征没有差异。,某体育用品公司设计出一种新款式的旅游鞋，在一项试验中，研究人员想确定新款式的旅游鞋与旧款式的哪一种穿起来更舒服一些。为此，随机抽选了12位顾客，让他们分别试穿两种旅游鞋，然后，让每位顾客按照下列标准来评价两种旅游鞋的舒服程度：,试

7、穿后所得评价结果如下表所示：,匹配样本数据不可进行混合排序，不适合威尔科克森秩和检验。可考虑针对每对匹配的观测值计算其差值。当某一对观测值的差值符号为正时，表明该顾客更为偏好旧款旅游鞋；当某一对观测值的差值符号为负时，表明该顾客更为偏好新款旅游鞋。,将正号在样本容量中所占的比率记作。,以正号个数做为检验统计量，记作。,：两种款式旅游鞋舒服程度打分总体位置相同,：两种款式旅游鞋舒服程度打分总体位置不同,问题中的原假设为：,问题中的原假设也可表述为：,12,0.10,0.20,11,10,9,8,7,6,5,4,3,2,1,0,接受域,拒绝域,拒绝域,拒绝准则：。,，落入拒绝域。所以，拒绝两

8、种款式旅游鞋舒服程度打分总体位置相同的愿望设。结论：顾客更为偏好新款旅游鞋，做出这一推断的把握程度为95%。,在一个试验中，研究人员想确定人们认为乘坐两款车中的哪一种更舒服。挑选了25个人分别乘坐在欧洲豪华车和北美中型车的后座，让每个人按照如下方式来评价乘坐的舒适程度：1=非常不舒适；2=不太舒适；3=模棱两可；4=比较舒适；5=非常舒适。得如表数据。在5%的显著性水平下，能否从这些数据中推断出欧洲豪华型车比北美中型车更舒适？,对舒适度的评价,配对数据差值符号计算表,5个差值中，18个正值、5个负值、2个零。如果原假设成立，正号与负号都应近似等于样本容量的一半。选择正号个数为检验统计量并

9、记为x。x服从二项分布。若原假设成立，二项比例为p=0.5。由二项分布的性质我们知道：当n足够大时，x近似服从均值为、标准差为的正态分布。标准化后可得服从标准正态分布的检验统计量：问题中：x =18、n =25-2 =23、p=0.5，统计量值：,拒绝原假设。结论：人们认为乘坐欧洲l轿车比乘坐北美轿车更舒适。,原假设：两种车型同样舒适。,符号检验应用条件1. 问题的目标：比较两个总体的位置。 2. 数据类型：定序数据。 3. 样本特性：匹配样本。,为研究长跑运动对增强普通高校学生的心功能效果，对某校15名男生进行测试，经过5个月的长跑锻炼后看其晨脉是否减少。锻炼前后的晨脉

10、数据如下表所示。我们想知道长跑锻炼前后学生的晨脉有无显著的差异。,长跑锻炼前后晨脉变化,分析：问题的原假设是两个总体的位置相同。但这是两个匹配样本数据，不可对两个样本的观测值混合排序，因此不适合采用威尔科克森秩和检验。可考虑算出每对数据的差值，形成单个样本，进而构造检验原假设的统计量。此外，此数据为数值型数据，每对数据差值的大小有实际含义，如果采用符号检验，无疑将会损失差值大小上的有用信息。可考虑将符号检验与威尔科克森检验结合起来，进而构造检验原假设的统计量。,长跑锻炼前后晨脉变化符号秩和计算表,注意：在我们的研究中只考虑正的和负的差值。如果差值为0，该观测则应从进一步的研究中去掉，样本容

11、量也相应减小。此数据中没有出现这种情况。如果原假设为真，那么正的秩和（T+）与负的秩和（T-）应当接近相等。两者之间的差异越大，就越是拒绝原假设的证据。选择两者之中较小者即负的秩和T-为检验统计量T，即T=T-，则负的秩和T-越小就越是拒绝原假设的证据。,威尔科克森符号秩和检验临界值表,统计学家根据符号秩和的概率分布编制了威尔科克森符号秩和检验临界值表。此问题中样本容量为15，在0.05的显著性水平下进行双侧检验，查表得拒绝域的临界值为25。决策原则为：如果较小的秩和为25或更小，则拒绝原假设。此问题中较小的秩和为10，故拒绝原假设。结论：长跑锻炼前后学生的晨脉具有显著的差异。,威尔科克森符

12、号秩和检验临界值表一般只给到样本容量为30时有关的临界值。尽管在理论上我们可以得出任何样本容量下的检验统计量的抽样分布，但这一计算过程过于繁琐。统计学家已经证明，当样本容量大于30时，检验统计量T服从均值为E（T），标准差为的正态分布：,标准化的检验统计量为：,也就是说，样本容量大于30 时，可借助上述统计量进行Z检验。,由于私家车数量的急聚增加，人们日常工作上下班变得很困难，要在路上耽误许多时间。采用弹性上班制或许会改变这种状况。研究人员随机抽取了32位在职人员，记录下来他们某天正常上班花在路上的时间，然后让他们自由选定上下班时间，以避开交通高峰，并记录下某天花在路上的时间，获得如下样本数

13、据：,：传统上班制与弹性上班制上班所花时间相同,：传统上班制与弹性上班制上班所花时间不同,若给定显著性水平,落入接受域，所以没有理由拒绝原假设。结论是传统上班制与弹性上班制上班所花时间没有显著差异，做出这一推断的把握程度为95%。,威尔科克森符号秩和检验应用条件1. 问题的目标：比较两个总体的位置。 2. 数据类型：数据值型数据。 3. 差值分布：非正态分布 3. 样本特性：匹配样本。,两个独立样本的非参数检验（威尔科克森秩和检验）,两个相关样本的非参数检验（符号检验）,对两种型号汽车进行了有关里程表现的检验.从每一型号中随机挑出12辆汽车,且以高速行驶1000英里为基础得到了每种型号汽

14、车的每加仑行驶里程数如下表：,每加仑行驶里程数的两个独立样本数据,在=0.10的显著性水平下，检验两种型号汽车的每项加仑行驶里程数总体间是否有显著差异。,建立上述数据的SPSS数据集如图所示，其中包含number(序号)、singhao( 汽车型号）和liching(行驶里程)三个变量。第一种型汽车编与第二种型号汽车分别编码为1、2。,操作步骤：（1）按AnalyzeNonparametricTests 2Independent Samples顺序单击菜单项，打开对话框，并指定检验变量licheng进入”Test Variable List” 框内。如下图示：,（2）指定分组变量xingha

15、o进入”Grouping Variable” 框内，并点击Define Groups按钮，输入分组值1、2。,操作步骤：（3）在Test Type框中，选择检验方法Mann-Whitney U（曼-惠特尼检验）。Mann-Whitney U（曼-惠特尼检验）等同于Wilcoxon(威尔科克森)秩和检验。是由曼-惠特尼与威尔科克林联合提出的。原假设为两个总体位置相同；备择假设为两个总体位置不同。（4）【OK】。见输出结果如下：,检验统计量的P值小于0.05。故拒绝两个总体位置相同的原假设。即两种型号汽车的每项加仑行驶里程数总体间存在有显著差异,符号检验,威尔科克森符号秩和检验,建立欧美车型比较的数据的SPSS数据集如图所示，其中包含number(序号)、european( 欧洲车型）和american(美洲车型)三个变量。数据编码： 1=非常不舒适；2=不太舒适；3=模棱两可；4=比较舒适；5=非常舒适。,操作步骤：（1）按AnalyzeNonparametricTests 2Related Samples顺序单击菜单项，打开对话框，并指定变量european和american进入”Test Pair(s) List” 框内。如下图示：,操作步骤：（2）在Test Type框中，选中Sign复选项。（3）【OK】。见输出结果如下：,

展开阅读全文

用spss作定序数据分析

最新文档