数据统计与分析课后答案

上传人:xzh****18 文档编号:34294124 上传时间:2018-02-22 格式:DOC 页数:21 大小:216.50KB
返回 下载 相关 举报
数据统计与分析课后答案_第1页
第1页 / 共21页
数据统计与分析课后答案_第2页
第2页 / 共21页
数据统计与分析课后答案_第3页
第3页 / 共21页
数据统计与分析课后答案_第4页
第4页 / 共21页
数据统计与分析课后答案_第5页
第5页 / 共21页
点击查看更多>>
资源描述

《数据统计与分析课后答案》由会员分享,可在线阅读,更多相关《数据统计与分析课后答案(21页珍藏版)》请在金锄头文库上搜索。

1、附录 2:数据统计与分析SPSS 应用教程习题答案 本“习题答案”也适用于统计分析应用教程SPSS,LISREL & SAS 实例精选书中的习题。习题 1 答案1(1)答:有错误, 犯了水平互相嵌套的错误; 如“每周去 2 次或 2 次以上”把第 1组的编码嵌套进去了。又比如:“每周去 3 次或 3 次以上”又把第 2 组的编码嵌套进去了。(2)答:正确的编码方案如下:1=每周去 1 次2=每周去 2 次3=每周去 3 次4=每周去 4 次或 4 次以上2答:该编码问题严重。(1)80 岁不能是缺失值, 缺失值可用 00 岁。(2)职业不编码不行, 而必须编码为:1=工人 2=农民 等等。(3

2、)职业变量用全称(Occupation)超出 8 个字符。(4)而且栏目位置占 1 列即可。(5)颜色的第 1 个字母作为变量值会引起重复,应该用单词的前 3-4 个字符。(6)Color 变量的栏目位置 10 被嵌套在“4-14”之内,这是严重的错误。更正后的编码方案见图 1-19:Variable Code 栏目位置Age 00 岁是 Missing Value1-2Occupation 职业应编码为:1=工人 2=农民3=教师 4=干部5=医生 6=其它职业变量要缩写,如 Occu,然后用变量标签注解 Occu 为“职业”3Color 颜色用前三个字母作为变量值,比如: blu=蓝色(b

3、lue)bla=黑色(black)4图 1-19 纠错后的编码方案3(1) 答:错。错在变量名超过 8 个字符。(2) 答:错。错在变量名的首字符是数字领头。(3) 答:错。错在变量名中间冒出一个空格。(4) 答:对,#号可以作为变量名。但不提倡。习题 2 答案1答:合并后的大目标数据文件“BIGab.sav” 中仍然有 30 个 Cases、但每个 Cases各有(50+30)=80 个变量,即 v1、v2、v3、v4v50、x1、x2、x3、x4x30。2答:合并后的大目标数据文件“BIGab2.sav”中仍然是 50 个变量,即v1、v2、v3、v4v50。但是 Cases 数目增加为(

4、20+30)=50 个 Cases。3答:请读者照着书中的方法去使用对话框。排序的命令如下:SORT CASES BY xh (D)sex.LIST xh sex score。4答:对话框的解法请按照书中介绍的去举一反三。命令解法如下:GET File=9293.sav.SELECT IF (location=2 AND sex=2). SORT Cases BY xh (D) sex.LIST xh sex score.5答:对话框的解法请按照书中介绍的去举一反三。命令解法如下:SAMPLE 0.20.LIST xh.6答:对话框的解法请按照书中介绍的去举一反三。命令解法如下:N 50.LI

5、ST xh.7答:对话框的解法请按照书中介绍的去举一反三。命令解法如下:WEIGHT BY location.8答案略。9答案略。习题 3 答案1(1) 答:DATA LIST 命令本身应有终止符“.” 。(2) 答:在 DATA LIST 命令中,File 所调用的数据文件名必须用一对左撇号括住。正确的写法是:DATA LIST File=Myf1.Dat/v1 1-2 v2 3.(3) 答:栏目位置不够变量数目整除。正确的写法是:DATA LIST/v1 To v12 10-33.(4) 答:数值标签要用一对左撇号括住,而且要加上命令的终止符“.” 。正确的写法是:VALUE LABEL

6、Vf 1 工人 2 农民 3 教师 4 医生.(5) 答:命令后面应有终止符“.” 。正确的写法是:VALUE LABEL Vf 1 工人 2 农民 3 教师 4 医生 5 干部.(6) 答:定义缺失值时只能根据变量的栏目位置赋予一个唯一的值。正确的写法是:MISSING VALUE v1 To v100 (-1).或是:MISSING VALUE v1 To v100 (0).(7) 答:变量标签是唯一的;一个变量应该对应唯一的一个标签。正确的写法是:VARIABLE LABEL Score1 第一次考试的成绩/Score2 第二次考试的成绩/Score3 第三次考试的成绩2(1)答:此文件

7、的前 5 个 cases 见表 1-4。表 1-4 文件的前 5 个 casesCASES Id age Height1 01 23 1.652 02 22 1.703 06 21 1.754 08 21 1.765 12 21 1.68(2)答:学号为 01 的学生有最多的 Score1(高考得分)。(3)答:学号为 12 的学生家住农村。(4)答:在 Vm 变量中,有 4 个 Cases 的数据有效。3答:至少有 8 处错误。(1)A 应改为(A)(2)Haircolor 超过 8 个字符,应改为 Haircolr(3)Weigh 应改为 WEIGHT(4)VALUE LABEL 中的 E

8、yecolr 应改为 Eyecolor(5)VALUE LABEL 中的 Haircolor 应改为 8 个字符以内,如 Haircolr(6)MISSING VALUE 中的 age(-1)应去掉,因为 Data List 中尚未定义 age。(7)正确的 MISSING VALUE 语句应改为:MISSING VALUE Height Weight(000).(8)List Variable 语句应改为:List Variable=Height To Eyecolor.4答:“05 F Ll”中的 Ll 为字母(型),犯了类型不匹配的错误。正确的写法是:05 F 005答:总体(popul

9、ation)是样本测量值的集合。对于感兴趣的整个组中,每个成员都对应一个这样的值。具体说来是某省的人口(总体)或工业产值(总体)中的某个指标测量值的集合,而不是那些人或物的集合。样本(sample)虽然也是一些值的集合,但不代表整个感兴趣的组。比如,一个样本可以是某省中某县的人口的集合或某县工业产值的集合。6答:由于总体与样本的不同,由此派生出参数与统计量的差别。(1)参数:参数(parameters)是总体的测量值,用希腊字母表示。(2)统计量:统计量(statistics)则是样本的测量值,用一般的英文字母表示(见本章内容)。7答:(1)均值:用以描述数据(值)分布的中心位置。定距以上的数

10、据计算均值才有意义。比如,对于一个总体(某省)的人口,其平均值被称为总体均值(populationg mean),记为。对于某样本(某县)的人口,其平均人口则被称为样本均值(sample average)。总体均值和样本均值的计算公式是相同的。但是其他测量值不一定相同。此外,还有方差、标准偏差等概念。(2)标准偏差:也被称为标准差。表示某人的身高或收入等测量值偏离均值多少。比如甲班语文成绩的标准偏差为 20,乙班语文成绩的标准偏差为 30,那么,乙班语文成绩比甲班的语文成绩变化(波动)大。(3)方差:标准偏差的平方则是方差。方差表示数据内部的变异性。8答:统计学上,一般都是假设被统计的样本是来

11、自正态分布(Normal distribution)的总体。正态分布是关于总体的一种理论分布,是有严格的数学定义的。从正态分布的总体中抽取的样本一般是服从正态分布的。正态分布的重要特征如下:(1)均值:均值是观察值的平均值(Mean value)。区间(Interval)型以上变量值的均值才有意义。 (2)众数:众数是最经常发生的频次。众数是对定类变量(Nominal)而言的。比如某班有男生 25 名、女生 15 名,那么,该班男生的人数是众数。(3)中位数:中位数是对次序(Ordinal)变量值而言的。中位数是比取值的一半大、同时又比取值的一半小的值。或者说,中位数的一半落在均值之上,同时,

12、另一半则落在均值之下。中位数的取值方法有两种:单数情况下的观察值的中位数;双数情况下的观察值的中位数。(4)正态分布的均值、众数、中位数重叠:将正态分布的图形沿着中心位置对半折叠时,均值、众数、中位数三者重叠在一起。9.有哪些经验规则?答:如果数据来自服从正态分布的总体,可用下面的经验规则很快地概括出我们的数据。经验规则如下: 68%的观察值是落在离均值一个标准偏差(1)的范围内。 95%的观察值是落在离均值两个标准偏差(2)的范围内。 99%的观察值是落在离均值三个标准偏差(3)的范围内。习题 4 答案下面是 RECODE 习题。1答:命令格式如下:RECODE v1,v2 (原值 1=新值

13、 1)(原值 2=新值 2). (原值 m=新值 m)例如:RECODE age (0 thru 30=1)(30 thru 60=2)(60 thru 90=3)(90 thru hi=4).2答:命令中允许使用的关键词如下:LO(或 LOWEST)、HI(或 HIGHEST)、THRU、 MISSING、ELSE、SYSMIS3.(1)答:语法正确,但结果不太理想。因为结果只剩下 0 和 2 两组。(2)答:语法正确,但结果不太理想。原因同上。4.答:用“/”分隔。例如:RECODE Gage (1,2=1)(3,4=2)/sex(1=1)(2=0).5.答:对。因为将变量 A 由原来的

14、4 组合并为两组。 6.(1)答:对。这是端点连接法。 (2)答:对。符合语法规则,但是会漏掉各组的端点值。 (3)答:对。符合语法规则。但结果只剩下 100 卡以内的一组数据。7.RECODE age(MISSING=00).MISSING VALUE age(-1). (进一步将系统缺失值“-1”改为用户缺失值)8.答:RECODE INCOME (LO THRU 5000=1)(5000 THRU HI=2).9.答:RECODE sex(F=B)(M=A).10.答:有以下 4 个变换命令。RECODE sex (1=1)(2=0).COMPUTE Gage=age.COUNT FM=

15、F(1)M(2).IF(sex=2 AND location=2) GROUP=2.下面是 Compute 习题11.答:COMPUTE score=S1/S2*100.COMPUTE X=ABS(-7.8).12.答:见第 4 章。13.(1)答:Y 1=7.8(2)答:Y 2=-16(3)答:Y 3=25(4)答:Y 4=-1(5)答:A=10(6)答:B=0.79(7)答:C=2.2(8)答:D=2(9)答:E=2.72(10)答:F=0下面是 COUNT 习题14.(1) 答:真(2) 答:真(3) 答:假15.(1) 答:真(2) 答:真习题 5 答案下面是 FREQUENCIES 习题答案。1(1) 答:众数(2) 答:众数(3) 答:均值(4) 答:均值(5) 答:众数(6) 答:均值(7) 答:均值2(1) 答:真(2) 答:真(3) 答:假(4) 答:假(5) 答:真3. 答:已填补的频次见图 5-24 中打#标记的数据。择 偶 标 准 115 38.5 38.5 38.55# 12.8# 12.8# 51.37 17.9 17.9 69.2#5 12.8 12.8 82.13 7.7 7.7 89.71 2.6 2.6 92.33 7.7# 7.7 100.039 100.0 100.0相 貌文 化 水 准气 质 风 度志 同 道 合人 品本 人 收 入

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号