数据分析及图表编辑•统计分析都是和变量打交道的,变量则可分为定量变量和分类变量两大类对分类变量的描述和推断自然是各种统计软件中非常重要的一部分功能•custom table菜单:–描述表格、汇总报表•Crosstabs菜单项:–频数分布描述,并进行统计推断•Logistic菜单项:–拟合两分类、多分类的Logistic回归模型•Loglinear菜单:–拟合对数线性模型分类资料数据录入格式简介•在定量资料中,一般每个观察对象的变量值都不一样,记录格式为一个观察对象一条记录•分类资料的数据录入格式往往和定量资料不太相同,人们 往往采用频数表格式来记录(此格式没有原始数据库)对频数表格式需要用weight case过程指定频数变量如记录全班54名同学性别资料namesex张三男李四女sexcount男32女22一、行、列表分析•Crosstabs过程用于对计数资料和有序分类资料进行统计描述和统计推断在分析时可以产生二维至n维列联表,并计算相应的百分数指标•统计推断则包括了我们常用的X2检验、Kappa值,分层X2(X2M-H)如果安装了相应模块,还可计算n维列联表的确切概率(Fisher's Exact Test)值。
提示:•Crosstabs过程不能产生一维频数表(单变量频数表),该功能由Frequencies过程实现•要求样本含量应大于40且每个格子中的理论频数不应小于5当样本含量大于40但理论频数有小于5的情况时卡方值需要校正,当样本含量小于40时只能用确切概率法计算概率 1、Crosstabs对话框Crosstabs对话框说明•Row 行变量栏•Column:列变量栏•Previous layer 1 of 1 next 层变量栏•Display clustered bar charts:– 显示聚类条图SPSS会为每对“行变量X列变量”产生一个聚类条图•Suppress tables: 隐藏表格•Layer:指的是层,对话框中的许多设置都可以分层设定,在同一层中的变量使用相同的设置,而不同层中的变量分别使用各自层的设置如果要让不同的变量做不同的分析,则将其选入Layer框,并用Previous和Next钮设为不同层•Layer在这里用的比较少,多用在多元回归中Statistics… 统计量按钮说明•Chi-square:卡方值•Correlations: –相关系数。
在数值型变量下,此选项有效•Nominal:名义数据它是指行与列变量均是无序分类变量–选择是否输出反映分类资料相关性的指标,很少使用说明•Ordinal: 双向有序:–选择是否输出反映有序分类资料相关性的指标,很少使用•Nominal by interval: 名义尺度数据–Eta :艾塔其平方值可认为是应变量受不同因素影响所致方差的比例说明•Kappa: 卡帕系数即内部一致性系数– 例如用来检验两个评估人对同一对象进行评估,是否具有相同的态度,1表示两个人评估结果完全一致,0表明两个人评估结果是由于随机因素造成•Risk:相对危险度它适用于2*2表•McNemar:麦克内马它是用于二个二项分类变量的非参数检验•Cochran’s and Mantel-Haenszel statistics: –Cochran氏与 Mantel-Haenszel统计量 Cells…对话框期望频数残差Format…对话框2、四格表(2*2)例题:–在二乙基亚硝胺诱发大白鼠鼻咽癌的实验中,一组(71只)单纯用亚硝胺向鼻滴注,发癌症鼠数为52只;另一组(42只)在鼻注基础上加肌注维生素B12,结果39只发病。
问两组发癌率有无差别?操作步骤1.建立数据文件2.SPSS的操作步骤1.加权个体2.选择统计分析过程3.参数选择3.结果与分析建立数据文件实例2•某医生用国产呋喃硝胺治疗十二指肠溃疡,以甲氰咪胍作为对照组,问二种方法治疗效果有无差别?处理未愈合 愈合呋喃硝胺854甲氰咪胍2044行、列表资料的卡方检验 •应用条件: 要求每个格子中的理论频数T均大于5或1
•SPSS内含有很强的图形功能,可以产生多种统计图,这些统计图可以由各种统计分析过程产生,也可直接由graph图图形菜单产生其过程可分为三步:–建立数据文件建立数据文件–生成图形生成图形–修饰生成的图形修饰生成的图形1.条形图•它是利用等宽条形的长短或高低来表示相互独立的各指标的数值大小•它适合用来表达各水平组中的数量大小这种定性变量通常是名义变量定性变量通常是名义变量,即对各组在横轴上被放置的前后顺序没有严格的要求–一般说来,按各组数量由大到小排列或由小到大排列绘图时,所用统计指标可以是绝对数也可是相对数 简单分组分段条图同一变量取值不同的分组汇总不同变量的汇总个体观察值例•某厂1994年至1988年年产量如下,试绘制合适的条图年份19941995199619971998产量23.625.127.529.430.1(1)图的图形编辑(2) Chart菜单重设坐轴(刻度轴和分类轴)尺度(线性或对数)数据的范围设定主、次刻度定义第二坐标轴起始位置分类轴的对话框(3) Format菜单•就是用来定义图形的格式–通过此菜单上的命令,可以图形的颜色、填充方式、点标志、连线方式等。
2.圆图•一般概念–圆图是以圆的面积来表示被研究的对象的总体,按该对象各部分所占比重的大小,将圆的面积分割成若干个扇形来表示该对象各部分的构成与总体间的比例关系–通常用于反映局部与整体之间的数量关系绘图时,所用的观测指标必须是相对数•单式园图中只有一个定性变量;•复式园图中有两个或多个定性变量 提示•简单条图、线图、饼图、面积图等在图形编辑窗口中是可以相互转换的•图形编辑窗中,注意菜单gallery的功能3.直方图(histogram) •适用于一组定量资料的频数分布情况,其作用就是把频数分布表表达的资料用图形显示出来使各组段上的频数分布情况一目了然 对话框。