统计分析-Spss17.0应用

上传人:n**** 文档编号:50601550 上传时间:2018-08-09 格式:PPT 页数:62 大小:2.01MB
返回 下载 相关 举报
统计分析-Spss17.0应用_第1页
第1页 / 共62页
统计分析-Spss17.0应用_第2页
第2页 / 共62页
统计分析-Spss17.0应用_第3页
第3页 / 共62页
统计分析-Spss17.0应用_第4页
第4页 / 共62页
统计分析-Spss17.0应用_第5页
第5页 / 共62页
点击查看更多>>
资源描述

《统计分析-Spss17.0应用》由会员分享,可在线阅读,更多相关《统计分析-Spss17.0应用(62页珍藏版)》请在金锄头文库上搜索。

1、统计分析Spss17.0应用数学建模工作室房恩岳2013-1-14一、Spss简介二、数据基本操作目 录三、统计图绘制四、统计分析五、应用实例一、SPSS简介SPSS是英文Statistical Package for the Social Science(社会科学统计软件包) 的缩写。20世纪60年代末,美国斯坦福大学 的三位研究生研制开发了最早的统计分析软 件SPSS.一、SPSS简介SPSS名为社会科学统计软件包,这是为 了强调其在社会科学应用的一面(因为社会科 学研究中的许多现象都是随机的,要使用统 计学来进行研究),而实际上广泛应用于经济 学、社会学、生物学、教育学、心理学、医 学以

2、及体育、工业、农业、林业、商业和金 融等各个领域。二、数据的基本操作l 导入数据 l 数据排序l 数据转置l 数据加权l 数据转换l 替换缺失值l 随机数生成器l 导出数据三、统计图的绘制描述定量数据的统计图描述定性数据的统计图1. 直方图2. 线图3. 箱式图4. 误差条图5. 散点图1. 直条图2. 构成图四、统计分析I. 假设检验II. 相关分析III.回归分析IV. 聚类分析V. 主成分分析和因子分析1.正态性检验2.T检验3.方差分析4. 检验5.非参数秩和检验1.单样本T检验1.1 统计学上的定义和计算公式定义:SPSS单样本T检验是检验某个变量的总 体均值和某指定值之间是否存在显

3、著差异。 统计的前提:样本总体服从正态分布。 也就是说单样本本身无法比较,进行的是其均值与 已知总体均值间的比较I.T检验I.T检验1.建立检验假设,确定检验水准 无效假设H0: ,即样本均数 与总体均数 和已知总体均值 之间不存在显著差异。备则假设H1: ,即样本均数 与总体均数 和已知总体均值 之间存在显著差异。 =0.052.计算检验统计量按照下面公式计算T统计量: I.T检验3.根据P值,做出推断结论I.T检验SPSS将自动计算T值,由于该统计量服从n1个 自由度的T分布,SPSS将根据T分布表给出t值对应 的相伴概率值。如果相伴概率值小于或等于用户设 想的显著性水平,则拒绝 ,认为被

4、检验数据之 间存在显著差异。相反,相伴概率值大于显著性水 平,则不拒绝 ,可以认为被检验数据之间不存 在显著差异。1.2 SPSS的实现过程 例1.一个生产高性能汽车的公司生产直径 为322mm的圆盘制动闸。公司的质量控制部门 随机抽取不同机器生产的制动闸进行检验。现 一共有4台机器,每台机器抽取16个产品。测 量结果见附表1,用适当方法检验每台机器生 产的产品均值和322在90%的置信水平下是否有 显著差异。I.T检验2.两独立样本T检验 2.1 统计学上的定义 定义:所谓独立样本是指两个样本之间彼此独立没 有任何关联,两个独立样本各自接受相同的测量, 研究者的主要目的是了解两个样本之间是否

5、有显著 差异存在。I.T检验适用条件: 两个样本应是互相独立的,即从一总体中抽取一 批样本对从另一总体中抽取一批样本没有任何影响 ,两组样本个案数目可以不同,个案顺序可以随意 调整。 样本来自的两个总体应该服从正态分布。 两总体方差 ,即方差齐性1. 建立检验假设,确定检验水准2. 计算检验统计量t3. 根据P值,作出推断结论I.T检验两总体均数相同两总体均数不同2.3 SPSS的实现过程 例2.在体育课上记录14名学生乒乓球得分 的数据,男女各7名,他们的得分数据如下表 (附表2),比较在置信度为95%的情况下男女 得分时的明显差别。性别得分男82 80 85 85 78 87 82女75

6、76 80 77 80 77 73I.T检验3.配对样本T检验3.1 统计学上的定义和计算公式l定义:配对样本t检验目的是检验两相关样本均数 所代表的未知总体均数是否有差别。 一般用于同一研究对象(或两配对对象)分别给予 两种不同处理的效果比较,以及同一研究对象(或 两配对对象)处理前后的效果比较。前者推断两种 效果有无差别,后者推断某种处理是否有效。I.T检验两配对样本T检验的适用条件如下: 两个样本应是配对的。在应用领域中,主 要的配对资料包括:具有年龄、性别、体重、 病况等非处理因素相同或相似者。首先两个样 本的观察数目相同,其次两样本的观察值顺序 不能随意改变。 样本来自的两个总体应服

7、从正态分布。且 差值也服从正态分布。I.T检验配对样本的T检验是求出每个个案值之差, 所有样本值的观测值之差形成一个新的单样本。 显然,如果两个样本的均值没有显著差异,则样 本值之差的均值应该接近零,这实际上转换成为 一个单样本的T检验。所以,配对样本的T检验就 是检验来自总体均值的差值是否为零,这里要求 差值来自总体服从正态分布。当u1-u2=0时,t统计量服从自 由度为n-1的分布I.T检验3.2 SPSS的实现过程 例3.新药疗效的测试结果检验某医疗机构针对具有家族心脏病史的病人研发了 一种新药。为了检验这种新药的疗效是否显著,对16 位病人进行了为期半年的观察测试,测试指标为使用 该药

8、之前和之后的体重以及甘油三酯的水平变化。数据详见附表3I.T检验小结以上讨论了统计分析中的参数检验方法。参数检 验问题一般分为三个部分:单样本T检验、独立样本T 检验和配对样本T检验,处理方式各有各的特点,也 不尽相同。应重点掌握参数检验的基本思想以及统计 结果输出的实际含义。I.T检验练习1某项研究评估低氧环境对运动者心肌血流量 的影响,将17名男性志愿者随机分成两组,分别 在正常含氧环境和低氧环境中测定运动后的心肌 血流量,数据详见练习1,问两种环境中运动者 的心肌血流量有无差异。I.T检验方差分析概述方差分析是20世纪20年代发展起来的一种统 计方法,被广泛应用于分析心理学、生物学、工

9、程和医药的试验数据等领域。在形式上方差分析 是比较多个总体的均值是否相等,本质上它是研 究变量之间的关系,这与回归分析方法有许多相 同之处,但又有本质区别。在研究一个(或多个 )分类性自变量与一个数值型因变量之间的关系 时,方差分析是主要方法之一。II.方差分析方差分析是研究分类性自变量对数值型 因变量的影响,例如它们之间有无关系、关 系强度如何等,方差分析方法首先检验总体 的均值是否相等,进而判断分类型自变量对 数值型因变量的显著性影响。II.方差分析Bonferroni t 检验Dunnett-t 检验LSD-t 检验SNK-q检验Tukey检验Schffe检验Sidak t检验多个样本均

10、数的两两比较问题:k个均数间两两比较能 否采用t 检验?II.方差分析SNK (StudentNewmanKeuls) 法的检验统计量为 ,故又称为 检验II.方差分析SPSS的实现过程 例4.某实验室研究人员检测了三种病情慢 性乙型肝炎患者血清sFasl水平,试比较不同 病情乙型肝炎患者sFasl水平是否不同?数据详见附表4II.方差分析多因素方差分析多因素方差分析用来研究两个及两个以上 的控制变量是否对观察变量产生显著影响。由 于讨论多个因素对个案的影响,因此这种方差 分析过程被称为多因素方差分析。多因素方差 分析不仅能够分析多个因素对观测变量的影响 ,而且能够分析多个控制因素的交互作用能

11、否 对观测变量的分布产生影响,进而最终找到利 于观测变量的最优组合。II.方差分析多因素方差分析 SPSS利用“一般线性模 型”模块的“单变量”过 程来完成多因素方差分析 。 “单变量”过程可以处 理各种不同设计,如完全 随机区组设计、析因设计 、拉丁方设计、裂区试验 设计、交叉设计和协方差 分析。II.方差分析多因素方差分析单变量:模型II.方差分析多因素方差分析单变量:对比II.方差分析多因素方差分析单变量:轮廓图II.方差分析多因素方差分析单变量:保存II.方差分析多因素方差分析单变量:选项II.方差分析SPSS的实现过程 例5.三台机器(用A、B、C表示)生产同 一种产品,附表5 给出

12、了4名工人操作机器A、 B、C生产的产品的产量,问机器之间、工人之 间在产量上是否存在显著差异?II.方差分析小 结1.方差分析常用于三个及以上均数的比较,当用于两个均数的比较时,同一资料所得结果与t检验等价,即有如下关系 。 2.方差分析的基本思想:将全部观测值的总变异按影响因素分解为相应的若干部分变异,在此基础上,计算假设检验的统计量 F 值,实现对总体均数是否有差别的推断。 II.方差分析III.相关分析1.1 简单相关分析双变量相关分析,即简单相关分析,主要用于 进行两个或多个变量间的相关分析(包括参数 和非参数)。由于相关分析的绝大多数都通过 两个变量进行相关分析,故有时直接将其简称

13、 为相关分析。如果进行两个变量的相关分析, 则直接给出相关结果;如果进行多个变量的相 关分析,则系统将给出多个变量间两两相关的 分析结果。简单相关分析在数理统计分析过程中,相关分析的使用非常 广泛。例如,通过相关分析,可以判断学生的 数学成绩和英语成绩高低是否相关。又例如, 相关分析可以帮助实现验证家庭收入、消费、 储蓄之间的关系。相关分析提供了衡量变量之 间相互线形关系强弱的工具。III.相关分析简单相关分析进行简单相关分析方法有两种:第一种,通过 散点图直观显示变量之间关系;第二种,通过 相关系数准确反映两变量的关系程度。两种方 法各有优劣。利用散点图直观显示,相关关系 更为简单明了、但不

14、够精确;而利用相关系数 反映正好相反,它能够以数字准确描述变量间 的线性相关程度。III.相关分析简单相关分析简单相关分析统计推断的基本步骤如下:(1)无效假设H0:两总体之间不存在显著的线性相关备择假设H1:两总体之间存在显著的线性相关;(2)根据不同的相关系数计算方法,计算相应的统计量;(3)根据统计量得到所对应的概率P;(4)用户给定一个显著性水平。如果P小于或等于显著 性水平,则拒绝零假设H0,接受H1,认为两总体之间存在 显著的线性相关。否则,如果P大于显著性水平,则接受零 假设H0,认为两总体之间不存在显著的线性相关。III.相关分析1.2 SPSS的实现过程 例6. 某医师研究某

15、种乳粉价值时,用大白鼠做 实验,得到大白鼠进食量和体重增加量的资料如下表 ,试问大白鼠的进食量与体重的增加量之间有无关系 ?能否用大白鼠的进食量来估计体重的增加量?动物编号1 2 3 4 5 6 7 8 9 10 11进食量820 780 720 867 690 787 934 679 639 820 780增重量165 158 130 180 134 167 186 145 120 150 135III.相关分析IV.回归分析线性回归线性回归分析(Linear Regression)是研究一 个因变量和一个或多个自变量之间是否存在某种线 性关系的统计学方法。如果参与回归分析的自变量 只有一个

16、,就是线性回归分析,也称为直线回归分 析,得到的结果称为直线回归方程。如果参与回归 分析的变量有多个,则是多元线性回归。线性回归分析是基于最小二乘原理的统计分析 方法,是在统计假设下的最优线性无偏估计。线性回归线性回归方程显著性检验 无效假设H0,即检验回归系数为零; 备则假设H1,即检验回归系数不为零; 如果为零,说明被解释变量和解释变量之间不具有 线性关系,回归方程没有意义,线性回归方程不能 够解释被解释变量和解释变量之间的关系。IV.回归分析V.聚类分析1.1 K-Means聚类K-Means聚类分析的核心步骤1. 指定聚类数目K 2. 确定K个初始类中心SPSS中初始类中心的指定方式有两种:一是用户指定 方式;二是系统指定方式。 3. 根据距离最近原则进行分类 4. 依次计算每

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 医学/心理学 > 综合/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号