spss软件使用方法_上海交通大学-魏晓萍

上传人:飞*** 文档编号:48059061 上传时间:2018-07-09 格式:PPT 页数:93 大小:17.93MB
返回 下载 相关 举报
spss软件使用方法_上海交通大学-魏晓萍_第1页
第1页 / 共93页
spss软件使用方法_上海交通大学-魏晓萍_第2页
第2页 / 共93页
spss软件使用方法_上海交通大学-魏晓萍_第3页
第3页 / 共93页
spss软件使用方法_上海交通大学-魏晓萍_第4页
第4页 / 共93页
spss软件使用方法_上海交通大学-魏晓萍_第5页
第5页 / 共93页
点击查看更多>>
资源描述

《spss软件使用方法_上海交通大学-魏晓萍》由会员分享,可在线阅读,更多相关《spss软件使用方法_上海交通大学-魏晓萍(93页珍藏版)》请在金锄头文库上搜索。

1、统计分析软件SPSS应用方法魏晓萍SPSS一、SPSS概述二、SPSS数据创建三、SPSS统计分析1、基本统计分析2、方差分析3、相关分析4、回归分析5、聚类分析1 SPSS简介SPSSStatistical Package for the Social Sciences社会科学统计软件包Statistical Product and Service Solutions统计产品与服务解决方案68年开发,75年成立SPSS公司,2009年IBM收购,目前到IBM SPSS20.0版本次讲解应用IBM SPSS for Windows 19.0一 SPSS概述1、SPSS简介2、SPSS窗口1 S

2、PSS简介SAS、SPSS和SYSTATSAS:为专业统计分析人员设计,功能强大,灵活多样。 SPSS:非专业人士,操作简便,好学易懂,简单实用。“易学易用易普及”大多数操作可通过鼠标拖曳、点击“菜单”、“按钮”和“对话框”来完成。无需掌握统计分析的各种复杂的数学运算过程,只需掌握各种方法的应用,分析结果 的解释。功能强大完整的数据输入、编辑、统计分析、报表、图形制作等功能。自带11种类型136个函 数。提供从简单的统计描述到复杂的多因素统计分析方法。能非常方便地与其他软件的数据进行转换图表功能强大,输出结果美观漂亮2 SPSS窗口标题栏 菜单栏工具栏编辑栏变量名栏观 测 序 号窗 口 切 换

3、 标 签2 SPSS窗口变量序号 名称可变观测序号变量序号变量属性名称结果输出窗口2 SPSS窗口导 航 窗 口二、统计数据创建数据属性及定义、编辑 SPSS数据创建案例:SPSS数据创建1数据属性及定义编辑SPSS数据特点:结构化(数据内容、数据结构)变量名、变量类型、变量名标签、变量值标签、缺失值的定义、度量的尺度、及数据 的显示属性(显示宽度、列宽度、对齐方式)不超过8个字符、4个汉字 变量名必须唯一,并且不区 分大小写如不指定变量名,则系统默 认变量名以VAR开头后面跟 5个数字。如VAR00001、 VAR0002等1.1变量名(名称)数 据 视 图变 量 视 图1.2变量类型变量取

4、值的类型 数值型、字符型(不能进行算术运算)、日期型1.3标签标签是对变量名的进一步解释名称限制字符不超过8个,标签可达120个字符1.4值值是对变量取值含义的进一步解释1.5缺失值缺失值两种情况:数据中存在漏填数据 数据中存在明显错误或明显不合理的数据(如年龄130)如果直接进行数据分析,SPSS将把缺失数据作为正常数据,造成非常大的误差缺失数据处理步骤: 1、指定缺失数据,指明哪些数据属于缺失数据空缺数据,首先填一个特定标记数据(如99999,区别于该变量其他非缺失数据)2、统计分析时对缺失数据进行一定处理选择缺失数据处理方法2、 SPSS数据创建直接录入1、定义数据属性;2、输入数据打开

5、现有数据(sav、excel、SAS、txt)2、 SPSS数据创建直接录入1、定义数据属性;2、输入数据打开现有数据(sav、excel、SAS、txt)2.SPSS数据创建3.案例:SPSS数据创建1、定义变量属性2、读取excel数据文件三、SPSS统计分析SPSS基本统计分析方差分析相关分析线性回归分析聚类分析1、基本统计分析基本统计分析,描述性统计分析是统计分析的第一步,做好这第一步是下面 进行正确统计推断的先决条件。SPSS的许多模块均可完成描述性分析,但专门为该目的而设计的几个模块则集中在描述菜单中,包括:1.1频数分析频数分析目的:基本统计分析往往从频数分析开始。通过频数分析

6、能够了解变量取值的状况,对把握数据的分布特征是非常有用的。基本任务 (1)编制频数分布表频数:即变量值落在某个区间(或某个类别)中的次数 百分比:即各频数占总样本数的百分比有效百分比:即各频数占有效样本数的百分比,有效样本数总样本缺失样本数 累计百分比:即各百分比逐级累加起来的结果。最终取值为100。(2)绘制统计图1.1 频数分析频数分析的基本操作(1)分析描述统计频率 (2)将频数分析变量选择到变量框中 (3)单击表格按钮选择绘制统计图形 ,选择饼图1.1频数分析1.1频数分析输出结果1.2 描述分析描述分析目的:获取数据的均值、标准差、峰度等数据,进一步把 握数据的集中趋势、离散程度和分

7、布形状。基本描述统计量刻画集中趋势的统计量刻画离散程度的统计量刻画分布形态的统计量1.2 描述分析刻画集中趋势的统计量集中趋势指一组数据向某一中心值靠拢的倾向。计算刻画集中趋势的统计量 正是要寻找能够反应数据一般水平的“代表值”或“中心值”。常用统计量:均值、中位数、众数均值:即算术平均数,是反映某变量所有取值的集中趋势或平均水 平的指标。如某企业职工的平均月收入。中位数:即一组数据按升序排序后,处于中间位置上的数据值。众数:即一组数据中出现次数最多的数据值。1.2 描述分析刻画离散程度的统计量离散程度是指一组数据远离其“中心值”的程度。如果数据都紧密地集中在“中心值”的周围,数据的离散程度较

8、小,说明这 个“中心值”对数据的代表性好;相反,如果数据仅是比较松散地分布在“中 心值”的周围,数据的离散程度较大,则此“中心值”说明数据特征是不具有 代表性的。常用统计量:全距、方差、标准差全距:也称极差,是数据的最大值与最小值之间的绝对离差。1.2 描述分析刻画分布形态的描述统计量数据分布形态主要指数据分布是否对称,偏斜程度如何,分布陡峭程度等。常用统计量:偏度、峰度偏度:描述变量取值分布形态对称性的统计量。当分布为对称分布时,正负总偏差相等,偏度值等于0;当分布为不对称分布时,正 负总偏差不相等,偏度值大于0或小于0。偏度值大于0表示正偏差值大,称为正偏或 右偏;偏度值小于0表示负偏差值

9、大,称为负偏或左偏。偏度绝对值越大,表示数据 分布形态的偏斜程度越大。峰度:描述变量取值分布形态陡峭程度的统计量。当数据分布与标准正态分布的陡峭程度相同时,峰度值等于0;峰度大于0表示数据的 分布比标准正态分布更陡峭,为尖峰分布;峰度小于0表示数据的分布比标准正态分 布平缓,为平峰分布。1.2 描述分析计算基本描述统计量的操作(1)分析描述统计描述 (2)将分析变量选择到变量框中 (3)单击选项按钮指定基本统计量1.2 描述分析1.3 基本统计分析案例案例:居民基本储蓄情况2、方差分析方差分析概述背景案例统计学原理相关统计量 SPSS操作SPSS结果解读方差分析案例2.1方差分析概述2.1.1

10、背景案例影响农作物产量的因素可能有多个,如品种、施肥量、地域特征等 。在众多的因素中,有些因素会对产量有明显的影响,有些因素的 影响不大。因此,找到中影响因素中起重要的和关键作用的因素是 非常重要的。进一步,在掌握了关键因素后,如品种、施肥量等, 还需要对不同品种、不同施肥量的产量进行比较,研究究竟哪个品 种的产量高,施肥量究竟多少最为合适。在制定广告宣传策略时,不同方案所获得的广告效果可能是不一样 的。广告效果可能会受到广告形式、地区规模、播放时间段、播放 频率等因素的影响。需要研究在影响广告效果的众多因素中,哪些 因素是主要的,哪些是次要的,哪些因素水平是最合理的。对这种类似问题的研究可以

11、通过方差分析来实现。2.1 方差分析概述2.1.2 方差分析相关概念观测变量:农作物产量、广告效果因素(控制变量):品种、施肥量、播放时间段等因素水平:因素的不同类别,如甲品种、乙品种就是品种这一变量 的两个水平。单因素方差分析、多因素方差分析2.1 方差分析概述2.1.3 方差分析统计学原理 观测变量取值变化原因:1、控制变量; 2、随机变量如果相对于随机变量引起的观测值差异,控制变量引起的观测值差异较大,则说明控制变 量对观测变量有显著影响。在统计学中,控制变量和随机变量引起的差异可以分别用一个 统计量来表示。单因素方差分析中,分别用SSA、SSE来表示。 SSA:组间差异(组间离差平方和

12、),主要是由控制变量的不同水平造 成的差异; SSE:组内差异(组内离差平方和),主要是由随机变量引起的差异。 SSA+SSE=SST SST:总差异(总离差平方和)方差分析任务:判定SSA相对于SST(或SSE)的大小。SSA相对较大,则表明 控制变量起到了显著影响,若相对较小,则表明控制变量没有显著影响。2.1 方差分析概述2.1.3 单因素方差分析统计学原理假设控制变量会对观测值不会产生显著影响,将总离差(SST)分解为组间离差平方和( SSA)和组内离差平方和(SSE)。 比较SSA与SST的相对大小。SSA与SST的相对大小要受到样本规模、控制变量水平数的影响,为消除这些因素的影响

13、对SSA、SST要进行一定的处理(分别除以自由度),用统计量F来表示SSA的相对大小F= =SSA /自由度 组件均方差 SSE /自由度 总均方差方差分析-从观测变量的部分取值推测观测变量总体取值与随机变量的关系。 部分是否能够代表总体情况?由于存在随机抽样和样本数量较少等原因,通过分析样本的出的结论不能直接用于总体 。要进行假设检验。F是随机变量,服从一定的分布,其取值会因为具体的样本的不同而不同。计算研究样 本的F值,即F的观测值,并计算该F观测值对应概率p值,如果p值很小(一般是小于 0.05),说明F取到该观测值的概率很小,是不可能发生的。则认为假设“控制变量对观 测值没有显著影响”

14、是不对的,也就是,控制变量会对观测变量产生显著影响。2.1方差分析概述2.1.4 单因素方差分析基本假设:对总体分布的假设:总体服从正态分布各处理组总体方差相等(方差齐性或方差同质性)正态分布检验:根据大数定律和中心极限定理原理 ,假设满足。方差齐性检验:对控制变量不同水平下观测变量总体的方差是否相等进行假设检验,在 SPSS中可以通过方差同质性检验进行。2.2 SPSS方差分析操作2.2.1 方差分析数据形式离差分解时仅仅是对观测水平这一列的数值进行分析,但是也要有 存放控制变量的列。正确的数据格式是统计分析的前提。观测变量 控制变量2.2 SPSS方差分析操作2.2.2 SPSS操作步骤打

15、开的数据格式分析比较均值单因素方差分析选择观测变量(因子)、控制变量(因变量)(只能选择一个因子) 选项,选择“方差同质性检验”缺失值处理2.3 SPSS方差分析结果解读P值(显著性)=0.515,远大 于基准值0.05,说明假设“方 差齐性”正确,即控制变量不 同水平下各组的方差相同。 满足方差分析的前提。P值(显著性)=0. 000,远小于基 准值0.05,说明假设“控制变量对观 测变量没有显著影响,即广告形式 对销售额没有显著影响”正确,即控 制变量不同水平下各组的方差相 同。结论:广告形式对销售额有显著影响。2.3 SPSS方差分析结果解读结论:广告形式用报纸获得的销售额最高,宣传品的

16、效果最不好2.4 单因素方差分析案例SPSS单因素方差分析操作案例广告形式、地区对销售额的影响1、广告形式、地区对销售额是否有影响?2、哪种广告形式效果最理想?哪个地区的销售额最高?3 相关分析相关分析概述 SPSS相关分析操作SPSS相关分析结果解读SPSS相关分析案例3.1 相关分析概述家庭收入和支出、子女身高和父母身高的关系、一个人的身高和体重的关系?客观事物之间关系:函数关系、统计关系函数关系:当一个或几个变量取一定的值时,另一个变量有确定值与之相对应 统计关系:非一一对应,当一个变量x取一定值时,另一变量y无法依确定的函 数取唯一确定的值。相关分析:研究两个变量相互关系的密切程度和变化趋势,并用适当的统计指 标描述。3.1 相关分析概述相关分析与方差分析的比较相同点:分析两个变量之间是否有关系不同点: 1、相关分析的两个变量都是随机变量(不能人为精确控制取值大小 ); 回归分析的控制变量是非随机变量(其取值可以固定),观测 变量是随机变量。2、相关分析的两个变量都可

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号