李炜制作 第三讲 SPSS的主要窗口和菜单培训课件

上传人:yuzo****123 文档编号:138127475 上传时间:2020-07-13 格式:PPT 页数:114 大小:767.50KB
返回 下载 相关 举报
李炜制作 第三讲 SPSS的主要窗口和菜单培训课件_第1页
第1页 / 共114页
李炜制作 第三讲 SPSS的主要窗口和菜单培训课件_第2页
第2页 / 共114页
李炜制作 第三讲 SPSS的主要窗口和菜单培训课件_第3页
第3页 / 共114页
李炜制作 第三讲 SPSS的主要窗口和菜单培训课件_第4页
第4页 / 共114页
李炜制作 第三讲 SPSS的主要窗口和菜单培训课件_第5页
第5页 / 共114页
点击查看更多>>
资源描述

《李炜制作 第三讲 SPSS的主要窗口和菜单培训课件》由会员分享,可在线阅读,更多相关《李炜制作 第三讲 SPSS的主要窗口和菜单培训课件(114页珍藏版)》请在金锄头文库上搜索。

1、李炜制作*,第三讲 SPSS的主要窗口和菜单,1 SPSS的3个主要窗口 1-1 数据编辑器窗口(SPSS Data Editor):用来编辑和显示数据;在此窗口中的文件名称为*. sav。 1-2 程序语句编辑器窗口( SPSS Syntax Editor):用来编写各种程序;在此窗口中的文件名称为*. sps。 1-3 结果观看窗口( SPSS Viewer):显示统计运算结果;在此窗口中的文件名称为*. spo。,李炜制作*,2 SPSS 数据编辑器的主要菜单 2-1 File 菜单:文件管理 New;Open;Save;Save as;Exit。 2-2 Edit 菜单:编辑 Undo

2、;Cut;Copy;Paste;Clear; Find; 2-3 View菜单:视图 Fonts;Grid lines;Value labels。,李炜制作*,2-4 Data菜单:数据整理 define variables;Insert variables;Insert case; go to case;sort case;select case。 2-5 Transform菜单:数据转换 recode;compute;count。 2-6 Statistics菜单:统计 2-7 Graphs菜单:统计图 2-8 Utilities菜单:工具附件 2-9 Windows菜单:窗口 2-10

3、Help菜单:帮助,李炜制作*,第四讲 SPSS的单变量描述统计,1 单变量描述统计介绍 A变量的尺度: a 定类 Category Scale:只能计次 b 定序 Ordinal Scale:计次、排序 c 定距 Interval Scale:计次、排序、加减 d 定比 Ratio Scale:计次、排序、加减、乘除,李炜制作*,分布,平均数,中位数,众数,离散程度,李炜制作*,李炜制作*,2 SPSS的单变量描述统计命令 A Frequencies: 频数统计 StatisticsSummarizeFrequencies,李炜制作*,变量值,频数,百分比,有效百分比,累计百分比,李炜制作*

4、,李炜制作*,李炜制作*,B Descriptives: 定距变量描述统计 StatisticsSummarizeDescriptives,李炜制作*,变量名,平均数,标准差,最小值,最大值,李炜制作*,第四讲 SPSS的双变量关系描述统计(一) 列联与方差分析,1、变量关系概述 寻找变量间的关系是科学研究的首要目的。变量间的关系最简单的划分即是有关与无关。 在统计学上,我们通常这样判断变量之间是否有关:如果一个变量的取值发生变化,另外一个变量的取值也相应发生变化,则这两个变量有关。如果一个变量的变化不引起另一个变量的变化则二者无关。,李炜制作*,性别与四级英语考试通过率的相关统计,表述:统计

5、结果显示,当性别取值不同时,通过率变量的取值并未发生变化,因此性别与考试通过率无关。 自变量的不同取值在因变量上无差异,两变量无关。 自变量的不同取值在因变量上有差异,两变量有关。,李炜制作*,表述:统计结果显示,当性别取值不同时,收入变量的取值发生了变化,因此性别与月收入有关。,李炜制作*,2、双变量关系的统计类型,李炜制作*,3、列联统计 3-1 列联表的格式,自变量,因变量,人数,行百分比,列百分比,总百分比,李炜制作*,3-2 列联分析的原理: 自变量发生变化,因变量取值是否也发生变化。 比较边缘百分比和条件百分比的差别。,李炜制作*,4-1) 变量关系强度的含义: 指两个变量相关程度

6、的高低。统计学中是以准实验的思想来分析变量相关的。通常从以下的角度分析: A)两变量是否相互独立。 B)两变量是否有共变趋势。 C)一变量的变化多大程度上能由另一变量的变化来解释。,4 列联变量的关系强度测量,李炜制作*,4-2) 双变量关系强度测量的主要指标,李炜制作*,4-3)卡方测量的原理: 卡方测量用来考察两变量是否独立(无关)。 其原理是根据这一概率定理:若两变量无关,则两变量中联合事件发生的概率应等于各自独立发生的概率乘积。,在列联表中,这一定理就具体转化为:若两变量无关,则两变量中条件概率应等于各自边缘的概率乘积。反之,则两变量有关,或,两变量不独立。,李炜制作*,示例,李炜制作

7、*,由此可见,期望值(独立模型)与观察值的差距越大,说明两变量越不独立,也就越有相关。因此,卡方的表达式如下: 卡方的取值在0之间。卡方值越大,关联性越强。在SPSS中,有Pearson X2和相似比卡方(Likelihood Ratio X2 )两种。,李炜制作*,4-4) 的改进标准化系数: 为使 值有一固定的区间,便于比较,采用了以下几个修正:,A、系数(Phi): (01), 适用于22表。 B、 列联系数(Contingency Coefficient): (01),适用任意表。 C、 Cramer V系数:(01),适用任意表。 D、系数(Lambda): (01),适用任意表。

8、E、 Goodman Y(妻子收入),P(xi, yi),Y=k,李炜制作*,共变异数(协方差)=,李炜制作*,散点越集中于1、3象限,共变异数的和正值约大; 散点越集中于2、4象限,共变异数的和负值约大; 散点越均匀分布于各象限,共变异数的和越趋近于0。,李炜制作*,3)相关系数的计算公式:,由此公式可看出: 1 相关就是共变异数的标准化。 2 相关系数r的取值范围在(-1,+1)之间。 +1代表完全正相关;-1表示完全负相关;0 表示无相关。,李炜制作*,示例:通过此题来演算相关系数。,李炜制作*,2 定序定序尺度 (Spearman Cor.) 积差相关的公式: 积差相关又称等级相关,用

9、来考察两个定序变量间的相关关系。它的公式是由积矩相关转变而来,,其中,D是每一对因变量和自变量的序数的差值;N是总的排序的序数。,李炜制作*,示例:,李炜制作*,3 SPSS中的相关统计命令 Statistics-Correlate-Bivariate,李炜制作*,4 相关统计的输出格式,相关系数,人数,李炜制作*,1 回归的含义: 回归(Regression,或Linear Regression)和相关同样都用来分析两个定距变量间的关系,但回归有明确的因果关系假设。即要假设一个变量为自变量,一个为因变量,自变量对因变量的影响就用回归表示。如年龄对收入的影响。由于回归构建了变量间因果关系的数学

10、表达,它具有统计预测功能。,第六讲 SPSS的双变量关系描述统计(四) 线性回归,李炜制作*,2 回归的统计原理: 两个定距变量的回归是用函数 y= f(x) 来分析的。我们最常用的是一元回归方程,其中x为自变量;y为因变量;a为截距,即常量;b为回归系数,表明自变量对因变量的影响程度。,李炜制作*,Y=350+20 x,李炜制作*,在统计学中,这一方程中的系数是靠x与y变量的大量数据拟合出来的。,X,Y,Y=a+bx,(x,y),李炜制作*,由图中可以看出,回归直线应该是到所有数据点最短距离的直线。该直线的求得即使用“最小二乘方法”,使:,在拟合的回归直线方程中,回归系数:,表示x每变化一个

11、单位时,x与y共同变化的程度(共变异数)。,常数,李炜制作*,李炜制作*,比如通过上学年数和工资的关系计算得出下列的回归公式: y=472+14.8x 就可知上学年数每增长1年,工资会增加14.8元; 也可推测,上学年数为15年的人,工资收入应为472 + 14.8 *15=694元。,李炜制作*,3 SPSS线性回归的统计命令 StatisticsRegressionLinear,李炜制作*,自变量,因变量,回归方式,李炜制作*,4 SPSS线性回归的输出格式:,常数,自变量,回归系数,标准化回归系数,每月工资=823.3-3.487年龄,李炜制作*,1 推断统计的一般概念 1.1 推断统计

12、的含义及类型: (1)含义:推断统计是指用概率分布的方法,由样本的统计量推断总体参数的统计方式。,第七讲:SPSS的推断统计(一) 参数估计和单变量的假设检验,李炜制作*,样本统计量:样本中某个变量的统计值。如此次调查中高中文化程度的人占32%。,样本 32%,总体参数:与样本中某个变量的统计值相对应的总体中的统计值。如全市人口中高中比例为38%。,总体38,李炜制作*,样本统计量有可能等于总体参数,也有可能不等于总体参数,但二者之间有着某种概率关系。推断统计就是教会我们如何利用这种概率关系来由样本统计量推估总体参数。,为了区别样本和总体的不同,样本的平均数用,来表示,标准差用S表示;总体的平

13、均数用表示,标准差用表示。因此,推断统计往往,可以看作是由,推断。,李炜制作*,样本 32%,总体 = ?,(2)类型:推断统计分为参数估计和假设检验两大类。 参数估计:根据一个随机样本的统计值来估计总体参数。即已知样本,估计总体。,李炜制作*,假设检验:先假定总体参数为 ,用一个随机样,总体 =38%,样本 32%,来检验总体参数为的假设是否成立。,本的统计量,?,李炜制作*,1.2推断统计的原理: 参数估计和假设检验都是利用正态分布的概率特征来进行的。 (1)正态分布(,): 正态分布是一种统计分布,它有如下几个特征: A 单峰对称; B 平均数、中位数、众数合一,都在峰点; C 1.96

14、包含了95的面积; 1.65包含了90的面积;即面积和标准差之间有一个固定换算。,李炜制作*,正态分布 N(,), 1.96 ,平均数,李炜制作*,170 1.96*10,(170,10),例:某校同学的身高为正态分布,平均值为170cm,标准差为10cm。问: 1)高于平均数1.5个标准差的同学身高是多少? 2)162cm身高的同学距平均数有几个标准差? 3)95%的同学身高会在什么范围内?,李炜制作*,解1:Xi=+Z*=170+1.5*10=185cm; 解2: Z=(Xi - )/ =(162-170)/10=-0.8; 解3: Xi = -Z * =170-1.96*10=150.4

15、 Xi = +Z * =170+1.96*10=189.6 (150.4189.6),由上可得出:,其中Xi为分布中任何一个值, 是平均数; 是标准差。Z是Xi距离平均数的标准差单位,又称Z分数,同时也表示Xi与平均数之间的面积。,李炜制作*,(2)标准正态分(Z分布):N(0,1) 标准化了的正态分布。即平均数=0,标准差=1的正态分布。,( 0,1), =1,李炜制作*,(3)总体分布:D( , )总体中某变量的几何分布。有可能是正态分布,也可能不是正态分布。,李炜制作*,(4)样本分布: D(,,S),样本中某变量的统计分布,和总体分布一样,它有可能是正态分布,也可能不是正态分布。,李炜

16、制作*,(5)样本平均数的抽样分布:N( ,,),从总体中多次重复抽取容量为n的样本,每个样本平,均数的所形成的统计分布。是由多个,组成的。,总体分布,样本平均数的抽样分布,D(, ),N(,,),李炜制作*,样本平均数的抽样分布的特点:,B 正态分布。 C 它的平均数就等于总体的平均数,标准差则是,A 是由多个,组成,,因此,我们所作的任何一次抽样的平均数,都可看作是样本平均数的抽样分布中的一个点。,它会有95的概率落在 1.96,总体标准差的,倍。即,的范围内。,,又被称作,标准误(Standard Error,S . E),李炜制作*,总体分布( , ),样本分布( , s),样本平均数的抽样 分布(, ),三种分布的关系,李炜制作*,推断统计的原理就是: 利用样本平均数的抽样分布的正态特征,以及 与的包含关系,来从样本统计量推估总体参数(即参数估计),或用样本统计量检验有关总

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号