基本统计分析一频数分布表.ppt

上传人:公**** 文档编号:570553095 上传时间:2024-08-05 格式:PPT 页数:50 大小:430.81KB
返回 下载 相关 举报
基本统计分析一频数分布表.ppt_第1页
第1页 / 共50页
基本统计分析一频数分布表.ppt_第2页
第2页 / 共50页
基本统计分析一频数分布表.ppt_第3页
第3页 / 共50页
基本统计分析一频数分布表.ppt_第4页
第4页 / 共50页
基本统计分析一频数分布表.ppt_第5页
第5页 / 共50页
点击查看更多>>
资源描述

《基本统计分析一频数分布表.ppt》由会员分享,可在线阅读,更多相关《基本统计分析一频数分布表.ppt(50页珍藏版)》请在金锄头文库上搜索。

1、SPSS在社会统计中的应用在社会统计中的应用 社会统计中的统计软件社会统计中的统计软件 SPSS基础基础 SPSS在社会统计学中的应用在社会统计学中的应用 描述性统计描述性统计( Descriptive Statistics Descriptive Statistics) 相关分析相关分析(CorrelateCorrelate) 回归分析回归分析(RegressionRegression) 均值比较与检验均值比较与检验(Compare MeansCompare Means) 社会统计中的统计软件n n统计分析软件是数据分析的主要工具n n完整的数据分析过程包括:n n数据的收集数据的收集n n

2、数据的整理数据的整理n n数据的分析数据的分析n n统计学为数据分析过程提供一套完整的科学的方法论。统计软件为数据分析提供了实现手段。n n统计分析软件的一般特点n n功能全面,系统地集成了多种成熟的统计分析方法;n n有完善的数据定义、操作和管理功能;n n方便地生成各种统计图形和统计表格;n n使用方式简单,有完备的联机帮助功能;n n软件开放性好,能方便地和其他软件进行数据交换。n n常用统计软件简介n nSASSAS:真正的巨无霸。被誉为国际上的标准统计:真正的巨无霸。被誉为国际上的标准统计软件和最权威的组合式优秀统计软件。软件和最权威的组合式优秀统计软件。n nSPSSSPSS:统计

3、软件中的贵族:统计软件中的贵族n nS-PlusS-Plus:S S语言(语言(AT&TAT&T贝尔实验室)的后续发展贝尔实验室)的后续发展n nStataStata:软件小巧、功能强大:软件小巧、功能强大n n以下,我们介绍的主要是以下,我们介绍的主要是SPSSSPSS。SPSS(PASW)基础n n软件名称n nStatistical Package for Social Science Statistical Package for Social Science (1975-20001975-2000年)年)n nStatistical Product and Service Solut

4、ions(2000Statistical Product and Service Solutions(2000年年-2009-2009年年4 4月月) )n nPredictive Analytics SoftwarePredictive Analytics Software(20092009年年4 4月起)月起)n n软件发展软件发展n n1960 1960 年代:美国斯坦福大学三位研究生研制年代:美国斯坦福大学三位研究生研制 n n1970 1970 年代:年代:SPSS SPSS 总部成立于芝加哥,推出总部成立于芝加哥,推出 SPSS SPSS 中小中小型机版型机版 SPSSXSPSSX

5、n n1980 1980 年代:微机版(年代:微机版( V13 SPSS/PC+ 3V13 SPSS/PC+ 3)n n1990 1990 年代:年代:Windows Windows 版(版( v517v517)n n20092009年年4 4月:被月:被IBMIBM公司收购,改名为公司收购,改名为PASWPASW。第一节第一节 描述性统计描述性统计n n频数分布(Frequencies)n n数据描述(Descriptives)n n数据探索(Explore)n n交互列联表(Crosstab)一、频数分布一、频数分布一、频数分布一、频数分布在在在在SPSSSPSS中可以很容易地得出频数分布

6、表,平均数,中可以很容易地得出频数分布表,平均数,中可以很容易地得出频数分布表,平均数,中可以很容易地得出频数分布表,平均数,标准差等。标准差等。标准差等。标准差等。频数分布:可以概略地看到资料的分布情况,可做频数分布:可以概略地看到资料的分布情况,可做频数分布:可以概略地看到资料的分布情况,可做频数分布:可以概略地看到资料的分布情况,可做初步整理之用,从中还可检查数据输入情况。初步整理之用,从中还可检查数据输入情况。初步整理之用,从中还可检查数据输入情况。初步整理之用,从中还可检查数据输入情况。命令选择:命令选择:命令选择:命令选择:Analyze Analyze Descriptive D

7、escriptive Statistics Statistics Frequencies Frequencies备备备备 注:可选入多个变量注:可选入多个变量注:可选入多个变量注:可选入多个变量Statistics:Statistics:Dispersion(Dispersion(离差栏)离差栏)离差栏)离差栏): :Std.Deviation Std.Deviation 标准差标准差标准差标准差 Variance Variance 方差方差方差方差 Range Range 全距全距全距全距Minimum Minimum 最小值最小值最小值最小值Maximum Maximum 最大值最大值最大

8、值最大值 S.E.mean S.E.mean 均值的标准误均值的标准误均值的标准误均值的标准误Central Tendency (Central Tendency (集中趋势栏)集中趋势栏)集中趋势栏)集中趋势栏)Mean Mean 均值均值均值均值Median Median 中位数中位数中位数中位数Mode Mode 众数众数众数众数Sum Sum 总和总和总和总和Skewness Skewness 偏度(偏度(偏度(偏度(0 0,1.51.5,0.50.5,-0.5-0.5) Kurtosis Kurtosis 峰度(峰度(峰度(峰度(0 0,正,负),正,负),正,负),正,负)例:例:

9、例:例:09-0109-01还可直接作出图形(还可直接作出图形(Charts):):Bar charts:条形图条形图Pie Charts:圆图、饼图圆图、饼图Histograms:直方图,只适用于连续的直方图,只适用于连续的数值型变量。数值型变量。二、数据描述分析过程二、数据描述分析过程适用条件:对于定距以上变量,可以进行适用条件:对于定距以上变量,可以进行集中趋势和离中趋势的统计集中趋势和离中趋势的统计命命 令:令:Analyze Descriptive Statistics Descriptives变量要求:可多选变量要求:可多选 可可 选选 项:项:Mean、Std.deviation

10、、Minimum 三、数据探索三、数据探索三、数据探索三、数据探索1 1、对数据进行初步考察:、对数据进行初步考察:、对数据进行初步考察:、对数据进行初步考察:检查数据是否有错误:过大或过小的数据有可能检查数据是否有错误:过大或过小的数据有可能检查数据是否有错误:过大或过小的数据有可能检查数据是否有错误:过大或过小的数据有可能是奇异值、影响点或错误数据。一要找出,二是奇异值、影响点或错误数据。一要找出,二是奇异值、影响点或错误数据。一要找出,二是奇异值、影响点或错误数据。一要找出,二要分析原因,三要决定是否从中剔除。要分析原因,三要决定是否从中剔除。要分析原因,三要决定是否从中剔除。要分析原因

11、,三要决定是否从中剔除。数据分布特征:许多分析方法对数据的分布有一数据分布特征:许多分析方法对数据的分布有一数据分布特征:许多分析方法对数据的分布有一数据分布特征:许多分析方法对数据的分布有一定要求。从数据是否服从正态分布,决定他们定要求。从数据是否服从正态分布,决定他们定要求。从数据是否服从正态分布,决定他们定要求。从数据是否服从正态分布,决定他们是否可以选用只对正态分布数据适用的分析方是否可以选用只对正态分布数据适用的分析方是否可以选用只对正态分布数据适用的分析方是否可以选用只对正态分布数据适用的分析方法。法。法。法。Explore :Explore :进行初步探索分析进行初步探索分析进行

12、初步探索分析进行初步探索分析09-0309-03四、交互列联表四、交互列联表适用条件:根据变量的层次,统计学中有适用条件:根据变量的层次,统计学中有各种不同的相关系数来描述,在社调中各种不同的相关系数来描述,在社调中常见的两个定类(或一个定类、一个定常见的两个定类(或一个定类、一个定序)序)命命 令:令:Analyze Descriptive Statistics Crosstabs变变 量:选择一个或多个变量进入量:选择一个或多个变量进入Rows,Column框框对复选框的解释对复选框的解释(1)Chi-square,(1)Chi-square,卡方检验。卡方检验。卡方检验。卡方检验。Pea

13、rson Chi-square test Pearson Chi-square test Likehood ration Chi-square test Likehood ration Chi-square test 似然比卡方检验似然比卡方检验似然比卡方检验似然比卡方检验FisherFisher s exactly test s exactly test 费雪精确检验费雪精确检验费雪精确检验费雪精确检验(2 2)CorrelationCorrelation复选框。复选框。复选框。复选框。Pearson,SpearmanPearson,Spearman(只适(只适(只适(只适用于数值型)用于数

14、值型)用于数值型)用于数值型)(3)Nominal Data(3)Nominal Data栏,适用于定类变量的统计量。栏,适用于定类变量的统计量。栏,适用于定类变量的统计量。栏,适用于定类变量的统计量。LambdaLambda复选项复选项复选项复选项(4 4)Ordinal DataOrdinal Data栏:适用于定序变量的统计量栏:适用于定序变量的统计量栏:适用于定序变量的统计量栏:适用于定序变量的统计量GammaGamma、Kendall”s tau-bKendall”s tau-b、Kendall”s tau-cKendall”s tau-c(5)Nominal by Interval

15、:(5)Nominal by Interval:一个定类一个定距以上变量一个定类一个定距以上变量一个定类一个定距以上变量一个定类一个定距以上变量EtaEta统计量,如收入和性别的关联性统计量,如收入和性别的关联性统计量,如收入和性别的关联性统计量,如收入和性别的关联性Flag significant correlations:Flag significant correlations:用星号标记有统计学意用星号标记有统计学意用星号标记有统计学意用星号标记有统计学意义的相关关系。义的相关关系。义的相关关系。义的相关关系。第二节第二节 相关分析相关分析相关分析是研究变量间密切程度的一种统计方法。相

16、关分析是研究变量间密切程度的一种统计方法。相关分析是研究变量间密切程度的一种统计方法。相关分析是研究变量间密切程度的一种统计方法。对于其数值可以从小到大排列的数据才能计算其对于其数值可以从小到大排列的数据才能计算其对于其数值可以从小到大排列的数据才能计算其对于其数值可以从小到大排列的数据才能计算其相关系数。相关系数。相关系数。相关系数。 简单相关(简单相关(简单相关(简单相关( Bivariate Bivariate ) 偏相关(偏相关(偏相关(偏相关( Partial Partial )1 1、对定距以上两个变量、对定距以上两个变量、对定距以上两个变量、对定距以上两个变量x x与与与与y y

17、的相关系数采用的相关系数采用的相关系数采用的相关系数采用PearsonPearson相关系数相关系数相关系数相关系数2 2、Spearman KendallSpearman Kendall相关系数是一种非参测度,相关系数是一种非参测度,相关系数是一种非参测度,相关系数是一种非参测度,是根据数据的秩而不是根据实际值计算的。适合定序是根据数据的秩而不是根据实际值计算的。适合定序是根据数据的秩而不是根据实际值计算的。适合定序是根据数据的秩而不是根据实际值计算的。适合定序数据或不满足正态分布假设的定距数据。数据或不满足正态分布假设的定距数据。数据或不满足正态分布假设的定距数据。数据或不满足正态分布假设

18、的定距数据。3 3、偏相关系数:描述的是当控制了一个或几个另外的变、偏相关系数:描述的是当控制了一个或几个另外的变、偏相关系数:描述的是当控制了一个或几个另外的变、偏相关系数:描述的是当控制了一个或几个另外的变量的影响条件下两个变量间的相关性。如:可以控制量的影响条件下两个变量间的相关性。如:可以控制量的影响条件下两个变量间的相关性。如:可以控制量的影响条件下两个变量间的相关性。如:可以控制年龄和工作经验,估计工资收入与受教育程度之间的年龄和工作经验,估计工资收入与受教育程度之间的年龄和工作经验,估计工资收入与受教育程度之间的年龄和工作经验,估计工资收入与受教育程度之间的相关关系。相关关系。相

19、关关系。相关关系。4 4、关于相关系数统计意义的检验:由于抽样误差的存在。、关于相关系数统计意义的检验:由于抽样误差的存在。、关于相关系数统计意义的检验:由于抽样误差的存在。、关于相关系数统计意义的检验:由于抽样误差的存在。检验的零假设检验的零假设检验的零假设检验的零假设总体中两个变量间的关系为总体中两个变量间的关系为总体中两个变量间的关系为总体中两个变量间的关系为0 0。SPSSSPSS只给出给假设成立的概率只给出给假设成立的概率只给出给假设成立的概率只给出给假设成立的概率P P值。值。值。值。(1 1)Analyze Analyze CorrelationsCorrelations Biv

20、ariateBivariate计算指定的两个变量之间的相关系数,可选择计算指定的两个变量之间的相关系数,可选择计算指定的两个变量之间的相关系数,可选择计算指定的两个变量之间的相关系数,可选择PearsonPearson相关、相关、相关、相关、SpearmanSpearman和和和和 Kendall Tau-bKendall Tau-b相关;同时对相关系数进行检相关;同时对相关系数进行检相关;同时对相关系数进行检相关;同时对相关系数进行检验。验。验。验。Test of Significance Test of Significance 是用于变量间相关的是用于变量间相关的是用于变量间相关的是用于

21、变量间相关的显著性检验。系统默认的是双侧检验。显著性检验。系统默认的是双侧检验。显著性检验。系统默认的是双侧检验。显著性检验。系统默认的是双侧检验。Two-tailed:Two-tailed:事先不知道相关方向事先不知道相关方向事先不知道相关方向事先不知道相关方向One-tailed:One-tailed:事先知道相关方向事先知道相关方向事先知道相关方向事先知道相关方向例例例例Data09-03Data09-03使用系统默认值进行相关分析:使用系统默认值进行相关分析:分析:起始工资、现工资与雇员受教育水分析:起始工资、现工资与雇员受教育水平、工作经验、职务等级之间是否存在平、工作经验、职务等级

22、之间是否存在线性关系。线性关系。(2 2) Analyze Analyze CorrelationsCorrelationsPartial Partial 用上例:用上例:用上例:用上例:- Controlling for. JOBCAT PREVEXP - Controlling for. JOBCAT PREVEXP - Controlling for. JOBCAT PREVEXP - Controlling for. JOBCAT PREVEXP JOBTIMEJOBTIMEJOBTIMEJOBTIME SALARY EDUC SALARY EDUC SALARY EDUC SALAR

23、Y EDUCSALARY 1.0000 .4399SALARY 1.0000 .4399SALARY 1.0000 .4399SALARY 1.0000 .4399 ( 0) ( 469) ( 0) ( 469) ( 0) ( 469) ( 0) ( 469) P= . P= .000 P= . P= .000 P= . P= .000 P= . P= .000EDUC .4399 1.0000EDUC .4399 1.0000EDUC .4399 1.0000EDUC .4399 1.0000 ( 469) ( 0) ( 469) ( 0) ( 469) ( 0) ( 469) ( 0) P

24、= .000 P= . P= .000 P= . P= .000 P= . P= .000 P= .(Coefficient / (D.F.) / 2-tailed Significance)(Coefficient / (D.F.) / 2-tailed Significance)(Coefficient / (D.F.) / 2-tailed Significance)(Coefficient / (D.F.) / 2-tailed Significance) . is printed if a coefficient cannot be . is printed if a coeffic

25、ient cannot be . is printed if a coefficient cannot be . is printed if a coefficient cannot be computedcomputedcomputedcomputed 第三节第三节 回归分析回归分析n n回归分析是处理两个及两个以上变量间线性依存回归分析是处理两个及两个以上变量间线性依存回归分析是处理两个及两个以上变量间线性依存回归分析是处理两个及两个以上变量间线性依存关系的统计方法。关系的统计方法。关系的统计方法。关系的统计方法。n n回归分析作为一个严肃的统计学模型,有着严格回归分析作为一个严肃的统计学

26、模型,有着严格回归分析作为一个严肃的统计学模型,有着严格回归分析作为一个严肃的统计学模型,有着严格的使用条件。因此在做回归分析之前,应该对数的使用条件。因此在做回归分析之前,应该对数的使用条件。因此在做回归分析之前,应该对数的使用条件。因此在做回归分析之前,应该对数据进行基本的判断。如作出散点图、观察变量间据进行基本的判断。如作出散点图、观察变量间据进行基本的判断。如作出散点图、观察变量间据进行基本的判断。如作出散点图、观察变量间的趋势等。的趋势等。的趋势等。的趋势等。n nAnalyzeAnalyzeRegressionRegressionLinear Linear n nDependent

27、:Dependent:因变量,只选一个因变量,只选一个因变量,只选一个因变量,只选一个n nIndependent:Independent:自变量,可选入多个自变量。自变量,可选入多个自变量。自变量,可选入多个自变量。自变量,可选入多个自变量。Method:对自变量的选入方法。对自变量的选入方法。Enter:强行进入法强行进入法Forward:向前选择法:向前选择法Backward:向后剔除法:向后剔除法Stepwise:逐步进入法:逐步进入法(例,及解释)(例,及解释)先做散点图:先做散点图:09-03Graphs-scatter剩余变差:剩余变差:Y值对于回归直线的偏差。值对于回归直线的偏

28、差。回归变差:回归已知时误差减少的量。回归变差:回归已知时误差减少的量。总变差总变差=剩余变差剩余变差+回归变差回归变差总平方和总平方和=未解释的平方和未解释的平方和+已解释的平方和已解释的平方和扩展扩展几个自变量的线性回归示例:几个自变量的线性回归示例:如:现工资与受教育水平、初始工资、工作如:现工资与受教育水平、初始工资、工作经验、职位之间的回归模型。经验、职位之间的回归模型。第四节第四节 均值比较与检验均值比较与检验均值不相等的两个样本不一定来自均值不同均值不相等的两个样本不一定来自均值不同的总体;两个变量均数接近的样本是否来的总体;两个变量均数接近的样本是否来自均值相同的总体?自均值相

29、同的总体?两个样本某变量两个样本某变量均值不同,其差异是否具有统计意义。均值不同,其差异是否具有统计意义。对调查样本中不同的子总体在某些变量上的对调查样本中不同的子总体在某些变量上的平均值之间的差异情况进行比较。平均值之间的差异情况进行比较。n nMeans: 主要是对样本的描述统计,也直主要是对样本的描述统计,也直接进行比较。接进行比较。n nOne-Samples T Test:样本均值和已知样本均值和已知n nIndependent-Samples T Test:独立独立样本均值差比较样本均值差比较n nPaired-Samples T Test:配对样本配对样本问:检验男生和女生的学习

30、成绩是否有显问:检验男生和女生的学习成绩是否有显著性差异?著性差异?检验丈夫和妻子的智商是否有显著性差异检验丈夫和妻子的智商是否有显著性差异?方差齐次检验:方差齐次检验:F一、一、Means过程过程AnalyzeCompare MeansMeans例:例: 09-03男女工资均值男女工资均值职位不同的男女雇员工资的均值二、单样本二、单样本T检验检验AnalyzeCompare MeansOne-Samples T Test例:已知某地例:已知某地12岁男孩身高岁男孩身高142.3cm,现测得某市现测得某市120名名12岁男孩身高资料。岁男孩身高资料。11-02在在Test中输入中输入142.3

31、三、独立样本三、独立样本T检验检验要求被比较的两个样本彼此独立,没有配要求被比较的两个样本彼此独立,没有配对关系。要求两个样本均来自正态总体。对关系。要求两个样本均来自正态总体。例:检验男女雇员现工资是否有显著性差例:检验男女雇员现工资是否有显著性差异。异。09-03AnalyzeCompare MeansIndependent Samples T Test四、配对样本四、配对样本T检验检验要求被比较的两个样本有配对关系。两个要求被比较的两个样本有配对关系。两个样本均来自正态总体。均值对于检验是样本均来自正态总体。均值对于检验是有意义的描述统计量。有意义的描述统计量。例:例:10个高血压患者在施以体育疗法前后个高血压患者在施以体育疗法前后测定舒张压。要求判断体育疗法对降低测定舒张压。要求判断体育疗法对降低血压是否有效。血压是否有效。11-03零假设:零假设:练习练习自己在电脑上进行操作,将频数分析、交互自己在电脑上进行操作,将频数分析、交互分析、相关分析、回归分析、均数检验等分析、相关分析、回归分析、均数检验等熟悉一遍。熟悉一遍。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号