spss描述性统计分析.ppt

上传人:m**** 文档编号:568280397 上传时间:2024-07-23 格式:PPT 页数:42 大小:642KB
返回 下载 相关 举报
spss描述性统计分析.ppt_第1页
第1页 / 共42页
spss描述性统计分析.ppt_第2页
第2页 / 共42页
spss描述性统计分析.ppt_第3页
第3页 / 共42页
spss描述性统计分析.ppt_第4页
第4页 / 共42页
spss描述性统计分析.ppt_第5页
第5页 / 共42页
点击查看更多>>
资源描述

《spss描述性统计分析.ppt》由会员分享,可在线阅读,更多相关《spss描述性统计分析.ppt(42页珍藏版)》请在金锄头文库上搜索。

1、1第4章 描述性统计分析 描述性分析有两方面功能:u数值计算,即通过计算常见统计量值,反映样本数据的统计特征;u图形绘制,即通过绘制常见统计图形,直观展现数据的分布特征,比较数据分布的异同。 实现描述性统计分析功能在 Analyze Descriptive Statistics 菜单 。 2SPSS 的描述性分析功能模块有:的描述性分析功能模块有: 1)Frequencies:频数分析,描述统计数据的频数分布特征:频数分析,描述统计数据的频数分布特征 2)Descriptive : 基本描述统计,对单变量计算基本描述统计量基本描述统计,对单变量计算基本描述统计量 3)Explore: 探索性分

2、析,考察一些极端值和奇异值;考察变量探索性分析,考察一些极端值和奇异值;考察变量与变量间分布的差异是否显著与变量间分布的差异是否显著 4)Crosstabs:交叉列联表,讨论变量间的频数关系及各种测度交叉列联表,讨论变量间的频数关系及各种测度(定类、定序、定距、定比)间的相关关系(定类、定序、定距、定比)间的相关关系 5)Ratio:比率分析,对两变量间变量值比率变化的描述分析:比率分析,对两变量间变量值比率变化的描述分析3 进行频数分布表的分析,进行频数分布表的分析,适合于定性资料,适合于定性资料,以及部分定量资料,不能分组以及部分定量资料,不能分组进行。进行。 对数据的分布趋势进行初步分析

3、。对数据的分布趋势进行初步分析。 基本概念: 频数(Frequency): 百分比(Percent,频率 ): 有效百分比(Valid Percent):各频数占有效样本数(除去缺失样本数)的百分比。 累计百分数(Cumulative Percent):最后累积取值100。4.1 Frequencies(频数分析)(频数分析)4频数分析中常用的三种基本统计图:特点:宽度(类别)相同,高度表示频数或频率,常分开排列。适于定类、定序资料条形图(柱形图 Bar Chart)饼图(Pie Chart)直方图(Histograms)特点:扇形面积表示频数或百分比。适于研究内在的结构组成。特点:矩形面积表

4、示频数或频率,宽为组距,高为密度,可附正态线,也称质量分布图。适于定距资料。5【实例4.1】计算全部学生英语、数学及语文三门成绩的均值、标准差、极差和四分位数,并生成语文成绩各区间的频数分布表和显示频数的饼图。6Statistics按钮:按钮:四分位数按输入值定义等分位数按输入不同值定义分位数7Charts按钮:按钮:8结果:结果:94.2 Descriptive( 基本描述统计) 对变量进行整体描述性统计分析,但对变量进行整体描述性统计分析,但不能分组不能分组进行,包括集中趋势值,离散趋势值,偏度系数,进行,包括集中趋势值,离散趋势值,偏度系数,峰度系数等。峰度系数等。 最最适合服从正态分布

5、的定量资料适合服从正态分布的定量资料,使用频率最,使用频率最高,且可将原始数据转换成标准高,且可将原始数据转换成标准Z分值并存入数据分值并存入数据库。库。常见基本描述统计量大致有三类:u描述集中趋势:反映一组数据的共同趋势,即反映数据一般水平的中心值或代表值。如样本均值、中位数、众数、总和等。10u描述离散趋势:反映一组数据的各观测值距离中心的离散程度。如样本方差、标准差、极差、 最大值、最小值及均值标准误差 等。u描述分布形态:考察数据分布是否对称、偏斜程度及陡缓程度。主要指偏度和峰度。 偏度系数:反映数据形态对称性。 峰度系数:反映分布形态陡缓程度。11【实例4.2】计算全部学生三门成绩的

6、均值、标准差、最大值及最小值,并考察学生成绩的分布形态。12Options按钮:按钮:13结果:结果:144.3 探索性分析(探索性分析(Explore) 能分组进行分析能分组进行分析,适用于对资料的性质、分布,适用于对资料的性质、分布特点完全不清楚情况,有助于确定对数据进行进一特点完全不清楚情况,有助于确定对数据进行进一步分析的方案。步分析的方案。主要对数据进行三方面考察:u考察数据真实性:找出偏离主体较远的数据,如非正常值和极端值,分析之,并判断其正确性。u考察数据的分布特性:主要考察数据的正态性。u考察变量间数据的相互关系:考察变量间相关性及方差齐性。15考察变量列表分组变量16主要功能

7、:1、通过茎叶图(Stem and leaf Plots)描述频数分布茎茎(Stem):整数部分,其值为:整数部分,其值为Stem 乘以乘以 Stem width,可以多位,表,可以多位,表示该行出现数的相同部分示该行出现数的相同部分叶叶(Leaf):小数部分,其值为:小数部分,其值为Leaf 乘以乘以 Each leaf,只能一位,表,只能一位,表示该行出现数的不同部分示该行出现数的不同部分茎叶图可以观察出现同茎,不同叶组成数出现的频数。 如第三行数据表示:总共3个case,其中一个9x10+0=90,2个9x10+2=92172、通过箱图(Boxplots)描述数据分布箱图主体箱图主体:图

8、中个案数占:图中个案数占50%50%(大于(大于25%25%且小于且小于75%75%的百分位数)的百分位数)箱图本体箱图本体:矩形部分,上下边:矩形部分,上下边对应上下四分位数对应上下四分位数奇异值奇异值(上下上下)o o:超过箱图本:超过箱图本体高度体高度1.51.5倍的数据。倍的数据。极端值极端值(上下上下) :超过箱图主超过箱图主体高度体高度3 3倍的数据。倍的数据。中位数中位数箱线图箱线图是利用数据中的五个统计量是利用数据中的五个统计量: :最小值、第一四分最小值、第一四分位数、中位数、第三四分位数与最大值来描述数据的位数、中位数、第三四分位数与最大值来描述数据的一种方法,它也可以粗略

9、地看出数据是否具有有对称一种方法,它也可以粗略地看出数据是否具有有对称性性, ,分布的分散程度等信息分布的分散程度等信息 正常值分正常值分界点界点 183、通过、通过Q-Q概率图描述数据分布的正态性概率图描述数据分布的正态性Q-Q概率图概率图有两种:有两种:(1)正态概率图()正态概率图(Normal Probability Plots)-直观反直观反映实际分布和理论分布的差异。映实际分布和理论分布的差异。 如图,纵坐标为如图,纵坐标为Z分数值,斜线为分数值,斜线为Z分数期望标准线。分数期望标准线。点越趋近斜线,则越符合正态分布。点越趋近斜线,则越符合正态分布。19(2)反趋势正态概率图(De

10、trended Normal Probability Plots)-直观反映实际分布和理论分布的差异。 如图,纵坐标为Z分数值-正态分布期望值,水平线为期望标准线。点越趋近水平线,则越符合正态分布。204、检验按分组变量对考察变量分组后,各组间的方差齐性21【实例4.3】试考察学生三门成绩的描述统计量与均值的估计区间、极端值、奇异值、及正态分布性、方差齐性。22统统计计选选项项解解释释:(1)Descriptives:(1)Descriptives:一一般般描描述述性性统统计计量量值值,并并进进行行均值的区间估计。均值的区间估计。 (2)M-estimators(2)M-estimators:

11、用于对集中趋势进行最大稳健估计。用于对集中趋势进行最大稳健估计。当当异异常常值值较较多多时时,适适合合于于用用该该估估计计值值代代替替平平均均值值来来反反映映数数据据的的集集中中趋趋势势。通通常常有有四四种种统统计计量量:HuberHuber、AndrewAndrew、HampelHampel、 TukeyTukey。 (3)Outliers(3)Outliers:输出五个最大值与五个最小值;输出五个最大值与五个最小值;(4)Percentiles(4)Percentiles:第:第5%5%、10%10%、25%25%、50%50%、75%75%、90%90%、95%95%位数位数( (5)G

12、rouped Frequency tables5)Grouped Frequency tables:输出分组例数与数值范围表。输出分组例数与数值范围表。Statistics按钮:按钮:用于对均值进行区间估计的置信度23对均值的区间估计24Plots按钮:按钮:结果类似功能部分。结果类似功能部分。按各组别分别进按各组别分别进行箱图绘制行箱图绘制按组别进行综合按组别进行综合箱图绘制箱图绘制作茎叶图描述作茎叶图描述作直方图描述作直方图描述直方图带有趋势线直方图带有趋势线方差齐性检验处理方差齐性检验处理254.4 交叉列联表分析(交叉列联表分析(Crosstabs) 进行计数资料的列联表分析,在分析中

13、,可对二进行计数资料的列联表分析,在分析中,可对二维至维至n维列联表(维列联表(RxC表)资料进行统计描述和表)资料进行统计描述和2 检检验,并计算相应的百分数指标。验,并计算相应的百分数指标。 此外,还可计算四格表确切概率且有单双侧,对此外,还可计算四格表确切概率且有单双侧,对数似然比检验以及线性关系的数似然比检验以及线性关系的2 检验。检验。 交叉列联表交叉列联表是两个或多个变量交叉分组后形成的是两个或多个变量交叉分组后形成的频数分布表,用于分析研究计数变量之间相关关系。频数分布表,用于分析研究计数变量之间相关关系。 而研究计量变量相关关系(称为协变)的方法常而研究计量变量相关关系(称为协

14、变)的方法常用相关分析和回归分析。用相关分析和回归分析。26主要对数据进行两方面考察:1、利用样本数据,产生二维或多维交叉列联表、利用样本数据,产生二维或多维交叉列联表2、在交叉列联表基础上,分析两变量间的相关性、在交叉列联表基础上,分析两变量间的相关性 通常采用卡方检验和相关性检验。通常采用卡方检验和相关性检验。【注意注意】(1)交叉列联表单元格中,期望频数不应)交叉列联表单元格中,期望频数不应1或不或不应有大量的应有大量的5。 设设RT为行频数合计,为行频数合计,CT为列频数合计,则为列频数合计,则(2)卡方统计量值受样本量大小的影响,常需要修正。)卡方统计量值受样本量大小的影响,常需要修

15、正。27【实例4.4】如表的学生成绩数据,以年龄段为行变量,成绩水平为列变量,计算卡方值、检验行列变量是否独立。同时计算频数、期望频数、行频数、列频数及标准化残差。28操作主界面:操作主界面:29Exact按钮:按钮:30计算卡方值,用于行列变量的独立性检验Statistics按钮:按钮:计算pearson和spearman相关系数定类资料的行列变量相关性检验定序资料的行列变量相关性检验定序与定距资料的行列变量相关性检验评判内部一致性相关风险比例两相关二项分类变量的非参检验二项分类变量的因、自变量独立性检验31Cells按钮:按钮:计算与输出频数计算频数百分比计算残差32结果:结果:334.5

16、 比率分析(比率分析(Ratio)比率分析比率分析是两个变量之间变量值比率变化的描述分析,是两个变量之间变量值比率变化的描述分析,适于定距变量。适于定距变量。几个相对比描述指标:几个相对比描述指标:1、集中趋势指标(集中趋势指标(central) 均数、中位数、均数、中位数、 加权比率均值(加权比率均值(Weighted mean)-两变量均值之比。两变量均值之比。2、离散程度指标(离散程度指标(dispersion) 平均绝对离差(平均绝对离差(AAD) 离散系数(离散系数(COD)相关价格相关价格微分(微分(PRD)变异系数(变异系数(COV)。)。34【实例4.5】如表是学生使用计算机时

17、间、上网时间及是否受过处分的数据,试分析受处分和没受处分学生的上网时间和使用计算机时间比率情况。35操作主界面:操作主界面:分子变量分母变量36Statistics按钮:按钮:集中趋势指数定义相对数区间定义中位数百分比区间37结果:结果:384.6 多选项分析(多选项分析(Multiple response) 针对问卷调查中多选项问题,进行多选项频数分析针对问卷调查中多选项问题,进行多选项频数分析或交叉列联表分析。菜单或交叉列联表分析。菜单Analyze- Multiple response。【实例4.6】如表是学生报考高考志愿情况(V1,V2,V3为三个志愿),试分别分析全体学生及不同性别学生报考志愿情况。39操作步骤:操作步骤:(1)定义多选项变量集)定义多选项变量集多选项二分法多选项分类法多变量集名二分法中要分析的变量值多分法中变量值的最大最小值40(2)多选项频数分析)多选项频数分析结果:结果:41(2)多选项交叉列联表)多选项交叉列联表42结果:结果:

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 研究生课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号