描述性统计分析DescriptiveStatistics

上传人:jiups****uk12 文档编号:90896397 上传时间:2019-06-20 格式:DOC 页数:29 大小:667.01KB
返回 下载 相关 举报
描述性统计分析DescriptiveStatistics_第1页
第1页 / 共29页
描述性统计分析DescriptiveStatistics_第2页
第2页 / 共29页
描述性统计分析DescriptiveStatistics_第3页
第3页 / 共29页
描述性统计分析DescriptiveStatistics_第4页
第4页 / 共29页
描述性统计分析DescriptiveStatistics_第5页
第5页 / 共29页
点击查看更多>>
资源描述

《描述性统计分析DescriptiveStatistics》由会员分享,可在线阅读,更多相关《描述性统计分析DescriptiveStatistics(29页珍藏版)》请在金锄头文库上搜索。

1、第二讲:一般数据分析教学目的:能应用SPSS软件进行:描述分析、频数分析、数据探索、交叉表分析、图形分析等教学内容:1)描述分析 2)频数分析 3)数据探索 4)交叉表分析教学重点:描述分析、频数分析、交叉表教学难点:数据探索、交叉表分析教学时间:1学时描述性统计分析Descriptive Statistics 描述性统计分析是统计分析的第一步,做好这第一步是下面进行正确统计推断的先决条件。SPSS的许多模块均可完成描述性分析,但专门为该目的而设计的几个模块则集中在Descriptive Statistics菜单中,最常用的是列在最前面的四个过程:Frequencies过程的特色是产生频数表;

2、Descriptives过程则进行一般性的统计描述;Explore过程用于对数据概况不清时的探索性分析;Crosstabs过程则完成计数资料和等级资料的统计描述和一般的统计检验,常用的X2 检验也在其中完成。1.1 Frequencies过程频数分布表是描述性统计中最常用的方法之一,Frequencies过程就是专门为产生频数表而设计的。它不仅可以产生详细的频数表,还可以按要求给出某百分位点的数值,以及常用的条图、饼图等统计图。和国内常用的频数表不同,几乎所有统计软件给出的都是详细频数表,即并不按某种要求确定组段数和组距,而是按照数值精确列表。如果想用Frequencies过程得到熟悉的频数表

3、,请先用第3章学过的Recode过程产生一个新变量来代表所需的各组段。1.1.1界面说明Frequencies对话框的界面如图1.1a所示。选取AnalyzeDescriptive StatisticsFrequencies,系统就会弹出该对话框,其各部分的功能如下:1Variable(s)框:左侧的变量可全部选入右侧的Variable(s)框内,一次性完成所有变量的频数分析;也可逐一选入右侧,进行分析n次分析(这样就太累了)。2Display frequency tables复选框:确定是否在结果中输出频数表。图1.1a Frequencies对话框3Statistics:单击后弹出Stat

4、istics对话框如图1.1b,用于定义需要计算的其他描述统计量。其中:Percentile Values复选框组:定义需要输出的百分位数,可计算四分位数(Quartiles)、每隔指定百分位输出当前百分位数(Cut points for equal groups)、或直接指定某个百分位数(Percentiles),如直接指定输出P2.5(即累计百分数为2.5%处的变量值)和P97.5(即累计达到97.5%处的变量值)。 Central tendency复选框组:用于定义描述集中趋势的一组指标:均值(Mean)、中位数(Median)、众数(Mode)、总和(Sum)。 Dispersion复

5、选框组:用于定义描述离散趋势的一组指标:标准差(Std.deviation)、方差(Variance)、全距 (Range)、最小值(Minimum)、最大值(Maximum)、标准误(S.E.mean)。 Distribution复选框组:用于定义描述分布特征的两个指标:偏度系数(Skewness)和峰度系数(Kurtosis)。 Values are group midpoints复选框:当输出的数据是分组频数数据,并且具体数值是组中值时,选中该复选框,以通知SPSS,免得它犯错误。图1.1b Frequencies的Statistics对话框4Charts:弹出Charts对话框,用于设

6、定所做的统计图。Chart type单选钮组 定义统计图类型,有四种选择:无、条图(Bar chart)、圆图(Pie chart)、直方图Histogram),其中直方图还可以选择是否加上正态曲线(With normal curve)。 Chart Values单选钮组 定义是按照频数还是按百分比做图(即影响纵坐标刻度)。5Format:弹出Format对话框,用于定义输出频数表的格式,不过用处不大,一般不管。Order by单选钮组 定义频数表的排列次序,有四个选项:Ascending values为根据数值大小按升序从小到大作频数分布;Descending values为根据数值大小按降

7、序从大到小作频数分布;Ascending counts为根据频数多少按升序从少到多作频数分布;Descending counts为根据频数多少按降序从多到少作频数分布。 Multiple Variables单选钮组 如果选择了两个以上变量做频数表,则Compare variables可以将他们的结果在同一个频数表过程输出结果中显示,便于互相比较,Organize output by variables则将结果在不同的频数表过程输出结果中显示。 Suppress Tables more than.复选框 当频数表的分组数大于下面设定数值时禁止它在结果中输出,这样可以避免产生巨型表格。1.1.2

8、实例分析例1.1 利用111.sav文件中q9(即被访问者最近一次参加促销活动的消费)的调查数据,绘制频数表、直方图,计算平均值、标准差、变异系数CV、中位数Mode、p2.5和p97.5。求解上述要求中,除CV需用手工计算外,其他问题都可通过Frequencie解决。其主要操作如下:1. 从程序中打开SPSS,选择Fileopendata,打开111.sav;2. AnalyzeDescriptive StatisticsFrequencies,弹出Frequencies对话框;3. Variables框:选入q9 4. 单击Statistics 5. 选中Mean、Std.deviatio

9、n、Median复选框 6. 单击Percentiles:输入2.5:单击Add:输入97.5:单击Add: 7. 单击Continue 8. 单击Charts: 9. 选中Bar charts 10. 单击Continue 11. 单击OK,系统即在SPSS Viewer中显示所有结果,详见结果解释。而CV可用得到的Std. deviation 与Mean相除求得。问题与处理图1.2是q9的次数分布直方图,它表明:由于q9的取值点较多 ,使得按变量取值分组进行的Frequencies分析表很长,绘出的直方图也因分组太多而显得不清爽,需要进一步处理。可先对q9分组,可通过重新赋值于新变量来实现

10、,再作直方图。图1.2 q9的次数分布直方图1.1.3结果解释Statistics TableStatistics被访问者最近一次参加促销活动的消费 NValid312Missing0Mean114.03Mode113Std. Deviation18.158Percentiles2.558.0097.5293.70表的最上方是表名,接下来是变量q9的标签被访问者最近一次参加促销活动的消费;表的左侧是统计变量名称,右侧是统计结果。表中数据显示:样本量N为312个,缺失值0个,平均值Mean=114.03,中位数Median=113,标准差STD=18.158,P2.5=58,P97.5=293.

11、7。Frequencies Table上表是系统对变量q9作的频数分布表(此处只列出了开头部分),Vaild右侧为原始值,Frequency为频数,Percent为各组频数占总例数的百分比(包括缺失记录在内),Valid percent为各组频数占总例数的有效百分比,Cum Percent为各组频数占总例数的累积百分比。1.2 Descriptives过程Descriptives过程是连续资料统计描述应用最多的一个过程,他可对变量进行描述性统计分析,计算并列出一系列相应的统计指标。这和其他过程相比并无不同。但该过程还有个特殊功能就是可将原始数据转换成标准正态评分值并以变量的形式存入数据库供以后

12、分析。1.2.1 界面说明Descriptives对话框的界面如图1.3a所示。选取AnalyzeDescriptive StatisticsDescriptives,系统就会弹出该对话框,其各部分的功能如下:Save standardized values as variables复选框:确定是否将原始数据的标准正态评分存为新变量。Options:Options对话框(见图1.3b)中的大部分内容均在前面Frequences过程的Statistics对话框中见过,只有最下方的Display Order单选钮组是新的,可以选择为变量列表顺序、字母顺序、均值升序或均值降序。1.2.2结果解释利用

13、111.sav文件中的q9数据,选择AnalyzeDescriptive StatisticsDescriptives,在弹出的Descriptives对话框中选q9到Variable(s)框中,点击ok,即可得到如下一个典型的Descriptives过程结果统计表: Descriptive Statistics NMinimumMaximumMeanStd. Deviation被访问者最近一次参加促销活动的消费31252300114.0318.158Valid N (listwise)312 表中各统计项在前面都有解释,这里就不再啰嗦了。图1.3a Descriptives对话框图1.3b

14、Descriptives中的Options对话框1.3 Explore过程Explore过程可对变量进行更为深入详尽的描述性统计分析,主要用于对资料的性质、分布特点等完全不清楚时,故又称之为探索性分析。它在一般描述性统计指标的基础上,增加有关数据其他特征的文字与图形描述,如茎叶图、箱图等,显得更加详细、全面,有助于用户制定继续分析的方案。1.3.1界面说明Explore对话框的界面如图1.4a所示。选取AnalyzeDescriptive StatisticsExplore,系统就会弹出该对话框,其各部分的功能如下:图1.4a Explore对话框Display单选钮组:用于选择输出结果中是否

15、包含统计描述、统计图或两者均包括。Dependent List框:用于选入需要分析的变量。Factor List框:如果想让所分析的变量按某种因素取值分组分析,则在这里选入分组变量。Label cases by框:选择一个变量,他的取值将作为每条记录的标签。最典型的情况是使用记录ID号的变量。Statistics:弹出Statistics对话框(见图1.4b),用于选择所需要的描述统计量。有如下选项:Descriptives复选框:输出平均值、中位数、众数、5%修正平均值、标准误、方差、标准差、最小值、最大值、全距、四分位全距、峰度系数、峰度系数的标准误、偏度系数、偏度系数的标准误及指定的均值可信区间。 M-estimators复选框:作中心趋势的粗略最大似然确定,输出四个不同权重的最大似然确定数。 Outliers复选框:输出五个最大值与五个最小值。 Perc

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 其它中学文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号