2频数分析列连表.doc－金锄头文库

资源描述

《2频数分析列连表.doc》由会员分享，可在线阅读，更多相关《2频数分析列连表.doc（17页珍藏版）》请在金锄头文库上搜索。

1、1 频数分析 (Descriptive Statistics - Frequencies)频数分布分析主要通过频数分布表、条形图和直方图，以及集中趋势和离散趋势的各种统计量来描述数据的分布特征。下面我们通过例子来学习单变量频数分析操作。1) 输入分析数据在数据编辑器窗口打开“data1-2.sav”数据文件。2) 调用分析过程在主菜单栏单击“Analyze”，在出现的下拉菜单里移动鼠标至“Descriptive Statistics”项上，在出现的次菜单里单击“Frequencies”项，打开如图3-4所示的对话框。图3-4 “Frequencies” 对话框3) 设置分析变量从左则的源变量

2、框里选择一个和多个变量进入“Variable(s):”框里。在这里我们选“三化螟蚁螟虫口数”变量进入“Variable(s):”框。4) 输出频数分布表 Display frequency tables，选中显示。5) 设置输出的统计量单击“Statistics”按钮，打开图3-5所示的对话框，该对话框用于选择统计量：图3-5 “Statistics”对话框选择百分位显示“Percentiles Values”栏：Quartiles：四分位数，显示25%、50%和75%的百分位数。 Cut points for 10 equal groups：将数据平分为输入的10个等份。 Percen

3、tile(s):：用户自定义百分位数，输入值0100之间。选中此项后，可以利用“Add”、“Change”和 “Remove”按钮设置多个百分位数。选择变异程度的统计量“Dispersion”：（离散趋势）Std.deviation 标准差 Minimum 最小值 Variance 方差 Maximum 最大值 Range 极差 S.E.mean 均值标准误选择表示数据中心位置的统计量“Central Tendency”：（集中趋势）Mean 均值 Median 中位数 Mode 众数 Sum 算术和选择分布指标“Distribution”：Skewness 偏度 Kurtosis 峰度

4、6) 统计图形输出设置单击“Charts”按钮，将弹出如图3-6所示的对话框：图3-6 “Charts”对话框 Chart Type 图形选择栏： None：不输出图形； Bar charts：输出条形图； Pie charts：输出饼图； Histograms：输出柱状图。若选中“With normal curve”项，则在绘制柱状图中加绘一条正态分布曲线。当用户选中条形图或饼图时，在“Chart Values”框的选项中可选择： Frequencies：绘制频数图。 Percentages：绘制频率图。7）设置频数表格式在图3-4对话框中，单击“Format”按钮，打开如图3-7

5、所示的对话框：图3-7 “Format”对话框设置排序的方法“Order by”： Ascending values：按变量值的升序排列。 Descending valus：按变量值的降序排列。 Ascending counts：按频数的升序排列。 Descending counts：按频数的降序排列。选择多变量输出设置“Multiple Variables ”： Compare variables 选项，所有变量在一个图形中输出，以便进行比较。 Organize output by variables选项，为每一个变量单独输出一个图。设置在频数表中显示的组数选中此项，输入分组数，系统缺

6、省为10组。设置完成后，点击“Continue”按钮回到上一级对话框。8）提交执行在图3-4 对话框里单击“OK”按钮，SPSS在输出窗口的输出结果如表1、表2和图1结果。 9）分析结果表1 统计量表 Statistics三化螟蚁螟 N Valid120 Missing0Mean（平均数）75.14Std. Deviation（标准差）7.024Skewness（偏度系数）-.031Std. Error of Skewness（偏度系数误差）.221Kurtosis（峰度系数）-.582Std. Error of Kurtosis（峰度系数误差）.438Percentiles1065.00 2

7、068.20 3071.00 4073.40 5075.00 6077.00 7079.00 8081.80 9084.90在表1中列出的信息有：有效观测值有124个，缺失值0个，平均数75.14，标准差7.024。偏度系数（Skewness）及误差：-0.031和0.221，峰度系数（Kurtosis）及误差：-0.582和0.438。表2 频数表三化螟蚁螟Frequency（频数）Percent（百分比）Valid Percent（有效观测值的百分比）Cumulative Percent（累积百分比）Valid?581.8.8.86232.52.53.3631.8.84.26443.33.

8、37.56543.33.310.8661.8.811.76754.24.215.86854.24.220.06943.33.323.37043.33.326.77154.24.230.87275.85.836.77343.33.340.07443.33.343.37597.57.550.87697.57.558.37754.24.262.57865.05.067.57965.05.072.58065.05.077.58132.52.580.08243.33.383.38332.52.585.88454.24.290.08521.71.791.78643.33.395.08732.52.597.

9、5881.8.898.3901.8.899.2911.8.8100.0Total120100.0100.0?在表2中列出的信息有：Frequency 频数；Percent 百分比；Valid Percent有效观测值的百分比；Cumulative Percent 累积百分比。图3-8 频数分布的条形图表示 2 列联表分析（Crosstabs）列联表是指两个或多个分类变量各水平的频数分布表，又称频数交叉表。SPSS的Crosstabs过程，为二维或高维列联表分析提供了22种检验和相关性度量方法。其中卡方检验是分析列联表资料常用的假设检验方法。例子：山东烟台地区病虫测报站预测一代玉米螟卵高峰期。

10、预报发生期y为3级（1级为6月20日前，2级为6月21-25日，3级为6月25日后）；预报因子5月份平均气温x1（）分为3级（1级为16.5以下，2级为16.6-17.8，3级为17.8以上），6月上旬平均气温x2（）分为3级（1级为20以下，2级为20.1-21.5，3级为21.5以上），6月上旬降雨量x3（mm）分为3级（1级为15mm以下，2级为15.1-30mm，3级为30mm以上），6月中旬降雨量x4（mm）分为3级（1级为29mm以下，2级为29.1-36mm，3级为36mm以上）。数据如下表。山东烟台历年观测数据分级表（）年份 59606162636465666769707172

11、7374757677y131131121321223221x1322313233123111221x2123112211112311112x3311312132212123231x4311111111131121111注：摘自农业病虫统计测报 131页。 1) 输入分析数据在数据编辑器窗口打开“data1-3.sav”数据文件。数据文件中变量格式如下：2) 调用分析过程在菜单选中“Analyze-Descriptive- Crosstabs”命令，弹出列联表分析对话框，如下图3) 设置分析变量选择行变量：将“五月气温x1，六月上气温x2，六月上降雨x3，六月中降雨x4”变量选入“Rows:”行

12、变量框中。选择列变量：将“玉米螟卵高峰发生期y”变量选入 “Columns:”列变量框中。4) 输出条形图和频数分布表 Display clustered bar charts: 选中显示复式条形图。 Suppress table: 选中则不输出多维频数分布表。5) 统计量输出点击“Statistics”按钮，弹出统计分析对话框（如下图）。Chi-Square: 卡方检验。选中可以输出皮尔森卡方检验（Pearson）、似然比卡方检验（Likelihood-ratio）、连续性校正卡方检验（Continuity Correction）及Fisher精确概率检验（Fishers Exact test）的结果。Correlations: 选中输出皮尔森（Pearson）和Spearman相关系数，用以说明行变量和列变量的相关程度。Nominal: 两分类变量的关联度（Association）测量Contingency Coefficient: 列联系数，其值越大关联性越强。 Phi and Cramers V：Cramer列联系数，其值越大关联性越强。 Lambda: 减少预测误差率，1表示预测效果最好，0表示预测效果最差。 Uncertainty Coefficient: 不定系数Ordinal: 两有序分类变量（等级变量）的关联

展开阅读全文