2频数分析列连表.doc

上传人:博****1 文档编号:563309228 上传时间:2022-09-12 格式:DOC 页数:17 大小:393.50KB
返回 下载 相关 举报
2频数分析列连表.doc_第1页
第1页 / 共17页
2频数分析列连表.doc_第2页
第2页 / 共17页
2频数分析列连表.doc_第3页
第3页 / 共17页
2频数分析列连表.doc_第4页
第4页 / 共17页
2频数分析列连表.doc_第5页
第5页 / 共17页
点击查看更多>>
资源描述

《2频数分析列连表.doc》由会员分享,可在线阅读,更多相关《2频数分析列连表.doc(17页珍藏版)》请在金锄头文库上搜索。

1、1 频数分析 (Descriptive Statistics - Frequencies)频数分布分析主要通过频数分布表、条形图和直方图,以及集中趋势和离散趋势的各种统计量来描述数据的分布特征。下面我们通过例子来学习单变量频数分析操作。1) 输入分析数据在数据编辑器窗口打开“data1-2.sav”数据文件。2) 调用分析过程在主菜单栏单击“Analyze”,在出现的下拉菜单里移动鼠标至“Descriptive Statistics”项上,在出现的次菜单里单击“Frequencies”项,打开如图3-4所示的对话框。 图3-4 “Frequencies” 对话框3) 设置分析变量从左则的源变量

2、框里选择一个和多个变量进入“Variable(s):”框里。在这里我们选“三化螟蚁螟 虫口数”变量进入“Variable(s):”框。4) 输出频数分布表 Display frequency tables,选中显示。5) 设置输出的统计量单击“Statistics”按钮,打开图3-5所示的对话框,该对话框用于选择统计量: 图3-5 “Statistics”对话框 选择百分位显示“Percentiles Values”栏:Quartiles:四分位数,显示25%、50%和75%的百分位数。 Cut points for 10 equal groups:将数据平分为输入的10个等份。 Percen

3、tile(s)::用户自定义百分位数,输入值0100之间。选中此项后,可以利用“Add”、“Change”和 “Remove”按钮设置多个百分位数。 选择变异程度的统计量“Dispersion”:(离散趋势)Std.deviation 标准差 Minimum 最小值 Variance 方差 Maximum 最大值 Range 极差 S.E.mean 均值标准误 选择表示数据中心位置的统计量“Central Tendency”:(集中趋势)Mean 均值 Median 中位数 Mode 众数 Sum 算术和 选择分布指标“Distribution”:Skewness 偏度 Kurtosis 峰度

4、6) 统计图形输出设置单击“Charts”按钮,将弹出如图3-6所示的对话框:图3-6 “Charts”对话框 Chart Type 图形选择栏: None: 不输出图形; Bar charts: 输出条形图; Pie charts: 输出饼图; Histograms: 输出柱状图。若选中“With normal curve”项,则在绘制柱状图中加绘一条正态分布曲线。 当用户选中条形图或饼图时,在“Chart Values”框的选项中可选择: Frequencies:绘制频数图。 Percentages:绘制频率图。7)设置频数表格式在图3-4对话框中,单击“Format”按钮,打开如图3-7

5、所示的对话框:图3-7 “Format”对话框 设置排序的方法“Order by”: Ascending values:按变量值的升序排列。 Descending valus:按变量值的降序排列。 Ascending counts:按频数的升序排列。 Descending counts:按频数的降序排列。 选择多变量输出设置“Multiple Variables ”: Compare variables 选项,所有变量在一个图形中输出,以便进行比较。 Organize output by variables选项,为每一个变量单独输出一个图。 设置在频数表中显示的组数选中此项,输入分组数,系统缺

6、省为10组。设置完成后,点击“Continue”按钮回到上一级对话框。8)提交执行在图3-4 对话框里单击“OK”按钮,SPSS在输出窗口的输出结果如表1、表2和图1结果。 9)分析结果表1 统计量表 Statistics三化螟蚁螟 N Valid120 Missing0Mean(平均数)75.14Std. Deviation(标准差)7.024Skewness(偏度系数)-.031Std. Error of Skewness(偏度系数误差).221Kurtosis(峰度系数)-.582Std. Error of Kurtosis(峰度系数误差).438Percentiles1065.00 2

7、068.20 3071.00 4073.40 5075.00 6077.00 7079.00 8081.80 9084.90在表1中列出的信息有:有效观测值有124个,缺失值0个,平均数75.14,标准差7.024。偏度系数(Skewness)及误差:-0.031和0.221,峰度系数(Kurtosis)及误差:-0.582和0.438。表2 频数表三化螟蚁螟Frequency(频数)Percent(百分比)Valid Percent(有效观测值的百分比)Cumulative Percent(累积百分比)Valid?581.8.8.86232.52.53.3631.8.84.26443.33.

8、37.56543.33.310.8661.8.811.76754.24.215.86854.24.220.06943.33.323.37043.33.326.77154.24.230.87275.85.836.77343.33.340.07443.33.343.37597.57.550.87697.57.558.37754.24.262.57865.05.067.57965.05.072.58065.05.077.58132.52.580.08243.33.383.38332.52.585.88454.24.290.08521.71.791.78643.33.395.08732.52.597.

9、5881.8.898.3901.8.899.2911.8.8100.0Total120100.0100.0?在表2中列出的信息有:Frequency 频数;Percent 百分比;Valid Percent有效观测值的百分比;Cumulative Percent 累积百分比。 图3-8 频数分布的条形图表示 2 列联表分析(Crosstabs)列联表是指两个或多个分类变量各水平的频数分布表,又称频数交叉表。SPSS的Crosstabs过程,为二维或高维列联表分析提供了22种检验和相关性度量方法。其中卡方检验是分析列联表资料常用的假设检验方法。例子:山东烟台地区病虫测报站预测一代玉米螟卵高峰期。

10、预报发生期y为3级(1级为6月20日前,2级为6月21-25日,3级为6月25日后);预报因子5月份平均气温x1()分为3级(1级为16.5以下,2级为16.6-17.8,3级为17.8以上),6月上旬平均气温x2()分为3级(1级为20以下,2级为20.1-21.5,3级为21.5以上),6月上旬降雨量x3(mm)分为3级(1级为15mm以下,2级为15.1-30mm,3级为30mm以上),6月中旬降雨量x4(mm)分为3级(1级为29mm以下,2级为29.1-36mm,3级为36mm以上)。数据如下表。山东烟台历年观测数据分级表()年份 59606162636465666769707172

11、7374757677y131131121321223221x1322313233123111221x2123112211112311112x3311312132212123231x4311111111131121111注:摘自农业病虫统计测报 131页。 1) 输入分析数据在数据编辑器窗口打开“data1-3.sav”数据文件。数据文件中变量格式如下:2) 调用分析过程在菜单选中“Analyze-Descriptive- Crosstabs”命令,弹出列联表分析对话框,如下图3) 设置分析变量选择行变量:将“五月气温x1,六月上气温x2,六月上降雨x3,六月中降雨x4”变量选入“Rows:”行

12、变量框中。选择列变量:将“玉米螟卵高峰发生期y”变量选入 “Columns:”列变量框中。4) 输出条形图和频数分布表 Display clustered bar charts: 选中显示复式条形图。 Suppress table: 选中则不输出多维频数分布表。5) 统计量输出点击“Statistics”按钮,弹出统计分析对话框(如下图)。Chi-Square: 卡方检验。选中可以输出皮尔森卡方检验(Pearson)、似然比卡方检验(Likelihood-ratio)、连续性校正卡方检验 (Continuity Correction)及Fisher精确概率检验(Fishers Exact test)的结果。Correlations: 选中输出皮尔森(Pearson)和Spearman相关系数,用以说明行变量和列变量的相关程度。Nominal: 两分类变量的关联度(Association)测量Contingency Coefficient: 列联系数,其值越大关联性越强。 Phi and Cramers V:Cramer列联系数,其值越大关联性越强。 Lambda: 减少预测误差率,1表示预测效果最好,0表示预测效果最差。 Uncertainty Coefficient: 不定系数Ordinal: 两有序分类变量(等级变量)的关联

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号