《现代社会调查与研究方法第九讲课件》由会员分享,可在线阅读,更多相关《现代社会调查与研究方法第九讲课件(9页珍藏版)》请在金锄头文库上搜索。
1、第九讲 资料的统计分析单变量分析,主要内容,单变量描述统计 频数分布与频率分布 集中趋势分析:均值、众数、中位数 离散趋势分析:全距、标准差、离散系数、四分位差 推论统计 区间估计 假设检验,单变量描述统计频数、频率分布,1、频数分布与频率分布 (1)频率分布(frequency distribution) 概念:是指一组数据中取不同值的个案的次数分布情况,它一般以频 数分布表的形式表达。 优点:简化资料;了解数据的分布范围和分布情况 (2)频率分布(percentages distribution) 概念:是一组数据中不同取值的频数相对于总数的比率分布情况【百分比形式】 差别: 频数不同类别
2、在总体中的绝对数量; 频率不同类别在总体中的相对数量; (3)主要适用:定类适度变量的描述 (4)注意:一定规模的社会调查,不易做年龄、收入、时间等定比变量频数、 频率分布表,单变量描述统计集中趋势分析,2、集中趋势分析(centeral tendency analysis) 概念:用一个典型值或代表值来反映一组数据的一般水平,或者说 反映这组数据向这个典型值集中的情况。 主要包括:平均值、众数、中位数 (1)平均数(mean) 原始数据 单值分组 组距分组 注意:组距分组资料中,尽量使所有分组都成为闭区间,既方便被调查 者回答,也可以计算出平均值。,单变量描述统计集中趋势分析,(2)众数(m
3、ode) 概念:是一组数据中出现次数最多(即频数最高)的那个数值。 单值分组资料:最大的频数对应的标志值 组距分组资料:频数最高的组对应组组中值 (3)中位数(median) 概念:把一组数据按值的大小顺序排列起来,处于中央位置的那个数值便是中位数。 适用范围:定序变量以上层次的变量 原始数据【奇数、偶数】 单值分组数据 组距分组数据,单变量描述统计集中趋势分析,(4)平均数与中位数之间的比较 平均数比中位数利用了更多的有关数据的信息;对数据的总体描述和 反映更加全面、准确。 平均数非常容易受到极端值的影响;中位数不会; 抽样调查中,平均数是一种比中位数更为稳定的量度,它随样本的变 化比较小;
4、 平均数特有的性质:容易算术运算。 平均数要以定距变量为前提,而中位数则既可用于定距变量,又可用 于定序变量。,单变量描述统计离散趋势分析,3、离散趋势分析(dispersion tendency analysis) 概念:用一个特别的值来反映一组数据相互之间的离散程度。 主要包括:全距、标准差【均值】、异众比率【众数】、 四分位差【中位数】 (1)全距(range):最大值与最小值之差 (2)标准差(standard deviation)S 概念:一组数据对其平均数的偏差平方的算数平均数的平方根。 公式类型:原始数据 单值分组数据 组距分组数据,单变量描述统计离散趋势分析,(3)异众比率(variation ratio)VS 概念:一组数据中非众数的次数相对于总体全部单位的比率 公式:VR=( n f mo ) / n (4)四分位差(interquartile range)Q 公式:Q = Q3 - Q1,单变量描述统计离散趋势分析,(5)离散系数(coefficient of variation)CV 概念:是一种相对的离散量数统计量,它使我们能够对同一总体中的 两种不同的离散量数统计量进行比较,或者是对两个不同总体 中的同一离散量数统计量进行比较。 公式:CV=标准差/平均值100%,