社会学统计第四章节课件

上传人:E**** 文档编号:91093477 上传时间:2019-06-21 格式:PPT 页数:60 大小:14.34MB
返回 下载 相关 举报
社会学统计第四章节课件_第1页
第1页 / 共60页
社会学统计第四章节课件_第2页
第2页 / 共60页
社会学统计第四章节课件_第3页
第3页 / 共60页
社会学统计第四章节课件_第4页
第4页 / 共60页
社会学统计第四章节课件_第5页
第5页 / 共60页
点击查看更多>>
资源描述

《社会学统计第四章节课件》由会员分享,可在线阅读,更多相关《社会学统计第四章节课件(60页珍藏版)》请在金锄头文库上搜索。

1、第四章 离散程度的测度,一. 定类数据:异众比率 二. 定序数据:四分位差 三. 定距和定比数据:方差及标准差 四. 相对离散程度:离散系数,离中趋势,数据分布的另一个重要特征 离中趋势的各测度值是对数据离散程度所作的描述 反映各变量值远离其中心值的程度,因此也称为离中趋势 从另一个侧面说明了集中趋势测度值的代表程度 不同类型的数据有不同的离散程度测度值,数据的特征和测度 (本节位置),定类数据:异众比率,异众比率 (概念要点),1. 离散程度的测度值之一 2. 非众数组的频数占总频数的比率 3. 计算公式为,4. 用于衡量众数的代表性,异众比率 (算例),计算异众比率,定序数据:四分位差,四

2、分位差 (概念要点),1. 离散程度的测度值之一 2. 也称为内距或四分间距 3. 上四分位数与下四分位数之差 QD = QU - QL 4. 反映了中间50%数据的离散程度 不受极端值的影响 用于衡量中位数的代表性,四分位差 (定序数据的算例),计算甲城市家庭对住房满意状况评价的四分位差,解:设非常不满意为1,不满意为2, 一般为3, 满意为 4, 非常满意为5 已知 QL = 不满意 = 2, QU = 一般 = 3 四分位差: QD = QU - QL = 3 2 = 1,定距数据:方差和标准差,全距 (概念要点及计算公式),1. 一组数据的最大值与最小值之差 2. 离散程度的最简单测度

3、值 3. 易受极端值影响 4. 未考虑数据的分布,未分组数据 R = max(Xi) - min(Xi),5. 计算公式为,平均离差 (概念要点及计算公式),1. 离散程度的测度值之一 2. 各变量值与其均值离差绝对值的平均数 3. 能全面反映一组数据的离散程度 4. 数学性质较差,实际中应用较少,5. 计算公式为,未分组数据,组距分组数据,方差和标准差 (概念要点),1. 离散程度的测度值之一 2. 最常用的测度值 3. 反映了数据的分布 反映了各变量值与均值的平均差异 根据总体数据计算的,称为总体方差或总体标准差;根据样本数据计算的,称为样本方差或样本标准差,总体方差和总体标准差 (计算公

4、式),未分组数据:,组距分组数据:,未分组数据:,组距分组数据:,方差的计算公式,标准差的计算公式,方差或标准差的另一种意义: 用均值做估计或者预测变量值时所犯错误的大小。,样本方差和样本标准差 (计算公式),未分组数据:,组距分组数据:,未分组数据:,组距分组数据:,样本方差的计算公式,样本标准差的计算公式,样本方差 自由度(degree of freedom),一组数据中可以自由取值的数据的个数 2. 当样本数据的个数为 n 时,若样本均值x 确定后,只有n-1个数据可以自由取值,其中必有一个数据则不能自由取值。,样本方差 自由度(degree of freedom),例如,样本有3个数值

5、,即x1=2,x2=4,x3=9,则 x = 5。当 x = 5 确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他值 3、样本方差用自由度去除,其原因可从多方面来解释,从实际应用角度看,在抽样估计中,当用样本方差去估计总体方差2时,它是2的无偏估计量,当样本数据的个数为 n 时,若样本均值x 确定后,只有n-1个数据可以自由取值,其中必有一个数据则不能自由取值。所以自由度为n-1。,第一,自由度的产生是与抽样分布联系在一起的。因为从总体中抽取样本,因而我们需要计算样本的“统计量”,“统计量”是研究者通过调查样本数据人

6、为地计算出来的,而“参数”是被调查者的总体所客观存在的,这是两者的区别。在统计学的理论层面上,要求统计量是参数的无偏估计,认为两者是相等的。在实际研究中,由于抽样的误差可能导致两者的不相等,但对于这种情况,研究者是无法知道的,否则就没有抽样的必要了。在理论假设下,统计量和参数一样被看作是客观的、确定性的。,第二,既然在理论上统计量被要求是确定的,那么在实际层面上计算统计量的那组数据就不是完全自由的。这一点很重要,因为“自由度”中“自由”的含义就是相对这个“确定”而言的。正是统计量的这个“确定性”限制了与之相关的一组数据的“自由度”,也就是说,一组数据不是可以完全自由取值的,它必须支持“统计量与

7、总体参数相等”的理论假设。这就是“自由度”存在的理由。,研究者对某一社区内居民家庭的收入状况进行调查,该社区共有1000户,采取随机抽取的方式对100户进行了调查。在这个例子中,总体1000户的收入的平均数是总体参数,是客观的、确定的,尽管研究者不知道。通过随机抽样和入户问卷调查,研究者获得了100户的收入数据。运用这组数据可以算出样本的平均数,它是统计量。由于在理论上要求统计量与参数相等。所以这100个数据的和是确定的,当99个数据被选择以后,第100个数据就是确定的,所以,这组数据在求平均数这统计量时的自由度就是:k=100-1=99。,你可以这样理解:10个人挑选10个桔子,那么只有9个

8、人有自由挑选的自由,那么剩下的那个人就只有挑最后那个了,所以自由度就为9,样本方差 (算例),原始数据: 10 5 9 13 6 8,样本标准差 (算例),样本标准差,原始数据: 10 5 9 13 6 8,方差 (简化计算公式),样本方差,总体方差,方差 (数学性质),各变量值对均值的方差小于对任意值的方差,标准化值 (概念要点和计算公式),一组数据是钟形分布:正态曲线 正态分布:众数、中位数、平均数是相同的,经验法则,经验法则表明:当一组数据对称分布时 约有68%的数据在平均数加减1个标准差的范围之内 约有95%的数据在平均数加减2个标准差的范围之内 约有99%的数据在平均数加减3个标准差

9、的范围之内,标准化值 (概念要点和计算公式),1. 也称标准分数 2. 给出某一个值在一组数据中的相对位置 3. 可用于判断一组数据是否有离群点 4. 用于对变量的标准化处理 5. 计算公式为,标准正态分布,相对离散程度:离散系数,离散系数 (概念要点和计算公式),1. 标准差与其相应的均值之比 2. 消除了数据水平高低和计量单位的影响 3. 测度了数据的相对离散程度 4. 用于对不同组别数据离散程度的比较 5. 计算公式为,离散系数 (实例和计算过程),例:某管理局抽查了所属的8家企业,其产品销售数据表。试比较产品销售额与销售利润的离散程度,离散系数 (计算结果),结论: 计算结果表明,V1

10、V2,说明产品销售额的离散程度小于销售利润的离散程度,例:甲、乙班级社会统计学考试成绩分布情况如下表,试比较两个班级同学考试成绩的离散程度。,解,某大学田径队的队员跑400米和1500米的时间(分钟) 400米: 0.92 0.98 1.04 0.90 0.99 1500米:4.52 4.35 4.60 4.70 4.50 一名教练看了以上样本后断言,400米耗时更具有一致性。 对不对?为什么?,箱图,数据类型与离散程度测度值,第三节 偏态与峰度的测度,一. 偏态及其测度 二. 峰度及其测度,数据的特征和测度 (本节位置),偏 态,偏态与峰度分布的形状,偏态,峰度,偏态 (概念要点),1. 数

11、据分布偏斜程度的测度 2. 偏态系数=0为对称分布 3. 偏态系数 0为右偏分布 4. 偏态系数 0为左偏分布 5. 计算公式为,偏态 (实例),已知2006年我国农村居民家庭按纯收入分组的有关数据如表4.9。试计算偏态系数,农村居民家庭村收入数据的直方图,偏态与峰度 (从直方图上观察),按纯收入分组(元),结论:为右偏分布,偏态系数 (计算过程),偏态系数 (计算结果),根据上表数据计算得,将计算结果代入公式得,结论:偏态系数为正值,而且数值较大,说明农村居民家庭纯收入的分布为右偏分布,即收入较少的家庭占据多数,而收入较高的家庭则占少数,而且偏斜的程度较大,峰 度,峰度 (概念要点),1.

12、数据分布扁平程度的测度 2. 峰度系数=3扁平程度适中 3. 偏态系数3为尖峰分布 5. 计算公式为,峰度系数系数 (实例计算结果),代入公式得,根据2006年农村居民家庭纯收入数据,计算农村居民家庭纯收入分布的峰度系数,结论:由于=3.43,说明我国农村居民家庭纯收入的分布为尖峰分布,说明低收入家庭占有较大的比重,本章小结,1. 集中趋势各测度值的含义、计算方法、特点和应用场合 2. 离散程度各测度值的含义、计算方法、特点和应用场合 偏态及峰度的测度方法,数据分布的特征和测度,数据类型与集中趋势测度值,数据类型与离散程度测度值,课后练习: 1、集中趋势的测度方法 2、离散程度的测度方法 3、偏态与峰度的测度方法,结 束,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号