统计学期末复习第3章讲述

上传人:最**** 文档编号:117920152 上传时间:2019-12-11 格式:PPT 页数:26 大小:3.34MB
返回 下载 相关 举报
统计学期末复习第3章讲述_第1页
第1页 / 共26页
统计学期末复习第3章讲述_第2页
第2页 / 共26页
统计学期末复习第3章讲述_第3页
第3页 / 共26页
统计学期末复习第3章讲述_第4页
第4页 / 共26页
统计学期末复习第3章讲述_第5页
第5页 / 共26页
点击查看更多>>
资源描述

《统计学期末复习第3章讲述》由会员分享,可在线阅读,更多相关《统计学期末复习第3章讲述(26页珍藏版)》请在金锄头文库上搜索。

1、第 3 章 数据的概括性度量 第一节节 集中趋势测度指标 第二节节 离散程度测度指标 用Excel计算描述统计量 原始原始 数据数据 静态分布静态分布 动态趋势动态趋势 总量指标(绝对规模)(绝对规模) 相对指标(相对关系)(相对关系) 平均指标(集中趋势)(集中趋势) 变异指标(离散趋势)(离散趋势) 水平指标(绝对规模)(绝对规模) 速度指标(相对变化)(相对变化) 因素分析(趋势预测)(趋势预测) 统计统计 指标指标 加工加工 整理整理 第一节 集中趋势测度指标 一、 分类数据:众数 二、 顺序数据:中位数和分位数 三、 数值型数据:平均数 四、 众数、中位数和平均数的比较 集中趋势 (

2、central tendency) 1. 1. 测度集中趋势就是寻找数据水平的测度集中趋势就是寻找数据水平的代表值代表值或或中心值中心值 2. 2. 不同类型的数据用不同的集中趋势测度值不同类型的数据用不同的集中趋势测度值 3. 3. 低层次数据的测度值适用于高层次的测量数据,但高低层次数据的测度值适用于高层次的测量数据,但高 层次数据的测度值并不适用于低层次的测量数据层次数据的测度值并不适用于低层次的测量数据 4.4. 一一组数据向其中心值靠拢的倾向和程度组数据向其中心值靠拢的倾向和程度 一、分类数据:众数 众数 (mode) 一组数据中出现次数最多的变量值 适合于数据量较多时使用 不受极端

3、值的影响 一组数据可能没有众数或有几个众数 主要用于分类数据,也可用于顺序数据和 数值型数据 中位数 (median) 排序后处于中间位置上的值 MM e e 50%50%50%50% 2.2. 不受极端值的影响不受极端值的影响 3.3. 主要用于顺序数据,也可用数值型数据,但不能主要用于顺序数据,也可用数值型数据,但不能 用于分类数据用于分类数据 4.4. 各变量值与中位数的离差绝对值之和最小,即各变量值与中位数的离差绝对值之和最小,即 三、数值型数据:平均数 平均数 (mean) 也称为均值 集中趋势的最常用测度值 一组数据的均衡点所在 体现了数据的必然性特征 易受极端值的影响 有简单平均

4、数和加权平均数之分 根据总体数据计算的,称为平均数,记为;根 据样本数据计算的,称为样本平均数,记为x x x 加权平均数 (Weighted mean) 设设各组的组中值为:各组的组中值为:MM1 1 , ,MM2 2 , , ,MM k k 相应的频数为:相应的频数为: f f1 1 , , f f2 2 , , ,f f k k 样本样本加权平均加权平均 总体总体加权平均加权平均 加权平均数加权平均数 ( (例题分析例题分析) ) 某电脑电脑 公司销销售量数据分组组表 按销销售量分组组组组中值值(Mi)频频数(fi)Mi fi 140150 150160 160170 170180 18

5、0190 190200 200210 210220 220230 230240 145 155 165 175 185 195 205 215 225 235 4 9 16 27 20 17 10 8 4 5 580 1395 2640 4725 3700 3315 2050 1720 900 1175 合计计12022200 众数、中位数和平均数的比较 众数、中位数和平均数的关系 左偏分布左偏分布 均值均值 中位数中位数 众数众数 对称分布对称分布 均值均值 = = 中位数中位数 = = 众数众数 右偏分布右偏分布 众数众数 中位数中位数均值均值 众数、中位数、平均数的特点和应用 众数 n不

6、受极端值影响 n具有不惟一性 n数据分布偏斜程度较大且有明显峰值时应用 中位数 n不受极端值影响 n数据分布偏斜程度较大时应用 平均数 n易受极端值影响 n数学性质优良 n数据对称分布或接近对称分布时应用 第二节 离散程度测度指标 一、 分类数据:异众比率 二、 顺序数据:四分位差 三、 数值型数据:方差和标准差 四、 相对离散程度:离散系数 离中趋势 1.1. 数据分布的另一个重要特征数据分布的另一个重要特征 2.2. 反映各变量值远离其中心值的程度反映各变量值远离其中心值的程度( (离散程度离散程度) ) 3.3. 从另一个侧面说明了集中趋势测度值的代表程度从另一个侧面说明了集中趋势测度值

7、的代表程度 4.4. 不同类型的数据有不同的离散程度测度值不同类型的数据有不同的离散程度测度值 数值型数据:方差和标准差 极差 (range) 一组数据的最大值与最小值之差 离散程度的最简单测度值 易受极端值影响 未考虑数据的分布 R R = = max(max(x x i i ) - ) - min(min(x x i i ) ) 5.5. 计算公式为计算公式为 方差和标准差 (variance and standard deviation) 数据离散程度的最常用测度值 反映了各变量值与均值的平均差异 根据总体数据计算的,称为总体方差(标准 差),记为2();根据样本数据计算的,称 为样本方

8、差(标准差),记为s2(s) 样本方差和标准差 (sample variance and standard deviation) 未分组数据 组距分组数据组距分组数据 未分组数据未分组数据 组距分组数据组距分组数据 方差的计算公式方差的计算公式标准差的计算公式标准差的计算公式 注意:注意: 样本方差用自样本方差用自 由度由度n n-1-1去除去除! ! 相对离散程度:离散系数 离散系数 (coefficient of variation) 1. 标准差与其相应的均值之比 对数据相对离散程度的测度 消除了数据水平高低和计量单位的影响 4. 用于对不同组别数据离散程度的比较 5. 计算公式为 离散

9、系数 (例题分析) 某管理局所属8家企业业的产产品销销售数据 企业编业编 号 产产品销销售额额(万元) x1 销销售利润润(万元) x2 1 2 3 4 5 6 7 8 170 220 390 430 480 650 950 1000 8.1 12.5 18.0 22.0 26.5 40.0 64.0 69.0 【 例例 】某管理局抽查了所属的某管理局抽查了所属的8 8家企业,其产品销售数家企业,其产品销售数 据如表。试比较产品销售额与销售利润的离散程度据如表。试比较产品销售额与销售利润的离散程度 离散系数 (例题分析) 结论:结论: 计算结果表明,计算结果表明,v v 1 1 0为右偏分布 偏态系数 0为左偏分布 偏态系数大于1或小于-1,被称为高度 偏态分布;偏态系数在0.51或-1- 0.5之间,被认为是中等偏态分布;偏 态系数越接近0,偏斜程度就越低 峰态 (kurtosis) 统计学家Pearson于1905年首次提出 数据分布扁平程度的测度 峰态系数=0扁平峰度适中 峰态系数0为尖峰分布

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号