文档详情

xin第3章 描述统计学Ⅱ :数值方法

我***
实名认证
店铺
PDF
2.79MB
约58页
文档ID:133116622
xin第3章 描述统计学Ⅱ :数值方法_第1页
1/58

应用统计学 项目管理工程硕士学位课程 1西安工程大学管理学院 第第3章 描述统计学 数值方法章 描述统计学 数值方法 西安工程大学管理学院2 位置的度量 平均数 3西安工程大学管理学院 位置的度量 中位数 中位数 median 由小到大排序后 处于 中间位置 的数据 如果是奇数个观测值时 中位数是中间 那个数 如果是偶数个观测值时 中位数是中间 两个的平均值 西安工程大学管理学院4 位置的度量 众数 众数 Mode 出现频率最高的那个样本值 注 众数可能会有多个 适用于分类型和 数量型数据 西安工程大学管理学院5 均值 中位数和众数的比较 1 数据的分布是单峰对称时 三者重合 2 偏斜分布时 相对于众数 中位数朝 尾巴方向偏离了一些 均值偏离得更远 3 一般情况下 中位数居中 众数和均 值处在两边 4 众数是最高峰对应的横坐标 西安工程大学管理学院6 某商品价格 西安工程大学管理学院7 男生身高 西安工程大学管理学院8 男生身高 西安工程大学管理学院9 众数 中位数 均值 10 均值 中位数 众数 歌手大赛 电视台举办业余歌手大赛 11名评委对某位 歌手的评分分别是 9 9 9 3 9 3 9 3 9 2 8 9 8 8 8 8 8 7 8 5 8 4 众数 9 3 中位数 8 9 均值 9 01 假定复赛还是这11名评委 给分是 9 9 9 3 9 3 9 2 9 2 8 8 8 8 8 8 8 7 8 5 8 4 众数 8 8 中位数 8 8 均值 8 99 西安工程大学管理学院11 歌手大赛 再假定 工作人员粗心 将8 4写成了0 4 则 众数 8 8 中位数 8 8 均值 8 26 均值对异常值敏感 西安工程大学管理学院12 四分位数 第一四分位数 quartiles 把排序后的数 据分成左右两部分 左边包含四分之一 数据观测值 右边包含四分之三的数据 观测值 第二四分位数处于观测值数目 的中间位置 中位数 第三四分位数 quartiles 把排序后的数据分成左右两 部分 左边包含四分之三数据观测值 右边包含四分之一的数据观测值 西安工程大学管理学院13 14 第一四分位数的计算 将数据由小到大排列 记排列后的数据为 令 其中表示向上取整 如 则第 一四分位数就是 即约有1 4的数据比小 3 4的数据比大 如果i是整数 则第p百分 位数是第i项和第i 1项的平均值 n xxx 21 L ni 100 25 55 61 5 i x i x i x 15 第三四分位数的计算 将数据由小到大排列 记排列后的数据为 令 其中表示向上取整 如 则第 一四分位数就是 即约有1 4的数据比大 3 4的数据比小 如果i是整数 则第p百分 位数是第i项和第i 1项的平均值 n xxx 21 L ni 100 75 55 61 5 i x i x i x 百分位数 第p百分位数把数据分成左右两部分 大 约有p 的观测值比它小 而 1 p 的观 测值比它大 计算办法与四分位数类似 第25百分位数就是第一四分位数 西安工程大学管理学院16 17 百分位数的计算 将数据由小到大排列 记排列后的数据为 令 其中表示向上取整 如 则第p 百分位数就是 如果i是整数 则第p百分位数是第i项和第i 1项 的平均值 n xxx 21 L n p i 100 55 61 5 i x 18 例子 例2 8 某班30名MBA学生的年龄按上升顺序排列如下表 请计算这组数据的众数 中数 平均数 第一四分位数和 第三四分位数 众数为27和28 分别出现5次 中位数为 27 28 2 27 5 平均数为27 67 第一四分位数x8 26 第三四分位数为x23 30 极大值为32极小值为24 第10百分位数为 25 第90百分位数为31 242425252525262626262727272727 282828282829293030303031313132 计算机输出 西安工程大学管理学院19 变异程度的度量 极差 range 最大值与最小值之差 四分位数间距 inter quartile range 是 中间50 的数据的极差 四分位数间距能够克服极端值的影响 西安工程大学管理学院20 变异程度的度量 方差 总体方差 population variance 样本方差 Sample variance 标准差 standard deviation 标准差系数 coefficient of variance 西安工程大学管理学院21 样本方差和样本标准差 西安工程大学管理学院22 总体方差和总体标准差 西安工程大学管理学院23 2 2 2 总体标准差 总体方差 N xi 标准差系数CV 西安工程大学管理学院24 100 xsCV 几种变异程度度量的比较 极差 容易计算 但最不稳定 特别容易受 极端值的影响 四分位数间距 稳定性较弱 对极端值不敏 感 方差和标准差 计算时要用到全部数据 能 比较合理地反映不同数据对离散度量的作用 容易受极端值的影响 变异系数 比较两组或两组以上数据集的离 散程度时 应采用无量度单位的变异系数CV 注 描述样本数据的分布中心常用样本均值 描述样本数据的分布形状常用样本标准差 西安工程大学管理学院25 分布形态 对称钟形 西安工程大学管理学院26 分布形态 向右偏 西安工程大学管理学院27 分布形态 向左偏 西安工程大学管理学院28 Z 分数 度量数据集中一个特定的数据距均值有 多远 用标准差度量 西安工程大学管理学院29 样本标准差 样本均值 分数 的是 式中 s x zxz s xx z ii i i 班级人数的例子 某大学5个班级组成一个样本 每个班的 学生人数如下 46 54 42 46 32 计算离差 标准差 Z 分数 均值 44 方差 64 标准差 8 西安工程大学管理学院30 班级人数 手工计算 西安工程大学管理学院31 班级人数 软件输出 西安工程大学管理学院32 标准误计算公式 西安工程大学管理学院33 样本个数 标准差 标准误 N Mean ofStd Error 班级人数z 分数 西安工程大学管理学院34 切比雪夫定理 对任何分布的数据 都有 至少有75 的数据值与均值的距离在z 2 个标准差之内 至少有89 的数据值与均值的距离在z 3 个标准差之内 至少有94 的数据值与均值的距离在z 4 个标准差之内 西安工程大学管理学院35 经验法则 对于具有钟形分布的数据 有 68 3 的数据与平均数的距离在1个标准 差之内 95 4 的数据与平均数的距离在2个标准 差之内 99 7 的数据与平均数的距离在3个标准 差之内 西安工程大学管理学院36 例子 某校同学的身高为钟形分布 平均值为 170cm 标准差为10cm 问 1 高于平均数1 5个标准差的同学身高是 多少 2 162cm身高的同学距平均数有几个标 准差 3 75 的同学身高会在什么范围内 西安工程大学管理学院37 例子 解1 Xi 170 1 5 10 185cm 解2 Z 162 170 10 0 8 解3 xi x z s 170 2 10 150 xi x z s 170 2 10 190 150 190 因为 至少有75 的数据值与均值的距 离在z 2个标准差之内 西安工程大学管理学院38 切比雪夫定理 一般表述 与平均数的距离在z个标准差之内的数据 值所占比例至少为 其中z是 大于1的任意实数 西安工程大学管理学院39 2 1 1 z 考试成绩 假定有100名大学生的统计学课程考试成 绩的平均分是70分 标准差为5分 那么 有多少学生的考试成绩在58 82分 58 70 5 2 4 82 70 5 2 4 这样z 2 4 于是 结论 至少有82 6 的成绩在58 82之间 西安工程大学管理学院40 826 0 4 2 1 1 1 1 22 z 检测异常值 用z 分数检测异常值 根据钟形分布的经 验法则 将z 分数大于3和小于 3的观察 值视为异常值 西安工程大学管理学院41 探索性数据分析 五数概括法 用5个数来汇总数据 1 最小值 2 第一四分位数 3 中位数 4 第三四分位数 5 最大值 这5个数把变量的所有观测值分成4部分 西安工程大学管理学院42 箱形图 box plot 用矩形表示箱体 左右边分别代表第一 第三四分位数 矩形中间画一条线 代表 中位数 箱体左边向左画一条线 到最左 边 代表四分位数间距的1 5倍的位置 右 边也一样 左右两条横线叫触须线 箱形图也可以检测异常值 西安工程大学管理学院43 箱形图 西安工程大学管理学院44 四分位数间距 IQR 第一四分位数第三四分位数 1 5IQR1 5IQR 中位数 数据轴 按上升排列 商学院毕业生起始月薪 美元 西安工程大学管理学院45 月薪的五数概括 西安工程大学管理学院46 月薪的箱形图 西安工程大学管理学院47 两变量间关系的度量 协方差 假定有两个变量和的观测数据 这两个变量的样本协方差定义为 西安工程大学管理学院48 332211nn yxyxyxyx 1 n yyxx s ii xy xy 总体协方差定义 西安工程大学管理学院49 N yx yixi xy 总体协方差的解释 音响店 西安工程大学管理学院50 3 x 51 y 相关系数 皮尔逊样本相关系数的定义 西安工程大学管理学院51 的样本标准差表示 的样本标准差表示 ys xs ss s r y x yx xy xy 总体相关系数的定义 西安工程大学管理学院52 的总体标准差表示 的总体标准差 表示 y x y x yx xy xy 加权平均数 需要加权的例子 以下是过去3个月购买5批次原材料的样 本 价格的平均数就要用数量做权重 西安工程大学管理学院53 加权平均数的计算公式 西安工程大学管理学院54 i ii w xw x 原材料加权平均数的计算 西安工程大学管理学院55 分组数据 有时候得到的是分组数据 那么求均值 和样本方差就要利用加权公式 西安工程大学管理学院56 分组数据计算样本方差 西安工程大学管理学院57 1 2 2 n xMf s ii 计算机输出 西安工程大学管理学院58 。

下载提示
相似文档
正为您匹配相似的精品文档
相关文档