06基本统计20151027CN

上传人:豆浆 文档编号:24901586 上传时间:2017-12-08 格式:PDF 页数:97 大小:3.74MB
返回 下载 相关 举报
06基本统计20151027CN_第1页
第1页 / 共97页
06基本统计20151027CN_第2页
第2页 / 共97页
06基本统计20151027CN_第3页
第3页 / 共97页
06基本统计20151027CN_第4页
第4页 / 共97页
06基本统计20151027CN_第5页
第5页 / 共97页
点击查看更多>>
资源描述

《06基本统计20151027CN》由会员分享,可在线阅读,更多相关《06基本统计20151027CN(97页珍藏版)》请在金锄头文库上搜索。

1、基础统计学11/17/2015 2Long Live Data模块目标 定义数据类型名称型 , 序数型 , 间隔型 , 比例型 介绍中心趋势测量众值 , 中位值 和 平均值 介绍偏差测量极差 , 方差 , 标准差 介绍形状概念频率分布正态性 Z分值的介绍11/17/2015Long Live Data3基本统计对我们哪方面有帮助?1) 项目范围和验证业务问题 依据企业的项目筛选流程评估并缩小项目范围 明确关键业务问题 明确产品、服务和流程包含的内容(使用宏观流程图) 明确关键过程输出特性2) 形成问题描述 使用 3W2H( What, when, where, how much, how do

2、 I know)3) 定义项目指标 业务指标 主要指标和次要指标 衍生性指标 财务指标:形成一个财务预测4) 形成目标陈述 在 日期 前将 流程指标 从 基线 改进到 目标 5) 确定团队成员项目范围和问题的确定问题陈述项目指标团队成员定义目标陈述11/17/2015Long Live Data4还记得 Taguchi 吗 ?球门柱心态传统观念LSL USL凡因偏离目标而对社会造成的损失即表示品质损失偏差有害无益Taguchi 观念?LSL USL凡超出标准的部分即表示品质损失$ $11/17/2015Long Live Data5目标值 例如 :周期时间缺陷率消耗率 例如 :预约时间尺寸浓度

3、 例如 :平均寿命客户满意度分数能量转换效率11/17/2015Long Live Data6定性型与定量型数据数据类型 描述 例子 统计学工具标称值离散型 :无序分类数据无间隔信息合格 /不合格计数数据属性数据产量数据Chi2 检验偶然性检验表1- 和 2-比例检验序数值离散型 :有序分类数据无间隔信息好 /很好 /最好Likert (程度 )刻度小 /中 /大1 至 5 的刻度标称检验 外加 :符号检验Wilcoxon 序数 -加和 检验Wilcoxon 符号 -序数 检验间隔值连续型 :间隔均等无绝对零温度 ( C)位置序数检验 外加 :方差分析 Chi2 检验DOE 实验 MOOD氏检

4、验z & t 检验 F 检验 回归Kruskal-Wallis 以及 比率值连续型 :间隔均等有绝对零尺寸大小压力浓度信息增强11/17/2015 7Long Live Data总体与样本统计值 描述性参数 (用于总体 )总体 : 包括某个集合所有个体的数据集描述性参数用于 描述 总体 样本统计量样本 :只包括某个集合的部分个体测量值的数据集样本统计值用于由样本测量结果 推断 整个总体特征总体样本?11/17/2015 8Long Live Data生成基本统计值以获得信息样本统计值用于估计总体特征12.4 15.2 16.409.2 18.7 15.432.6 14.2 19.108.5 1

5、0.7 06.311/17/2015 9Long Live Data样本统计值什么是统计值 ? 由 数据 取得的信息 : 最小值 最大值 个数 百分位数:第 25, 50, 75位数 缺陷百分数 和11/17/2015Long Live Data10重要 “总体” 属性 位置 离 散 度分 布 的 形 状一 致 性11/17/2015 11Long Live Data位置的测量 : 中心趋势 众值一组测量值的众值定义:出现次数最多 (频率最高 )的测量值如果将此组数据用直方图或点图来表示的话 , 则最高的柱条或堆垛区间的中心点即为众值 中位值一组测量值的中位值定义:是当测量值按大小顺序排列时所

6、取的中间值 算术平均 值一个 “ 加权 ” 平均各测量结果按其发生频率加权11/17/2015Long Live Data12平衡措施 :算术平均 = 4.0 算术平均 可解释为 数据组的 “重心” 考虑数据组 : 2,3,3,3,4,4,4,4,5,5,5,6 “重心” = 4.011/17/2015 13Long Live Data位置的测量 : 均值 增加两个数据点 10 和 12. “重心” 向 5.0偏移 算术平均 可解释为 数据组的 “重心” 考虑数据组 : 2,3,3,3,4,4,4,4,5,5,5,6 “重心” = 4.0 = 511/17/2015 14Long Live D

7、ata位置的测量 : 中心趋势 算术平均均值也是总体中所有值的和除以总体中个体的总数 各个体 以 1/N“加权”总体平均值用希腊字母 来表示样本平均值用 X 杠来表示NxNii 1)(? nxXnii 111/17/2015 15Long Live Data离散度的测量 : 偏差 极差一组测量值的极差是这一组测量值的最大值与最小值之差 优点 : 易于计算 缺点 : 考虑两套数据 : 5,6,6,7,7,7,8,8,9 极差 = (9-5) = 4 5,5,5,5,5,5,5,5,9 极差 = (9-5) = 4 只考虑两个数据点可能会错误解释 数据的“离散度”极差 = (9-5) = 411/

8、17/2015 16Long Live Data离散度的测量 : 方差 离散度的测量总体方差 (s2) 方差是 所有数值与平均值的偏离量平方的平均 . 所有数值与平均值之差的平方和除以数据总个数总体方差的估计值 (s2) 平均值的平方偏离量 除以 (n-1) 而不是 n 就得到对总体方差的“无偏” 估计NxNii 12)(2s 1)(122nxxsnii?11/17/2015 17Long Live Data计算 S2 的例子 考虑一个掷一对“公平的”骰子的过程78.314933.521)(122 nxxsnii11/17/2015 18Long Live Data离散度的测量 : 偏差 离散

9、度的测量 : 总体标准差 (s)标准差是方差的正平方根标准差的估计值 (s )协方差 (COV) s 和 s2 是绝对偏差的测量 有时一个偏差的相对测量是非常有用的 . COV 是由平均值归一化后的标准差2ss sC OV2ss 11/17/2015 19Long Live Data总体参数与样本统计值 总体参数总体平均值 ()总体方差 (s2) 样本统计值样本平均值 (X-杠 )方差估计值NxNii 1nxXnii 1NxNii 12)(2s1)(122nXixsni11/17/2015Long Live Data20好奇的话 : 除以 n 与 n-1的区别- 0 . 3 5- 0 . 3

10、0- 0 . 2 5- 0 . 2 0- 0 . 1 5- 0 . 1 0- 0 . 0 50 . 0 00 10 20 30差别nsq r t 1/n - sq r t 1/ ( n - 1) 11/17/2015 21Long Live Data练习 由这组数据估计总体方差X X-平均 (X-平均 )2101697810109912nSX杠s2s1)( 22 nxxs i12 n)xx(s i用 Excel 和 Minitab验证结果11/17/2015 22Long Live Data描述性统计展示描述性统计 对话 框步骤 1: 统计 基本统计量 显示描述性统计量步骤 2: 在列表 框

11、, 连击 GRAMLOAD.步骤 3: 按 OK.GramLoad.mpj变量 框列表 框11/17/2015 23Long Live Data生成一个图表窗用展示描述统计创建图表步骤 1: 按 (编辑上次命令 ).步骤 2: 按步骤 3: 选步骤 4: 按两次 , 在各对话框各一次 .2 . 52 . 42 . 32 . 22 . 12 . 01 . 91 . 81 81 61 41 21 086420G R A M L O A D频率G R A M L O A D 直 方 图11/17/2015Long Live Data24图形汇总GramLoad.mpj图形汇总 对话 框步骤 1: 统

12、计 基本统计量 图形化汇总步骤 2: 在列表 框 , 连击 GRAMLOAD.步骤 3: 按 OK.11/17/2015Long Live Data25图形汇总输出第 一 四 分 位 数 2 . 1 3 0 0中 位 数 2 . 2 4 5 0第 三 四 分 位 数 2 . 3 2 5 0最 大 值 2 . 5 0 0 02 . 1 9 6 3 2 . 2 5 4 52 . 2 0 7 4 2 . 2 7 0 00 . 1 2 8 8 0 . 1 7 0 4A 平 方 0 . 4 5P 值 0 . 2 6 5均 值 2 . 2 2 5 4标 准 差 0 . 1 4 6 7方 差 0 . 0 2

13、 1 5偏 度 - 0 . 5 0 7 5 3 2峰 度 0 . 3 0 4 8 7 7N 1 0 0最 小 值 1 . 7 8 0 0A n d e r s o n - D a r l i n g 正 态 性 检 验9 5 % 均 值 置 信 区 间9 5 % 中 位 数 置 信 区 间9 5 % 标 准 差 置 信 区 间2 . 4 02 . 2 52 . 1 01 . 9 51 . 8 0中 位 数均 值2 . 2 82 . 2 62 . 2 42 . 2 22 . 2 09 5 % 置 信 区 间G R A M L O A D 的 汇 总 报 告11/17/2015Long Live

14、Data26形状 : 频率格局频率测量值 11/17/2015 27Long Live Data进一步观察截边分布通过对产品分类来达到规格要求不是 100% 有效超过规格限的比例很高LSL USL11/17/2015 28Long Live Data建立直方图 用 Minitab 的图表能力可以把数据组织起来以得到有用的频率分布曲线 图形 直方图 简单 改变区间的方法:编辑条形 区间对准柱子点击右键 ?Bstatshapes.mtw0 . 4 00 . 3 60 . 3 20 . 2 80 . 2 40 . 2 00 . 1 61 6 01 4 01 2 01 0 08 06 04 02 00

15、H a m b u r g e r W t频率H a m b u r g e r W t 直 方 图11/17/2015Long Live Data29Goldilock的困境11/17/2015 30Long Live Data生成直方图的指导方针 选择 5 到 15 个区间 应用 2k 规则 :选择 k 个区间 , 其中 k是由 2k n推算出的 最小值 , n 是数据点的数量 例如 : n=50 , 选择 k=6 例如 : n=1000, 选择 k=10 为得到一个中心区间 , 可把 k 改成一个奇数?11/17/2015 31Long Live Data正态分布222 )(21)( ss xexf统计学中最重要的连续概率分布就是正态分布样子是钟形的对称的 : 均值 = 中位值 = 众值 = 中位值 =

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 其它文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号