正态性检验和数据处理

上传人:n**** 文档编号:87902482 上传时间:2019-04-14 格式:PDF 页数:18 大小:828.63KB
返回 下载 相关 举报
正态性检验和数据处理_第1页
第1页 / 共18页
正态性检验和数据处理_第2页
第2页 / 共18页
正态性检验和数据处理_第3页
第3页 / 共18页
正态性检验和数据处理_第4页
第4页 / 共18页
正态性检验和数据处理_第5页
第5页 / 共18页
点击查看更多>>
资源描述

《正态性检验和数据处理》由会员分享,可在线阅读,更多相关《正态性检验和数据处理(18页珍藏版)》请在金锄头文库上搜索。

1、2014年年3月月21日日 正态性检验和数据处理正态性检验和数据处理 模块内容模块内容 目的:目的: 数据转换的常用方法数据转换的常用方法 Minitab的的Johnson转换转换 数据转换数据转换Roadmap 转换数据在流程能力转换数据在流程能力Sigma水平计算中的应用比较水平计算中的应用比较(3种种 方法比较方法比较) 2 1. 线性转换线性转换: . 形式形式: Y = aX + b . 数据可以乘以一个常数数据可以乘以一个常数 . 可以加上一个常数可以加上一个常数 . 或同时进行或同时进行 . 简单的例子简单的例子: 美元转换成人民币美元转换成人民币 $1 = ¥8.27 RMB

2、什么是数据的转换什么是数据的转换? ? 乘或者加上一个常数不会影响数据的分布乘或者加上一个常数不会影响数据的分布, , 仅改变测量单位仅改变测量单位 数据转换分类:线性转换和非线性转换数据转换分类:线性转换和非线性转换 3 Y Y T = Y的直方图的直方图 YT 表示转换表示转换 后的后的 Y SQRT(Y)的直方图的直方图 2 4 6 8 10 12 14 16 18 20 22 0 10 20 Y Frequency 1 2 3 4 5 0 5 10 15 SQRT(Y) Frequency 改变改变“形状形状” 的转换的转换 分布不再倾斜了分布不再倾斜了 转换以后的Y 不再倾斜 2.

3、非线性转换非线性转换: 此类转换改变数据的形状此类转换改变数据的形状, 如如方根转换方根转换 4 Log(Y) Y Y Y 方根方根-正态正态 对数对数-正态正态 YYT Log(Y)Y T 原始数据与转换数据的比较原始数据与转换数据的比较 原始数据分布原始数据分布 转换转换 转换后的分布转换后的分布 5 Y 1 YT Y 1 YT 倒数倒数-正态正态 Y 1 Y Y Y 1 倒数方根倒数方根-正态正态 原始数据分布原始数据分布 转换转换 转换后的分布转换后的分布 原始数据与转换数据的比较原始数据与转换数据的比较 6 数据转换案例数据转换案例: : 进行对数转换进行对数转换 决定时间的直方图决

4、定时间的直方图 决定时间的正态概率图决定时间的正态概率图 数据背景:贷款申请的决定时间数据背景:贷款申请的决定时间-一般为非正态数据一般为非正态数据 数据文件数据文件: Decision.MTW,分析决定时间的正态性分析决定时间的正态性 Time Frequency 50403020100 40 30 20 10 0 Histogram of Time Time Percent 6050403020100-10-20-30 99.9 99 95 90 80 70 60 50 40 30 20 10 5 1 0.1 Mean 概率图概率图 LogTime Frequency 1.61.41.21

5、.00.80.60.4 20 15 10 5 0 Histogram of LogTime LogTime Percent 2.01.51.00.50.0 99.9 99 95 90 80 70 60 50 40 30 20 10 5 1 0.1 Mean 0.299 0.9855 StDev0.2973 N100 AD0.432 P-Value Probability Plot of LogTime Normal - 95% CI 9 统计统计 质量工具质量工具 Johnson 转换转换 Percent 60300 99.9 99 90 50 10 1 0.1 N100 AD5.738 P-

6、Value0.005 Percent 40-4 99.9 99 90 50 10 1 0.1 N100 AD0.267 P-Value0.680 Z Value P-Value for AD test 1.21.00.80.60.40.2 0.60 0.45 0.30 0.15 0.00 0.74 Ref P P-Value for Best Fit: 0.680058 Z for Best Fit: 0.74 Best Transformation Type: SU Transformation function equals -3.41413 + 1.24801 * Asinh( ( X

7、- 1.68038 ) / 1.02785 ) Probability Plot for Original Data Probability Plot for Transformed Data Select a Transformation (P-Value = 0.005 means = 0.005) Johnson Transformation for Time 得到转换的方程得到转换的方程 数据转换数据转换 Minitab JohnsonMinitab Johnson 10 关于不正态的问题(1) 数据正态吗?数据正态吗? 11 关于不正态的问题(1) 如果有一个异常值,数据还正态吗?如

8、果有一个异常值,数据还正态吗? 12 关于不正态的问题(2) 如果把它们堆叠起来如果把它们堆叠起来 13 关于不正态的问题(2) 有两列正态分布的数据有两列正态分布的数据 14 数据转换数据转换RoadmapRoadmap 数据连续? 数据正态? 否 是 数据初步分析 数据有缺陷? 否 是 否 数据量 是 异常点 分层 收集更多 数据分析 去除异常 点后分析 数据层别 后分析 转换可否? BOX- COX 是 Johnson 转换转换 Individual Distribution Identification 离散数 据处理 正态数 据处理 否 定义Defect, 计算DPMO 用转换后的数

9、据再进行相关分析 注注: 规格界限需要转换规格界限需要转换 均值和标准偏差不能转换均值和标准偏差不能转换 15 转换数据在流程能力转换数据在流程能力SIGMA水平水平 计算中的应用计算中的应用 16 三种方法计算流程三种方法计算流程SigmaSigma水平的案例水平的案例 你可以用你可以用3种选择来计算流程的种选择来计算流程的Sigma水平水平: 方法方法 1: 计算缺陷率计算缺陷率 (DPMO): 当作离散数据计算缺陷PPM 方法方法 2: 用原始数据用原始数据: 将非正态数据当作正态数据来处理 方法方法 3: 用转换后的数据用转换后的数据: 将近似的正态分布当作正态分布 假设你有关于周期时间的非正态分布数据假设你有关于周期时间的非正态分布数据 17 目的目的: 明确用不同方法计算的结果的差别依赖于是否转换数据 时间时间: 30 分钟 数据数据: 文件: Decision.mtw 规格上限为 (USL) 14 三种方法计算流程三种方法计算流程SigmaSigma水平的案例水平的案例 18

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 职业教育

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号