Unit4分析4.9相关回归

上传人:夏** 文档编号:569531247 上传时间:2024-07-30 格式:PPT 页数:52 大小:798.50KB
返回 下载 相关 举报
Unit4分析4.9相关回归_第1页
第1页 / 共52页
Unit4分析4.9相关回归_第2页
第2页 / 共52页
Unit4分析4.9相关回归_第3页
第3页 / 共52页
Unit4分析4.9相关回归_第4页
第4页 / 共52页
Unit4分析4.9相关回归_第5页
第5页 / 共52页
点击查看更多>>
资源描述

《Unit4分析4.9相关回归》由会员分享,可在线阅读,更多相关《Unit4分析4.9相关回归(52页珍藏版)》请在金锄头文库上搜索。

1、六西格玛断根推进团队六西格玛断根推进团队分析分析(Analyze)阶段阶段Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -1-相关回归相关回归( Correlation & Regression )Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -2-DefineDefineMeasureMeasureAnalyzeAnalyzeImproveImproveControlControlStep 8- Data 分析分析Step 9- Vital Few X的选定的选定q Multi Variq Central l

2、imitq Hypothesis testingq Confidence intervalq ANOVA, T-testq Chi-squareq Correlation,regressionStep 7- Data 收集收集路径位置路径位置Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -3-目的目的定定义义并并计计算相算相关关系系数数 讨讨论论相相关关性性及因果及因果关关系系 绘绘制制并并分析分析拟合直线图拟合直线图介介绍绍回归分析回归分析的的基基本本知知识识使使用用回归分析回归分析技技术术建建立立数数学学预测预测模模型型Haier Six sigm

3、a GB Training-V3.0相关相关 / 回归回归 -4-X X和和Y Y数据类型研究数据类型研究 Y Y 是什么是什么? _ _ 数据数据类型类型? _ _ X X 是什么是什么? _ _ 数据数据类型类型?_你你将将使用使用哪种哪种工具工具? _ _设设计计小小组组想想了了解解引引擎擎寿寿命命与与车车辆辆重重量量有有无无关关系系Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -5-分析路线图分析路线图( (单单一一 X X :单单一一 Y Y) )X Data离散 连续 Y Data离散连续Chi-SquareLogistic Regress

4、ionT test/ANOVAMeans / Medians TestsRegressionHaier Six sigma GB Training-V3.0相关相关 / 回归回归 -6-相关(相关(CorrelationCorrelation):是什么是什么?“相关”为什么如此重要 ?你是否经历过测量某些产品合格后送给顾客,但他们 告诉你你的产品不符合规格?在奥运会滑冰比赛上,你认为两个裁判成绩的相关性 有多高?Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -7-这这两两张张图有何不同?图有何不同?Haier Six sigma GB Training

5、-V3.0相关相关 / 回归回归 -8-“+ +” 相关相关的的强强度度与与趋向趋向Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -9-“- -” 负相关负相关的的强强度度与与趋趋向向Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -10-相关系数相关系数( (r) r) 的的确认确认有有几几种方法可以种方法可以决决定定 r r 值值-相关研究相关研究-拟合直线图拟合直线图-回归分析回归分析让让我我们们一一探一一探讨各讨各个个方法方法Haier Six sigma GB Training-V3.0相关相关 / 回

6、归回归 -11-打开文件打开文件 Correlation.MPJCorrelation.MPJCorrelation.MPJCorrelation.MPJ 中的工作表中的工作表 Correlation ExampleCorrelation ExampleCorrelation ExampleCorrelation Example依依据据产品产品特性特性,确定确定 Customer Customer 与与 Supplier Supplier 之之间间的相的相关关性性 相关性相关性分析分析Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -12-既然既然我我们

7、们使用使用统统计计检验检验方法,方法,则则 “假设假设” 需被需被检验检验! Ho: Ho: 没没有相有相关关存在存在 Ha: Ha: 有有相相关存在关存在若若p p值值大大于于 0 0.05.05,即接受即接受 Ho Ho ,亦即亦即 X X 与与Y Y 之之间没间没有有相关相关存在存在;若若p p值小值小于于0 0.05.05,则则 Ho Ho 被拒被拒绝绝且且 Ha Ha 将将被接受,亦即有被接受,亦即有相关相关存在存在相关性相关性分析分析Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -13-结果结果: Correlation Example:

8、Correlation Example相关相关: Supplier, Customer : Supplier, Customer Supplier Supplier 和和 Customer Customer 的的 Pearson Pearson 相关系数相关系数 = 0.834= 0.834 P P值值 = 0.000= 0.000结果结果显示在显示在对话窗中对话窗中注意,我注意,我们们得到得到相关系数相关系数及及P P值值你你对对 Supplier Supplier 和和 Customer Customer 之间的关系有何见之间的关系有何见解解? ?相关性相关性分析分析Haier Six s

9、igma GB Training-V3.0相关相关 / 回归回归 -14-r r 应该应该多大多大? ?依依样样本大小,若所得的本大小,若所得的相关系相关系数数比表中的值大,比表中的值大,则则可可视视为为 “重要重要” 或或统统计计显显著著Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -15- r r r r 应应应应该多大?该多大?该多大?该多大?勿需勿需担担心此表,心此表,Minitab Minitab 可以可以帮帮助我助我们们在在 “相关相关” 程序中程序中选选取取 显示显示 p p 值值 选选项,项, Minitab Minitab 将将会会显

10、显示是否示是否显显著著寻找寻找比比 0.05 0.05 小的小的 p- p-值值 Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -16-在在1930 1930 1936 1936 年间,年间,曾曾有人有人跟踪跟踪德德国国城镇城镇 OldenburgOldenburg 的人口的人口与鹳鸟与鹳鸟数数量量之间的关系之间的关系结结果如下果如下( (人口以千人口以千为为单位单位) )显然显然,鹳鹳鸟鸟送送来来了了婴儿婴儿 !?!?相关举例相关举例Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -17-相关(相关(Corre

11、lationCorrelation)直线倾向 (正或负)斜率:直线角度其测量值为 r回归(回归(RegressionRegression)回归预测方程其测量值为 R2残差分析线性,二次或三次拟合 最佳拟合直线相关相关与与回归回归Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -18-回归的回归的定定义义/ /术语术语 回归分析 是一种用于分析变量间相关性的统计工具。在统计课程中通常被称为:“计算最佳拟合直线”本课程将讨论简单回归分析,其探讨对象为单一连续Y 与单一连续X的关系下列术语可经常交换使用:下列术语可经常交换使用:回归方程式* 回归线 预测方程式

12、 预测线 模型Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -19-回归回归分析分析路线图路线图规划分析內容收集数据利用 Minitab 绘制 拟合直线图评估 R2和 P 值的显著性评估残差制订决策Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -20-分析分析路线图路线图范范例:例:brake.mtwbrake.mtw336325418375355367445385365375455395395395. . . . .SpeedBraking Distance进进行行2121次速度次速度测测试,你试,你对对此此

13、数据数据有何有何看法看法?Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -21-拟合直线图拟合直线图我也想对相关性进行检验,我也想对相关性进行检验,并并观察观察线性关系和线性关系和数据点数据点的的之间的拟合性之间的拟合性使使用用 Fitted Line PlotFitted Line Plot 选选项项来来看看此关系此关系Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -22-提供提供视觉化图表和方程式视觉化图表和方程式拟合直线图拟合直线图Haier Six sigma GB Training-V3.0相关相关

14、/ 回归回归 -23-Minitab Minitab :输输出出结结果果Y = 182.807 + .476288x该线性方程为该线性方程为Y = m(x) + bm = 直线直线斜率斜率b = 截距截距该该方程方程给给我我们们一个对能力的估计值一个对能力的估计值注意注意 R R2 2 = .695 = .695稍稍后后将将作作详细详细讨论讨论Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -24-一些基一些基础知识回顾础知识回顾Y 截距斜率( )Ym Xb=+中中学学代代数数所所学学的的方程式方程式在在回归回归中中,以以 b b0 0 和和 b b1

15、1 表示表示( )YbbX=+01Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -25-使用使用回归回归方程:內方程:內推法与外推法推法与外推法Y = 182.807 + .476288 x例: 若速度测量值为 400,我们对刹车距离的合理估计值应该是多少?例: 若速度测量值为 1000,我们对距离的合理估计值应该是多少?例: 若速度测量值为 0,我们对距离的合理估计值应该是多少?Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -26-此此拟合直线拟合直线从从何而来?何而来?Minitab 将找出一条直线,使各点

16、至该直线的距离为最小. * * * * * * * * *拟合线实际数据点实际点与直线的距离输入变量 (X)输出变量(Y)Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -27-拟合直线图:预测带拟合直线图:预测带 Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -28-置信区间 Confidence Interval:代表基于系数 b0 及 b1 的置信区间预测区间预测区间 Prediction Interval: 给定X,在单一测试中Y有95% 的可能性会落在预测带内拟合直线图:预测带拟合直线图:预测带 Hai

17、er Six sigma GB Training-V3.0相关相关 / 回归回归 -29-R2 R2 :其意其意义义是什么是什么?R2 与P 值,有助于我们基于统计作决策。R2 被称为决决定定系数系数 (coefficient of determination (coefficient of determination ) )R2 值代表“多少”输出变异总量可由回归模型所解释,其值介于 0 到 1 (0% 到 100%)之间。此值越高表示该模型的可信度越高 R2100%0%Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -30-R2 R2 :值大小值大小

18、应应为多少为多少 ? ?视视分析分析对对象而定象而定 就像就像安全系安全系统统或或文件夹文件夹例如,排放例如,排放废废气气系统系统实验实验的的结果结果将将送送交交交通交通部部审审查查,你的,你的数数值值应该应该“好好”到什么程度到什么程度?不同的不同的课课题题决定决定不同的不同的决决策策标准标准 ( (通常通常为为 +60%) +60%)。我我们们必必须须认识到认识到 R R2 2 越高越高相关性相关性就越就越强强。 Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -31-还还记记得得 ANOVA ANOVA 及我及我们们对对 X X 显显著性的看法著性

19、的看法吗吗?区区分分变异变异的的来来源源生产周期的所有变异周间的变异周內的变异=+Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -32-对CycleTim的方差分析来源 自由度 SS MS F PWeek 3 1032.48 344.16 299.38 0.000Error 96 110.36 1.15Total 99 1142.84 SS 或或 Sum of the Squares 将将数据数据的的变变异异量化量化 通过计算通过计算 Epsilon2 2 值,值,来来检验检验X 实实际的际的显显著性著性 此值告此值告诉诉我我们们有多少有多少总总变变异

20、异可被可被 X 所所解释解释Epsilon 2 = = = 90.34%SS for X1032.48SS Total1142.84还还记得记得 ANOVA ANOVA 及我及我们们对对 X X 显显著性的看法著性的看法吗吗?Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -33-ANOVA ANOVA 与与回归回归有有什么关系什么关系?SSE( Sum of Squares due to the Error )目目标标:最小化此值最小化此值SST ( Sum of Squares Total )SSR (Sum of Squares due to th

21、e Regression)总总变异变异 = = 群群内内变异变异 + + 群群间间变异变异Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -34-解释时,请使用可靠的判断理解理解R R2 2R-Squared .80 相相关关可能可能显著显著R-Squared .50 且 .80 需要需要判断判断R-Squared .50 相相关关可能不可能不显显著著0 01 1相相关关可能不可能不显显著著0.80.80.50.5相相关关可能可能显显著著需要需要判判断断即即: :有多少比率的有多少比率的 Y Y 变变异可异可归归因因于与于与 X X 的的关系关系Haie

22、r Six sigma GB Training-V3.0相关相关 / 回归回归 -35-SpeedDistanceRESI1FITS1 336325-17.8392342.839残差与拟合值残差与拟合值: : 它它们们是什么?是什么?拟合线拟合线336325实际数据点实际数据点残留距离 (-17.8392)理论点理论点Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -36-SpeedDistanceRESI1FITS1336325-17.8392342.839418375-6.8948381.89535536715.1113351.889445385-9

23、.7546394.75536537518.3484356.652455395-4.5175399.51739539524.0598370.940405365-10.7031375.7033463557.3979347.60. . . . . . . . .MinitabMinitab:更多更多的的输输出出结结果果Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -37-残差与拟合值残差与拟合值Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -38-数据应该数据应该通过通过“Fat Pencil Test”( (粗粗铅

24、笔铅笔检测检测) )残差残差分析分析数据数据分布应趋近分布应趋近于于正正态态曲线曲线Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -39-数据数据应该受控应该受控, ,探探讨讨异常点异常点数据数据应应呈呈现现无无规则规则状状残差残差分析分析Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -40-为什么进行残差为什么进行残差分析分析? ?关键的回归假设基于残差(而不是原始数据)的属性。 我们假设残差:-与 X 无关-稳定而且独立, 不随时间变化-是常量,不随预测的 Y 增加而增大-是正态的(钟形的), 平均值为 0

25、残差2残差7Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -41-是否是否总总是是线线性性关关系系? ?打开打开工作表工作表 Multiwet.mtwMultiwet.mtw执执行行 Fitted Line Plot Fitted Line Plot 并并假定假定 Y=Y=WetPUWetPU 且且 X=X=ol_phol_phR R2 2 = 27.2% = 27.2% 是是该该关关系系的的正确正确评估评估吗?吗?Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -42-你可你可利利用用二次二次或或三次方程三次方

26、程,得到,得到较较合适的合适的拟合线拟合线 中学中学代代数数 y = 3 + 4x + 2x y = 3 + 4x + 2x2 2在在讨论温讨论温度或度或压压力力数据数据值值时时,常看到此,常看到此关关系系R2 值由值由 27% 27% 增加到增加到 79% 79%Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -43-多项式回归分析:wet_pu 与 ol_ph 回归方程为wet_pu = - 11.42 + 8.405 ol_ph - 1.113 ol_ph*2S = 0.0911530 R-Sq = 79.5% R-Sq(调整) = 78.7%方差

27、分析来源 自由度 SS MS F P回归 2 1.54843 0.774213 93.18 0.000误差 48 0.39883 0.008309合计 50 1.94725方差的序贯分析来源 自由度 SS F P线性 1 0.53021 18.33 0.000二次 1 1.01822 122.55 0.000注意,在此我注意,在此我们们检验检验多多个个假设假设我我们们如何如何计计算算 EpsilonEpsilon2 2值值? ?Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -44-小小小小测测测测验验验验1) 1) 下列下列哪哪组组数据数据适适于于应用

28、应用相关和回归相关和回归分析?分析?顾客类型与销售量顾客类型与销售量顾客大小与利润顾客大小与利润 月与库存月与库存2) 2) 解解释释下下页页图图表表的意义的意义A) A) Wet_puWet_pu 与与sl_visl_vi 之之间间有有无无关系关系B) B) 其其关关系系为为正正向还是向还是负负向向?C) C) 若若sl_visl_vi 为为 47.3 47.3 ,预测预测 Wet_puWet_pu 的的值值为多少为多少?3) 3) 是是/ /非非:若能若能确立确立 X X 与与 Y Y间间的相的相关关性性,我,我就就可以可以认为认为 Y Y 的的变变化化是是由由 X X 所引起的?所引起的

29、?Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -45-Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -46-陈述陈述因果因果关关系系应该小心应该小心 即使我即使我们们建立了建立了 y y 与与 x x 的的相相关关性,但性,但并并不能代表不能代表 x x 的的变变异异将将一一定定导致导致 y y 的的变变异异。其他其他潜潜在在的的变变量量,可能造成,可能造成 x x 与与 y y 的的改改变变。Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -47-研究指出研究指出,医

30、院医院规模规模增加,病人死亡率亦增加,病人死亡率亦显显著提升。著提升。这这么么说说来,我来,我们们应该应该避免避免去去大型大型医医院就院就诊诊吗?吗?回归回归问问题题探讨探讨:X X 丢失丢失0 1 2 4 5 X= 医医院院规模规模Y =Y =死亡率死亡率15105Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -48-回归回归问题问题探讨探讨: :研究研究范范围围过过于于狭窄狭窄0 1 2 4 5 X= 车龄车龄Y =Y = 售价售价15105Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -49-车辆价格车辆

31、价格车车龄龄现在看来应该如何?0 1 5 10 15 20 25 30 35 40 45 50回归回归问题问题探讨探讨: :研究研究范范围围过过于于狭窄狭窄Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -50-给给BBBB的的提示提示在某些合适的条件下,计数型数据亦能利用此工具达成良好成效。请试用R2值不需要是 “完美的” _Haier Six sigma GB Training-V3.0相关相关 / 回归回归 -51-回回顾顾&定定义义并并计计算相算相关关系系数数 &讨讨论论相相关关性性及因果及因果关关系系 &绘绘制制并并分析分析拟合直线图拟合直线图&介介绍绍回归分析回归分析的的基基本本知知识识&使使用用回归分析回归分析技技术术建建立立数数学学预测预测模模型型&评审回归分析的风险评审回归分析的风险所有模型都是错误的,但其中有一些是有用的。所有模型都是错误的,但其中有一些是有用的。 George BoxGeorge Box

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号