统计培训教材3.1 方差分析

上传人:012****78 文档编号:132726442 上传时间:2020-05-19 格式:PPT 页数:52 大小:1.56MB
返回 下载 相关 举报
统计培训教材3.1 方差分析_第1页
第1页 / 共52页
统计培训教材3.1 方差分析_第2页
第2页 / 共52页
统计培训教材3.1 方差分析_第3页
第3页 / 共52页
统计培训教材3.1 方差分析_第4页
第4页 / 共52页
统计培训教材3.1 方差分析_第5页
第5页 / 共52页
点击查看更多>>
资源描述

《统计培训教材3.1 方差分析》由会员分享,可在线阅读,更多相关《统计培训教材3.1 方差分析(52页珍藏版)》请在金锄头文库上搜索。

1、 ANOVA 主要内容 变异方差分析假设检验假设模型ANOVA模型单因子方差分析 One WayANOVA 双因子方差分析 Two WayANOVA 多因子方差分析 Multi FactorANOVA 变异的类型 固有变异由许多不可避免的小因素累积而成的变异通常也叫噪声 noise 特殊变异a 不适当地调教机器b 操作错误c 原材料有缺陷 方差分析 ANOVA 方差分析 ANOVA 是R A Fisher在进行农业试验时发展起来的对实验数据的变异性进行分析的一套统计方法 方差分析做法 通过试验 以观察某一种或多种因素的变化 对试验结果的观察数值是否有显著影响 从而选取最优方案 例 在化工生产中

2、 影响结果的因素有 配方 设备 温度 压力 催化剂 操作人员等 需要通过观察或试验判断哪些因素是重要的 有显著影响的 哪些因素是不重要的 没有显著影响的 方差分析 ANOVA 试验中考虑的因素只有一个 即只有一个因素在变 其他因素保持不变 这种试验称为单因素方差分析 One WayANOVA 试验中考虑的因素有两个 这种试验称为双因素方差分析 Two WayANOVA 试验中考虑的因素有k个 这种试验称为k因素方差分析 k WayANOVA ANOVA的应用 因素所处的状态 称为水平 Level 例如 温度是一个因素 可在50 60 70 三个水平下做试验 ANOVA可用于估计每个变异来源对总

3、变异的贡献 明确各效应的显著性估计过程中的随机误差或噪声计算方差的成份 ANOVA 假设检验 H0 1 2 r所有总体均值相等H1 至少有两个总体的均值不等ANOVA通过比较组间差和组内差来进行F 检验 如果 则拒绝原假设 ANOVA 假设检验 N 1 1 N 2 2 N 3 3 N 4 4 N groups between ANOVA 假设 观察值相互独立 各水平的数据服从正态分布 即因子水平i N i i 各水平的方差相同 即 1 2 r ANOVA 模型 固定效应模型 ANOVAI 因子水平是指定的相关结论只能对指定的因子水平而言随机效应模型 ANOVAII 因子水平是随机抽取的结论对整

4、个处理总体有效混合效应模型 ANOVAIII 有些因子是固定的 有些因子是随机的 ANOVA 模型 一个k WayANOVA模型 是指试验中包含有k个因素 k WayANOVAI k个因素 所有因素效应固定k WayANOVAII k个因素 所有因素效应随机k WayANOVAIII k个因素 有些因素效应固定 有些因素效应随机注意 当k大于等于2时 还要考虑各因素之间的相互作用 或交互效应 Interaction 我们要观察的一个input变量 因子 有多个样本时 我们实际上在实施单因子实验 SingleFactorExperiment 我们要分析对象的因子是否有水平间的差异确定3个供应商的

5、平均交货期是否有差异确定某个机器的设定值在5个水平间变化时 零件的尺寸是否不同现在开始做第一次实验 观察 OnewayANOVA的概念 1 概要 OneANOVA的概念 2 例题 考虑如下情景 一个产品开发工程师要研究某个电阻焊接系统中5种不同的电流设置对焊接强度的影响她要研究的电流范围为15 19安培 她将调查5个水平的输入变量 因子 15A 16A 17A 18A和19A 她将对每个水平进行5次实验输出 焊接强度输入 电流这是一个具有5个水平的单因子实验 电流 该实验的结果参考下页 OneANOVA的概念 3 例题 存在电流对焊接强度的影响吗 对于这个设备使用哪个电流 你的结论是什么 为什

6、么 输入结果DATA的designmatrix同下 实习 打开窗口Mont52 mtw制作各列数据的dotplot 使用对所有变量相同的格式 SCALE OneANOVA的概念 3 例题 各均值的95 置信区间 CI 如下 DATAStack后Stat ANOVA IntervalPlot 对电流和焊接强度的关系做什么结论 这结论的置信度是怎样 OnewayANOVA的概念 3 例题 设定假设 OneANOVA的概念 4 假设 Ha 至少有一个水平产生不同过程 H0 数据只描述一个过程的自然散布 你认为答案是什么 为什么 OneANOVA的概念 5 假设 此设计的数学模型是 Ho假设处理项是零

7、 数学模型假设 常规假设 Yti t ti其中 yti 来自处理t的单个响应 总平均值 t 处理t ti 随机误差 OneANOVA的概念 6 变量选定 输入变量作为一个因子 在单因子设计中 因子被当作特征变量处理 即使它可能是间隔值或比率 如果因子自然为连续型的 可以把它分类成子群 例如 我可以采用低和高来度量生产线的压力值 我们可以作中值分离 MedianSplit 来把因子分成两个水平 低和高 对于我们的例子 因为电流是连续型变量 我们把它分成5个等级 输出一般以间隔值或比率范围来度量 合格率 温度 电压 等等 输出变量可以是分离型或间隔 比率变量 ANOVA的原理 1 总变动 因子A的

8、水平是I个 各水平的反复数都是m次 则数据矩阵排列成下面的样子 总均值是用右边的公式求 利用各个DATA和总均值把总均值分解为两个 同下表示 左边和右边平方时同下 ANOVA的原理 2 总变动 上面的第三项变为如下 SS total SS error SS factor 同样第8页式从写如下 这意义的略写SS SumofSquares 来表示 ANOVA的原理 3 总变动 SS total 的自由度是 SS factor 的自由度是 SS error 的自由度是 因此 ANOVA的原理 4 自由度 在一个系统中不影响其他变量能够独立移动的数Ex a b c 4这式中变量的自由度是2 假如a b

9、定为1 2 c必须是2 即能够自然的移动的变量 自由度是 自由度的计算 ANOVA的原理 5 方差分析表 方差分析表的制作 对错误的均值平方因子 利用A的均值平方的大小观察A效果的大小 F越大A效果越大 利用F分布确认P value ANOVA的原理 6 F分布 F分布的参考 自由度k1 k2的变量的F值的F k1 k2 按 的大小占有面积 发生概率 显著水平 F k1 k2 F k1 k2 F 分布 6 5 4 3 2 1 0 0 7 0 6 0 5 0 4 0 3 0 2 0 1 0 0 S c o r e s P r o b 10 1 5 Exercise 某个coating工程认为反应

10、温度对生产的产品的强度有影响 所以对反应温度变化强度有什么变化 还有温度在什么水平时强度最好 进行了实验 反应温度设为因子水平 各温度反复3回 总共12回实验数据随机整理 这结果同下表 制作方差分析表 ANOVAtable 参考Excelsheet ANOVA的原理 7 例题 ANOVAtable ANOVA的原理 8 例题 F分布表中F是 3 8 0 05 4 07 F 3 8 0 01 7 59 那么A是显著水平1 中是否采用零假设 还是推翻 要推翻 ANOVA的原理 9 统计的假定 输出的总体方差在给定因子所有水平上都相等 方差均一性 TestforEqualVariance 我们可以用

11、Stat ANOVA TestforEqualVariance程序来检验这个假设 响应均值是独立的 并服从正态分布 如果使用随机化和适当的样本数 这个假设一般有效 警告 在化学过程中 均值相关的风险很高 应永远考虑随机化 残差 数学模型的误差 是独立的 其分布是均值 0 方差为恒量的正态分布 单一因子实验分析 实验结果移动到MINITABWorksheet 数据有没有异常点利用管理图进行确认 稳定性分析 利用Stat ANOVA TestforEqualVariance进行等方差检验 方差同一时实施 p valueANOVA One way进行分析 所有的数据在1列时 Stacked One

12、way按水平别数据分几列时 Unstacked 采用One way Unstacked 解释F ratio F value高p value显著水平时 一般5 10 推翻零假设 Ho 推翻零假设时 利用Stat ANOVA MainEffectsPlot或Stat ANOVA IntervalPlot对均值差异利用区间图说明 利用Minitab的Anova视窗中的残差项目 残差Plot 对残差实施评价 为测试实际的显著性 对有影响的Epsilon Squared进行计算 根据分析结果找出方案 应用MINITAB分析 1 分析顺序 零假设 Ho 3名作业者刷漆厚度相同 备择假设 Ha 作业者中至少

13、有一名刷的厚度与其他作业者刷的厚度不同 或大或小 应用MINITAB分析 1 老板的思考 是谁刷漆刷的这么厚 Bob Jane Walt 一定要查找出来 显著水平设为5 设置假设 按照下列样式在Minitab中输入数据 打开 ANOVA MPJ 的 3LevelANOVA worksheet BobJaneWalt25 296926 005628 426826 057825 940027 508524 070026 006327 582524 819926 435627 401825 985125 992724 9209 应用MINITAB分析 2 输入数据 1 判信 2 判量 参考 MSA

14、章节 参考 抽样与样本大小 章节 应用MINITAB分析 3 稳定性分析 目的 确认各水平数据中是否有异常现象 逃逸点 不随机等 路径 Stat ControlChart 参考下图 3 判异 应用MINITAB分析 3 稳定性分析 输出结果 结论各水平中的数据没发现有异常点 可继续往后分析 应用MINITAB分析 4 正态性分析 目的 确认各水平数据是否服从正态分布 路径 Stat BasicStatistics NormalityTest 参考下图 4 判形 应用MINITAB分析 4 正态性分析 输出结果 结论各水平中的数据都服从正态分布 可继续往后分析 应用MINITAB分析 5 等方差

15、检验 目的 确认各水平数据之间方差是否相等 数据堆栈 路径 Data Stack Columns 参考下图 5 判散 应用MINITAB分析 5 等方差检验 等方差检验路径 Stat ANOVA TestforEqualVariances 参考下图 P值大于0 05 输出结果 结论 故3个人所油漆的厚度数据方差相等 应用MINITAB分析 5 等方差检验 应用MINITAB分析 6 均值检验 目的 确认各水平数据集所对应的总体均值是否相等 路径 堆栈型 Stat ANOVA One Way 参考左下图 非堆栈型 Stat ANOVA One Way Unstacked 6 判中 应用MINIT

16、AB分析 6 均值检验 应用MINITAB分析 6 均值检验 均值检验输出结果 均值检验结论各水平数据集所对应的总体之间的均值至少有一个不相等 One wayANOVA Bob Jane WaltSourceDFSSMSFPFactor280 38640 19344 760 000Error8778 1160 898Total89158 502S 0 9476R Sq 50 72 R Sq adj 49 58 P值小于显著水平5 时 得到至少有一个总体均值与其他总体均值不同的结论 推翻零假设 这时 推翻所有总体均值相同的零假设 Ho 即至少有一个均值不同 因随机现象得到这样大的F 值 实际上其概率不足1 10 000 这与抛硬币时 10次连续相同的情况是相同的 群间方差与群内方差相近时 F值接近1 本例中 F 值很大 子群大小相同时共有标准差 应用MINITAB分析 7 残差分析 目的 二次检验前面的分析是否有不可信的证据 残差有异常现象 路径 Stat ANOVA One Way 点击Graph 点Fourinone 7 判差 应用MINITAB分析 7 残差分析 残差输出结果 残差

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号