MINITAB应用质量管理技术系列培训A阶段回归分析课件

上传人:pu****.1 文档编号:576978045 上传时间:2024-08-20 格式:PPT 页数:49 大小:1.32MB
返回 下载 相关 举报
MINITAB应用质量管理技术系列培训A阶段回归分析课件_第1页
第1页 / 共49页
MINITAB应用质量管理技术系列培训A阶段回归分析课件_第2页
第2页 / 共49页
MINITAB应用质量管理技术系列培训A阶段回归分析课件_第3页
第3页 / 共49页
MINITAB应用质量管理技术系列培训A阶段回归分析课件_第4页
第4页 / 共49页
MINITAB应用质量管理技术系列培训A阶段回归分析课件_第5页
第5页 / 共49页
点击查看更多>>
资源描述

《MINITAB应用质量管理技术系列培训A阶段回归分析课件》由会员分享,可在线阅读,更多相关《MINITAB应用质量管理技术系列培训A阶段回归分析课件(49页珍藏版)》请在金锄头文库上搜索。

1、6 6-6 6-回归分析回归分析回归分析回归分析(RegressionRegression) 某种合成纤维的强度与其拉伸倍数某种合成纤维的强度与其拉伸倍数有关。下表是有关。下表是2424个纤维样品的强度与相应的个纤维样品的强度与相应的拉伸倍数的实测记录。试求拉伸倍数的实测记录。试求y y关于关于x x的线性回的线性回归方程。归方程。引例引例1一元线性回归分析(一元线性回归分析(Simple Linear RegressionSimple Linear Regression)一元线性回归分析(一元线性回归分析(Simple Linear RegressionSimple Linear Regre

2、ssion)一元线性回归分析(Simple Linear Regression)引例引例2 在改进某合金强度的项目中,在改进某合金强度的项目中,6西格玛小组认为西格玛小组认为在某合金加工过程中影响其强度的可能的关键影响因在某合金加工过程中影响其强度的可能的关键影响因素是碳含量,为了调查碳含量对合金强度的影响,小素是碳含量,为了调查碳含量对合金强度的影响,小组在生产现场一对一地收集了碳含量与合金强度的数组在生产现场一对一地收集了碳含量与合金强度的数据。数据见(引用据。数据见(引用1)问:碳含量对合金强度是否有影响?其影响强问:碳含量对合金强度是否有影响?其影响强度有多大?度有多大?6 6-一元线

3、性回归分析(一元线性回归分析(Simple Linear RegressionSimple Linear Regression)分析阶段分析阶段定量分定量分析工具析工具6 6-单样本单样本T-检验检验双样本双样本T-检验检验F-检验检验方差分析方差分析一般线性模型一般线性模型一元线性回归一元线性回归多元线性回归多元线性回归一般线性模型一般线性模型卡方检验卡方检验二项逻辑回归二项逻辑回归二项逻辑回归二项逻辑回归连续连续连续连续非连续非连续非连续非连续YX回归分析(回归分析(Regression)6 6-回归分析回归分析(RegressionRegression)l回归分析是根据试验或观测得到的数

4、据结果,分析、回归分析是根据试验或观测得到的数据结果,分析、推断哪些因素对过程的推断哪些因素对过程的Y Y有着显著的影响,以及影响有着显著的影响,以及影响大小的常用工具大小的常用工具l回归分析研究的是在一项观测或实验中,回归分析研究的是在一项观测或实验中,X X的变化的变化是否对是否对Y Y产生影响及影响的大小。产生影响及影响的大小。l一元和多元线性回归分析中,一元和多元线性回归分析中,X X和和Y Y都是连续型数据。都是连续型数据。回归分析的基本统计原理简介回归分析的基本统计原理简介6 6-回归分析回归分析(RegressionRegression)l回归分析可以帮助我们寻找潜在的回归分析可

5、以帮助我们寻找潜在的X X,以及确定它们以及确定它们与与Y Y的关系。的关系。l通过回归分析,确定通过回归分析,确定X X对对Y Y是否有显著的影响是否有显著的影响( (统计显统计显著性著性) ),以及他们对,以及他们对Y Y的影响程度的影响程度实践显著性。实践显著性。l获得获得X X和和Y Y的线性模型(建模),用的线性模型(建模),用X X预测预测Y Y。一元线性回归分析(一元线性回归分析(一元线性回归分析(一元线性回归分析(Simple Simple Linear RegressionLinear Regression)l在回归分析中,我们假设在回归分析中,我们假设X对对Y的影响是线性的

6、。的影响是线性的。l当只考虑一个当只考虑一个X对对Y的影响时,称为一元线性回归。的影响时,称为一元线性回归。(X与与Y都是连续型数据)都是连续型数据)l在收集数据时,将在收集数据时,将X与与Y一一对应,即:收集到一一对应,即:收集到每一个每一个X和与其对应的和与其对应的Y。一元线性回归分析(Simple Linear Regression)一元线性回归分析(Simple Linear Regression)例例1 在改进某合金强度的项目中,在改进某合金强度的项目中,6 6西格玛小组认为在西格玛小组认为在某合金加工过程中影响其强度的可能的关键影响因素某合金加工过程中影响其强度的可能的关键影响因素

7、是碳含量,为了调查碳含量对合金强度的影响,小组是碳含量,为了调查碳含量对合金强度的影响,小组在生产现场一对一地收集了碳含量与合金强度的数据。在生产现场一对一地收集了碳含量与合金强度的数据。数据见(回归分析(引用数据见(回归分析(引用1 1)问:碳含量对合金强度是否有影响?其影响强问:碳含量对合金强度是否有影响?其影响强度有多大?度有多大?6 6-数据输出结果数据输出结果多元线性回归分析(多元线性回归分析(Multiple Linear Regression)例例 在某平炉炼钢过程中,由于矿石和炉气的在某平炉炼钢过程中,由于矿石和炉气的氧化作用,铁水的总含炭量在不断降低。试氧化作用,铁水的总含炭

8、量在不断降低。试分析一炉钢的去碳量分析一炉钢的去碳量Y Y与所加的两种矿石量与所加的两种矿石量X1X1、X2X2及融化时间及融化时间X3X3是否有关。数据见(回归分是否有关。数据见(回归分析(引用析(引用2 2)多元回归分析1 1 多元线性回归分析基本理论多元线性回归分析基本理论2 2 标准的多元线性回归模型标准的多元线性回归模型3 3 多元线性回归模型的估计多元线性回归模型的估计4 4 多元线性回归模型的检验多元线性回归模型的检验5 5 多元线性回归模型预测多元线性回归模型预测6 6 多元线性回归模型的多元线性回归模型的MinitabMinitab实现实现7 7 多元非线性回归多元非线性回归

9、多元线性回归分析(多元线性回归分析(Multiple Linear Regression)1 多元线性回归分析的基本理论 u 多元线性回归是简单线性回归的推广多元线性回归是简单线性回归的推广, ,指的是多个因变量对多个自变量的回归指的是多个因变量对多个自变量的回归(Multivariate Regression)(Multivariate Regression),最常用的是,最常用的是一个因变量对多个自变量的回归。一个因变量对多个自变量的回归。多元线性回归分析(Multiple Linear Regression)因变量y自变量x1自变量x2自变量xk返回目录多元线性回归分析(Multiple

10、 Linear Regression)计算估计多元回归方程计算估计多元回归方程u多元线性回归模型多元线性回归模型u u多元线性回归方程多元线性回归方程u 样本数据:样本数据:x x1 1 x x2 2 x xk k y y. . . . . . . . . . . . .b b1 1,b,b2 2,b,bk k是是1 1, ,2 2,k k的估计的估计值值2 标准的多元线性回归模型多元线性回归分析(Multiple Linear Regression)多元线性回归模型的性质截距截距偏回归系数偏回归系数例例二元线性回归模型:二元线性回归模型:b b2 2:假定:假定x x2 2固定时固定时x x

11、1 1每变动每变动1 1个单位引起的个单位引起的y y的增量。的增量。b b3 3:假定:假定x x1 1固定时固定时x x2 2每变动每变动1 1个单位引起的个单位引起的y y的增量。的增量。 是是x x1 1和和x x2 2共同变动引起的共同变动引起的y y的平均的平均 变动,反映一组自变量与因变量的平均变动关系。变动,反映一组自变量与因变量的平均变动关系。是给定是给定x x1 1、x x2 2计算得到的估计值,是计算得到的估计值,是y y的实际值的数的实际值的数学期望。学期望。多元线性回归分析(Multiple Linear Regression)(实际值)一组自变量对一组自变量对y y

12、的线性影响的线性影响而形成的系统部分,反映而形成的系统部分,反映x x与与y y变动关系的本质特征。变动关系的本质特征。随机干扰:随机干扰:各种偶然因素观察误差和各种偶然因素观察误差和其他被忽视因素的影响。其他被忽视因素的影响。多元线性回归分析(Multiple Linear Regression)3 多元线性回归模型的估计u(一)回归系数的估计(一)回归系数的估计u u(二)随机误差方差的估计(二)随机误差方差的估计uu u(三)最小二乘估计量的性质(三)最小二乘估计量的性质u 标准的多元线性回归模型中,高斯标准的多元线性回归模型中,高斯. .马尔可马尔可夫定理同样成立。夫定理同样成立。 多

13、元线性回归分析(Multiple Linear Regression)u一一. .拟合程度的评价拟合程度的评价u调整可决系数调整可决系数 u uu式中,式中,n n是样本容量;是样本容量;k k是模型中回归系数的个数。是模型中回归系数的个数。u调整可决系数调整可决系数 的特点。的特点。 4 多元线性回归模型的检验多元线性回归分析(Multiple Linear Regression)多元线性回归模型的显著性检验u回归系数回归系数 b b 的检验的检验u1 1提出假设。提出假设。 H H0 0 : j j = 0 = 0; H H1 1: j j00 u2.2.确定显著水平确定显著水平。u3.3

14、.计算回归系数的计算回归系数的t t 值。值。u 式中式中, , 是的标准差的估计值。是的标准差的估计值。 按下式计算:按下式计算:u u式中,式中, 是是(XX)(XX)-1 -1 的第的第 j j 个对角线元素,个对角线元素, S S 2 2 是随机是随机误差项方差的估计值。误差项方差的估计值。多元线性回归分析(Multiple Linear Regression)多元线性回归模型的显著性检验(续一)4.4.确定临界值。确定临界值。 双侧检验查双侧检验查t t分布表所确定的临界值是分布表所确定的临界值是(-(-t t/2/2) )和和( (t t/2/2) );单侧检验所确定的临界值是(单

15、侧检验所确定的临界值是(t t)。)。5.5.做出判断。做出判断。 拒绝域拒绝域接受域双侧检验图示:多元线性回归分析(Multiple Linear Regression)u回归方程的显著性检验回归方程的显著性检验l具体的方法步骤具体的方法步骤 l回归模型方差分析表回归模型方差分析表lF F统计量统计量 多元线性回归模型的显著性检验(续二)离差名称平方和自由度均 方 差回归平方和k-1SSR/(k-1)残差平方和 n-kSSE/(n-k)总离差平方和 n-1多元线性回归分析(Multiple Linear Regression)5 多元线性回归模型预测u基本公式:基本公式:u u 式中,式中,

16、x xjfjf (j=2,3,k)(j=2,3,k)是给定的是给定的x xj j 在预在预测期的具体数值;测期的具体数值; 是已估计出的样本回归系是已估计出的样本回归系数;数; 是是x xj j 给定时给定时y y 的预测值。的预测值。 返回目录多元线性回归分析(Multiple Linear Regression)6 多元线性回归模型的MinitabMinitab实现u 在研究多元回归问题时可能感到比较复杂,在研究多元回归问题时可能感到比较复杂,下面我们用统计软件帮助大家实现多元线性回归模下面我们用统计软件帮助大家实现多元线性回归模型的建立、估计、检验以及预测问题。型的建立、估计、检验以及预

17、测问题。u 多元回归模型在建立过程中可采用两种不多元回归模型在建立过程中可采用两种不同的方法,分别为:同的方法,分别为:实现方法实现方法直接回归法直接回归法逐步线性回归逐步线性回归向前加入变量法向前加入变量法逐步回归法逐步回归法向后淘汰变量法向后淘汰变量法多元线性回归分析(Multiple Linear Regression)u例例1 1:在研究某超市顾客人数:在研究某超市顾客人数y y与该超市促销费用与该超市促销费用x x1 1 、超市面积、超市面积x x2 2 、超市位置、超市位置x x3 3之间关系时,选取变量之间关系时,选取变量如下:如下: Y Y - -某超市某一周六顾客人数(千人)

18、某超市某一周六顾客人数(千人) X X1 1 -该超市上周促销所花的费用(万元该超市上周促销所花的费用(万元) ) X X2 2 该超市的面积(百平方米)该超市的面积(百平方米) X X3 3 超市所处位置超市所处位置(0(0表示市区、表示市区、1 1表示郊区表示郊区) )u 按照按照y y变量排序后的原始数据是:变量排序后的原始数据是:y y2 23 35 57 78 8101017172424252530303131353536364242444445454848505052525555x x1 11 11.1.5 52 22 22 22.2.3 32.2.5 52.2.5 52.2.4

19、42.2.6 62.2.5 52.2.5 54 44.4.1 14 44.4.3 34.4.5 54.4.4 44 44.4.1 1x x2 22 21 11.1.3 31.1.3 31.1.5 51.1.5 52 22.2.5 52 22 24 43 34 43.3.5 53.3.5 53.3.5 55 55 57 78 8x x3 31 11 11 11 10 01 11 11 10 00 01 10 01 10 00 00 01 10 00 00 0多元回归案例分析:多元线性回归分析(Multiple Linear Regression)定性分析过程: 数据分析之前,我们要先考虑各个自变

20、数据分析之前,我们要先考虑各个自变量与因变量之间是否存在相关关系。量与因变量之间是否存在相关关系。 分别绘制顾客人数分别绘制顾客人数y y与促销费用与促销费用x x1 1 、超、超市面积市面积x x2 2 的散点图,直观上测定其是否存在线的散点图,直观上测定其是否存在线性关系。通过散点图可以看出,因变量性关系。通过散点图可以看出,因变量y y与自变与自变量量x x1 1 、x x2 2 之间确实存在较明显的线性相关关系,之间确实存在较明显的线性相关关系,而而x x3 3 超市位置是虚拟二元变量,我们无法从散超市位置是虚拟二元变量,我们无法从散点图中看出其中的线性关系,但经验所知其一点图中看出其

21、中的线性关系,但经验所知其一定影响着因变量定影响着因变量y y,所以我们同时将其纳入分析所以我们同时将其纳入分析模型。模型。 模型建立过程如下:模型建立过程如下:多元线性回归分析(Multiple Linear Regression)数据见数据见多变量回归多变量回归( (例例1)1)1 1、直接回归法、直接回归法: :多元线性回归分析(Multiple Linear Regression)2、最优回归实现:、最优回归实现: 若我们上面的预测方程不显著,但确实知道其中几个若我们上面的预测方程不显著,但确实知道其中几个变量存在着一定的线性关系,我们也可以运用逐步回归的变量存在着一定的线性关系,我们

22、也可以运用逐步回归的方法对变量进行分析处理方法对变量进行分析处理 。多元线性回归分析(多元线性回归分析(Multiple Linear Regression)例例1 在某平炉炼钢过程中,由于矿石和炉气的氧在某平炉炼钢过程中,由于矿石和炉气的氧化作用,铁水的总含炭量在不断降低。试分化作用,铁水的总含炭量在不断降低。试分析一炉钢的去碳量析一炉钢的去碳量Y Y与所加的两种矿石量与所加的两种矿石量X1X1、X2X2及融化时间及融化时间X3X3是否有关。数据见(回归分是否有关。数据见(回归分析(引用析(引用2 2)多元线性回归分析(多元线性回归分析(Multiple Linear Regression)

23、练习练习 六西格玛项目小组为了调查影响熊的六西格玛项目小组为了调查影响熊的重量因素,他们收集到了这样一组数据。重量因素,他们收集到了这样一组数据。数据见数据见: 试分析试分析:熊的重量熊的重量Y与这些因素是否有关及与这些因素是否有关及其影响程度有多大其影响程度有多大?7 多元非线性回归u 多元非线性回归是一元非线性回归多元非线性回归是一元非线性回归的多元扩展,其理论基础建立在多元回归的多元扩展,其理论基础建立在多元回归与非线性回归的基础上。与非线性回归的基础上。u 在实际工作中,多元非线性回归的在实际工作中,多元非线性回归的应用非常广泛,大多数生产函数和需求函应用非常广泛,大多数生产函数和需求

24、函数都需要用到多元非线性拟合。常用的有数都需要用到多元非线性拟合。常用的有C-DC-D生产函数、产品的需求弹性分析。生产函数、产品的需求弹性分析。u 下面我们用需求弹性分析实例介绍下面我们用需求弹性分析实例介绍此类模型的估计方法及结果处理解释。此类模型的估计方法及结果处理解释。xyu例例2 2:厂商想研究其产品销售量与居民月平:厂商想研究其产品销售量与居民月平均收入、商品价格之间的变化关系,现调均收入、商品价格之间的变化关系,现调查某城市有关此商品需求的数据如下:查某城市有关此商品需求的数据如下: 年年 次次12345678910销售量销售量y y( (百件百件) )居民人均收入居民人均收入x

25、 x2 2( (百百元元) )单价单价x x3 3(10(10元元) )105210731582139514942010318104241231913523154试根据数据建立销售量试根据数据建立销售量 y y 与居民人均收入与居民人均收入 x x2 2 及及商品单价商品单价 x x3 3 之间的关系。之间的关系。数据变换分析:u1.1.根据我们对经济规律的分析可知:产品销售量与根据我们对经济规律的分析可知:产品销售量与居民人均收入、商品单价呈现幂函数形式的关系,居民人均收入、商品单价呈现幂函数形式的关系,即:即:u2.2.利用双对数变换法,同时加入随机误差项,可得利用双对数变换法,同时加入随

26、机误差项,可得以下线性回归函数:以下线性回归函数:u3.3.这样我们就得到一般的多元线性回归模型,可以这样我们就得到一般的多元线性回归模型,可以利用软件对其进行参数估计、检验,然后通过两个利用软件对其进行参数估计、检验,然后通过两个方程之间的关系,写出原方程的形式。数据见方程之间的关系,写出原方程的形式。数据见( (多多元非线性回归例元非线性回归例1)1)数据的初步变换:原数据与新产生数据列:原始数据:原始数据与三次变量变换后的数据:对变换后的数据进行建模:对变换后的数据进行建模:计算结果:变换过的数据产生的回归方程根据两个方程间的变换关系,对产生的回归方程进行反对数根据两个方程间的变换关系,

27、对产生的回归方程进行反对数变换,得变量间的回归方程如下:变换,得变量间的回归方程如下:结果解释及预测分析: 由上式可知:居民收入的需求弹性约由上式可知:居民收入的需求弹性约为为1.161.16,而价格的需求弹性约为,而价格的需求弹性约为-0.4-0.4。也就是。也就是说,在其他情况不变的条件下,居民人均收入说,在其他情况不变的条件下,居民人均收入每增加每增加1%1%会使此商品的需求增加会使此商品的需求增加1.16%1.16%,价格,价格每提高每提高1%1%会使此商品的需求减少会使此商品的需求减少0.4%0.4%。 若此时我们要预测居民人均收入为若此时我们要预测居民人均收入为22002200元,

28、商品单价为元,商品单价为5050元时该商品的需求量元时该商品的需求量y y,只需将,只需将x x2 2=22=22,x x3 3=5=5代入方程即得:代入方程即得:一般线性模型(一般线性模型(一般线性模型(一般线性模型(General General Linear ModelLinear Model)例例 某化工产品的不纯度可能受到多种因素的影响。现收某化工产品的不纯度可能受到多种因素的影响。现收集到数据见(集到数据见(GLMGLM(练习(练习3 3) 1 1、不纯度、不纯度Y Y是连续型数据;是连续型数据; 2 2、有多个、有多个X X为可能的影响因素这些为可能的影响因素这些X X中既有连续

29、型中既有连续型的又有非连续型的;的又有非连续型的; 3 3、故此它们适用于、故此它们适用于GLMGLM分析方法。分析方法。一般线性模型(一般线性模型(一般线性模型(一般线性模型(General General Linear ModelLinear Model)l在回归分析中,我们假设在回归分析中,我们假设X X对对Y Y的影响是线性的。的影响是线性的。l当考虑多个当考虑多个X X(此时此时X X可以是连续型数据也可以是连续型数据也可以是非连续型数据可以是非连续型数据的)的)对对Y Y的影响的影响但但Y Y都是都是连续型数据时,连续型数据时,可以采用一般线性模型分析法。可以采用一般线性模型分析法

30、。l在收集数据时,将在收集数据时,将X X与与Y Y一一对应,即:收集到一一对应,即:收集到每一个每一个X X和与其对应的和与其对应的Y Y。一般线性模型(General Linear Model)一般线性模型(一般线性模型(一般线性模型(一般线性模型(General General Linear ModelLinear Model)例例1 某化工产品的不纯度可能受到多种因素的影响。现收某化工产品的不纯度可能受到多种因素的影响。现收集到数据见(集到数据见(GLMGLM(练习(练习3 3) 1 1、不纯度、不纯度Y Y是连续型数据;是连续型数据; 2 2、有多个、有多个X X为可能的影响因素这些

31、为可能的影响因素这些X X中既有连续型中既有连续型的又有非连续型的;的又有非连续型的; 3 3、故此它们适用于、故此它们适用于GLMGLM分析方法。分析方法。分析阶段分析阶段小结小结6 6-单样本单样本T-T-检验检验双样本双样本T-T-检验检验F-F-检验检验方差分析方差分析一般线性模型一般线性模型一元线性回归一元线性回归多元线性回归多元线性回归一般线性模型一般线性模型卡方检验卡方检验二项逻辑回归二项逻辑回归二项逻辑回归二项逻辑回归连续连续连续连续非连续非连续非连续非连续YX常用定量分析工具常用定量分析工具常用定量分析工具常用定量分析工具分析阶段分析阶段小结小结u 识别影响识别影响 的波动源

32、的波动源u 通过数据分析识别和确认关键通过数据分析识别和确认关键 及其影响程度及其影响程度u通过通过MINI-TAB MINI-TAB 软件的数据分析方法来实现软件的数据分析方法来实现6 6-分析阶段分析阶段小小结结u 确认因果分析列出所有可能的确认因果分析列出所有可能的u 用图形分析工具对潜在的关键用图形分析工具对潜在的关键 初步分析初步分析u 用统计分析工具验证潜在的关键用统计分析工具验证潜在的关键 和他们的和他们的 影响程度影响程度u 最终识别并排除关键的最终识别并排除关键的6 6- 分析阶段的分析阶段的重点重点: 通过数据分析确定关键的通过数据分析确定关键的 及其影响程度及其影响程度再再 见见 !谢谢谢谢! !合作愉快!合作愉快!

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 医学/心理学 > 基础医学

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号