经管类概率论与数理统计第九章回归分析.doc

上传人:F****n 文档编号:105078599 上传时间:2019-10-11 格式:DOCX 页数:7 大小:66.83KB
返回 下载 相关 举报
经管类概率论与数理统计第九章回归分析.doc_第1页
第1页 / 共7页
经管类概率论与数理统计第九章回归分析.doc_第2页
第2页 / 共7页
经管类概率论与数理统计第九章回归分析.doc_第3页
第3页 / 共7页
经管类概率论与数理统计第九章回归分析.doc_第4页
第4页 / 共7页
经管类概率论与数理统计第九章回归分析.doc_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《经管类概率论与数理统计第九章回归分析.doc》由会员分享,可在线阅读,更多相关《经管类概率论与数理统计第九章回归分析.doc(7页珍藏版)》请在金锄头文库上搜索。

1、在现实世界中,不少变量之间是存在着一定的关系的,一般来说,这种关系大体上可分为两类,一类是确定性的,即函数关系。例如,电路中的电压V,电流I,电阻R三者间有关系。另一类是非确定性的,这类变量之间虽有一定的关系却又并不完全确定,例如人的血压与年龄有关,炼钢过程中含碳量与精炼时间有关,农作物产量与施肥量和单位面积的播种量有关这些变量之间虽有一定联系,但又不能用普通函数关系式来表达。例如对给定的施肥量和确定的播种量,农作物的产量还是不能完全确定的。事实上,这些变量是随机变量或至少其中一个是随机变量。这种非确定性的关系称为相关关系。回归分析是研究相关关系的一种数学工具,是数理统计学中最常用的统计方法之

2、一,在生产实践和科学研究中有着广泛的应用。本章仅简单介绍一元线性回归分析。 9.1 回归直线方程的建立为了说明一元线性回归的数学模型,我们先看一个实际例子。例9-1 某种合金的抗拉强度y(kg/mm2)与其中的含碳量x(%)有关,现测12对数据如表9-1所示。【答疑编号:针对该题提问】表9-1x0.100.110.120.130.140.150.160.170.180.200.210.23y42.043.545.045.545.047.549.053.050.055.055.060.0为了了解其相关关系的表达式,在坐标上以(xi,yi),i=1,2,12为点,画出散点图如图9-1所示,这些点大

3、体上散布在某条直线的周围,又不完全在一条直线上,从而可认为y与x的关系基本上是线性的,而这些点与直线的偏离是由其他一切随机因素的影响造成的。一般说来,含碳量x是一个可观测或可控制的普通变量,而对任意一个含碳量x,相应的抗拉强度是一个随机变量Y,实际观测值y是Y的一个可能取值。随x的变化,Y的观测值线性变化的趋势可表示为。 (9.1.2)其中表示Y随x的变化而线性变化的部分,是一切随机因素影响的总和,称为随机误差项,它是不可观测其值的随机变量,在Y的方差时,是一个E()=0,D()的随机变量,在涉及分布时,可进一步假定。一般地,将x取一组不同的值,x1,x2,xn,通过试验得到对应的Y的值y1,

4、y2,yn,这样就得到n对观测值(xi,yi),i=1,2,n。可把y的值看成由两部分叠加而成,一部分是x的线性函数,另一部分系试验过程中其他一切随机因素的影响。因此,由(9.1.2)式可认为xi与yi之间有如下关系,(i=1,2,n), (9.1.3)且各相互独立。此式就是一元线性回归的数学模型。回归分析的基本问题是依据样本(xi,yi),i=1,2,n解决如下问题:(1)未知参数及的点估计,若分别为的估计,由此得。 (9.1.4)(9.1.4)是抽述Y与x之间关系的经验公式。我们称(9.1.4)式为Y关于x的一元线性回归方程,它就是我们要求的y与x之间的定量关系的表达式,其图像便是类似图9

5、-1中的直线,称此直线为回归直线,也称为回归系数,它是回归直线的斜率,称为回归常数,它是回归直线的截距。 方程,它就是我们要求的y与x之间的定量关系的表达式,其图像便是类似图9-1中的直线,称此直线为回归直线,也称为回归系数,它是回归直线的斜率,称为回归常数,它是回归直线的截距。(2)回归方程的显著性检验,在实际问题中,y与x之间是否存在关系式是要经过检验的。下面先讨论未知参数及的点估计问题。要求出回归方程(9.1.4),就是要求出的估计。而求此估计的一个自然而又直观的想法便是希望对一切xi,观测值yi与回归值的偏离达到最小。为此,一般采用最小二乘法来求的估计。对已知样本(xi,yi),i=1

6、,2,n令,它表示当用(9.1.2)式来逼近Y时,n个样品的总的误差平方和。最小二乘法的基本思想是选取的估计值,使,其中右端min是对一切 的容许值取的Q的最小值。由于是的非负二次函数,其最小值必定存在,同时它是的可微函数,故由微积分中求极值方法知,应是下列方程组的解:(9.1.5)经整理,(9.1.5)式化为我们将上式称为正规方程组,解此方程组得其中,若引进记号则最小二乘估计为若将代入(9.1.4)式,可得回归方程的另一形式,这说明回归直线通过散点图的几何重心。下面续例9-1,计算回归方程用表格形式(表9-2)给出如下: 表9-2序号xyx2xyy210.1042.00.01004.2001

7、764.0020.1143.50.01214.7851892.2530.1245.00.01445.4002025.0040.1345.50.01695.9152070.2550.1445.00.01966.3002025.0060.1547.50.02257.1252256.2570.1649.00.02567.8402401.0080.1753.00.02899.0102809.0090.1850.00.03249.0002500.00100.2055.00.040011.0003025.00110.2155.00.044111.5503025.00120.2360.00.052913.8

8、003600.001.90590.50.319495.92529392.75Lxy=0.0186, Lxy=2.4292, Lyy=335.2292,此即抗拉强度y与含碳量x的线性回归方程。9.2 回归方程的显著性检验由上段的讨论可知,对于任何两个变量x和y的一组观测数据(xi,yi),i=1,2, n,利用最小二乘法,都可以确定一个回归方程(9.1.4),然而事先并不知道Y与x之间是否真正存在线性关系,如果y和x之间并不存在显著的线性相关关系,那么,用上述的方法确定出的回归方程(9.1.4)显然是毫无实际意义的。因此需要对y和x是否具有线性关系作统计检验。下面介绍一种常见的检验方法F检验法。

9、由(9.1.3)式可知,若y与x之间不存在线性关系,则一次项系数,反之,。所以检验y与x之间是否具有线性关系,应归纳为检验假设为了检验H0是否为真,我们可以从分析各Yi(i= 1,2,n)的不同原因着手,n个yi的值之所以不同的原因有二:一是E(Y)如果确是随x线性变化的,那么x的取值不同就是一个原因;二是其他一切随机因素的影响,显然,如果前一方面的影响是主要的,那么,方程是有意义的,否则方程就没有意义,为此,必须把由这个原因引起的yi的波动大小从yi的总波动中分解出来,记,称其为总的偏差平方和,它反映了各yi的波动大小。(利用(9.1.5)(9.2.1)其中反映了由于x的变化所引起的波动大小

10、,称为回归平方和;而反映了观测值与回归直线间的偏离,这是由其他一切因素所引起的,称为剩余平方和。(9.2.1)式称为平方和分解式。显然,若方程有意义,总希望s回尽可能大,s剩尽可能小,那么s回要大到什么程度才能认为方程是有意义的呢?在假定各相互独立,且的条件下,可以证明:(1);(2)在H0为真时,;(3)s剩与s回相互独立。于是,当H0为真时 从而,对给定的显著水平,查附表5,得临界值F(1,n-2),因此拒绝域为W= F(1,n-2),+,当观测值FW时,拒绝H0,认为不真,这时我们认为,回归方程是显著的,反之,称回归方程不显著,这种用统计量F来检验回归方程显著与否的方法称为F检验法。以上

11、检验过程通常可通过一个所谓方差分析表来进行,见表9-3。表9-3来源平方和自由度均方F比显著性回归剩余总和1n-2n-1FW时,拒绝H0;否则接受H0;例2对四块面积都是1亩的土地,施用化肥x(公斤),得到的水稻产量y(公斤)的实验结果如下表。请按下表求x(化肥量)与y(水稻产量)的线性回归方程,并用F法进行检验。【答疑编号:针对该题提问】序号xiyi1103001009000030002204004008000330600900180004407001600280001002000300057000解(一)求线性回归方程, (1)(2)(3)线性回归方程为=150+14x。(二)对进行显著性

12、检验(1)(2)引进统计量(3)查F(1,n-2)表给定=0.05,F(1,2)=18.5拒绝域W为(F(1,n-2),+)=(18.5,+)(4)计算F(5)判定:F落在拒绝域W内; 拒绝H0,接受H1。即线性关系明显。本章小结本章考核要求:(一)会根据样本(x1,y1),(x2,y2),(xn,yn)求y与x的线性回归方程其中(二)会用F检验法判断y与x的线性关系是否明显本章作业:复习例2农村精神文明建设是新农村建设的重要任务,是全面建设小康社会的重要内容。根据市文明委相关文件精神要求,现就在全镇范围内深入开展以“乡风文明”和“村容整洁”为主题的“四创”活动several group nu

13、mber, then with b a, =c,c is is methyl b two vertical box between of accurate size. Per-23 measurement, such as proceeds of c values are equal and equal to the design value, then the vertical installation accurate. For example a, b, and c valueswhile on horizontal vertical errors for measurement, General in iron angle code bit at measurement level points grid errors, specific method is from baseline to methyl vertical box center line distance for a, to b vertical box distance for b, list can measured7

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 教学/培训

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号