统计学-回归分析

上传人:小** 文档编号:58356526 上传时间:2018-10-29 格式:PPT 页数:56 大小:457.50KB
返回 下载 相关 举报
统计学-回归分析_第1页
第1页 / 共56页
统计学-回归分析_第2页
第2页 / 共56页
统计学-回归分析_第3页
第3页 / 共56页
统计学-回归分析_第4页
第4页 / 共56页
统计学-回归分析_第5页
第5页 / 共56页
点击查看更多>>
资源描述

《统计学-回归分析》由会员分享,可在线阅读,更多相关《统计学-回归分析(56页珍藏版)》请在金锄头文库上搜索。

1、Regression Analsys 回归分析,童新元 中国人民解放军总医院,名人格言,纵使世界给我珍宝和荣誉,我也不愿意离开我的祖国,因为纵使我的祖国在耻辱之中,我还是喜欢,热爱,祝福我的祖国。-裴多菲(匈牙利诗人,18231849),问题,能否由脂肪的含量推出热量的多少?知道父代身高,可否推测子代身高?回归方程解决由一个量变化推断另一量变化的问题。,1) “回归”概念的来源,“香港回归”, “澳门回归”. “回归”这一名词起源于19世纪生物学家和统计学家FGalton的遗传学研究。 问题:现实直观经验: “通常都认为子女比父母的身高要高”。这是人身的客观规律还是一种假象? 如果这个趋势是客

2、观规律话,人身高应该是越来越高,早就超过了现在的水平。,观察研究 英国生物遗传学家Galton观察了1078对夫妇与子女,分析他们的身高关系。 以每对夫妇的平均身高作为x,取他们的一个成年儿子的身高作为y,将结果在平面直角坐标系上绘成散点图,发现趋势近乎一条直线。,计算出的回归直线方程为:Y=33.73+0.516x这种趋势及回归方程表明父母平均身高x每增加一个单位时,其成年儿子的身高y也平均增加0.516个单位。,结果表明,虽然高个子父辈确实有生高个子儿子的趋势,但父辈身高增加一个单位,儿子身高仅增加半个单位左右。 平均说来,一群高个子父辈的儿子们的平均高度要低于他们父辈的平均高度,他们儿子

3、的身高没有比他们更高,高个子父辈偏离其父辈平均身高的一部分被其子代拉回来了,即子代的平均身高向中心回归。,低个子父辈的儿子们虽然仍为低个子,平均身高却比他们的父辈增加了,即父辈偏离中心的部分在子代被拉回来一些。说明子代的平均身高没有比他们的父辈更低。正因为子代的身高有回到父辈平均身高的趋势,才使人类的身高在一定时间内相对稳定,没有出现父辈个子高其子女更高,父辈个子矮其子女更矮的两极分化现象。,这个例子说明了生物学中“种”的概念的稳定性。正是为了描述这种有趣的现象,Galton引进了“回归”这个名词来描述父辈身高与子代身高的关系。大自然界很多物种都有 “回归”现象: 大象、蚂蚁后代体重回归到其平

4、均水平,人类社会的“回归”.,少小离家,老大归。社会学叶落归根和谐社会 稳定-发展贫富分化严重社会不稳定,中国改革开放,中国经济体制改革 “中国经济进入中等发达国家水平” “我深知改革的难度,主要是任何一项改革必须有人民的觉醒、人民的支持、人民的积极性和创造精神。” -温家宝 中国半数人还处于文革状态,要么是缺乏理性的文革战士,要么是逆来顺从的奴隶状态,基本不懂现代社会的处事原则。茅于轼 “权利回归于人民,人民真正当家作主” ”没有独裁专制,才有新中国“,由父高推测子女身高的设想,影响子女身高y的因素:基本生长规律、父母的身高x个体差异(随机误差)问题的模型化:回归分析模型子高基本生长父母高作

5、用个体差异,2) 回归方程,回归分析研究目的是由自变量的信息去推断因变量,并用直线方程来表示它们的线性关系。 直线回归方程的一般表达式为,回归分析的数据基本格式,变量x 变量yx1 y1x2 y2 . . . .xn yn,相关问题,回归分析的任务:在平面上怎么找最佳的直线?实现的类似问题:某地区有若干个房子, 现要修建一条直的公路,怎样让大家都满意?,3) 参数的估计,回归方程:采用最小二乘法原理: 所有实测点到回归直线的纵向距离平方之和最小.,求解线性方程组,而得到最小二乘估计系数b和a,参数的计算公式,的估计: 的估计:,计算结果,a=33.73,b=0.516回归方程:y=33.73+

6、0.516x,例12-1 测定16种食物中的热量(卡路里)和脂肪含量(克). 试建立食物热量与脂肪含量之间的回归方程.,计算结果,a=36.0727,b=15.2584回归方程:y=36.0727+15.2584x,回归方程的基本含义,回归方程在坐标轴上的含义a:截距 b: 斜率称为回归系数。 回归系数b的意义:回归系数b反映的是x每增加1个单位时y的增加幅度;b越大,x对y的影响幅度越大。,回归直线与散点图的关系,b0 b0 b=0b=0 b=0 b=0,4 ) 回归方程的检验,回归方程的抽样误差:回归方程来自样本,存在抽样误差,回归方程的假设检验步骤:,1 建立假设:H0:回归方程无统计学

7、意义 H1:回归方程有统计学意义,=0.05,2 变异的分解: 方差分析思想yi- y = (yi - y) + (y - y),(yi- y)2 =(yi- y)2 + (y - y)2,变异分解示意图,F值的构造,SS总 SS残差 SS回归 df总 df残差 df回归MS回归=SS回归/df回归 MS残差 =SS残差 /df残差 F= MS回归/ MS残差 F值越大,越不利H0假设的成立。,方差分析表-y的变异来源 SS DF MS F值 P -回归方程 SS回归 1 MS回归 F=MS回归/Mse 残差 SSe n- 2 Mse总变异 SST n-1-,3 统计推断与决策p,不拒绝H0。

8、回归方程无统计学意义,5 ) 回归系数的假设检验:,建立假设H0: =0 H1: 0 =0.05 回归系数的标准误与t统计量得到P,做出推断p,不拒绝H0。,6) 回归方程价值的评价,回归方程评价:方程的假设检验 回归价值的评价:确定系数确定系数反映回归方程对因变量y的影响程度。,决定系数的意义,决定系数越大,回归方程价值越高.实际中,决定系数大于0.5时才有好的应用价值.,本实例回归方程的评价,回归模型的方差分析:F=67.923 P=0.000回归系数的t检验:tb=8.2416 , P=0.000 R2=0.8291,7) 直线回归图,若两变量间存在直线关系,在散点图上绘上回归直线,形成直线回归图.,直线回归图的CHISS实现,1、进入数据模块 点击 数据文件打开数据库表 打开文件名为:b12-1.DBF 确认 2、进入图形模块 进行绘图 点击 图形统计图曲线拟合 确认横轴:X脂肪 纵轴:Y热量,8) 回归分析的应用-预测,若回归方程有意义时,可以通过自变量X的值来预测因变量Y的值.通过知道父代身高推测子代平均身高例12-1中,脂肪含量与热量值建立的回归方程有意义P P145 例12-1-例12.4,谢谢,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号