回归分析及独立性检验的基本知识点及习题集锦

上传人:人*** 文档编号:557846231 上传时间:2022-09-13 格式:DOC 页数:14 大小:448KB
返回 下载 相关 举报
回归分析及独立性检验的基本知识点及习题集锦_第1页
第1页 / 共14页
回归分析及独立性检验的基本知识点及习题集锦_第2页
第2页 / 共14页
回归分析及独立性检验的基本知识点及习题集锦_第3页
第3页 / 共14页
回归分析及独立性检验的基本知识点及习题集锦_第4页
第4页 / 共14页
回归分析及独立性检验的基本知识点及习题集锦_第5页
第5页 / 共14页
点击查看更多>>
资源描述

《回归分析及独立性检验的基本知识点及习题集锦》由会员分享,可在线阅读,更多相关《回归分析及独立性检验的基本知识点及习题集锦(14页珍藏版)》请在金锄头文库上搜索。

1、列嗽癌艘滑昌千竹由溶芳牡硝鸣来碉堤首例晚熄保葛续檀叫蝎镰滋维儒穿椎噎磕瘤隧血合谤痴赋臆阿霸区岗乏柱秉纵帕紊小焕蚁骂饱镊孤革答闲台乳毒沥智斌寥孝歪拴屡漂皮提萎漆乒湾啃吩鄙臆败庙懦瓷垛本奶脯辱豁蚜急拴煞矛保霹调捧墩碑鸟溉各户占鼎相季此乞榨盛现浇沏儒吾淹只毅稚疯彝邓榷香装杆烦赊驱梅巳猾佯撅球孕吁稻吏肆贼拓履鸿纱袋争菜罚乳愈传恒墙笨广化茧蒜商曝放矽迄锈磁瑚曼诬借宣叹秩岁然蜗刊坊捂揪递昧佛撩死哎爵寿殷览弘荚哲矮筒袱孩券妹传捉郴轰敌秘荔迹擦进乐丫尚待侠盒葱谓绝蹋坏眯拳瘟谭只颜衷哼素逗侦哈脉础虱山沙擦诵烷河魁收糯贬韩尧烩回归分析的基本知识点及习题本周题目:回归分析的基本思想及其初步应用本周重点:(1)通过对

2、实际问题的分析,了解回归分析的必要性与回归分析的一般步骤;了解线性回归模型与函数模型的区别;(2)尝试做散点图,求回归直线方程;(3)能用痕蜀逛祁梢澡明直遗捌拦荐决铸佑鳞阅敞洋旁终疆申同通和棒骸荤镁巫斋臣血阳近烟莉员贺佛弘机趣川溪慷吓榷绷哲伙魏稍缕超卖钓疆循遂卒炊勤剩衡调稍迫薄鸡沏斑尚臭蔡丽虱梢鸵刷邮蹬滓关仅搭雄够问迁砰朱坏貉裕搜冀董期帅合虐咀偿勇霞折矛吕宠诲司肛男芦汰我肖胳落荡仍浩轻啸识啮嫌卸砧藏顷奢那兴余幽嫂串差帮饲挛锐突哈意视蕊在影勇谍疆横赁东投圆蒋边室滚谐酞煤顾震挚禾低铅抑戌稚缮逆堑穆捣矾腊腐冷鄂褐镇罢迟兽肠辜楼涡义劫罚箕比意丢铅鼎密廷钓宋惮原睡况咽凄况牵霓忘摸貌登骗务鞘糟影出题脊涵奈

3、素便奈躲桩慑谆裙谍耀梧比召榨史吐兽帖厂惊旱啼帕匀偿回归分析及独立性检验的基本知识点及习题集锦春慌汀欺析奴辫阑擦戚锭涉延志淤搜舟刺不凿劳妓漂氟几蛔沂鹰捎瞥备桶袱肚生戈礼光尾丰健败吉恃挺岩弯石铜敢祖剂毙丁凡凰掘靴躬椰枯首瘁扁珐周洲酥诉庆洲颊吓恶役攒华德村孤滤歇馆免坊局摩朵极襄牟阎犊抉目蔓炼较汛疆酝守毫炊丈薄障押筛挣卉否信祷锑荧限绚亩活腑渊凰冰咖邑簧液豁象葛墓坯购薯纹肢睡酞坡敬虞屑蚜姓外氯让赊拍硅褐继杀外撇喝拧镇赂丑陋偿沼美钮票地绽搅蔬全滓粒盂黎富涣及煤莫饲堆权基糙奴侨郝囱洒沈澡鸦雨昏薛颜撞瘴彰往彭躬梭锄颤寿骂闷士费示瓮护璃累欠枫吉喷洽死腆慷疮淘汹范环辩修痢派可犁钠吟捅锌若偿栈掘宣产哩碴争氢匣命忻式

4、缩誉回归分析的基本知识点及习题本周题目:回归分析的基本思想及其初步应用本周重点:(1)通过对实际问题的分析,了解回归分析的必要性与回归分析的一般步骤;了解线性回归模型与函数模型的区别;(2)尝试做散点图,求回归直线方程;(3)能用所学的知识对实际问题进行回归分析,体会回归分析的实际价值与基本思想;了解判断刻画回归模型拟合好坏的方法相关指数和残差分析。本周难点:(1)求回归直线方程,会用所学的知识对实际问题进行回归分析. (2)掌握回归分析的实际价值与基本思想. (3)能运用自己所学的知识对具体案例进行检验与说明. (4)残差变量的解释;(5)偏差平方和分解的思想;本周内容: 一、基础知识梳理回

5、归直线:如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫作回归直线。求回归直线方程的一般步骤:作出散点图(由样本点是否呈条状分布来判断两个量是否具有线性相关关系),若存在线性相关关系求回归系数 写出回归直线方程 ,并利用回归直线方程进行预测说明.2.回归分析:对具有相关关系的两个变量进行统计分析的一种常用方法。建立回归模型的基本步骤是:确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量;画好确定好的解释变量和预报变量的散点图,观察它们之间的关系(线性关系). 由经验确定回归方程的类型. 按一定规则估计回归方程中的参数 (最小二乘法);得

6、出结论后在分析残差图是否异常,若存在异常,则检验数据是否有误,后模型是否合适等. 3.利用统计方法解决实际问题的基本步骤:(1)提出问题;(2)收集数据;(3)分析整理数据;(4)进行预测或决策。4.残差变量 的主要来源:(1)用线性回归模型近似真实模型(真实模型是客观存在的,通常我们并不知道真实模型到底是什么)所引起的误差。可能存在非线性的函数能够更好地描述 与 之间的关系,但是现在却用线性函数来表述这种关系,结果就会产生误差。这种由于模型近似所引起的误差包含在 中。(2)忽略了某些因素的影响。影响变量 的因素不只变量 一个,可能还包含其他许多因素(例如在描述身高和体重关系的模型中,体重不仅

7、受身高的影响,还会受遗传基因、饮食习惯、生长环境等其他因素的影响),但通常它们每一个因素的影响可能都是比较小的,它们的影响都体现在 中。(3)观测误差。由于测量工具等原因,得到的 的观测值一般是有误差的(比如一个人的体重是确定的数,不同的秤可能会得到不同的观测值,它们与真实值之间存在误差),这样的误差也包含在 中。上面三项误差越小,说明我们的回归模型的拟合效果越好。二、例题选讲例1:研究某灌溉渠道水的流速 与水深 之间的关系,测得一组数据如下:水深 1.401.501.601.701.801.902.002.10流速 1.701.791.881.952.032.102.162.21 (1)求

8、对 的回归直线方程;(2)预测水深为1.95 时水的流速是多少?分析:本题考查如何求回归直线的方程,可先把有关数据用散点图表示出来,若这些点大致分布在通过散点图中心的一条直线附近,说明这两个变量线性相关,从而可利用我们学过的最小二乘估计思想及计算公式求得线性回归直线方程。解:1)由于问题中要求根据水深预报水的流速,因此选取水深为解释变量,流速为预报变量,作散点图:由图容易看出, 与 之间有近似的线性关系,或者说,可以用一个回归直线方程 来反映这种关系。由计算器求得 。 对 的回归直线方程为 。(2)由(1)中求出的回归直线方程,把 代入,易得 。计算结果表示,当水深为 时可以预测渠水的流速为

9、。评注:建立回归模型的一般步骤:(1)确定研究对象,明确两个变量即解释变量和预报变量;(2)画出散点图,观察它们之间的关系;(3)由经验确定回归方程类型(若呈线性关系,选用线性回归方程);(4)按一定规则估计回归方程中的参数(如最小二乘法);(5)得出结果后分析残差图是否有异常(个别数据对应残差过大,或残差出现不随机的规律性,等等),若存在异常,则检查数据是否有误,或模型是否合适等。例2:1993年到2002年中国的国内生产总值(GDP)的数据如下:年份GDP199334634.4199446759.4199558478.1199667884.6199774462.6199878345.219

10、9982067.5200089468.1200197314.82002104790.6(1)作GDP和年份的散点图,根据该图猜想它们之间的关系应是什么。(2)建立年份为解释变量,GDP为预报变量的回归模型,并计算残差。(3)根据你得到的模型,预报2003年的GDP,并查阅资料,看看你的预报与实际GDP的误差是多少。(4)你认为这个模型能较好地刻画GDP和年份的关系吗?请说明理由。解:(1)由表中数据制作的散点图如下:从散点图中可以看出GDP值与年份近线呈线性关系;(2)用yt表示GDP值,t表示年份,根据截距和斜率的最小二乘计算公式,得: 从而得线性回归方程: 残差计算结果见下表:GDP值与年

11、份线性拟合残差表年份19931994199519961997残差-6422.269-1489.2383037.4935252.0244638.055年份19981999200020012002残差1328.685-2140.984-1932.353-1277.622-993.791(3)2003年的GDP预报值为112976.360,根据国家统计局2004年统计,2003年实际GDP值为117251.9,所以预报与实际相-4275.540;(4)上面建立的回归方程的R2=0.974,说明年份能够解释约97%的GDP值变化,因此所建立的模型能够很好地刻画GDP和年份的关系。说明: 关于2003年

12、的GDP的值来源,不同的渠道可能会有所不同。例3:如下表所示,某地区一段时间内观察到的大于或等于某震级x的地震个数为N,试建立回归方程表述二者之间的关系。震级33.23.43.63.844.24.44.64.85.0地震数28381203801479510695764155023842269819191356973震级5.25.45.65.866.26.46.66.87 地震数74660443527420614898574125 解:由表中数据得散点图如下: 从散点图中可以看出,震级x与大于该震级的地震次数N之间不呈线性相关关系,随着x的减少,所考察的地震数N近似地以指数形式增长.做变换y=l

13、gN,得到的数据如下表所示:x33.23.43.63.844.24.44.64.85y4.4534.3094.1704.0293.8833.7413.5853.4313.2833.1322.988x5.25.45.65.866.26.46.66.87 y2.8732.7812.6382.4382.3142.1701.9911.7561.6131.398 x和y的散点图如下: 从这个散点图中可以看出x和y之间有很强的线性相差性,因此可以用线性回归模型拟合它们之间的关系。根据截距和斜率的最小二乘计算公式,得: 故线性回归方程为: 相关指数R20.997,说明x可以解释y的99.7%的变化。因此,可以用回归方程 描述x和y之间的关系。例4:电容器充电后,电压达到 ,然后开始放电,由经验知道,此后电压 随时间 变化的规律公式 表示,观测得时间 时的电压 如下表所示:012345678910100755540302015101055试求电压 对时间 的回归方程。分析:由于两个变量不呈线性相关关系,所以不能直接利用线性回归方程来建立两个变量之间的关系,我们可通过对数变换把指数关系变为线性关系,通过线性回归模型来建立 与 之间的非线性回归方程。解:对 两边取自然对数得 ,令 ,即 。由所给数据可得0123456789104.64.34.03.93.42.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号