统计学教案习题10直线相关与回归 (2)

上传人:平*** 文档编号:14487208 上传时间:2017-10-30 格式:DOC 页数:11 大小:418.26KB
返回 下载 相关 举报
统计学教案习题10直线相关与回归 (2)_第1页
第1页 / 共11页
统计学教案习题10直线相关与回归 (2)_第2页
第2页 / 共11页
统计学教案习题10直线相关与回归 (2)_第3页
第3页 / 共11页
统计学教案习题10直线相关与回归 (2)_第4页
第4页 / 共11页
统计学教案习题10直线相关与回归 (2)_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《统计学教案习题10直线相关与回归 (2)》由会员分享,可在线阅读,更多相关《统计学教案习题10直线相关与回归 (2)(11页珍藏版)》请在金锄头文库上搜索。

1、第十章 直线相关与回归一、教学大纲要求(一) 掌握内容直线相关与回归的基本概念。相关系数与回归系数的意义及计算。相关系数与回归系数相互的区别与联系。(二)熟悉内容相关系数与回归系数的假设检验。直线回归方程的应用。秩相关与秩回归的意义。(三)了解内容 曲线直线化。二、 学内容精要(一) 直线回归1. 基本概念直线回归(linear regression)建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直线纵向距离的平方和为最小。直线回归是回归分析中最基本、最简单的一种,故又称简单回归(simple regression ) 。直线回归方程 中,a、b 是决定直线的两个系数,见表 1

2、0-1。XY表 10-1 直线回归方程 a、b 两系数对比a b含义 回归直线在 Y 轴上的截距(intercept) 。表示 X 为零时,Y 的平均水平的估计值。回归系数(regression coefficient) ,即直线的斜率。表示 X 每变化一个单位时,Y 的平均变化量的估计值。系数0 a0 表示直线与纵轴的交点在原点的上方b0,表示直线从左下方走向右上方,即Y 随 X 增大而增大系数r 0.05( n-2)时,可认为两变量 X 与 Y 间( )A有一定关系 B. 有正相关关系C一定有直线关系 D. 有直线关系答案: D评析 本题考点:直线相关系数假设检验的理解。因为直线相关系数

3、r 是样本的相关系数,它是相应总体相关系数 的估计值。由于抽样误差的影响,必须进行显著性检验。r 的假设检验是检验两变量是否有直线相关关系。|r| r0.05( n-2)时,P0 D. 0,b0,b0Cr0 D. r 与 b 的符号毫无关系答案: B评析 本题考点:直线相关与回归的区别与联系的理解。因为对同一资料而言直线相关系数与回归系数的方向一致,若能同时计算 b 和 r,它们的符号一致。因此,同一双变量资料,进行直线相关与回归分析,有 r0,b0。四、习 题(一)单项选择题1 下列( )式可出现负值。A(X ) 2 BY 2(Y) 2/nC(Y ) 2 D(X ) (Y )2 Y=14+4

4、X 是 17 岁儿童以年龄(岁)估计体重(市斤)的回归方程,若体重换成国际单位 kg,则此方程( )。A截距改变 B回归系数改变C两者都改变 D两者都不改变3 已知 r=1,则一定有( )。Ab=1 Ba=1CS Y. X=0 DS Y. X= SY4 用最小二乘法确定直线回归方程的原则是各观察点( )。A距直线的纵向距离相等B距直线的纵向距离的平方和最小C与直线的垂直距离相等D与直线的垂直距离的平方和最小5 直线回归分析中,X 的影响被扣除后,Y 方面的变异可用指标( )表示。A B. A, 2()(xyXSn 2()1rYSnC. D. ,yxY AbxyX6 直线回归系数假设检验,其自由

5、度为( )。An Bn1Cn2 D2n17 应变量 Y 的离均差平方和划分,可出现( )。ASS 剩 =SS 回 BSS 总 =SS 剩CSS 总 =SS 回 D以上均可8 下列计算 SS 剩 的公式不正确的是( )。A B YXlbYXlbC. D 2l 2(1r9 直线相关系数可用( )计算。A BYXl YXYlC D 以上均可b10 当 r=0 时, 回归方程中有( )。aAa 必大于零 B. a 必等于Ca 必等于零 D. a 必等于 Y(二)名词解释1. 直线回归 2. 回归系数 3. 剩余平方和 4. 回归平方和 5. 直线相关6. 零相关 7. 相关系数 8. 决定系数 9.

6、曲线直线化 10.秩相关(三)是非题1 剩余平方和 SS 剩 1=SS 剩 2,则 r1 必然等于 r2。2 直线回归反映两变量间的依存关系,而直线相关反映两变量间的相互直线关系。3 两变量关系越密切 r 值越大。(四)简答题1 用什么方法考察回归直线图示是否正确?2 剩余标准差的意义和用途?3 某资料 n=100,X 与 Y 的相关系数为 r=0.1,可否认为 X 与 Y 有较密切的相关关系?4 r 与 rs 的应用条件有何不同?5 应用直线回归和相关分析时应注意哪些问题?6 举例说明如何用直线回归方程进行预测和控制?7 直线回归分析时怎样确定因变量与自变量?(五)计算题110 名 20 岁

7、男青年身高与前臂长的数据见表 10-2。计算相关系数并对 =0 进行假设检验;计算总体 的 95%可信区间。表 10-2 10 名 20 岁男青年身高与前臂长身 高(cm)170 173 160 155 173 188 178 183 180 165前臂长 45 42 44 41 47 50 47 46 49 43(cm)2 某单位研究代乳粉营养价值时,用大白鼠作实验,得到大白鼠进食量和增加体重的数据见表 10-3。此资料有无可疑的异常点?求直线回归方程并对回归系数作假设检验。试估计进食量为 900g 时,大白鼠的体重平均增加多少,计算其 95%的可信区间,并说明其含义。求进食量为 900g

8、时,个体 Y 值的 95%容许区间,并解释其意义。表 10-3 八只大白鼠的进食量和体重增加量鼠号 1 2 3 4 5 6 7 8进食量(g)800 780 720 867 690 787 934 750增量(g) 185 158 130 180 134 167 186 1333 某省卫生防疫站对八个城市进行肺癌死亡回顾调查,并对大气中苯并(a)芘进行监测,结果如下,试检验两者有无相关?表 10-4 八个城市的肺癌标化死亡率和大气中苯并(a)芘浓度城市编号 1 2 3 4 5 6 7 8肺癌标化死亡率(1/10 万) 5.60 18.50 16.23 11.40 13.80 8.13 18.0

9、0 12.10苯并(a)芘( g/100m3)0.05 1.17 1.05 0.10 0.75 0.50 0.65 1.204 就下表资料分析血小板和出血症的关系。表 10-5 12 例病人的血小板浓度和出血症的关系病例号 1 2 3 4 5 6 7 8 9 10 11 12血小板数(10 9/L)120 130 160 310 420 540 740 1060 1260 1230 1440 2000出血症状 + + + + + 五、习题答题要点(一) 单项选择题1.D 2.C 3.C 4.B 5.C 6.C 7.D 8.B 9.D 10.D(二) 名词解释1 直线回归(linear regr

10、ession)建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直线纵向距离的平方和为最小。直线回归是回归分析中最基本、最简单的一种,故又称简单回归(simple regression ) 。2 回归系数(regression coefficient)即直线的斜率(slope),在直线回归方程中用 b 表示,b 的统计意义为 X 每增(减)一个单位时,Y 平均改变 b 个单位。3 剩余平方和(residual sum of squares) ,SS 剩 即 ,它反映 X 对 Y 的线性影响之外的一切因素对 Y2Y的变异的作用,也就是在总平方和中无法用 X 解释的部分。在散点图中,各

11、实测点离回归直线越近, 也2就越小,说明直线回归的估计误差越小。4 回归平方和(regression sum of squares) ,SS 回 即 ,它反映由于 X 与 Y 的直线关系而使 Y 的总变2异所减小的部分,也就是在总平方和中可以用 X 解释的部分。回归平方和越大,说明回归效果越好。5 直线相关(linear correlation)又称简单相关(simple correlation) ,用于双变量正态分布资料。有正相关、负相关和零相关等关系。直线相关的性质可由散点图直观的说明。6 零相关(zerro correlation)是指两变量间没有直线相关关系。11 相关系数又称积差相关

12、系数(coefficient of product-moment correlation) ,以符号 r 表示样本相关系数, 表示总体相关系数。它是说明具有直线关系的两个变量间,相关关系的密切程度与相关方向的指标。12 决定系数(coefficient of determination)即 r 的平方, ,说明当 SS 总 固定总回SllrYXXY22不变时,回归平方和的大小决定了 r 平方的大小。回归平方和越接近总平方和,则 r 平方值越接近 1。13 曲线直线化(rectification)是曲线拟合的重要手段之一。对于某些非线性的资料可以通过简单的变量变换使之直线化,用直线回归分析方法来

13、分析。14. 秩相关又称等级相关(rank correlation) ,是用双变量等级数据作直线相关分析,适用于下列资料:不服从双变量正态分布而不宜作积差相关分析;总体分布型未知;用等级表示的原始数据。(三)是非题1错。两样本剩余平方和 SS 剩 1=SS 剩 2,但两样本总平方和 SS 总 及回归平方和 SS 回 不一定相等,故两样本相关系数 r1 与 r2 不一定相等。2正确。3错。相关系数 r 有正负之分,其值为1r1,在总体相关系数不为零,即两变量确有直线关系前提下,r绝对值愈接近 1,两个变量间的直线相关愈密切;愈接近 0,相关愈不密切。(四)简答题1用以下三种方法判定:直线必须通过点( ) 。YX,若纵坐标、横坐标无折断号时,将此线左端延长与纵轴相交,交点的纵坐标必等于截距 a。直线是否在自变量 X 的实测范围内。2剩余标准差用 sY. X 表示: 22. nYnSsY剩其意义是指当 X 对 Y 的影响被扣除后,Y 方面仍有变异。这部分变异与 X 无关,纯属抽样变异。故 sY. X 是用来反映 Y的剩余变异的,即不考虑 X 以后 Y 本身的随机变异。剩余标准差可用于:估计回归系数 b 的标准误, ,进行回归系数的区间估计和假设检验。Xbls.估计总体中当 X 为某一定值时,估计值 的标准误。 22.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 试题/考题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号