第十篇统计、统计案例第3讲变量间的相关关系与统计案例

上传人:平*** 文档编号:14741524 上传时间:2017-11-02 格式:DOC 页数:11 大小:301.64KB
返回 下载 相关 举报
第十篇统计、统计案例第3讲变量间的相关关系与统计案例_第1页
第1页 / 共11页
第十篇统计、统计案例第3讲变量间的相关关系与统计案例_第2页
第2页 / 共11页
第十篇统计、统计案例第3讲变量间的相关关系与统计案例_第3页
第3页 / 共11页
第十篇统计、统计案例第3讲变量间的相关关系与统计案例_第4页
第4页 / 共11页
第十篇统计、统计案例第3讲变量间的相关关系与统计案例_第5页
第5页 / 共11页
点击查看更多>>
资源描述

《第十篇统计、统计案例第3讲变量间的相关关系与统计案例》由会员分享,可在线阅读,更多相关《第十篇统计、统计案例第3讲变量间的相关关系与统计案例(11页珍藏版)》请在金锄头文库上搜索。

1、第 3 讲变量间的相关关系与统计案例以选择题或填空题的形式考查回归分析及独立性检验中的基本思想方法及其简单应用【复习指导】高考在该部分的主要命题点就是回归分析和独立性检验的基础知识和简单应用复习时要掌握好回归分析和独立性检验的基本思想、方法和基本公式基础梳理1相关关系的分类从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为负相关2线性相关从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫回归直线3回归方程(1)最小二乘法:使得样本数据的

2、点到回归直线的距离平方和最小的方法叫最小二乘法(2)回归方程:两个具有线性相关关系的变量的一组数据:(x1, y1),(x 2,y 2),(x n,y n),其回归方程为 x ,则y b a Error!其中,b 是回归方程的斜率,a 是在 y 轴上的截距4样本相关系数r ,用它来衡量两个变量间的线性相关关系ni 1xi xyi yni 1xi x2ni 1yi y2(1)当 r0 时,表明两个变量正相关;(2)当 r0 时,表明两个变量负相关;(3)r 的绝对值越接近 1,表明两个变量的线性相关性越强;r 的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系通常当|r |0.75 时,

3、认为两个变量有很强的线性相关关系5线性回归模型(1)ybxae 中,a、b 称为模型的未知参数;e 称为随机误差(2)相关指数用相关指数 R2 来刻画回归的效果,其计算公式是: R2 ,R 2 的值越大,说明残差平方和越小,也就是说模型的拟合效果越好在线性回归模型中,R 2 表示解释变量对预报变量变化的贡献率,R 2 越接近于 1,表示回归效果越好6独立性检验(1)用变量的不同“值”表示个体所属的不同类别,这种变量称为分类变量例如:是否吸烟,宗教信仰,国籍等(2)列出的两个分类变量的频数表,称为列联表(3)一般地,假设有两个分类变量 X 和 Y,它们的值域分别为x 1,x 2和y 1,y 2,

4、其样本频数列联表(称为 22 列联表)为:22 列联表y1 y2 总计x1 a b abx2 c d cd总计 ac bd abcdK2 (其中 nabcd 为样本容量),可利用独立性检nad bc2a ba cc db d验判断表来判断“x 与 y 的关系 ”这种利用随机变量 K2 来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验两个规律(1)函数关系是一种确定的关系,相关关系是一种非确定的关系事实上,函数关系是两个非随机变量的关系,而相关关系是非随机变量与随机变量的关系(2)当 K23.841 时, 则有 95%的把握说事 A 与 B 有关;当 K2 6.

5、635 时,则有 99%的把握说事件 A 与 B 有关;当 K2 2.706 时,则认为事件 A 与 B 无关三个注意(1)回归分析是 对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的回归直线方程才有实际意义,否 则,求出的回 归直线方程毫无意义(2)线性回归方程中的截距和斜率都是通过样本数据估计而来的,存在误差,这种误差会导致预报结果的偏差;而且回归方程只适用于我们所研究的样本总体(3)独立性检验 的随机变量 K23.841 是判断是否有关系的临界值,K 23.841 应判断为没有充分证据显示事件 A 与 B 有关系,而不能作为小于 95%的量化值来判断双基自测1

6、(人教 A 版教材习题改编)下面哪些变量是相关关系 ()A出租车车费与行驶的里程 B房屋面积与房屋价格C身高与体重 D铁块的大小与质量解析A, B,D 都是函数关系,其中 A 一般是分段函数,只有 C 是相关关系答案C2对变量 x, y 有观测数据 (xi,y i)(i1,2,10),得散点图(1);对变量 u,v 有观测数据(u i、v i)(i1,2,10),得散点图(2) 由这两个散点图可以判断()A变量 x 与 y 正相关,u 与 v 正相关B变量 x 与 y 正相关,u 与 v 负相关C变量 x 与 y 负相关,u 与 v 正相关D变量 x 与 y 负相关,u 与 v 负相关解析由题

7、图(1)可知,各点整体呈递减趋势,x 与 y 负相关;由题图(2)可知,各点整体呈递增趋势,u 与 v 正相关答案C3(2012南昌模拟 )某商品销售量 y(件)与销售价格 x(元/件)负相关,则其回归方程可能是()A. 10x200 B. 10x200y y C. 10x200 D. 10x200y y 解析因为销量与价格负相关,由函数关系考虑为减函数,又因为 x,y 不能为负数,再排除 C,故选 A.答案A4(2012枣庄模拟 )下面是 22 列联表:y1 y2 合计x1 a 21 73x2 22 25 47合计 b 46 120则表中 a,b 的值分别为()A94,72 B52,50 C

8、52,74 D74,52解析a2173,a 52,又 a22b, b74.答案C5在一项打鼾与患心脏病的调查中,共调查了 1 671 人,经过计算 K2 的观测值k27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是_的(有关,无关)解析由观测值 k27.63 与临界值比较,我们有 99%的把握说打鼾与患心脏病有关答案有关考向一相关关系的判断【例 1】山东鲁洁棉业公司的科研人员在 7 块并排、形状大小相同的试验田上对某棉花新品种进行施化肥量 x 对产量 y 影响的试验,得到如下表所示的一组数据(单位:kg) :施化肥量 x 15 20 25 30 35 40 45棉花产量 y 330

9、345 365 405 445 450 455(1)画出散点图;(2)判断是否具有相关关系审题视点 (1)用 x 轴表示化肥施用量, y 轴表示棉花 产量,逐一画点(2)根据散点图 ,分析两个变量是否存在相关关系解(1)散点图如图所示(2)由散点图知,各组数据对应点大致都在一条直线附近,所以施化肥量 x 与产量y 具有线性相关关系利用散点图判断两个变量是否有相关关系是比较简便的方法在散点图中如果所有的样本点都落在某一函数的曲线上,就用该函数来描述变量之间的关系即变量之间具有函数关系如果所有的 样本点落在某一函数的曲线附近, 变量之间就有相关关系;如果所有的样本点都落在某一直线附近,变量之间就有

10、线性相关关系【训练 1】 根据两个变量 x,y 之间的观测数据画成散点图如图所示,这两个变量是否具有线性相关关系_(填“是”与“否”)解析从散点图看,散点图的分布成团状,无任何 规律,所以两个 变量不具有线性相关关系答案否考向二独立性检验【例 2】(2010 全国新课标)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了 500 位老年人,结果如下:性别是否需要志愿者男 女需要 40 30不需要 160 270(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)能否有 99%的把握认为该地区老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能

11、否提出更好的调查方法来估计该地区老年人中,需要志愿者提供帮助的老年人的比例?说明理由附:P(K2k) 0.050 0.010 0.001k 3.841 6.635 10.828K2nad bc2a bc da cb d审题视点 第(2)问由 a40,b30, c160,d 270,代入公式可求 K2,由 K2的值与 6.635 比较断定第(3)问从抽样方法说明解(1)调查的 500 位老年人中有 70 位需要志愿者提供帮助,因此该地区老年人中,需要志愿者提供帮助的老年人的比例的估计值为 14%.70500(2)K2 9.967.50040270 30160270430200300由于 9.96

12、76.635,所以有 99%的把握认为该地区老年人是否需要帮助与性别有关(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层,采用分层抽样方法,这要比采用简单随机抽样方法更好独立性检验的步骤:(1)根据样本数据制成 22 列联表;(2)根据公式 K2 计算 K2的观测值;nad bc2a ba cb dc d(3)比较 K2与临界值的大小关系作统计推断【训练 2】 某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在29.94

13、,30.06)的零件为优质品从两个分厂生产的零件中各抽出了 500 件,量其内径尺寸,得结果如下表:甲厂:分组29.86,2990)29.90,2994)29.94,2998)29.98,3002)30.02,3006)30.06,3010)30.10,3014)频数 12 63 86 182 92 61 4乙厂:分组29.86,2990)29.90,2994)29.94,2998)29.98,3002)30.02,3006)30.06,3010)30.10,3014)频数 29 71 85 159 76 62 18(1)试分别估计两个分厂生产零件的优质品率;(2)由以上统计数据填下面 22

14、列联表,并问是否有 99%的把握认为“两个分厂生产的零件的质量有差异”.甲厂 乙厂 合计优质品非优质品合计附K 2 ,nad bc2a bc da cb dP(K2k) 0.05 0.01k 3.841 6.635解(1)甲厂抽查的产品中有 360 件优质品,从而甲厂生产的零件的优质品率估计为 100%72% ;360500乙厂抽查的产品中有 320 件优质品,从而乙厂生产的零件的优质品率估计为100%64%.320500(2)甲厂 乙厂 合计优质品 360 320 680非优质品 140 180 320合计 500 500 1 000K2 7.356.635,1 000360180 3201

15、402500500680320所以有 99%的把握认为“两个分厂生产的零件的质量有差异” 考向三线性回归方程【例 3】(2012 菏泽模拟)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量 x(吨)与相应的生产能耗 y(吨标准煤)的几组对照数据.x 3 4 5 6y 2.5 3 4 4.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出 y 关于 x 的线性回归方程 x ;y b a (3)已知该厂技改前生产 100 吨甲产品的生产能耗为 90 吨标准煤试根据(2)求出的线性回归方程预测生产 100 吨甲产品的生产能耗比技改前降低多少吨标准煤?(参考数值:32.5435464.566.5)审题视点 (2)问利用公式求 、,即可求出线性回归

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号