高中数学-变量间的相关关系与统计案例

上传人:博****1 文档编号:560167764 上传时间:2024-01-03 格式:DOC 页数:14 大小:660.51KB
返回 下载 相关 举报
高中数学-变量间的相关关系与统计案例_第1页
第1页 / 共14页
高中数学-变量间的相关关系与统计案例_第2页
第2页 / 共14页
高中数学-变量间的相关关系与统计案例_第3页
第3页 / 共14页
高中数学-变量间的相关关系与统计案例_第4页
第4页 / 共14页
高中数学-变量间的相关关系与统计案例_第5页
第5页 / 共14页
点击查看更多>>
资源描述

《高中数学-变量间的相关关系与统计案例》由会员分享,可在线阅读,更多相关《高中数学-变量间的相关关系与统计案例(14页珍藏版)》请在金锄头文库上搜索。

1、第六单元第3讲 变量间的相关关系与统计案例(3课时)一基础知识1相关关系的分类从散点图上看,点散布在从左下角到右上角的区域内,对于两个变量的这种相关关系,我们将它称为正相关;点散布在从左上角到右下角的区域内,两个变量的这种相关关系称为负相关2线性相关从散点图上看,如果这些点从整体上看大致分布在一条直线附近,则称这两个变量之间具有线性相关关系,这条直线叫回归直线3回归方程(1)最小二乘法:使得样本数据的点到回归直线的距离平方和最小的方法叫最小二乘法(2)回归方程:两个具有线性相关关系的变量的一组数据: (x1,y1),(x2,y2),(xn,yn),其回归方程为x,则其中,b是回归方程的斜率,a

2、是在y轴上的截距4样本相关系数r,用它来衡量两个变量间的线性相关关系(1)当r0时,表明两个变量正相关;(2)当r0时,表明两个变量负相关;(3)r的绝对值越接近1,表明两个变量的线性相关性越强;r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系(4)相关性检验的步骤: 作统计假设 根据小概率0.05与n-2在附表中找出r的一个临界值r0.05 根据样本相关系数计算公式算出r值 用统计判断,如果,那么可以认为y与x之间的线性相关关系不显著,从而接受统计假设. 如果,表明一个发生的概率不到5%的事件在一次试验中竟发生了.这个小概率事件的发生使我们有理由认为y与x之间不具有线性相关关系的

3、假设是不成立的,拒绝这一统计假设也就是表明可以认为y与x之间具有线性相关关系.5线性回归模型(1)ybxae中,a、b称为模型的未知参数;e称为随机误差(2)相关指数用相关指数R2来刻画回归的效果,其计算公式是: ,的值越大(接近1),R2的值越大,说明残差平方和越小,也就是说模型的拟合效果越好在线性回归模型中,R2表示解释变量对预报变量变化的贡献率,R2越接近于1,表示回归效果越好 (2) r具有以下性质:(1)当r0时,表明两个变量正相关;当r0时,表明两个变量负相关;(2)当|r|1,并且|r|越接近1时,两个变量的线性相关程度越强;当|r|越接近0时,两个变量的线性相关程度越弱; (3

4、)相关性检验的步骤: 作统计假设 根据小概率0.05与n-2在附表中找出r的一个临界值r0.05 根据样本相关系数计算公式算出r值 用统计判断,如果,那么可以认为y与x之间的线性相关关系不显著,从而接受统计假设. 如果,表明一个发生的概率不到5%的事件在一次试验中竟发生了.这个小概率事件的发生使我们有理由认为y与x之间不具有线性相关关系的假设是不成立的,拒绝这一统计假设也就是表明可以认为y与x之间具有线性相关关系.6独立性检验(1)用变量的不同“值”表示个体所属的不同类别,这种变量称为分类变量例如:是否吸烟,宗教信仰,国籍等(2)列出的两个分类变量的频数表,称为列联表(3)一般地,假设有两个分

5、类变量X和Y,它们的值域分别为x1,x2和y1,y2,其样本频数列联表(称为22列联表)为:22列联表y1y2总计x1ababx2cdcd总计acbdabcdK2(其中nabcd为样本容量),可利用独立性检验判断表来判断“x与y的关系”这种利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验当K23.841时,则有95%的把握说事A与B有关;当K26.635时,则有99%的把握说事件A与B有关;当K22.706时,则认为事件A与B无关三.题型分析题型1相关关系的判断题1.某棉业公司的科研人员在7块并排、形状大小相同的试验田上对某棉花新品种进行施化肥

6、量x对产量y影响的试验,得到如下表所示的一组数据(单位:kg):施化肥量x15202530354045棉花产量y330345365405445450455(1)画出散点图;(2)判断是否具有相关关系审题视点 (1)用x轴表示化肥施用量,y轴表示棉花产量,逐一画点(2)根据散点图,分析两个变量是否存在相关关系解(1)散点图如图所示(2)由散点图知,各组数据对应点大致都在一条直线附近,所以施化肥量x与产量y具有线性相关关系 利用散点图判断两个变量是否有相关关系是比较简便的方法在散点图中如果所有的样本点都落在某一函数的曲线上,就用该函数来描述变量之间的关系即变量之间具有函数关系如果所有的样本点落在某

7、一函数的曲线附近,变量之间就有相关关系;如果所有的样本点都落在某一直线附近,变量之间就有线性相关关系题2. 根据两个变量x,y之间的观测数据画成散点图如图所示,这两个变量是否具有线性相关关系_(填“是”与“否”)解析从散点图看,散点图的分布成团状,无任何规律,所以两个变量不具有线性相关关系答案否题型2.独立性检验题3为调查某地区老人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:是否需要志愿 性别男女需要4030不需要160270(1) 估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2) 能否有99的把握认为该地区的老年人是否需要志愿者提供帮助与性别

8、有关?(3) 根据(2)的结论,能否提供更好的调查方法来估计该地区老年人,需要志愿帮助的老年人的比例?说明理由审题视点 第(2)问由a40,b30,c160,d270,代入公式可求K2,由K2的值与6.635比较断定第(3)问从抽样方法说明解(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要志愿者提供帮助的老年人的比例的估计值为14%.(2)K29.967.由于9.9676.635,所以有99%的把握认为该地区老年人是否需要帮助与性别有关(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明

9、显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层,采用分层抽样方法,这要比采用简单随机抽样方法更好 独立性检验的步骤:(1)根据样本数据制成22列联表;(2)根据公式K2计算K2的观测值;(3)比较K2与临界值的大小关系作统计推断题4. 甲乙两个学校高三年级分别有1100人和1000人,为了了解这两个学校全体高三年级学生在该地区二模考试中的数学成绩情况,采用分层抽样方法从两个学校一共抽取了105名学生的数学成绩,并作出了如下的频数分布统汁表,规定考试成绩在120,150内为优秀 (I)试求x,y的值; (II)由以上统计数据填写右面22列联表,若按是否优秀来判断

10、,是否有97.5%的把握认为两个学校的数学成绩有差异。 (III)根据抽样结果分别估计甲校和乙校的优秀率,若把频率视为概率,现从乙校学生中任取3人,求优秀学生人数的分布列和数学期望。题型3.线性回归方程题5(2012菏泽模拟)下表提供了某厂节能降耗技术改造后生产甲产品过程中记录的产量x(吨)与相应的生产能耗y(吨标准煤)的几组对照数据.x3456y2.5344.5(1)请画出上表数据的散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程x;(3)已知该厂技改前生产100吨甲产品的生产能耗为90吨标准煤试根据(2)求出的线性回归方程预测生产100吨甲产品的生产能耗比技改前降

11、低多少吨标准煤?(参考数值:32.5435464.566.5)审题视点 (2)问利用公式求、,即可求出线性回归方程(3)问将x100代入回归直线方程即可解(1)由题设所给数据,可得散点图如图所示(2)由对照数据,计算得:86,4.5(吨),3.5(吨)已知iyi66.5,所以,由最小二乘法确定的回归方程的系数为:0.7,3.50.74.50.35.因此,所求的线性回归方程为0.7x0.35.(3)由(2)的回归方程及技改前生产100吨甲产品的生产能耗,得降低的生产能耗为:90(0.71000.35)19.65(吨标准煤) 在解决具体问题时,要先进行相关性检验,通过检验确认两个变量是否具有线性相

12、关关系,若它们之间有线性相关关系,再求回归直线方程题6. 有10名同学高一(x)和高二(y)的数学成绩如下:高一成绩x74717268767367706574高二成绩y76757170767965776272(1)y与x是否具有相关关系?(2)如果y与x具有相关关系,求回归直线方程参考数据:分析:判断两变量之间是否具有相关关系,首先要求出其相关系数r,然后根据显著性水平及自由度查相关系数临界值表找临界值,当时认为不具有相关关系;当时认为具有相关关系,求回归直线方程则比较简单,只要求出a与b的值即可解:(1):由已知表格中所给数据进行计算,得:于是又查得附表3中相应在于显著性水平0.05和的相关

13、系数临界值由知,y与x具有相关关系说明:这类问题思路一般不是很复杂,掌握比较容易,但往往运算量较大,很容易出现计算错误,这就需要在计算时仔细准确,还要能熟练地使用科学计算器,从而解题速度和准确性第六单元第3讲作业1(人教A版教材习题改编)下面哪些变量是相关关系()A出租车车费与行驶的里程 B房屋面积与房屋价格C身高与体重 D铁块的大小与质量解析A,B,D都是函数关系,其中A一般是分段函数,只有C是相关关系答案C2对变量x,y有观测数据(xi,yi)(i1,2,10),得散点图(1);对变量u,v有观测数据(ui、vi)(i1,2,10),得散点图(2)由这两个散点图可以判断()A变量x与y正相

14、关,u与v正相关B变量x与y正相关,u与v负相关C变量x与y负相关,u与v正相关D变量x与y负相关,u与v负相关解析由题图(1)可知,各点整体呈递减趋势,x与y负相关;由题图(2)可知,各点整体呈递增趋势,u与v正相关答案C3(2012南昌模拟)某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是()A.10x200 B.10x200C.10x200 D.10x200解析因为销量与价格负相关,由函数关系考虑为减函数,又因为x,y不能为负数,再排除C,故选A.答案A4(2012枣庄模拟)下面是22列联表:y1y2合计x1a2173x2222547合计b46120则表中a,b的值分别为()A94,72 B52,50 C52,74 D74,52解析a2173,a52,又a22b,b74.答案C

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 试题/考题 > 高中试题/考题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号