资源描述
考点66 变量间的相关关系、统计案例
1.已知具有线性相关的两个变量之间的一组数据如下表所示:
0
1
2
3
4
2.2
4.3
4.5
4.8
6.7
若满足回归方程,则以下为真命题的是( )
A. 每增加1个单位长度,则一定增加1.5个单位长度
B. 每增加1个单位长度,就减少1.5个单位长度
C. 所有样本点的中心为
D. 当时,的预测值为13.5
D
2.某公司为了增加其商品的销售利润,调查了该商品投入的广告费用与销售利润的统计数据如下表:
广告费用(万元)
2
3
5
6
销售利润(万元)
5
7
9
11
由表中数据,得线性回归方程:
,,则下列结论错误的是( )
A. B. C. 直线过点 D. 直线过点
D
3.某汽车销售公司统计了某款汽车行驶里程 (万公里)与维修保养费用 (万元)的五组数据,并根据这五组数据求得与的线性回归方程为.由于工作人员疏忽,行驶8万公里的数据被污损了,如下表所示.
行驶里程 (单位:万公里)
1
2
4
5
8
维修保养费用 (单位:万元)
0.50
0.90
2.3
2.7
则被污损的数据为( )
A. 3.20 B. 3.6 C. 3.76 D. 3.84
B
设被污损的数据为,由已知有
4.某运动制衣品牌为了成衣尺寸更精准,现选择15名志愿者,对其身高和臂展进行测量(单位:厘米),左图为选取的15名志愿者身高与臂展的折线图,右图为身高与臂展所对应的散点图,并求得其回归方程为,以下结论中不正确的为
A. 15名志愿者身高的极差小于臂展的极差
B. 15名志愿者身高和臂展成正相关关系,
C. 可估计身高为190厘米的人臂展大约为189.65厘米,
D. 身高相差10厘米的两人臂展都相差11.6厘米,
D
A,身高极差大约为25,臂展极差大于等于30,故正确;
B,很明显根据散点图像以及回归直线得到,身高矮臂展就会短一些,身高高一些,臂展就长一些,故正确;
C,身高为190厘米,代入回归方程可得到臂展估计值等于189.65厘米,但是不是准确值,故正确;
D,身高相差10厘米的两人臂展的估计值相差11.6厘米,但并不是准确值,回归方程上的点并不都是准确的样本点,故说法不正确.
故D.
5.一商场对每天进店人数和商品销售件数进行了统计对比,得到如下表格:
(1)在给定的坐标系中画出表中数据的散点图,并由散点图判断销售件数与进店人数是否线性相关?(给出判断即可,不必说明理由)
(2)建立关于的回归方程(系数精确到0.01),预测进店人数为80时,商品销售的件数(结果保留整数).
参考数据:,,,,,.
参考公式:回归方程,其中,.
(1)见解析; (2)58件.
所以回归方程,
当时,(件)
所以预测进店人数为80时,商品销售的件数为58件.
6.某兴趣小组欲研究昼夜温差大小与患感冒人数多少之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10号的昼夜温差情况与因患感冒而就诊的人数,得到如下资料:
该兴趣小组确定的研究方案是:先用2、3、4、5月的4组数据求线性回归方程,再用1月和6月的2组数据进行检验.
(1)请根据2、3、4、5月的数据,求出y关于x的线性回归方程;
(2)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?
(参考公式: ,)
参考数据:11×25+13×29+12×26+8×16=1092,112+132+122+82=498.
(1);(2)见解析
(1)由数据求得
7.对某地区儿童的身高与体重的一组数据,我们用两种模型①,②拟合,得到回归方程分别为,,作残差分析,如表:
身高
60
70
80
90
100
110
体重
6
8
10
14
15
18
0.41
0.01
1.21
0.41
0.07
0.12
1.69
(Ⅰ)求表中内实数的值;
(Ⅱ)根据残差比较模型①,②的拟合效果,决定选择哪个模型;
(Ⅲ)残差大于的样本点被认为是异常数据,应剔除,求剔除后对(Ⅱ)所选择的模型重新建立的线性回归方程,并检验一数据点身高,体重是否为异常数据.(结果保留到小数点后两位)
附:对于一组数据,,…,其回归直线的斜率和截距的最小二乘法估计分别为,.
(Ⅰ) (Ⅱ)不是异常数据
8.为了探究车流量与的浓度是否相关,现采集到华中某城市2015年12月份某星期星期一到星期日某一时间段车流量与的数据如表:
时间
星期一
星期二
星期三
星期四
星期五
星期六
星期日
车流量(万辆)
1
2
3
4
5
6
7
的浓度(微克/立方米)
28
30
35
41
49
56
62
(1)求关于的线性回归方程;(提示数据: )
(2)(I)利用(1)所求的回归方程,预测该市车流量为12万辆时的浓度;(II)规定:当一天内的浓度平均值在内,空气质量等级为优;当一天内的浓度平均值在内,空气质量等级为良,为使该市某日空气质量为优或者为良,则应控制当天车流量不超过多少万辆?(结果以万辆为单位,保留整数)参考公式:回归直线的方程是,其中, .
(1) ;(2)(ⅰ) 91微克/立方米;(ⅱ) 13万辆.
9.某省级示范高中高三年级对考试的评价指标中,有“难度系数”“区分度”和“综合”三个指标,其中,难度系数,区分度,综合指标.以下是高三年级 6 次考试的统计数据:
i
1
2
3
4
5
6
难度系数 xi
0.66
0.72
0.73
0.77
0.78
0.84
区分度 yi
0.19
0.24
0.23
0.23
0.21
0.16
(I) 计算相关系数,若,则认为与的相关性强;通过计算相关系数 ,能否认为与的相关性很强(结果保留两位小数)?
(II) 根据经验,当时,区分度与难度系数的相关性较强,从以上数据中剔除(0.7,0.8)以外的 值,即.
(i) 写出剩下 4 组数据的线性回归方程(保留两位小数);
(ii) 假设当时, 与的关系依从(i)中的回归方程,当 为何值时,综合指标的值最大?
参考数据:
参考公式:
相关系数
回归方程中斜率和截距的最小二乘估计公式为
(1)不能认为(2),
故所求线性回归方程为:
(ii)
,
故当时,取最大值
10.假设关于某种设备的使用年限 (年)与所支出的维修费用 (万元)有如下统计资料:
x
2
3
4
5
6
y
2.2
3.8
5.5
6.5
7.0
已知, .
,
(1)求, ;
(2)若 与具有线性相关关系,求出线性回归方程;
(3)估计使用年限为10年时,维修费用约是多少?
(1)4,5(2)=1.23x+0.08(3)12.38万元
11.某厂生产不同规格的一种产品,根据检测标准,其合格产品的质量与尺寸x(mm)之间近似满足关系式(b、c为大于0的常数).按照某项指标测定,当产品质量与尺寸的比在区间内时为优等品.现随机抽取6件合格产品,测得数据如下:
尺寸x(mm)
38
48
58
68
78
88
质量y (g)
16.8
18.8
20.7
22.4
24
25.5
质量与尺寸的比
0.442
0.392
0.357
0.329
0.308
0.290
(Ⅰ)现从抽取的6件合格产品中再任选3件,记为取到优等品的件数,试求随机变量的分布列和期望;
(Ⅱ)根据测得数据作了初步处理,得相关统计量的值如下表:
75.3
24.6
18.3
101.4
(ⅰ)根据所给统计量,求y关于x的回归方程;
(ⅱ)已知优等品的收益(单位:千元)与的关系为,则当优等品的尺寸x为何值时,收益的预报值最大?(精确到0.1)
附:对于样本 ,其回归直线的斜率和截距的最小二乘估计公式分别为:,,.
(1)见解析(2),x=72.3
(1)解:由已知,优等品的质量与尺寸的比在区间内,即
则随机抽取的6件合格产品中,有3件为优等品,3件为非优等品
令,
当时,取最大值 -
即优等品的尺寸(mm),收益的预报值最大.
12.中石化集团获得了某地深海油田块的开采权,集团在该地区随机初步勘探了部分几口井,取得了地质资料.进入全面勘探时期后,集团按网络点米布置井位进行全面勘探.由于勘探一口井的费用很高,如果新设计的井位与原有井位重合或接近,便利用旧井的地质资料,不必打这口新井,以节约勘探费用,勘探初期数据资料见下表:
井号
1
2
3
4
5
6
坐标(x,y)(km)
(2,30)
(4,40)
(5,60)
(6,50)
(8,70)
(1,y)
钻探深度(km)
2
4
5
6
8
10
出油量(L)
40
70
110
90
160
205
(Ⅰ)1~6号旧井位置线性分布,借助前5组数据求得回归直线方程为y=6.5x+a,求a,并估计y的预报值;
(Ⅱ)现准备勘探新井7(1,25),若通过1、3、5、7号井计算出的,的值(,精确到0.01)与(I)中b,a的值差不超过10%,则使用位置最接近的已有旧井6(1,y),否则在新位置打开,请判断可否使用旧井?(参考公式和计算结果:,,,)
(Ⅲ)设出油量与勘探深度的比值k不低于20的勘探井称为优质井,那么在原有6口井中任意勘探4口井,求勘探优质井数X的分布列与数学期望.
(Ⅰ)24(Ⅱ)6(1,24)(Ⅲ)
13.参与数学选修课的同学对某公司的一种产品销量与价格进行了统计,得到如下数据和散点图.
定价x(元/千克)
10
20
30
40
50
60
年销量y(千克)
1150
643
424
262
165
86
z=2 ln y
14.1
12.9
12.1
11.1
10.2
8.9
参考数据:
,
.
(1)根据散点图判断y与x,z与x哪一对具有较强的线性相关性(给出判断即可,不必说明理由)?
(2)根据(1)的判断结果及数据,建立y关于x的回归方程(方程中的系数均保留两位有效数字).
(3)当定价为150元/千克时,试估计年销量.
附:对于一组数据(x1,y1),(x2,y2),(x3,y3),…,(xn,yn),其回归直线x+的斜率和截距的最
小二乘估计分别为
(1) z与x具有较强的线性相关性(2)(3)估计年销量为=1千克
14.随着智能手机的普及,使用手机上网成为了人们日常生活的一部分,很多消费者对手机流量的需求越来越大.长沙某通信公司为了更好地满足消费者对流量的需求,准备推出一款流量包.该通信公司选了5个城市(总人数、经济发展情况、消费能力等方面比较接近)采用不同的定价方案作为试点,经过一个月的统计,发现该流量包的定价:(单位:元/月)和购买人数(单位:万人)的关系如表:
(1)根据表中的数据,运用相关系数进行分析说明,是否可以用线性回归模型拟合与的关系?并指出是正相关还是负相关;
(2)①求出关于的回归方程;
②若该通信公司在一个类似于试点的城市中将这款流量包的价格定位25元/ 月,请用所求回归方程预测长沙市一个月内购买该流量包的人数能否超过20 万人.
参考数据:,,.
参考公式:相关系数,回归直线方
展开阅读全文
温馨提示:
金锄头文库所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
相关搜索