变量的相关性、回归分析、独立性检验试题

上传人:千****8 文档编号:132214777 上传时间:2020-05-13 格式:PPT 页数:37 大小:1.43MB
返回 下载 相关 举报
变量的相关性、回归分析、独立性检验试题_第1页
第1页 / 共37页
变量的相关性、回归分析、独立性检验试题_第2页
第2页 / 共37页
变量的相关性、回归分析、独立性检验试题_第3页
第3页 / 共37页
变量的相关性、回归分析、独立性检验试题_第4页
第4页 / 共37页
变量的相关性、回归分析、独立性检验试题_第5页
第5页 / 共37页
点击查看更多>>
资源描述

《变量的相关性、回归分析、独立性检验试题》由会员分享,可在线阅读,更多相关《变量的相关性、回归分析、独立性检验试题(37页珍藏版)》请在金锄头文库上搜索。

1、1 本资料来源 新课标高中一轮总复习 第七单元计算原理 概率与统计 第55讲 变量的相关性 回归分析 独立性检验 1 会作两个有关联变量数据的散点图 会利用散点图认识变量间的相关关系 2 了解最小二乘法的思想 能根据给出的线性回归方程系数公式建立线性回归方程 3 了解独立性检验的含义 知道什么是2 2列联表 4 会运用独立性检验的方法判断事件A与B的关系 5 会求回归方程模型 并能进行相关性检验 6 掌握相关性检验的步骤 1 下列两个变量之间的关系是相关关系的是 A A 人的年龄和身高B 正方形的边长和面积C 正n边形的边数与其内角和D 某角度与它的余弦值 人的年龄和身高是一种不确定的关系 其

2、他三组两个变量之间都是确定的函数关系 故选A 2 回归直线方程表示直线必定过点 D A 0 0 B 0 C 0 D 回归直线必定经过样本中心点 3 某装饰品的广告费投入x 单位 万元 与销售y 单位 万元 之间有如下表所示的对应数据 则回归直线方程为 A A 7 5x 24 5B 7 5x 24 5C 7 5x 24 5D 7 5x 24 5 通过公式b a b 求之 4 下列说法中正确的是 C A K2在任何相互独立问题中都可以用于检验有关还是无关B K2的值越大 两个事件的相关性就越大C K2是用来判断两个分类变量是否有关系的随机变量D K2的观测值k 5 用A和B两种药物各治疗9个病人

3、结果如下 则这两种药物的疗效显著差别 答 有 或 无 由表中看出 使用A药痊愈的概率高于B药 故可以粗略估计两种药的疗效是有显著差别的 有 1 两个变量间的相关关系如果两个变量之间确实存在关系 但又没有函数关系所具有的确定性 它们的关系带有随机性 则称这两个变量具有 有相关关系的两个变量 若一个变量的值由小到大时 另一个变量的值也是由小到大 这种相关称为 反之 一个变量的值由小到大 另一个变量的值由大到小 这种相关称为 相关关系 正相关 负相关 2 散点图在平面直角坐标系中描点 得到关于两个变量的一组数据的图形 这样的图形叫做 如果散点图中 相应于具有相关关系的两个变量所有观察值的数据点 分布

4、在一条直线附近 则称这两个变量具有 这条直线叫做 方程为 bx a 其中b a b 散点图 线性相关关系 回归直线 3 最小二乘法使残差平方和Q yi bxi a 2为最小的方法 叫做 4 线性回归模型 1 样本的相关系数r 最小二乘法 当r 0时 表示两个变量正相关 当r 0时 表示两个变量负相关 r 越近于1 表明两个变量的线性相关性越强 r 越近于0 表明两个变量之间几乎不存在线性相关关系 2 线性回归模型y bx a e e为随机误差 3 总体偏差平方和 yi 2 残差 yi 残差平方和 yi 2 回归平方和 总偏差平方和 残差平方和 5 相关指数R2 1 用R2来刻画回归的效果 R2

5、 表示 6 分类变量变量的不同 值 表示个体所属的不同类别 越大 拟合效果越好 7 列联表 即列出两个分类变量的频率表 其中n为样本容量 8 建立回归模型的基本步骤 1 确定研究对象 明确解释变量与预报变量 2 画出解释变量与预报变量的散点图 3 由经验确定回归方程的类型 4 估计回归方程中的参数 5 分析残差图是否异常 若存在异常 则检查数据是否有误 或模型是否合适等 9 利用随机变量K2进行判断检验K2 先假设两个分类变量x与y无关系 若K2的值较大 则拒绝假设 只要K2 2 706 就认为x与y有关系 利用K2来确定在多大程度可以认为 两个分类变量有关系 的方法称为独立性检验 题型一变量

6、的相关性 例1 汽车的重量和汽车消耗一升汽油所行驶的路程成负相关 这说明 A 汽车越重 每消耗1升汽油所行驶的路程越短B 汽车越轻 每消耗1升汽油所行驶的路程越短C 汽车越重 消耗汽油越多D 汽车越轻 消耗汽油越多 A 要透彻理解一些常见参概念的意义 题型二回归分析 例2 某车间为了规定工时定额 需要确定加工零件所花费的时间 为此做了四次试验 根据试验数据得到如下图所示的散点图 其中x表示零件的个数 y表示加工时间 1 求出y关于x的线性回归方程 bx a 2 试预测加工10个零件需多长时间 1 3 5 3 5 所以b 0 7 a b 3 5 0 7 3 5 1 05 所以线性回归方程为 0

7、7x 1 05 2 当x 10时 0 7 10 1 05 8 05 故加工10个零件大约需8 05小时 求出回归直线方程后 往往用来作为现实生产中的变量之间相关关系的近似关系 从而可用来指导生产实践 为了研究某种细菌随时间x变化繁殖的个数 收集数据如下 1 以x为解释变量 y为预报变量作这些数据的散点图 2 求y关于x的回归方程 用所学函数看变化趋势 1 画散点图 2 若建立线性模型 a bx 则得到 56 467 34 086x 若建立指数函数模型 menx 则得到 3 0519e0 6902x 回归方程不一定惟一 该题还可以用二次函数为模型 题型二独立性检验 例2 在对人群的休闲方式的一次

8、调查中 共调查了124人 其中女性70人 女性中有43人主要的休闲方式是看电视 另外27人主要的休闲方式是运动 男性中21人主要的休闲方式是看电视 其余男性的主要休闲方式是运动 1 根据以上数据建立一个2 2列联表 2 判断性别与休闲方式是否有关系 并说明理由 是否有关系取决于K2的大小 1 2 2列联表为 2 K2 6 2设H1 性别与不同运动方式有关系 假设H0 性别与不同的运动方式没有关系 在H0的前提下 K2应该很小 而P K2 5 024 0 025 所以有97 5 的把握认为性别与不同的运动方式之间有关系 对判断过程和计算方式要清楚 计算K2时勿将 ad bc 2中的平方运算漏掉

9、下面是两个变量间的一组数据 1 在同一直角坐标系中画出散点图 直线 24 2 5x和曲线 2 比较所画直线与曲线 哪一条更能表现这组数据之间的关系 3 分别计算用直线方程与曲线方程得到在5个x点处的预测值与实际预测之间的误差 比较两个误差绝对值之和的大小 1 所求作图型如下 2 从图形上看 曲线 比直线 24 2 5x更能表现这组数据间的关系 3 用直线 24 2 5x近似数据时 误差绝对值的和为27 5 用曲线 时 误差绝对值的和为12 5 比前者小得多 由散点图可比较直观地看出更能表现所给数据的关系的曲线 再通过比较误差绝对值之和的大小 则显得更有说服力 1 计算回归直线方程中的参数a b

10、时应分层进行 避免因计算错误而产生误差 2 求线性回归方程之前 应对数据进行线性相关分析 3 回归分析的关键是根据散点图选择函数模型 用相关系数判定哪种模型更好 4 独立性检验不能用比例余数来判定 a b c d成比例扩大 K2的值是不同的 正确列出2 2列联表是解题的关键步骤 2009 辽宁卷 某企业有两个分厂生产某种零件 按规定内径尺寸 单位 mm 的值落在 29 94 30 06 的零件为优质品 从两个分厂生产的零件中各抽出了500件 量其内径尺寸 得结果如下表 甲厂 乙厂 1 试分别估计两个分厂生产的零件的优质品率 2 由以上统计数据填下面2 2列联表 并分析是否有99 的把握认为 两个分厂生产的零件的质量有差异 附 K2 1 甲厂抽查的产品中有360件优质品 从而甲厂生产的零件的优质品率估计为 72 乙厂抽查的产品中有320件优质品 从而乙厂生产的零件的优质品率估计为 64 2 2 2列联表如下 K2 7 35 6 635 所以有99 的把握认为 两个分厂生产的零件的质量有差异

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 经营企划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号