专题07 统计案例(知识梳理)(原卷版)

上传人:cl****1 文档编号:475083779 上传时间:2023-03-22 格式:DOC 页数:7 大小:90.50KB
返回 下载 相关 举报
专题07 统计案例(知识梳理)(原卷版)_第1页
第1页 / 共7页
专题07 统计案例(知识梳理)(原卷版)_第2页
第2页 / 共7页
专题07 统计案例(知识梳理)(原卷版)_第3页
第3页 / 共7页
专题07 统计案例(知识梳理)(原卷版)_第4页
第4页 / 共7页
专题07 统计案例(知识梳理)(原卷版)_第5页
第5页 / 共7页
点击查看更多>>
资源描述

《专题07 统计案例(知识梳理)(原卷版)》由会员分享,可在线阅读,更多相关《专题07 统计案例(知识梳理)(原卷版)(7页珍藏版)》请在金锄头文库上搜索。

1、专题07 统计案例(知识梳理)一、基本概念1、两个变量的线性相关(1)正相关:在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它称为正相关;(2)负相关:在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关;(3)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在一条直线附近,我们就称这两个变量之间具有线性相关关系,这条直线叫做回归直线。(4)相关系数:,越接近于相关性越强。2、回归方程(1)最小二乘法:求回归直线使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法;(2)回归方程:方程是两个具有线性相关关系的变量的一组数据、

2、的回归方程,其中、是待定参数。,。(3)求回归直线方程的一般步骤:作出散点图(由样本点是否呈条状分布来判断两个量是否具有线性相关关系),若存在线性相关关系;计算出、的值,求回归系数、;写出回归直线方程 ,并利用回归直线方程进行预测说明。3、回归分析:对具有相关关系的两个变量进行统计分析的一种常用方法。建立回归模型的基本步骤是:(1)确定研究对象,明确两个变量即解释变量和预报变量;(2)画出散点图,观察它们之间的关系;(3)由经验确定回归方程类型(若呈线性关系,选用线性回归方程);(4)按一定规则估计回归方程中的参数(如最小二乘法);(5)得出结果后分析残差图是否有异常(个别数据对应残差过大,或

3、残差出现不随机的规律性,等等),若存在异常,则检查数据是否有误,或模型是否合适等。4、利用统计方法解决实际问题的基本步骤:(1)提出问题;(2)收集数据;(3)分析整理数据;(4)进行预测或决策。5、残差变量的主要来源:(1)用线性回归模型近似真实模型(真实模型是客观存在的,通常我们并不知道真实模型到底是什么)所引起的误差。可能存在非线性的函数能够更好地描述与之间的关系,但是现在却用线性函数来表述这种关系,结果就会产生误差。这种由于模型近似所引起的误差包含在中。(2)忽略了某些因素的影响。影响变量的因素不只变量一个,可能还包含其他许多因素(例如在描述身高和体重关系的模型中,体重不仅受身高的影响

4、,还会受遗传基因、饮食习惯、生长环境等其他因素的影响),但通常它们每一个因素的影响可能都是比较小的,它们的影响都体现在中。(3)观测误差。由于测量工具等原因,得到的的观测值一般是有误差的(比如一个人的体重是确定的数,不同的秤可能会得到不同的观测值,它们与真实值之间存在误差),这样的误差也包含在中。上面三项误差越小,说明我们的回归模型的拟合效果越好。6、独立性检验:利用随机变量来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验。(1)独立性检验的一般步骤:根据样本数据制成列联表;根据公式,计算的值;查表比较与临界值的大小关系,作出统计判断。(2)回归分析是处理变量

5、相关关系的一种数学方法,根据回归方程进行预报,仅是一个预报值,而不是真实发生的值;独立性检验是一种假设检验,在对总体的估计中,通过抽样,构造合适的随机变量,对假设的正确性进行判断。7、判断结论成立的可能性的步骤:(1)通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度。(2)可以利用独立性检验来考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度。二、例题选讲例1对变量、有观测数据()可以得到散点图(1);对变量、有观测数据()可以得到散点图(2)。由这两个散点图可以判断( )。A、变量与正相关,与正相关B、变量与正相关,

6、与负相关C、变量与负相关,与正相关D、变量与负相关,与负相关例2有五组变量:汽车的重量和汽车每消耗升汽油所行驶的平均路程;平均日学习时间和平均学习成绩;某人每日吸烟量和身体健康情况;圆的半径与面积;汽车的重量和每千米耗油量。其中两个变量成正相关的是( )。A、B、C、D、例3为了解儿子身高与其父亲身高的关系,随机抽取对父子的身高数据如下:父亲身高 ()儿子身高 ()则对的线性回归方程为( )。A、B、C、D、例4设、是变量和的个样本点,直线是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论中正确的是( )。A、和的相关系数为直线的斜率B、和的相关系数在到之间C、当为偶数时,分布在

7、两侧的样本点的个数一定相同D、直线过点例5最小二乘法的原理是( ) A、使得最小B、使得最小C、使得最小D、使得最小例6研究某灌溉渠道水的流速与水深之间的关系,测得一组数据如下:水深流速(1)求对的回归直线方程;(2)预测水深为时水的流速是多少?例7年到年中国的国内生产总值()的数据如下:年份(1)作和年份的散点图,根据该图猜想它们之间的关系应是什么。(2)建立年份为解释变量,为预报变量的回归模型,并计算残差。(3)根据你得到的模型,预报年的,并查阅资料,看看你的预报与实际的误差是多少。(4)你认为这个模型能较好地刻画和年份的关系吗?请说明理由。例8如下表所示,某地区一段时间内观察到的大于或等

8、于某震级的地震次数为,试建立回归方程表述二者之间的关系。震级地震次数震级地震次数例9电容器充电后,电压达到 ,然后开始放电,由经验知道,此后电压随时间变化的规律公式()表示,观测得时间()时的电压()如下表所示:试求电压对时间的回归方程。例10为了探究患慢性气管炎是否与吸烟有关,调查了名岁以上的人,调查结果如下表所示:患病不患病合计吸烟不吸烟合计试问:岁以上的人患慢性气管炎与吸烟习惯有关吗?例11甲乙两个班级进行一门考试,按照学生考试成绩优秀和不优秀统计成绩后,得到如下的列联表:班级与成绩列联表优秀不优秀总计甲班乙班总计(1)画出列联表的条形图,并通过图形判断成绩与班级是否有关;(2)利用列联表的独立性检验估计,认为“成绩与班级有关系”犯错误的概率是多少?例12为考察某种药物预防疾病的效果,进行动物试验,得到如下的列联列表:药物效果与动物试验列联表患病未患病总计服用药没服用药总计请问能有多大把握认为药物有效?例13在一次恶劣气候的飞行航程中调查男女乘客在机上晕机的情况如下表所示,根据此资料你是否认为在恶劣气候中男人比女人更容易晕机?晕机不晕机总计男人女人总计

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 习题/试题

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号