高中数学复习学案(第72讲) 正态分布和线性回归

上传人:小** 文档编号:57509987 上传时间:2018-10-22 格式:DOC 页数:10 大小:425.52KB
返回 下载 相关 举报
高中数学复习学案(第72讲) 正态分布和线性回归_第1页
第1页 / 共10页
高中数学复习学案(第72讲) 正态分布和线性回归_第2页
第2页 / 共10页
高中数学复习学案(第72讲) 正态分布和线性回归_第3页
第3页 / 共10页
高中数学复习学案(第72讲) 正态分布和线性回归_第4页
第4页 / 共10页
高中数学复习学案(第72讲) 正态分布和线性回归_第5页
第5页 / 共10页
点击查看更多>>
资源描述

《高中数学复习学案(第72讲) 正态分布和线性回归》由会员分享,可在线阅读,更多相关《高中数学复习学案(第72讲) 正态分布和线性回归(10页珍藏版)》请在金锄头文库上搜索。

1、题目题目 http:/ (选修选修)第一章概率与统计第一章概率与统计 http:/ 线性回归线性回归 高考要求高考要求 http:/ 1.了解正态分布的意义及主要性质 http:/ 2.了解线性回归的方法和简单应用 http:/ 知识点归纳知识点归纳 http:/ 1正态分布密度函数:, (0,-x)22()21( )2x f xe 其中 是圆周率;e 是自然对数的底;x 是随机变量的取值; 为正态分布的均值; 是正态分布的标准差.正态分布一般记为 ),(2N2正态分布)是由均值 和标准差 唯一决定的分布),(2N3正态曲线的性质 :正态分布由参数 、 唯一确定,如果随机变量N(,2),根据定

2、义有:=E,=D。 正态曲线具有以下性质: (1)曲线在x轴的上方,与x轴不相交。 (2)曲线关于直线x = 对称。 (3)曲线在x = 时位于最高点。 (4)当x 时,曲线下降。并且当曲线向左、右两边无限 延伸时,以x轴为渐近线,向它无限靠近。 (5)当 一定时,曲线的形状由 确定。 越大,曲线越“矮胖” ,表示总体越分散; 越小,曲线越“瘦高” ,表示总体的分布越集中。 五条性质中前三条较易掌握,后两条较难理解,因此应运用数形结合的原则,采用对比 教学 4标准正态曲线:当 =0、=l 时,正态总体称为标准正态总体,其相应的函数表示式是, (-x+)2221)(x exf其相应的曲线称为标准

3、正态曲线 标准正态总体 N(0,1)在正态总体的研究中占有重要的地位任何正态分布的概率问题 均可转化成标准正态分布的概率问题 5.标准正态总体的概率问题: x准 准 准 准 准 准 准 准f x = 1 2e-x2 2 xy对于标准正态总体 N(0,1) ,是总体取值小于的概率,)(0x0x即 ,)()(00xxPx其中,图中阴影部分的面积表示为概率只要有标准正态分布表即可查表解00x0()P xx决.从图中不难发现:当时,;而当时,(0)=0.5 00x)(1)(00xx00x6.标准正态分布表标准正态总体在正态总体的研究中有非常重要的地位,为此专门制作了) 1 , 0(N“标准正态分布表

4、”在这个表中,对应于的值是指总体取值小于的概0x)(0x0x率,即 ,)()(00xxPx)0(0x若,则00x)(1)(00xx利用标准正态分布表,可以求出标准正态总体在任意区间内取值的概率,),(21xx即直线,与正态曲线、x轴所围成的曲边梯形的面积1xx 2xx 1221()()()P xxxxx 7非标准正态总体在某区间内取值的概率:可以通过转化成标准正态)()(xxF总体,然后查标准正态分布表即可在这里重点掌握如何转化首先要掌握正态总体的均值和标 准差,然后进行相应的转化 8.小概率事件的含义:发生概率一般不超过 5的事件,即事件在一次试验中几乎不可 能发生 假设检验方法的基本思想:

5、首先,假设总体应是或近似为正态总体,然后,依照小概率 事件几乎不可能在一次试验中发生的原理对试验结果进行分析 假设检验方法的操作程序,即“三步曲”一是提出统计假设,教科书中的统计假设总体是正态总体; 二是确定一次试验中的 a 值是否落入(-3,+3); 三是作出判断 9相关关系:当自变量一定时,因变量的取值带有一定的随机性的两个变量之间的关系称为相关关系 相关关系与函数关系的异同点如下: 相同点:均是指两个变量的关系 不同点:函数关系是一种确定的关系;而相关关系是一种非确定关系;函数关系是自变 量与因变量之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随 机变量的关系 10

6、回归分析一元线性回归分析: 对具有相关关系的两个变量进行统计分析的方法叫做 回归分析通俗地讲,回归分析是寻找相关关系中非确定性关系的某种确定性 对于线性回归分析,我们要注意以下几个方面:(1)回归分析是对具有相关关系的两个变量进行统计分析的方法。两个变量具有相关 关系是回归分析的前提。(2)散点图是定义在具有相关系的两个变量基础上的,对于性质不明确的两组数据, 可先作散点图,在图上看它们有无关系,关系的密切程度,然后再进行相关回归分析。 (3)求回归直线方程,首先应注意到,只有在散点图大至呈线性时,求出的回归直线 方程才有实际意义,否则,求出的回归直线方程毫无意义。 11散点图:表示具有相关关

7、系的两个变量的一组数据的图形叫做散点图.散点图形象 地反映了各对数据的密切程度粗略地看,散点分布具有一定的规律 12. 回归直线设所求的直线方程为,其中 a、b 是待定系数, abxy, ,1122211()()()nniiii ii nnii iixxyyx ynxy b xxxnxaybx niixnx11 niiyny11相应的直线叫做回归直线,对两个变量所进行的上述统计分析叫做回归分析 13.相关系数:相关系数是因果统计学家皮尔逊提出的,对于变量 y 与 x 的一组观测值, 把= niniiiniiiyyxxyyxx r11221)()()(niniiiniiiynyxnxyxnyx1

8、122221)(叫做变量 y 与 x 之间的样本相关系数,简称相关系数,用它来衡量两个变量之间的线性相 关程度. 14.相关系数的性质: 1,且越接近 1,相关程度越大;且越接近 0,相关程rrr度越小. 15.显著性水平:显著性水平是统计假设检验中的一个概念,它是公认的小概率事件的概 率值它必须在每一次统计检验之前确定 16. 显著性检验:(相关系数检验的步骤)由显著性水平和自由度查表得出临界值,显著 性水平一般取 0.01 和 0.05,自由度为,其中是数据的个数在“相关系数检验的临 界值表”查出与显著性水平 0.05 或 0.01 及自由度 n-2(n 为观测值组数)相应的相关数临 界值

9、 r0 05或 r0 01;例如时,0.050.754,0.010.874 求得的相关系数和临界值0.05比较,若0.05,上面与是线性相关的,当r0 05或 r0 01,认为线性关系不r显著 讨论若干变量是否线性相关,必须先进行相关性检验,在确认线性相关后,再求回归直 线;通过两个变量是否线性相关的估计,实际上就是把非确定性问题转化成确定性问题来研 究;我们研究的对象是两个变量的线性相关关系,还可以研究多个变量的相关问题,这在今 后的学习中会进一步学到 题型讲解题型讲解 http:/ 例例 1 已知连续型随机变量 的概率密度函数,且 f(x) 0,求常数 k 的值,并计算概率 P(1.50

10、时,f(x)为减函数. 例例 5 在实际生活中,常用统计中假设检验的思想检验产品是否合格,方法是: (1)提出统计假设:某种指标服从正态分布 N(,2) ;(2)确定一次试验中的取值 a; (3)作出统计推断:若 a(3,+3) ,则接受假设,若 a(3,+3) ,则拒绝假设. 某砖瓦厂生产的砖的“抗断强度”服从正态分布N(30,0.8) ,质检人员从该厂某一天 生产的1000 块砖中随机抽查一块,测得它的抗断强度为 27.5 kg/cm2,你认为该厂这天生产的 这批砖是否合格?为什么? 解:由于在一次试验中落在区间(3,+3)内的概率为 0.997,故几乎 必然落在上述区间内. 于是把=30

11、,=0.8 代入, 算出区间(3,+3)=(27.6,32.4) , 而 27.5(27.6,32.4).据此认为这批砖不合格. 例例 6 已知测量误差N(2,100) (cm) ,必须进行多少次测量,才能使至少有一次 测量误差的绝对值不超过 8 cm 的频率大于 0.9? 解:设表示 n 次测量中绝对误差不超过 8 cm 的次数,则B(n,p).其中 P=P(|0.9,n 应满足 P(1)=1P(=0)=1(1p)n0.9,n=2.75.)5671. 01lg()9 . 01lg( 4329. 0lg1因此,至少要进行3 次测量,才能使至少有一次误差的绝对值不超过8 cm 的概率大于0.9.

12、 例例 7 已知某地每单位面积菜地年平均使用氮肥量 xkg 与每单位面积蔬菜年平均产量 yt 之间的关系有如下数据: 年份19851986198719881989199019911992 x(kg)7074807885929095 y(t)5.16.06.87.89.010.210.012.0年份1993199419951996199719981999 x(kg)92108115123130138145 y(t)11.511.011.812.212.512.813.0(1)求 x 与 y 之间的相关系数,并检验是否线性相关;(2)若线性相关,求蔬菜产量 y 与使用氮肥量之间的回归直线方程,并估

13、计每单位面积 施肥 150kg 时,每单位面积蔬菜的年平均产量。分析:分析:(1)使用样本相关系数计算公式来完成;(2)查表得出显著性水平 0.05 与自由 度 15-2 相应的相关系数临界比较,若则线性相关,否则不线性相关。05. 0r05. 0rr 解:解:(1)列出下表,并用科学计算器进行有关计算:i123456789101112131415ix707480788592909592108115123130138145iy5.1 6.06.87.89.010.2 10.0 12.011.511.011.812.212.512.813.0iiyx357 444 544 608.4 765 9

14、38.4 900 1140 1058 1188 1357 1500.6 1625 1766.4 1885,101151515x11.10157 .151y,。1611251512 iix55.16281512 iiy8 .16076151 iiiyx故蔬菜产量与放用氮肥量的相关系数。8643. 0 )11.101555.1628)(10115161125(11.10101158 .1607622 r由于 n=15,故自由度 15-2=13。 由相关系数检验的临界值表查出与显著水平 0.05 及自由度 13 相关系数临界值 ,则,514. 005. 0r05. 0rr 从而说明蔬菜产量与氮肥量之间存在着线性相关关系。(2)设所求的回归直线方程为,则abxy,0937. 01011516112511.10101158 .160761515221512151 xxyxyx biiiii,6463. 01010937. 011.10xbya回归直线方程为。)(701.146463. 00937. 0txy点评:点评:求解两个变量的相关系数及它们的回归直线方程的计算量较大,需要细心、谨慎地计算。如果会使用含统计的科学计算器,能

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号