正态分布,线性回归

上传人:wm****3 文档编号:41111400 上传时间:2018-05-28 格式:DOC 页数:6 大小:214KB
返回 下载 相关 举报
正态分布,线性回归_第1页
第1页 / 共6页
正态分布,线性回归_第2页
第2页 / 共6页
正态分布,线性回归_第3页
第3页 / 共6页
正态分布,线性回归_第4页
第4页 / 共6页
正态分布,线性回归_第5页
第5页 / 共6页
点击查看更多>>
资源描述

《正态分布,线性回归》由会员分享,可在线阅读,更多相关《正态分布,线性回归(6页珍藏版)》请在金锄头文库上搜索。

1、正态分布、线性回归正态分布、线性回归一、 知识梳理知识梳理 1正态分布的重要性正态分布的重要性正态分布是概率统计中最重要的一种分布,其重要性我们可以从以下两方面来理解:一方面,正态分 布是自然界最常见的一种分布。一般说来,若影响某一数量指标的随机因素很多,而每个因素所起的作用 都不太大,则这个指标服从正态分布。2正态曲线及其性质正态曲线及其性质正态分布函数:,x(-,+)22()21( )2x f xe 3标准正态曲线标准正态曲线标准正态曲线 N(0,1)是一种特殊的正态分布曲线,以及标准正态总体在任一00()1()xx 区间(a,b)内取值概率。)()(abP4一般正态分布与标准正态分布的转

2、化一般正态分布与标准正态分布的转化由于一般的正态总体其图像不一定关于y 轴对称,对于任一正态总体,其取值小于),(2N),(2Nx 的概率。只要会用它求正态总体在某个特定区间的概率即可。)()(xxF),(2N5 “小概率事件小概率事件”和假设检验的基本思想和假设检验的基本思想 “小概率事件”通常指发生的概率小于 5%的事件,认为在一次试验中该事件是几乎不可能发生的。这 种认识便是进行推断的出发点。关于这一点我们要有以下两个方面的认识:一是这里的“几乎不可能发生” 是针对“一次试验”来说的,因为试验次数多了,该事件当然是很可能发生的;二是当我们运用“小概率 事件几乎不可能发生的原理”进行推断时

3、,我们也有 5%的犯错误的可能。 课本是借助于服从正态分布的有关零件尺寸的例子来介绍假设检验的基本思想。进行假设检验一般分 三步:第一步,提出统计假设。课本例子里的统计假设是这个工人制造的零件尺寸服从正态分布;),(2N第二步,确定一次试验中的取值 a 是否落入范围(-3,+3) ;第三步,作出推断。如果 a(-3,+3) ,接受统计假设;如果,由于这)3,3(a 是小概率事件,就拒绝统计假设。6相关关系相关关系研究两个变量间的相关关系是学习本节的目的。对于相关关系我们可以从下三个方面加以认识:相 关关系与函数关系不同。函数关系中的两个变量间是一种确定性关系。相关关系是一种非确定性关系,即 相

4、关关系是非随机变量与随机变量之间的关系。 函数关系是一种因果关系,而相关关系不一定是因果 关系,也可能是伴随关系。 函数关系与相关关系之间有着密切联系,在一定的条件下可以相互转化。 7回归分析回归分析本节所研究的回归分析是回归分析中最简单,也是最基本的一种类型一元线性回归分析。对于线性回归分析,我们要注意以下几个方面:回归分析是对具有相关关系的两个变量进行统计分析的方法。两个变量具有相关关系是回归分析的前 提。散点图是定义在具有相关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在 图上看它们有无关系,关系的密切程度,然后再进行相关回归分析。求回归直线方程,首先应注意到,只有在散

5、点图大至呈线性时,求出的回归直线方程才有实际意义, 否则,求出的回归直线方程毫无意义。8相关系数相关系数有时散点图中的各点并不集中在一条直线的附近,仍可以按照求回归直线方程的步骤求得回归直线方 程。显然这种情形下求得的回归直线方程没有实际意义。那么,在什么情况下求得的回归直线方程才能对 相应的一组观测数据具有代表意义?课本中不加证明地给出了相关系数的公式。相关系数公式的作用在于, 我们对一组数据之间的线性相关程度可作出定量的分析,而不是仅凭画出散点图,直觉地从散点图的形状 粗浅地得出数据之间的线性相关程度。9线性相关性检验线性相关性检验相关性检验是一种假设检验,它给出了一个具体检验 y 与 x

6、 之间线性相关与否的具体办法。限于要求,中学阶段只要求掌握这种检验方法的操作步骤,而不要求对这种方法包含的原理进行深入研究。其具体检 验的步骤如下:在课本中的附表 3 中查出与显著性水平 0.05 与自由度 n-2(n 为观测值组数)相应的相关系数临界值 。05. 0r根据公式计算 r 的值。 niniiiniiiynyxnxyxnyx r1212221)(检验所得结果。如果,那么可以认为 y 与 x 之间的线性相关关系不显著,从而接受统计假05. 0|rr 设。如果,表明一个发生的概率不到 5%的事件在一次试验中竟发生了。这个小概率事件的发生使05. 0|rr 我们有理由认为 y 与 x 之

7、间不具有线性相关关系的假设是不成立的,拒绝这一统计假设也就是表明可以认 为 y 与 x 之间具有线性相关关系。二、基础训练二、基础训练 1.如果随机变量N(,2) ,且 E=3,D=1,则 P(11等于 BA.2(1)1 B.(4)(2) C.(2)(4) D.(4)(2) 2. 随机变量服从正态分布 N(0,1) ,如果 P(0 时,f(x)为减函数. 【例 2】一投资者在两个投资方案中选择一个,这两个投资方案的利润 x(万元)分别服从正态分布 N(8,32)和 N(6,22) ,投资者要求利润超过 5 万元的概率尽量地大,那么他应选择哪一个方案?解:对第一个方案,有 xN(8,32) ,于

8、是 P(x5)=1P(x5)=1F(5)=1()385 =1(1)=11(1)=(1)=0.8413.对第二个方案,有 xN(6,22) ,于是 P(x5)=1P(x5)=1F(5)=1()265 =1(0.5)=(0.5)=0.6915. 相比之下, “利润超过 5 万元”的概率以第一个方案为好,可选第一个方案.【例 3】设,且总体密度曲线的函数表达式为:,xR。 ),(2NX412221)(xx exf求 ,;求及的值。)2|1(|xP)22121 (xP【例 4】公共汽车门的高度是按照确保 99%以上的成年男子头部不跟车门顶部碰撞设计的,如果某地成 年男子的身高 N(173,7) (单位

9、:cm) ,问车门应设计多高(精确到 1cm)? 解:设公共汽车门的设计高度为 x cm,由题意,需使 P(x)1%.N(173,72) ,P(x)=()0.99.7173x查表得2.33,x189.31,即公共汽车门的高度应设计为 190 cm,可确保 99%以上的成年男7173x子头部不跟车门顶部碰撞.四、同步练习四、同步练习 g3.1100 正态分布、线性回归正态分布、线性回归 1已知从某批材料中任取一件时,取得的这件材料的强度 N(200,18) ,则取得的这件材料的强度不 低于 180 的概率为( )A0.9973 B0.8665 C0.8413 D0.81592已知连续型随机变量

10、x 的概率密度函数是 b x0bxaA a x0 )(xf其中常数 A0,则 A 的值为( )A1 Bb C Db-aab 13某工厂某产品产量 x(千件)与单位成本 y(元)满足回归直线方程,则以下说法中xy82. 136.77 正确的是( ) A产量每增加 1000 件,单位成本下降 1.82 元 B产量每减少 1000 件,单位成本上升 1.82 元 C产量每增加 1000 件,单位成本上升 1.82 元 D产量每减少 1000 件,单位成本下降 1.82 元4工人月工资(元)依劳动生产率(千元)变化的回归方程为,下列判断正确的是xy9060 ( ) A劳动生产率为 1000 元时,工资

11、为 150 元 B劳动生产率提高 1000 元时,工资提高 150 元 C劳动生产率提高 1000 元时,工资提高 90 元 D劳动生产率为 1000 元时,工资为 90 元 5若随机变量 N(5,2) ,且 P(a)=0.9,则 a=_。6已知连续型随机变量 x 的分布函数为: 21 a1x0ax 0 )(xxf其他则 a=_,_。)23(xP7设随机变量 服从 N(0,1) ,求下列各式的值:(1)P(2.55); (2)P(-1.44); (3)P(|1.52)。 8某厂生产的圆柱形零件的外径 N(4,0.25) 。质检人员从该厂生产的 1000 件零件中随机抽查一件, 测得它的外径为

12、5.7cm。试问该厂生产的这批零件是否合格?9现随机抽取了我校 10 名学生在入学考试中的数学成绩(x)与入学后的第一次考试中的数学成绩(y) , 数据如下: 学生号12345678910 x12010811710410311010410599108 y84648468696869465771 试问这 10 个学生的两次数学考试成绩是否具有显著性线性相关关系?10某工业部门进行一项研究,分析该部门的产量与生产费用之间的关系,从这个工业部门内随机抽取选 了 10 个企业作样本,有如下资料: 产量(千件)40424855657988100120140 生产费用(千元)150140160170150

13、162185165190185完成下列要求:(1)计算 x 与 y 的相关系数;(2)对这两个变量之间是否线性相关进行相关性检验;(3)设回归直线方程为,求系数 a,b。abxy同步练习(参考答案):同步练习(参考答案):1B 2C 3A 4C 56.52 6,32a32)23(xP提示: 5因为 N(5,2) ,查表知,解得 a=6.52。9 . 0)25()(aaP28. 125a6由解得,即为图中阴影部分的面积。1) 12(121aa32a)23( xP327分析分析 一个随机变量若服从标准正态分布,可以借助于标准正态分布表,查出其值。但在标准正态 分布表中只给出了,即的情形,对于其它情

14、形一般用公式:(-x)=1-(x);00x)()(00xxxPp(axb)= (b)- (a)及等来转化。)(1)(00xxPxxP解解 (1))55. 2(1)55. 2(PP;0054. 09946. 01)55. 2(1(2))44. 1 (1)44. 1()44. 1(P;0749. 09251. 01(3)1)52. 1 (2)52. 1()52. 1 ()52. 152. 1()52. 1|(|PP8714. 019357. 02说明说明 从本例可知,在标准正态分布表中只要给出了的概率,就可以利用上述三个公式求出其00x它情形下的概率。8分析分析 欲判定这批零件是否合格,由假设检验基本思想可知,关键是看随机抽查的一件产品的尺寸 是在(-3,+3)内,还是在(-3,+3)之外。解解 由于圆柱形零件的外径 N(4,0.25) ,由正态分布的特征可知,正态分布 N(4,0.25)在区间 (4-30.5,4+30.5)即(2.5,5.5)之外取值的概率只有 0.003,而,这说明在一次试验中,出)5 . 5 , 5 . 2(7 . 5 现了几乎不可能发生的小概率事件,根据统计中假设检验的基

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号