正态分布线性回归

上传人:壹****1 文档编号:431898783 上传时间:2022-12-25 格式:DOCX 页数:8 大小:59.62KB
返回 下载 相关 举报
正态分布线性回归_第1页
第1页 / 共8页
正态分布线性回归_第2页
第2页 / 共8页
正态分布线性回归_第3页
第3页 / 共8页
正态分布线性回归_第4页
第4页 / 共8页
正态分布线性回归_第5页
第5页 / 共8页
点击查看更多>>
资源描述

《正态分布线性回归》由会员分享,可在线阅读,更多相关《正态分布线性回归(8页珍藏版)》请在金锄头文库上搜索。

1、正态分布、线性回归一、 知识梳理1正态分布的重要性 正态分布是概率统计中最重要的一种分布,其重要性我们可以从以下两方面来理解:一方面,正态分布 是自然界最常见的一种分布。一般说来,若影响某一数量指标的随机因素很多,而每个因素所起的作用都不 太大,则这个指标服从正态分布。2正态曲线及其性质1_ (x-l )2正态分布函数:f (x)=e 2。2 , xU(-8, +8)2兀Q3. 标准正态曲线标准正态曲线N (0, 1)是一种特殊的正态分布曲线,(_x ) = 1-(x ),以及标准正态总体在任一00区间(a, b)内取值概率P = O (b)-(a)。4. 一般正态分布与标准正态分布的转化由于

2、一般的正态总体N (卩,Q 2)其图像不一定关于y轴对称,对于任一正态总体N (卩,Q 2),其取值小于x 的概率F (x)=(兰二比)。只要会用它求正态总体N (卩,Q 2)在某个特定区间的概率即可。Q5. “小概率事件”和假设检验的基本思想“小概率事件”通常指发生的概率小于 5%的事件,认为在一次试验中该事件是几乎不可能发生的。这 种认识便是进行推断的出发点。关于这一点我们要有以下两个方面的认识:一是这里的“几乎不可能发生” 是针对“一次试验”来说的,因为试验次数多了,该事件当然是很可能发生的;二是当我们运用“小概率事 件几乎不可能发生的原理”进行推断时,我们也有5%的犯错误的可能。课本是

3、借助于服从正态分布的有关零件尺寸的例子来介绍假设检验的基本思想。进行假设检验一般分三I H步:第一步,提出统计假设。课本例子里的统计假设是这个工人制造的零件尺寸服从正态分布N (卩,Q 2); 第二步,确定一次试验中的取值a是否落入范围(p -30 , p +30 );第三步,作出推断。如果aU(p -30,p +30 ),接受统计假设;如果a电(y- 3o ,卩+ 3o ),由于这 是小概率事件,就拒绝统计假设。6. 相关关系研究两个变量间的相关关系是学习本节的目的。对于相关关系我们可以从下三个方面加以认识:(1)相关 关系与函数关系不同。函数关系中的两个变量间是一种确定性关系。相关关系是一

4、种非确定性关系,即相关 关系是非随机变量与随机变量之间的关系。函数关系是一种因果关系,而相关关系不一定是因果关系, 也可能是伴随关系。函数关系与相关关系之间有着密切联系,在一定的条件下可以相互转化。7. 回归分析 本节所研究的回归分析是回归分析中最简单,也是最基本的一种类型一元线性回归分析。对于线性回归分析,我们要注意以下几个方面:回归分析是对具有相关关系的两个变量进行统计分析的方法。两个变量具有相关关系是回归分析的前提。散点图是定义在具有相关系的两个变量基础上的,对于性质不明确的两组数据,可先作散点图,在图 上看它们有无关系,关系的密切程度,然后再进行相关回归分析。求回归直线方程,首先应注意

5、到,只有在散点图大至呈线性时,求出的回归直线方程才有实际意义, 否则,求出的回归直线方程毫无意义。8. 相关系数有时散点图中的各点并不集中在一条直线的附近,仍可以按照求回归直线方程的步骤求得回归直线方 程。显然这种情形下求得的回归直线方程没有实际意义。那么,在什么情况下求得的回归直线方程才能对相 应的一组观测数据具有代表意义?课本中不加证明地给出了相关系数的公式。相关系数公式的作用在于,我 们对一组数据之间的线性相关程度可作出定量的分析,而不是仅凭画出散点图,直觉地从散点图的形状粗浅 地得出数据之间的线性相关程度。9. 线性相关性检验相关性检验是一种假设检验,它给出了一个具体检验y与x之间线性

6、相关与否的具体办法。限于要求, 中学阶段只要求掌握这种检验方法的操作步骤,而不要求对这种方法包含的原理进行深入研究。其具体检验 的步骤如下:在课本中的附表3中查出与显著性水平0.05与自由度n-2 (n为观测值组数)相应的相关系数临界值r。n乙 x y -nxyii计算 r 的值。0.05根据公式r=二(为 x2 - nx2)(为 y 2 - n y 2)ii检验所得结果。如果I r l r ,表明一个发生的概率不到5%的事件在一次试验中竟发生了。这个小概率事件的发生使我们0.05有理由认为y与x之间不具有线性相关关系的假设是不成立的,拒绝这一统计假设也就是表明可以认为y与 x之间具有线性相关

7、关系。二、基础训练1.如果随机变量N (A.20(1)1C.0(2)0(4)/ , O 2),且 E =3, D =1,则 P ( 1 1 =等于 B B.0(4)0(2) D.0(4)0(2)2.随机变量服从正态分布N(0,1),如果P ( 1)=0.8413,则P ( 1 0)=三、例题剖析【例1】将温度调节器放置在贮存着某种液体的容器内,调节器设定在d C,液体的温度 (单位:C) 是一个随机变量,且N (d,0.52).(1) 若d=90,求 89的概率;(2) 若要保持液体的温度至少为80 C的概率不低于0.99,问d至少是多少?(其中若。N (0,1),则 (2) =P (n 2)

8、 =0.9772, 0 (2.327) =P (n 2.327) =0.01).剖析:(1)要求P ( 89) =F (89),N (d,0.5)不是标准正态分布,而给出的是0 (2),0 (2.327),故需转化为标准正态分布的 数值.(2)转化为标准正态分布下的数值求概率p,再利用p三0.99,解d.解:(1) P ( 89) =F (89) =0 ( 89 - 90 ) =0 (2) =1 0 (2) =10.9772=0.0228.0.5(2)由已知d满足0.99WP (三80),即 1P ( 80)三 1 0.01,.P ( v80)W0.01.0 (翌二A ) 0.01=0 (2.

9、327).0.5. 80 2.327.0.5. d81.1635.故d至少为81.1635.评述:(1)若N(0,1),贝町=N(0, 1) . (2)标准正态分布的密度函数f (x)是偶函数,x0时,f (x)为减函数.【例2】一投资者在两个投资方案中选择一个,这两个投资方案的利润x (万兀)分别服从正态分布N (8, 32)和N (6, 22),投资者要求利润超过5万元的概率尽量地大,那么他应选择哪一个方案?解:对第一个方案,有xN (8, 32),于是 P (x5) =1P (x5) =1 P (xW5) =1F (5) =1 ( - ) =1一(20.5) =0 (0.5) =0.69

10、15.2- 2 x + 14, xUR。求相比之下, “利润超过5 万元”的概率以第一个方案为好,可选第一个方案.【例3】设X N (卩Q 2),且总体密度曲线的函数表达式为:f (x) = e2*兀M , O ;求p(| x - 11:2)及P(1 蓄2 x 0.99.7查表得x - 173 2.33,.x189.31,即公共汽车门的高度应设计为190 cm,可确保99%以上的成年男 7子头部不跟车门顶部碰撞.四、同步练习 g3.1100 正态分布、线性回归1. 已知从某批材料中任取一件时,取得的这件材料的强度:N (200, 18),则取得的这件材料的强度不低 于 180 的概率为( )A

11、. 0.9973 B. 0.8665C. 0.8413D. 0.81590 x a2. 已知连续型随机变量x的概率密度函数是f (x) = A a x b其中常数A0,则A的值为A. 1B. bC.1b-aD. b-a3. 某工厂某产品产量x (千件)与单位成本y (元)满足回归直线方程y = 77.36 - 1.82x,则以下说法中正 确的是()A. 产量每增加1000件,单位成本下降1.82元B. 产量每减少1000件,单位成本上升1.82元C. 产量每增加1000件,单位成本上升1.82元D. 产量每减少1000件,单位成本下降1.82元4. 工人月工资(元)依劳动生产率(千元)变化的回

12、归方程为y = 60 + 90x,下列判断正确的是()A. 劳动生产率为1000元时,工资为150元B. 劳动生产率提高1000元时,工资提高150元C. 劳动生产率提高1000元时,工资提高90元D. 劳动生产率为1000元时,工资为90元5. 若随机变量 N (5, 2),且 P(a)=0.9,则 a=。 0 其他6. 已知连续型随机变量x的分布函数为:f (x) = ax 0 x 1a 1 x 23贝 Ia=, P (x ) =。27. 设随机变量 服从 N(0, 1),求下列各式的值:(1) P( 三2.55);(2) P(-1.44);(3) P(|s |1.52)。8. 某厂生产的

13、圆柱形零件的外径 N(4, 0.25)。质检人员从该厂生产的 1000 件零件中随机抽查一件测得它的外径为5.7cm。试问该厂生产的这批零件是否合格?9.现随机抽取了我校10名学生在入学考试中的数学成绩(x)与入学后的第一次考试中的数学成绩(y), 数据如下:学生号12345678910x12010811710410311010410599108y84648468696869465771试问这10个学生的两次数学考试成绩是否具有显著性线性相关关系?10.某工业部门进行一项研究,分析该部门的产量与生产费用之间的关系,从这个工业部门内随机抽取选了10个企业彳产量(千件)40424855657988100120140生产费用(千元)150140160170150162185165190185完成下列要求:( 1 )计算 x 与 y 的相关系数;(2)对这两个变量之间是否线性相关进行相关性检验(3)设回归直线方程为y? = bx + a,求系数a, b。同步练习(参考答案):

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号