[理学]第十三讲-曲线回归

上传人:油条 文档编号:49728482 上传时间:2018-08-01 格式:PPT 页数:51 大小:6.42MB
返回 下载 相关 举报
[理学]第十三讲-曲线回归_第1页
第1页 / 共51页
[理学]第十三讲-曲线回归_第2页
第2页 / 共51页
[理学]第十三讲-曲线回归_第3页
第3页 / 共51页
[理学]第十三讲-曲线回归_第4页
第4页 / 共51页
[理学]第十三讲-曲线回归_第5页
第5页 / 共51页
点击查看更多>>
资源描述

《[理学]第十三讲-曲线回归》由会员分享,可在线阅读,更多相关《[理学]第十三讲-曲线回归(51页珍藏版)》请在金锄头文库上搜索。

1、曲曲 线线 拟拟 合合内容提要内容提要: 第第 十十 三三 讲讲 非线性回归分析法 二维离散型随机变量的分布二维离散型随机变量的分布 曲线估计法例:将大白鼠置于不同的缺氧程度的条件下,经 相同剂量的放射线照射后,检查其骨髓内的坏死 灶,见下表求拟合曲线并求极小点X 300 400 500 600 700 760Y 214.5 87.5 92.5 136.5 180.2 212X:缺氧程度(mmHg)Y:坏死灶(个50个视野)6 非线性回归曲线拟合:根据原资料的性质和实际数据所呈现的趋势,按适当的曲线类型估计出 最可能的曲线回归,使估计误差为最少或接近于最小。作用:1. 修匀 由于研究对象的个体

2、变异和抽样误差,根据实例资料所绘制的散点图一般难以全部通过同一条光滑曲线,通过对观察点的修匀将尽可能减少此变异和误差的影响,且曲线比原资料的观察点合理而稳定。2. 估计 由于个体变异和抽样误差的影响,与同一个x 值对应的若干y 值并不相同,而形成某种分布,而由x推算出的y(估计值),就是这些值在曲线回归中的均数。 3. 求极大值和极小值 此为拟合抛物线特有的用途曲线拟合的方法步骤:. 定曲线型根据专业知识(理论推导或以往经验),结 合散点图,选择适合的曲线类型注:所拟合的曲线只说明此资料的两变量间不不 能排除能排除是这种曲线关系,但不能肯定不能肯定它们就是这种 曲线关系. 直线化对呈曲线关系的

3、变量进行适当变换,使变换后的两个变量之间呈直线关系,称为直线化注:直线化既可以验证所确定的曲线型是否恰当,更便于用求直线方程的方法得到曲线回归方程除多项式曲线可不必经直线化外,其他几类曲线的拟合大多须经直线化曲线拟合的方法步骤:. 求曲线回归方程. 求估计值. 作曲线图. 作拟合优度检验曲线拟合的方法步骤:非线性回归:形式上是非线性的,而实质是线性的形式和实质都是非线性的)必须在医学上有实际意义;)曲线类型要考虑到资料本身的性质所提出 的要求进行曲线拟合时应注意:一、第一类非线性回归为未知参数。g (Y) 为随机变量Y的函数, 是 的函数,g 、 都是不含任何未知数的已知函数,第一类非线性回归

4、模型实质上是线性回归模型实质上是线性回归模型,因为回归模型的线性其实是指未知参数都是一次。1. 双曲线回归模型常见的回归模型 :(一元线性回归模型一元线性回归模型)令2. 对数回归模型(一元线性回归模型一元线性回归模型)3. 多项式回归模型(多元线性回归模型)二、第二类非线性回归模型常见的回归函数及常见拟合曲线图形 :1. 幂函数形式2. 指数函数形式2. 指数函数形式3. S曲线形式 散点图进行初步评判 可通过多种模型进行曲线拟合,选择一种最好 的拟合曲线四、拟合曲线的选择 曲线拟合通过变量的适当变换利用一元或多元正态回归模型分析得出经验曲线方程的方法。1. 线性回归效果显著性检验 若 则线

5、性回归效果显著。2. 回归效果显著前提下,可决系数越大则回归效果越好1) 拟合残差无差异,选可决系数大者2)拟合残差有差异,选拟合残差小者3. 拟合残差:无差异用来检验 拟合效果两条曲线的比较:要求可决系数大同时拟合残差小;如果可决系数 大的拟合残差也大,则需要对拟合残差进行比较:例6.6.1 某医院测定正常孕妇不同孕周(GA, X )羊水内的甲胎蛋白含量 (AFP, Y )如下表,试建立二者之间的关系式。X 1 2 3 4 5 15 Y 19250 17420 12360 11270 7310 305(具体数据见 P175 )1. 描点获得散点图:2. 数据输入格式如下:15行2列3. SP

6、SS程序选择 我们采用曲线参数估计法做多种曲线拟和。 Analyze Regression Curve Estimation 选择连续变量甲胎蛋白为因变量(dependent), 孕周为自变量 (independent)。如果需要 显示方差 分析表和 图形,可 以选择Linear: 一元线性Quadratic: 二次函数Growth: 生长函数Logarithmic: 对数函数Cubic: 三次函数S: S形曲线 Exponential: 指数函数Inverse: 逆函数Power: 幂函数compound: 混合函数Logistic: Logistic曲线点击Save,将所需内容保存在数据编

7、辑窗中:选择因变量的预测值、残差值拟合残差 平方和:预测值预测值4. 主 要 结 果 :转化为线 性方程后 的残差转化为线 性方程后 的残差指数方程 预测值将甲胎 蛋白取 对数线性方 程预测 值误差1.2069曲线回归中给出的残差值:残差平方和拟合结果(图形):三次方程拟合结果:三次方程拟合结果(图形): 亦可采用非线性回归分析法 :方程建立:参数输入系数初值输入令:结 果:例:某出租汽车公司随着出租车数量的增加,每年 发生交通事故的次数也在增加,收集到的损失资料 如下。要求预测出租车数量增加时,每年发生损失 额的变化情况。年损失额的原始数据年份 1988 1989 1990 1991 199

8、2 1993 1994 1995 1996 1997 数量 40 42 48 55 65 79 88 100 120 140损失额 3000 2800 3200 3400 3000 3240 3700 3300 3800 3700 二维离散型随机向量的联合分布与边际分布定义:如果 均为一维离散型随机变量 ,则二维随机向量称为二维离散型随机向量。设( )是一个二维离散型随机向量,它们的一切可取值为 , ,令称为 的联合概率分布。定义:性质:1边际分布边际分布概率分布概率分布注意:1、具体求解二维离散联合分布,必须知道两个随机变量的所有取值,然后求出所有组合发生的概率2、如果有 满足如上性质,一定

9、可构造一二维随机向量,使得其联合分布为1例:一盒子中装有2支过期针剂和3支未过期针剂, 现随意抽取两支(无放回),求两次所抽针剂情况 的联合分布和边际分布。分析:如果令第一次抽得过期针剂 第一次抽得未过期针剂第二次抽得过期针剂 第二次抽得未过期针剂需求: 的联合分布和边际分布有放回?类似随机事件的条件概率定义:二维离散型向量条件分布为在给定 条件下, 的条件分布。设分别表示 及 与则我们称的联合概率分布及边际分布。假设为在给定 条件下, 的条件分布。 随机向量的条件分布 随机变量的独立性离散性随机变量的独立性定义设有离散型向量可取的值分别为满足,如果对任何给定的 值 的条件分布 则称 相互独立。条件分布=边际分布1)用以判断 是否相互独立2)已知边际分布以及两变量独立,可构造一 联合分布条件概率的实际意义因结核致死病人中,男性呼吸系统致死率是否比女性高?11 003534 1319270 252实际死亡人数表实际要考察:485352238041571作业:习题六 7,8预习:第七章 列联表分析

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号