数学建模统计模型

上传人:xzh****18 文档编号:56890302 上传时间:2018-10-16 格式:PPT 页数:65 大小:1.53MB
返回 下载 相关 举报
数学建模统计模型_第1页
第1页 / 共65页
数学建模统计模型_第2页
第2页 / 共65页
数学建模统计模型_第3页
第3页 / 共65页
数学建模统计模型_第4页
第4页 / 共65页
数学建模统计模型_第5页
第5页 / 共65页
点击查看更多>>
资源描述

《数学建模统计模型》由会员分享,可在线阅读,更多相关《数学建模统计模型(65页珍藏版)》请在金锄头文库上搜索。

1、1,建立实际回归模型的过程,实际问题 设置指标变量 解释变量的重要性;不相关性;用相近的变量代替或几个指标复合;个数适当这个过程需反复试算 收集整理数据 时间序列数据:随机误差项的序列相关,如人们的消费习惯 横截面数据:随机误差项的异方差性,如居民收入与消费 样本容量的个数应比解释变量个数多 缺失值,异常值处理 构造理论模型 绘制 yi 与 xi 的样本散点图,如生产函数、投资函数、需求函数 估计模型参数最小二乘,偏最小二乘,主成分回归等,依靠软件. 模型检验统计检验和模型经济意义检验,从设置指标变量修改 模型运用 经济因素分析、经济变量控制、经济决策预测,2,线性回归实例选讲牙膏的销售量,1

2、. 问题,建立牙膏销售量与价格、广告投入之间的模型;,预测在不同价格和广告费用下的牙膏销售量.,收集了30个销售周期本公司牙膏销售量、价格、广告费用,及同期其他厂家同类牙膏的平均售价 .,3,明确问题一 牙膏的销售量,确定关系: 牙膏销售量价格、广告投入 内部规律复杂数据统计分析 常用模型回归模型数学原理软件 30个销售周期数据: 销售量、价格、广告费用、同类产品均价,4,2. 基本模型,y 公司牙膏销售量 x1其它厂家与本公司价格差 x2公司广告费用,解释变量 (回归变量, 自变量),被解释变量(因变量),多元回归模型,5,Matlab 统计分析,rcoplot(r,rint) 残差及其置信

3、区间作图 MATLAB7.0版本 s增加一个统计量: 剩余方差s2,statistics toolbox,解释变量:矩阵,显著性水平:0.05,系数估计值,置信区间,残差向量y-xb,置信区间,被解释变量:列,检验统计量:R2,F,p,x=,3. 模型求解,由数据 y,x1,x2估计,x=ones(size(x1),x1,x2,x2.2; b,bint,r,rint,stats=regress(y,x),程序,6,4. 结果分析, 故x22项显著,但可将x2保留在模型中,即:,y的90.54%可由模型确定、 F远超过F检验的临界值、 p远小于=0.05,显著性 :整体显著,x2 :2 置信区间

4、包含零点, 但右端点距零点很近x2 对因变量 y 的影响不太显著;,3 显著,7,控制价格差 x1=0.2元,投入广告费 x2=6.5 百万元,销售量预测区间为 7.8230,8.7636(置信度95%),上限用作库存管理的目标值,下限用来把握公司的现金流,若估计 x3=3.9,设定 x4=3.7,(百万支),销售量预测,价差x1=它厂价x3-公司价x4,估计x3,调整x4,控制x1,预测y,得,则可以 95%的把握知道销售额在 7.83203.7 29(百万 元)以上,8,5. 模型改进,x1和x2对y的影响独立,比较: 置信区间,R2,9,比较: 两模型销售量预测,控制价格差 x1=0.2

5、 元,投入广告费 x2=6.5 百万元,(百万支),区间 7.8230,8.7636,区间 7.8953,8.7592,(百万支),预测区间长度更短,略有增加,10,x2=6.5,x1=0.2,x1,x1,x2,x2,6. 比较:两模型 与x1, x2的关系,11,讨论:交互作用影响,价格差 x1=0.1 价格差 x1=0.3,广告投入y ( x2大于6百万元),价格差较小时 增加的速率更大,x2,价格优势y,价格差较小广告作用大,x1,x2,12,多元二项式回归,命令:rstool(x,y,model, alpha),13,完全二次多项式模型,MATLAB中有命令rstool直接求解,从输出

6、 Export 可得,鼠标移动十字线(或下方窗口输入)可改变x1, x2, 左边窗口显示预测值 及预测区间,Rstool(x,y,model,alpha,xname,yname),14,牙膏的销售量,建立统计回归模型的基本步骤,根据已知数据从常识和经验分析, 辅之以作图, 决定回归变量及函数形式(先取尽量简单的形式).,用软件(如MATLAB统计工具箱)求解.,对结果作统计分析: R2,F, p, s2是对模型整体评价,回归系数置信区间是否含零点检验其影响的显著性.,模型改进, 如增添二次项、交互项等.,对因变量进行预测.,15,非线性回归实例选讲酶促反应,问题,研究酶促反应(酶催化反应)中嘌

7、呤霉素(处理与否)对反应速度与底物(反应物)浓度之间关系的影响.,酶促反应 由酶作为催化剂催化进行的化学反应 生物体内的化学反应绝大多数属于酶促反应 酶促反应中酶作为高效催化剂使得反应以极快的速度(1031017倍)或在一般情况下无法反应的条件下进行 酶是生物体内进行各种化学反应最重要的因素,16,建立数学模型,反映该酶促反应的速度与底物浓度以及经嘌呤霉素处理与否之间的关系 设计了两个实验 酶经过嘌呤霉素处理 酶未经嘌呤霉素处理 实验数据:,方案,17,分析,酶促反应的基本性质 底物浓度较小时,反应速度大致与浓度成正比; 底物浓度很大、渐进饱和时,反应速度趋于固定值,数据分析,18,解决方案一

8、:线性化模型,经嘌呤霉素处理后实验数据的估计结果,对1 , 2非线性,19,线性化模型结果分析,x较大时,y有较大偏差,1/x较小时有很好的线性趋势, 1/x较大时出现很大的起落,线性化:参数估计时 x 较小(1/x很大)的数据控制了回归参数的确定 改进:非线性模型,20,beta的置信区间,回归分析:非线性,statistics toolbox,解释变量:矩阵,模型的函数M文件名,参数估计值,残差,参数初值,被解释变量:列,估计预测误差的Jacobi矩阵,解决方案二:非线性化模型,MATLAB 统计工具箱,21,beta,R,J = nlinfit (x,y,model,beta0),% b

9、eta的置信区间,MATLAB 统计工具箱,function y=f1(beta, x) y=beta(1)*x./(beta(2)+x);,x= = ; y= ; beta0=195.8027 0.04841; beta,R,J=nlinfit(x,y,f1,beta0); betaci=nlparci(beta,R,J); beta, betaci,beta0线性化模型估计结果,Matlab 程序,22,半速度点(达到最终速度一半时 的底物浓度 x 值 )为,o 原始数据 + 拟合结果,非线性模型结果分析,其他输出,命令nlintool 给出交互画面,最终反应速度为,给出交互画面 拖动画面

10、的十字线,得y的预测值和预测区间 画面左下方的Export 输出其它统计结果。 剩余标准差s= 10.9337,23,在同一模型中考虑嘌呤霉素处理的影响,用未经嘌呤霉素处理的模型附加增量的方法。,混合反应模型,x2示性变量:x2=1表示经过处理,x2=0表示未经处理,24,用nlinfit 和 nlintool命令 参数初值:基于对数据的分析,o 原始数据 + 拟合结果,估计结果和预测,剩余标准差s= 10.4000,2置信区间包含零点,表明2对因变量y的影响不显著,混合模型求解,25,简化的混合模型,估计结果和预测,简化的混合模型形式简单 参数置信区间不含零点,剩余标准差 s = 10.58

11、51,比一般混合模型略大,26,简化混合模型的预测区间较短,更为实用、有效.,预测区间为预测值 ,一般混合模型与简化混合模型预测比较.,结果分析,27,酶促反应,评注,注:非线性模型拟合程度的评价无法直接利用线性模型的方法,但R2 与s仍然有效。,反应速度与底物浓度的关系,非线性关系,求解线性模型,求解非线性模型,嘌呤霉素处理与否对反应速度与底物浓度关系的影响,混合模型,简化模型,28,先用线性模型来简化参数估计,但由于变量的代换已经隐含了误差扰动项的变换,因此,除非变换后的误差项仍具有常数方差,一般情况下我们还需要采用原始数据做非线性回归,而把线性化模型的参数估计结果作为非线性模型参数估计的

12、迭代初值。,29,模型三 软件开发人员的薪金,薪金资历、岗位、学历 建立模型:分析人事策略的合理性,作为新聘用人员薪金的参考,资历 从事专业工作的年数;管理 1=管理人员,0=非管理人员;教育 1=中学,2=大学,3=更高程度,46名软件开发人员的档案资料,30,模型假设,假设: y 薪金,x1 资历(年)x2 = 1 管理人员,0 非管理人员,1 中学 2 大学 3 更高?,假设: 资历每加一年薪金的增长是常数;管理、教育、资历之间无交互作用,教育=,模型:线性回归,回归系数 随机误差,31,模型求解,x1资历(年) x2 = 1 管理,0 非管理 中学:x3=1, x4=0;大学:x3=0

13、, x4=1; 更高:x3=0, x4=0,Matlab程序: xinjindata.m xinjin.m,xinjindata.m:序号、工资y、资历x1、管理x2、学历、x3、x4、xx,xinjin.m : M=dlmread(xinjindata.m); x1=M(:,3);x2=M(:,4);x3=M(:,6);x4=M(:,7);y=M(:,2); x=ones(size(x1) x1 x2 x3 x4 b,bi,r,ri,s=regress(y,x),32,R2,F, p 模型整体上可用 资历增加1年薪金增长546 管理人员薪金多6883 中学程度薪金比更高的少2994 大学程度

14、薪金比更高的多148a4置信区间包含零点 解释不可靠!,结果,33,结果分析,残差分析法,残差, 与资历x1的关系,残差大概分成3个水平 6种管理教育组合混在一起,未正确反映,34, 与管理x2教育x3 、x4的关系,残差全为正,或全为负,管理教育组合处理不当,应在模型中增加管理x2与教育x3, x4的交互项,残差分析,35,模型改进,增加管理x2与教育x3, x4的交互项,R2,F有改进 回归系数置信区间不含零点 模型可用,Matlab: xinjin3.m,36,消除了不正常现象 异常数据(33号)去掉,残差分析,e x1,e 组合,37,去掉异常数据后的结果,模型改进,R2: 0.957

15、 0.999 0.9998 F: 226 554 36701 置信区间长度更短,38,残差分析,残差图正常 模型的结果可以应用, x1, 组合,39,模型应用,制订基础薪金 资历为0 : x1= 0 管理教育组合:6种,大学程度管理人员比更高程度管理人员的薪金高,大学程度非管理人员比更高程度非管理人员的薪金略低,教育 1中学:x3=1, x4=0 2大学:x3=0, x4=1 3更高:x3=0, x4=0,40,评注,对定性因素:如管理、教育 可以引入0-1变量处理 0-1变量的个数应比定性因素的水平少1 残差分析:可以发现模型的缺陷 引入交互作用项常常能够改善模型 剔除:异常数据 有助于得到更好的结果 另: 可以直接对6种管理教育组合引入5个0-1变量,41,随机过程是研究随机动态系统演变过程规律性的学科 广泛地应用于通信、控制、生物、地质、经济、管理、能源、气象等许多领域,马氏链(Markov Chain)模型:时间、状态均为离散的随机转移过程 系统在每个时期所处的状态是随机的 从一时期到下时期的状态按一定概率转移 下时期状态只取决于本时期状态和转移概率 已知现在,将来与过去无关(无后效性),42,模型一 健康与疾病,人的健康状态随着时间的推移会随机地发生转变 保险公司要对投保人未来的健康状态作出估计, 以制订保险金和理赔金的数额,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号