《线性回归》ppt课件

上传人:自*** 文档编号:81016239 上传时间:2019-02-20 格式:PPT 页数:56 大小:1.14MB
返回 下载 相关 举报
《线性回归》ppt课件_第1页
第1页 / 共56页
《线性回归》ppt课件_第2页
第2页 / 共56页
《线性回归》ppt课件_第3页
第3页 / 共56页
《线性回归》ppt课件_第4页
第4页 / 共56页
《线性回归》ppt课件_第5页
第5页 / 共56页
点击查看更多>>
资源描述

《《线性回归》ppt课件》由会员分享,可在线阅读,更多相关《《线性回归》ppt课件(56页珍藏版)》请在金锄头文库上搜索。

1、武汉科技大学 数学与统计系,线性回归,案例介绍,背景、目标、变量和分析,案例背景,目前中国的资本市场逐渐成熟,投资于股市成为众多企业乃至个人的重要理财方式。因此利用上市公司当年的公开的财务指标对起来年盈利状况予以预测就成为投资人最重要的决策依据。 本案例随机抽取深市和沪市2012年和2013年各500个样本,对上市公司的净资产收益率(return on equity, ROE)进行预测。,案例目标与变量,目标:盈利预测 因变量:下一年的净资产收益率(ROE) 自变量:当年的财务信息 样本容量:2012年500;2013年500,自变量,ROEt: 当年净资产收益率 ATO: 资产周转率(ass

2、et turnover ratio) LEV: 债务资本比率(debt to asset ratio) 反映公司基本债务状况 PB: 市倍率(price to book ratio) 反映公司预期未来成长率 ARR: 应收账款/主营业务收入(account receivable over total income) 反映公司的收入质量,自变量,PM: 主营业务利润/主营业务收入(profit margin) 反映公司利润状况 GROWTH: 主营业务增长率(sales growth rate) 反映公司已实现的当年增长率 INV: 存货/资产总计(inventory to asset rati

3、o) 反映公司的存货状况 ASSET: (对数)资产总计(log-transformed asset) 反映公司的规模,读取数据,在R环境下将数据读入系统并显示,使用如下语句:,数据的概括性度量,R语句:,变量间相关性分析,R语句:,R语句: plot(a1$ROEt,a1$ROE),模型的建立,模型、假设和参数估计,模型形式及假设,线性回归模型 模型假设 独立性假设 同方差假设 正态性假设,参数估计,模型: 最小二乘估计量: 方差估计量:,拟合优度,总平方和 残差平方和 R-Square,参数估计的软件实现,R语句: lm1=lm(ROEROEt+ATO+PM+LEV+GROWTH+PB+A

4、RR+INV+ASSET,data=a1) summary(lm1),显著性检验,F检验,假设 检验统计量 拒绝域,T检验,假设 检验统计量 拒绝域,显著性检验的结论,从F检验的结果看,模型的线性关系是显著的。 从T检验的结果看,ROEt和LEV两个变量通过了检验,GROWTH变量在显著性水平降至0.1时也可以通过检验,因此这三个变量与因变量的线性关系较为显著。 注意,这不说明应该删除其它变量!,模型的诊断,异方差性、非正态性、异常值,同方差性检验,同方差性检验,同方差性检验,同方差性检验,正态性检验,若 , 并且 则有,正态性检验,进一步可以得到 以及 所以在正态性假设下,残差 与 应该成线

5、性关系。,正态性检验,Q-Q 图 残差: 将残差排序: Y: X:,将上面的方法应用于本案例,目标1:检验模型是否符合三个假设 目标2:找出异常值 R语句: par(mfrow=c(2,2) #设置画图为2x2的格式 plot(lm1,which=c(1:4) #画出lm1中对应于模型检验的4张图,包括残差图、QQ图和Cook距离图 检验发现47号数据为异常值,需要将其消除 语句:a1=a1(-47),多重共线性,含义及检验,什么是多重共线性?,如果存在如下回归方程 能不能把它变成下面这样 如果对这个方程进行回归会发生什么事?,第一个例子,假如有两个变量x1和x2,用最小二乘法得到如下参数估计量。,第二个例子,假如有三个变量x1、x2和x3,用最小二乘法得到如下参数估计量。,方差膨胀因子,定义下面的回归形式为辅助回归 令 为辅助回归的判定系数 则方差膨胀因子为: 它反映了在多大程度上第i个自变量所包含的信息被其他自变量覆盖,方差膨胀因子,R语句: 所有的VIF值都小于10且接近1,所以没有多重共线性问题。,变量的选择,AIC 和 BIC,AIC方法比较保守,其中p为自变量个数,与RSS成反比。 使AIC达到最小的模型是最优的 BIC相对不那么保守,因此保留的变量可能会比较少。,预测,预测值与置信区间,数据准备,以2013年数据为检验数据,可以用如下方法对数据进行准备,预测,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号