《R岭回归关于变量选择》由会员分享,可在线阅读,更多相关《R岭回归关于变量选择(2页珍藏版)》请在金锄头文库上搜索。
1、选择的是在中小板上市的广东企业,研究的是他们的负债率和公司基本数据的关系(回归) 。 所选的数据如下: 总资产(万)ASSET、利润 PROFIT、总资产增长额 ASSET_INCREA、资产周转额 Asset_turnover、产品独特性 PRODUCT、 (固资+存货)Asset_soli、流动资产 ASSET_MOVING、负债额 LOAD。 假设总资产与总资产增长额同属于一类指标,资产周转额,固定资产和流动资产属于一 类指标,利润与产品独特性属于一个指标。 样本数为 55 个。 对数据进行标准化【0,1】之后,先进行回归:负债额总资产(万)、利润、总资产增长额、 资产周转额、产品独特性
2、、 (固资+存货) 、流动资产。 代码: test=read.table(“G:s.txt“,header=T); test.y=test,1; test.x=test,2:8; lambda - seq(from=0.01,to=0.7,by=0.01); lridge=ridge(test.y,test.x,lambda=lambda); traceplot(lridge);得到岭迹图:在这里来看不是很清晰,如果需要选择每个指标的一个变量,就可以选择越远离 X 轴的指 标变量:总资产、流动资产和产品独特性。再对三个变量进行一次岭回归: 得到岭迹图:再查看系数: B1=0.2006328 ;b2=-0.02110348;b3= -0.1154399.由于岭回归一般要求标准化,如果需要返回预测值再进行计算也可以的。