SAS线性回归分析案例

上传人:M****1 文档编号:476220597 上传时间:2022-07-20 格式:DOC 页数:15 大小:1.06MB
返回 下载 相关 举报
SAS线性回归分析案例_第1页
第1页 / 共15页
SAS线性回归分析案例_第2页
第2页 / 共15页
SAS线性回归分析案例_第3页
第3页 / 共15页
SAS线性回归分析案例_第4页
第4页 / 共15页
SAS线性回归分析案例_第5页
第5页 / 共15页
点击查看更多>>
资源描述

《SAS线性回归分析案例》由会员分享,可在线阅读,更多相关《SAS线性回归分析案例(15页珍藏版)》请在金锄头文库上搜索。

1、20094788陈磊计算2线性回归分为一元线性回归和多元线性回归。一元线性回归的模型为Y=o+X+,这里X是自变量,Y是因变量,是随机误差项。通常假设随机误差的均值为0,方差为,2(,20),2与x的值无关。若进一步假设随机误差服从正态分布,就叫做正态线性模型。一般情况,设有k个自变量和一个因变量,因变量的值可以分解为两部分:一部分是由于自变量的影响,即表示为自变量的函数,其中函数形式已知,但含有一些未知参数;另一部分是由于其他未被考虑的因素和随机性的影响,即随机误差。当函数形式为未知参数的线性函数时,称为线性回归分析模型。如果存在多个因变量,则回归模型为:Y=仔0+仔X+仔2X2+仔答+。由

2、于直线模型中含有随机误差项,所以回归模型反映的直线是不确定的。回归分析的主要目的是要从这些不确定的直线中找出一条最能拟合原始数据信息的直线,并将其作为回归模型来描述因变量和自变量之间的关系,这条直线被称为回归方程。通常在回归分析中,对有以下最为常用的经典假设。1、的期望值为0.2、对于所有的X而言具有同方差性。3、是服从正态分布且相互独立的随机变量。对线性回归的讲解,本文以例题为依托展开。在下面的例题中既有一元回归分析,又有二元回归分析。例题(数据据分析方法习题2.4_page79)某公司管理人员为了解某化妆品在一个城市的月销量Y(单位:箱)与该城市中适合使用该化妆品的人数(单位:千人)以及他

3、们人均月收入x2(单位:元)之间的关系,在某个月中对15个城市作了调查,得到上述各量的观测值如表2.12所示。表2.12化妆品销售数据城市销量(y)人数(xl)收入(x2)城市销量(y)人数(x1)收入(x2)116227424509116195213721201803254105553256032233753802112524304020413120528381223237244275678623471314423626606169265378214103157208878198300815212370260581923302450假设Y与X,X2之间满足线性回归关系儿=“0+耳叫1+“2叫

4、2+%=1,2,15其中勺独立同分布于W(0,2).(1)求线性回归系数仔。,厲,仔2的最小二乘估计和误差方差,2的估计,写出回归方程并对回归系数作解释;(2)求出方差分析表,解释对线性回归关系显著性检验结果。求复相关系数的平方R2的值并解释其意义;(3)分别求为和仔2的置信度为95%的置信区间;(4)对a=0.05,分别检验人数X及收入X2对销量Y的影响是否显著,利用与回归系数有关的一般假设检验方法检验和冷的交互作用(即X2)对Y的影响是否显著;数据导入在编辑窗口输入此题的数据导入代码:title数据据分析方法习题2.4_page79;/*标题,省略不影响分析结果*/datamylib.ch

5、2_2_4;/*首先新建逻辑库,在逻辑库mylib中创建数据集ch2_2_4*/inputyx1x2;/*表示可连续输入,y为因变量,xl、x2是自变量*/cards;/*开始输入数据*/162274245012018032542233753802131205283867862347169265378281983008192330245011619521375553256025243040202323724427144236266010315720882123702605/*遗漏数据用表示,否则对应的这组数据会被自动删除*/run;/*run语句用于说明处理当前程序步中该语句之前的所有行*/按

6、F8运行后,打开逻辑库mylib即可看到新建的数据集ch2_2_4。SAS提供了多种导入数据的方式,比如:1、从文件读入数据,infileF:mylibch2_2_4.txt;2、利用已经建立过数据集,procregdata=mylib.ch2_2_4;另外还可以从外部直接导入Excel等方式。上面的程序,是直接在编辑框内输入。过程调用本题所要调用的过程是procreg过程。procreg过程是SAS系统中众多回归分析过程的一种,它除可拟合一般线性回归模型外,还提供多种选取最优模型的方法及模型诊断检查方法。其中(1)、(2)、(3)主要用到多元线性回归分析的结果。(4)将用到一元线性回归分析的

7、结果。(一)J与X,,X?的线性回归分析procreg;/*调reg过程用*/modely=x1x2;/*因变量为y,自变量为x1、x2*/run;Model语句:用于定义模型中因变量、自变量、模型选项及结果输出选项。常用选项有Selection=,指定变量选择方法:FORWARD(向前输入法)、BACKWARD(向后删除法)、STEPWISE(逐步回归法)、ADJRSQ(修正复相关系数准则)、CP(Cp准则)等。N0INT,表示在模型中不包括常数项;STB,输出标准化的回归系数;CLI,输出单个预测值置信区间;R,进行残差分析,并输出分析结果;I,输出(XTX)1矩阵。格式:MODEL因变量

8、名二自变量名列/选项例:modely=x1x2/selection二stepwise;/*逐步回归*/运行程序后,得到结果参数估计表七oooI8oo1-M-_ll_-:rp22o4_yF-8Varia.b1eDFParameterEstimate=StandardErrorIntercept3.452612.43065x11049S00a.ooeos::FMode15?8B45269225679.47.FMode153417534171432.14.0001ErrorT3434.S81?.737.29857CorreefedTotal1453902,RootMSE6.10726F:-Squar

9、e0.9910DependentMean150.60000AdjR-Sq0.9903fCoeffYar4.05528ParameterEst:mateaParameterStandardVariab1eDFEst:mateErrortVa1uePr111I厂itercept122.792203=.727266.11F0.010349.51434R-Square0.4087Mt=a.n150.60000337005Md.iR-Sq0.362Analysis-ofVar;anceRootMSEDependentCoeffVarVariableDFIntercept1m21ParameterEsti

10、ms.tesF:ii.raMAterSta_ridardEstimateErrortVa1uePr-10.207510.0542955.147580.018110.85600.OIOS(4)复相关系数平方为:0.4087,X2对Y的影响不显著(四)Y与X02的线性回归分析datamylib.ch2_2_4;setmylib.ch2_2_4;z=xl*x2;run;/*读入数据集*/*新建自变量z*/procreg;modely=z;/*自变量为z*/run;Analysis:ciVaria.nceSumofMeanSourceDFSquaresSquareFValuePrFMode14867348673121.01;0001Error

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号