《多元线性回归方法及其应用实例》由会员分享,可在线阅读,更多相关《多元线性回归方法及其应用实例(47页珍藏版)》请在金锄头文库上搜索。
1、第三章第三章多元线性回归模型多元线性回归模型主要内容n多元线性回归模型的一般形式 n参数估计( OLS估计)n假设检验n预测一. 多元线性回归模型n问题的提出n解析形式n矩阵形式问题的提出n现实生活中引起被解释变量变化的因素并非仅只一个解释变量,可能有很多个解释变量。n例如,产出往往受各种投入要素资本、劳动、技术等的影响;销售额往往受价格和公司对广告费的投入的影响等。n所以在一元线性模型的基础上,提出多元线性模型解释变量个数 2多元线性回归模型的假设n解释变量 Xi 是确定性变量,不是随机变量;解释变量之间互不相关,即无多重共线性。n随机误差项具有0均值和同方差n随机误差项不存在序列相关关系n
2、随机误差项与解释变量之间不相关n随机误差项服从0均值、同方差的正态分布多元模型的解析表达式多元模型的矩阵表达式矩阵形式二. 参数估计(OLS)n参数值估计n参数估计量的性质n偏回归系数的含义n正规方程n样本容量问题1.参数值估计(OLS)得到下列方程组求参数估计值的实质是求一个k+1元方程组正规方程正规方程变成矩阵形式正规方程正规方程矩阵形式最小二乘法的矩阵表示最小二乘估计量的性质n(1)线性(估计量都是被解释变量观测值的线性组合)n(2)无偏性(估计量的数学期望=被估计的真值)n(3)有效性(估计量的方差是所有线性无偏估计中最小的)OLS估计量的性质(续)线性无偏性有效性2.2 OLS回归线
3、的性质n完全同一元情形:2.3 随机扰动项方差的估计注解:k与k+1n凡是按解释变量的个数为k的,那么共有k+1个参数要估计。而按参数个数为k的,则实际有k-1个解释变量。总之两者相差1而已!要小心所用的k是什么意思!n所以如果本来是用解释变量个数的k表示的要转换成参数个数的k则用k-1代换原来的k就可以了!3.偏回归系数的意义n多元回归模型中的回归系数称为偏回归系数n某解释变量前回归系数的含义是,在其他解释变量保持不变的条件下,该变量变化一个单位,被解释变量将平均发生偏回归系数大小的变动4.正规方程n由最小二乘法得到的用以估计回归系数的线性方程组,称为正规方程正规方程的结构nY 被解释变量观
4、测值 n x 1nX 解释变量观测值(含虚拟变量n x (k+1) )nXX 设计矩阵(实对称(k+1) x (k+1)矩阵 )nXY 正规方程右端 n x 1n 回归系数矩阵( (k+1) x 1 )n 高斯乘数矩阵, 设计矩阵的逆n 残差向量( n x 1 )n 被解释变量的拟合(预测)向量 n x 15.多元回归模型参数估计中的样本容量问题n样本是一个重要的实际问题,模型依赖于实际样本。n获取样本需要成本,企图通过样本容量的确定减轻收集数据的困难。n最小样本容量:满足基本要求的样本容量最小样本容量 n k+1n(XX)-1存在| XX | 0 XX 为k+1阶的满秩阵nR(AB) min
5、(R(A),R(B)nR(X) k+1n因此,必须有nk+1满足基本要求的样本容量n一般经验认为:n 30或者n 3(k+1)才能满足模型估计的基本要求。n 3(k+1)时,t分布才稳定,检验才较为有效第三节 多元线性回归模型的检验n本节主要介绍:n3.1 拟合优度检验(判定系数及其校正)n3.2 回归参数的显著性检验(t检验)n3.3 回归方程的显著性检验(F检验)n3.4 拟合优度、t检验、F检验的关系3.1.1 拟合优度检验 总平方和、自由度的分解n目的:构造一个不含单位,可以相互比较,而且能直观判断拟合优劣的指标。n类似于一元情形,先将多元线性回归作如下平方和分解:对以上自由度的分解的
6、说明3.1.2 判定系数n判定系数的定义:n意义:判定系数越大,自变量对因变量的解释程度越高,自变量引起的变动占总变动的百分比高。观察点在回归直线附近越密集。n取值范围:0-13.1.3 校正判定系数n为什么要校正?n判定系数随解释变量个数的增加而增大。易造成错觉:要模型拟合得越好,就应增加解释变量。然而增加解释变量会降低自由度,减少可用的样本数。并且有时增加解释变量是不必要的。n导致解释变量个数不同模型之间对比困难。n判定系数只涉及平方和,没有考虑自由度。n校正思路: 引进自由度校正所计算的平方和。校正判定系数 (续)3.2 回归参数的显著性检验 t检验以下给出t-检验的具体过程3.3 回归
7、方程的显著性检验 (F检验)n 回归系数的t检验,检验了各个解释变量Xj单独对应变量Y是否显著;我们还需要检验:所有解释变量联合在一起,是否对应变量Y也显著?n这即是下面所要进行的F-检验。3.3.1 方差分析表以下用表格的形式列出平方和、自由度、方差平方和来源平方和自由度均方和源于回归K-1源于残差n-k总平方和n-13.3.2 F检验(单侧检验)3.4 各种检验之间的关系n3.4.1 经济意义检验和其他检验的关系联系: 判断一个回归模型是否正确,首先要看模型是否具有合理的经济意义,其次才是统计检验。3.4.2 拟合优度和F检验的关系(1)都是对回归方程的显著性检验;(2)都是把总平方和分解
8、,以构成统计量进行检验;(3)两者同增同减,具有一致性。拟合优度和F检验的关系(续)n区别:(1)F检验中使用的统计量有精确的分布,而拟合优度检验没有;(2)对是否通过检验,判定系数(校正判定系数)只能给出一个模糊的推测;而F检验可以在给定显著水平下,给出统计上的严格结论;3.4.2 F检验和t检验的关系n在一元的情形,两者是一致的,等价的。对单个解释变量显著性进行t检验,也就检验了解释变量的整体显著性(F检验);并且可以证明:Ft2 (所以在一元情形,只需要进行一种检验)n多元中,不存在以上关系。回归模型假设检验的步骤n查看拟合优度,进行F检验,从整体上判断回归方程是否成立,如果F检验通不过,无须进行下一步;否则进行下一步n查看各个变量的t值及其相应的概率,进行t检验,如果相应的概率小于给定的显著水平,该自变量的系数显著地不为0,该自变量对因变量作用显著;否则系数与0无显著差异(本质上=0),该自变量对因变量无显著的作用,应从方程中删去,重新估计方程。n但是,一次只能将最不显著(相应概率最大)的删除。每次删除一个,直至全部显著。多元线性回归模型的预测举例:新股发行抑价的实证研究