文档详情

应用时间序列分位数回归

宝路
实名认证
店铺
DOCX
93.41KB
约21页
文档ID:23410698
应用时间序列分位数回归_第1页
1/21

目录一、为什么需要分位数回归二、总体分位数三、样本分位数四、分位数回归的估计方法五、分位数回归模型的估计六、R 软件操作分位数回归一、为什么需要分位数回归?1、一般的回归模型着重考察 x 对 y 的条件期望 E(y|x)的影响,如果 y|x 不是对称分布,则 E(y|x)难以反映条件分布的全貌如果能够估计条件分布 y|x 的若干重要的条件分位数,比如中位数等,能够更加全面的描述被解释变量条件分布的全貌,而不是仅仅分析被解释变量的条件期望(均值) 不同分位数下的回归系数估计量常常不同,即解释变量对不同水平被解释变量的影响不同2、使用 OLS 进行“均值回归” ,由于最小化的目标函数为残差平方和,容易受极端值影响 “分位数回归” ,使用残差绝对值的加权平均作为最小化的目标函数,不易受极端值影响而且,分位数回归对误差项并不要求很强的假设条件,因此对于非正态分布而言,分位数回归系数估计量则更加稳健二、总体分位数假设 Y 为连续型随机变量,其累积分布函数为 Fy(·)Y 的“总体q 分位数” ,记为 yq,满足以下定义式: q = P (Y≤y q)= Fy(yq) 总体 q 分位数正好将总体分布分为两部分,其中小于或等于 yq的概率为 q,而大于 yq 的概率为 (1-q )。

如果 q =1/ 2,则为中位数,正好将总体分为两个相等的部分如果 Fy(·)严格单调递增,则有 yq=Fy-1 (q) 对于回归模型,记条件分布 y | x 的累积分布函数为 F y | x (·)条件分布 y | x 的总体 q 分位数,记为 yq,满足以下定义式:q= F y | x (yq)假设 F y | x (·)严格单调递增,则有 yq= F y | x -1(q)由于条件累积分布函数 F y | x (·)依赖于 x ,故条件分布 y | x 的总体 q 分位数 yq 也依赖于 x,记为 yq (x),称为 “条件分位数函数” 对于线性回归模型,如果扰动项满足同方差的假定,或扰动项的异方差形式为乘积形式,则 yq (x)是 x 的线性函数证明如下:y=x’β+ uu=x’α·εε~ iid(0,σ 2)不失一般性,假设 x’α>0如果 x’α 为常数,则扰动项 u 为同方差;反之,则为乘积形式的异方差根据定义,条件分位数函数 yq (x)满足q=P{y ≤y q (x)} (条件分位数的定义 )=P{x’β+ u≤y q (x)}=P{u≤y q (x) – x’β}=P{x’α·ε≤ yq (x) – x’β}=P{ε≤(y q (x) – x’β)/( x’α)}=Fε (yq (x) – x’β)/( x’α))其中,F ε (·)为 ε 的累积分布函数。

因此,(y q(x) – x’β)/( x’α)= Fε -1 (q) yq(x)= x’β+ x’α*Fε -1(q),故 yq (x)是 x 的线性函数在同方差的情况下,x’α 为常数,所有条件分位数函数{y q(x),0 ”,故 𝜇 ‒ 𝜇(n k ) q+ k(1 q)=0‒ ‒ ‒经整理可得 k=nqk 必须是整数故最优解 ,即样𝜇=𝑦[𝑛𝑞]=⏞𝑦𝑞本分位数四、分位数回归的估计方法将单变量情形下对样本分位数的估计方法推广到线性回归假设条件分布 y | x 的总体 q 分位数 yq(x)是 x 的线性函数:𝑦𝑞(𝑥𝑖)=𝑥'𝑖𝛽𝑞称为“q 分位数回归系数” ,其估计量 由以下最小化问题来𝛽𝑞 𝛽𝑞 定义:𝑚𝑖𝑛𝛽𝑞 ∑𝑛𝑖:𝑦𝑖≥𝑥'𝑖𝛽𝑞 𝑞|𝑦𝑖‒𝑥'𝑖𝛽𝑞|+∑𝑛𝑖:𝑦𝑖 fit1 = rq(foodexp ~ income, tau = 0.5, data = engel,method="br") # 进行分位数回归> fit1 # 直接显示分位数回归的模型和系数Call:rq(formula = foodexp ~ income, tau = 0.5, data = engel, method = "br")Coefficients:(Intercept) income 81.4822474 0.5601806 Degrees of freedom: 235 total; 233 residual说明:以食物支出(foodexp)为因变量及家庭收入 (income)为自变量拟合中位数回归模型,得到的常数项系数为 81.48,自变量系数为0.56。

由此可知即使家庭没有收入来源,这个家庭也有食物支出81.48家庭收入每变动 1 个单位,食物支出同向变动 0.56 个单位运行结果:> summary(fit1) # 得到更加详细的显示结果Call: rq(formula = foodexp ~ income, tau = 0.5, data = engel, method = "br")tau: [1] 0.5Coefficients:coefficients lower bd upper bd (Intercept) 81.48225 53.25915 114.01156income 0.56018 0.48702 0.60199说明:summary 函数这里分别给出了中位数回归常数项系数和自变量系数的上下限,相当于给出了(1-α)%的置信区间中位数到上下限的距离并不相等,可以看出食物支出和家庭收入的分布是偏态的运行结果:> r1 = resid(fit1) # 得到残差序列,并赋值为变量 r1> acf(r1)> pacf(r1)> Box.test(r1, type="Ljung-Box")# 对残差进行 LB 检验Box-Ljung testdata: r1X-squared = 18.762, df = 1, p-value = 1.481e-050 5 10 15 20-0.20.00.20.40.60.81.0LagACFSeries r15 10 15 20-0.2-0.10.00.10.2LagPartial ACFSeries r1说明:通过 r1 = resid(fit1)命令得到中位数回归模型的残差,然后对其画自相关图和偏自相关图,来直观的观察残差是否是白噪声序列。

根据自相关图可以看出,存在一阶自相关,其余的相关系数大部分在两倍标准差以内再观察偏自相关图的值,也存在一阶偏自相关,其他滞后项大多都在两倍标准差以内,得出可能不是白噪声序列下面进行 LB 统计量的检验,给出统计学的证据LB 统计量的原假设 H0:p 1=p2=……=Pm,得到的 p 值= 1.481e-05 summary(fit1, se = "nid") # 通过设置参数 se,可以得到系数的假设检验Call: rq(formula = foodexp ~ income, tau = 0.5, data = engel, method = "br")tau: [1] 0.5Coefficients:Value Std. Error t value Pr(>|t|)(Intercept) 81.48225 19.25066 4.23270 0.00003income 0.56018 0.02828 19.81032 0.00000说明:进行系数的显著性检验由于残差项不是白噪声序列 A. se = “rank”和 B. se=“iid”并不适用选择 C. se = “nid”:表示按照 Huber 方法逼近得到的估计量。

H 0:系数与零没有显示出差异由上式结果知,常数项的 P 值为 0.00003F) 1 2 703 15.557 2.449e-07 ***---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1说明:对三个不同分位点的回归模型进行方差分析原假设H0:三个回归模型拟合的值没有显著性差异P 值=2.449e-07 summary(lm(foodexp ~ income))Call:lm(formula = foodexp ~ income)Residuals:Min 1Q Median 3Q Max -725.70 -60.24 -4.32 53.41 515.77 Coefficients:Estimate Std. Error t value Pr(>|t|) (Intercept) 147.47539 15.95708 9.242 <2e-16 ***income 0.48518 0.01437 33.772 <2e-16 ***---Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1Residual standard error: 114.1 on 233 degrees of freedomMultiple R-squared: 0.8304, Adjusted R-squared: 0.8296 F-statistic: 1141 on 1 and 233 DF, p-value: < 2.2e-16说明:对因变量食品支出和自变量家庭收入的线性最小二乘回归,y=147.47539+0.48518x,系数的显著性水平‘***’是非常显著的,其中调整的 R 方是 0.8296;F 统计量的值为 1140,p 值 2.2e-16,说明方程模拟的很好。

由于 R 软件找不到关于分位数回归的评价检验,如拟合优度、F统计量所以转为用 Eviews 来进行分位数回归的拟合先来看看Eviews 拟合均值回归模型的一些输出结果Dependent Variable: YMethod: Least SquaresDate: 12/24/16 Time: 11:11Sample: 1 235Included observations: 235Variable Coefficient Std. Error t-Statistic Prob. C 147.4754 15.95708 9.242005 0.0000X 0.485178 0.014366 33.77179 0.0000R-squared 0.830365 Mean dependent var 624.1501Adjusted R-squared 0.829637 S.D. dependent var 276.4570S.E. of regression 114.1079 Akaike info criterion 12.32064Sum squared resid 3033805. Schwarz criterion 12.35008Log likelihood -1445.675 Hannan-Quinn criter. 12.33251F-statistic 1140.534 Durbin-Watson stat 1.410754Prob(F-statistic) 0.000000说明:用 Eviews 拟合的均值回归模型 y=147.4754+0.485178x,调整的 R 方是 0.829637;F 统计量的值为 1140.534,p 值为0.000000。

跟 R 软件计算出来的统计量的数值都是一一对应的下面我们用 eviews 来拟合分位数回归的模型运行结果:eviews 来拟合中位数回归的模型Dependent Variable: YMethod: Qua。

下载提示
相似文档
正为您匹配相似的精品文档