半参数变系数部分线性模型的统计推断

上传人:野鹰 文档编号:13307321 上传时间:2017-09-04 格式:PDF 页数:12 大小:849.05KB
返回 下载 相关 举报
半参数变系数部分线性模型的统计推断_第1页
第1页 / 共12页
半参数变系数部分线性模型的统计推断_第2页
第2页 / 共12页
半参数变系数部分线性模型的统计推断_第3页
第3页 / 共12页
半参数变系数部分线性模型的统计推断_第4页
第4页 / 共12页
半参数变系数部分线性模型的统计推断_第5页
第5页 / 共12页
点击查看更多>>
资源描述

《半参数变系数部分线性模型的统计推断》由会员分享,可在线阅读,更多相关《半参数变系数部分线性模型的统计推断(12页珍藏版)》请在金锄头文库上搜索。

1、赵培信:半参数变系数部分线性模型的统计推断 法,并且在没有欠光滑的条件下,证明了所构造的经验对数似然比统计量均渐近服从标准卡方分布因 此,在估计过程中可以利用数据驱动的方法选择最优带宽 其次,在模型的参数分量和非参数分量均含有测量误差的情况下,研究了半参数变系数部分线 性EV模型的变量选择问题,提出了一个“纠偏”的变量选择方法通过选择适当的惩罚参数,证明 了该变量选择方法可以相合地识别出真实模型,并且所得的正则估计具有oracle性质另外,对响应 变量随机缺失下的半参数变系数部分线性模型的变量选择问题进行了研究结合基函数逼近以及惩罚 借补估计方程,提出了一个变量选择方法证明了所提出的变量选择方

2、法可以相合地识别出真实模型, 并且对回归系数的正则估计达到了最优的收敛速度 在博士论文之后,我们继续对该模型的变量选择问题进行了研究利用SCAD(smoothly clipped absolute deviation)惩罚估计方法【12研究了纵向数据下半参数变系数部分线性模型的变量选择问题, 提出了一个基于分组的变量选择方法13】并且利用SEE(smooththreshold estimating equation)变量 选择方法【14研究了带有工具变量的变系数模型的变量选择问题,提出了一个改进的SEE变量选择过 程15另外对协变量含有测量误差的变系数模型,我们还提出了一个工具变量类型的经验似

3、然统计推 断过程16 2 半参数变系数部分线性模型的经验似然推断 21 纵向数据下半参数变系数部分线性模型的经验似然推断 考虑含有礼个个体的样本,并且对第i个个体,在时间点t=til,ti i=1,n对响应变 量 (t)以及协变量xi(t)和 (t)进行观测,其中nt表示对第i个个体总的观测次数那么纵向数 据下的半参数变系数部分线性模型可写为 ( )= ( 玎)TO(tij)+Zi(tid)T +Ci( ), J=1, , i=1,n, (21) 其中 ()=(o1(), ()T为P X 1未知的函数系数向量, =( 1, )T为q1未知的参数向 量,ei(tij)为模型误差,并且满足Eei(

4、tj)I t( ), ( 玎)=0本文假定对来自不同个体的样本是相 互独立的,而来自同一个体的样本可以存在相关性另外,在渐近理论研究中,假定n 是有界的,而个 体的总数n是趋于无穷的类似文献IT,我们引入计数过程 (t)=n仁i 1 I(tijt)来刻画对第i个 个体的观测次数,其中 ()为示性函数具体地,我们把对个体的观测次数看成某一带删失的计数过 程的实现,即 (t)=孵min(t, ), 其中 为可以依赖协变量Xi(t)以及 ( )的删失时问记 、T :f 1( ) (tnnn (11一t)X1(t11) ( 一) (t ) 为2p矩阵,Qt=diagKh(ttl1),Kh(ttnnn)

5、为NN对角矩阵,其中N=仁n 1 ni另外 记( ,Op)(DTatDt)_。DTI2t三(Sll(t),S1 ( ),sn (),其中 为P X P单位矩阵,0 为PP 零矩阵那么 ()的局部线性估计可写为 竹 礼 =St(t)Yk(tk1)一 ( f) (22) 中国科学:数学第43卷第7期 把(22)代入模型(21),并经简单计算可得 ( )=磊( )T + ( ), (23) 其中磊( )= ( 巧)一 ( )T ( 巧), ( 巧)= ( )一五( 巧)T ( ), (): 1 1 Skl(t)Zk(t z), ( )= :1罂1 Skl(t)Yk(tkz)为了构造 的经验似然比函数

6、,我们引入如下辅助随机向量: ( )=磊( ) (t)一磊()T例d ( ) (24) J0 由(23)可知,如果 是参数真值,那么E ( )=o(1)利用此信息,我们可以定义关于 的经验似 然比函数为 ( )=-2maxlog(npt)P 0, =1,Pt硗( )=0 对纵向数据,尽管来自不同个体的样本是相互独立的,但是每个个体内部的数据往往是相关的 我们通过引入计数过程 ( )把数据分为仡组,从而保证了基于(24)所构造的辅助随机向量 ( ), i=1,n是相互独立的,因此,可以构造关于 的经验似然比函数这种构造方法可以有效地处理 纵向数据的组内相关性给构造经验似然比函数所带来的困难下面的

7、定理说明我们所构造的经验对数 似然比函数渐近服从标准卡方分布下面首先给出一些正则条件: A1带宽满足h=Cn一15,其中C0为某个正常数; A2核函数 ()是对称的概率核函数,且满足rt4K(t)dt0为某一正常数对给定的t,如果 ( )是参数真 值,那么在正则条件A1一A6下,有 (t)与)( 记)(;(1一 )为)(;的l一 分位数(00为某一正常数对给定的t,如果 ( )是参数真 值,那么在正则条件A1一A6下,有 () )(; 该定理的详细证明和数据模拟结果参见文献1,第3章 23 缺失数据下半参数变系数部分线性模型的经验似然推断 本节将经验似然方法应用于响应变量随机缺失下半参数变系数

8、部分线性模型的研究中;对模型中 的参数分量,提出一个基于借补值的经验似然统计推断方法;结合逆边际概率加权方法,并通过构造 基于借补值的辅助随机向量,证明所构造的经验对数似然比函数渐近服从标准卡方分布,该结果可以 用来构造模型中兴趣参数的置信域 设( , , , , ),i=1,n为来自模型(28)的一个不完全随机样本,即 =砰 ( )+ T +i, i:1,n, (28) 其中协变量 , 和 可以完全观测,并且当 =1时, 可以观测,当 =0时, 缺失本文假 定 为随机缺失,即 P(Si=1 l , , , )=P( =1 I , , ) 下面给出一个基于借补值的经验似然推断方法定义基于借补值

9、的辅助随机向量为 磊 +( 一志) 一 )j (2_9) 其中 为响应变量 缺失值的借补值,调整因子开( )为丌( )=P(Si=1 l = )的核估计,其定 义为亓(钆)= 1 ni( ) ,这里 t( “)= ( 一Ui)h) 1 ( Uj)h)在(29)中,我们引入调 整因子开(札)进行加权调整借补可以有效地消除数据缺失对统计推断的影响另外,辅助随机向量 ( ) 中的调整因子也可以取为 7r ( , ,u)=P( =1 l X=X,Z= ,U= )但是,当 和z的维数较高 639 赵培信:半参数变系数部分线性模型的统计推断 时,对丌 ( , , )的非参数估计往往会遇到“维数祸根”现象因

10、此,我们采用边际概率丌( )作为调整 因子,避免了高维非参数估计的问题进而,关于 的借补经验对数似然比函数可以定义为 c =一2max 。gcm 。, i=1 = , i=1p =。) 如下定理给出经验对数似然比函数袁(卢)的渐近分布 定理5 如果 为参数真值,那么在正则条件A1一A6下,有袁( ) x; 对任意给定的 ,0 ), 其中02,训0以及 (0)=0值得说明的是,在一些正则条件下,本文的结果对其他惩罚函数仍 是成立的另外注意到卵(7, )仅仅应用了完全观测的数据,而忽略了缺失数据所包含的信息为了改 进正则估计的效,定义惩罚借补估计方程为 巧( , )= ( , )一nb(7, ),

11、 (36) =1 其中 ( , )= (7, )+(1一 ) ( ,7, ),rh(u,7, )为E ( , ) :钆)的核估计,其定 义为 rh0(u, , )= ( ) ( , ), t=1 其中 ni(u)=Kh(u一 )n_1妨( 一 ), ():h-1 ( ), ()为核函数,h为带宽 令 和=(卯, )T为 (7, )=0的解那么, 为 的正则估计,并且Ok(u)的估计可定 义为 ( )=B(札)T饥下面研究所得正则估计的渐近性质为此,首先给出一些记号令 0()和 0分 别为 ()和 的参数真值,不失一般性,我们假定 0=0,f=s+1,g,并且 0,f=1,s为 的所有非零分量进

12、一步,假定 0()=0, =d+1,P,并且Oko(), =1,d为 0()的所有非 零分量如下定理给出了 以及O(u)的相合性我们首先给出如下一些正则条件: B1 (u)为区间(0,1)上的r次连续可微函数,其中r12 B2 U的密度函数,(u)为区间【0,1上的有界正函数进一步,我们假定,(u)在区间(0,1)上连 续可微 B3令G1( ):EgzT I U= ),G2(札)=ExxT f U= ),以及 ( )。=E I U=u),另 么, G1(钆),G2(,“)和 ( ) 关于u连续另外,对给定的 ,Gl(u)和G2(u)为正定矩阵 B4令c1,c 为区间0,1的内部节点另外,我们令

13、CO=0,CK+1=1,hi=Cict一1那么, 存在常数 满足 ,mxIh州 一o( ) B5当n 时,核估计 ( ,7)和rh(u,7, )的带宽 满足n 。 。,以及nh -0 B6对任给的非零叫,我们有lira _+。n南p (1w1)=0 B7 lim o。infI fGn一 (。 + )入一 p (I姓j1)0,以及lira 。supI lc 一 (2 +1)p (I叫1)=0 定理6 假设内部节点K=o(n (。件 ),那么在一些正则条件B卜B7下,有 (1) 一 ll=Op(n而+n ); (2)l10k(u)一0o(u)ll=Op(佗而+0 ), =1,P, 其中0 =mxk

14、,1Ip 。 ( 0I)1,Ip (IIkoII-)I: 00, 00),r由条件B1所定义进一步,在一些 条件下,我们证明了该相合估计具有稀疏性,即定理7 641 赵培信:半参数变系数部分线性模型的统计推断 定理7 假设条件B1一B7成立,并且内部节点K=O(n (2r+ )令 =maX 1 ,入2f:k =1,P,f=1,口),以及 i =min)lk,A2z: =1,P,f=1,q)如果当n_。时, ax _0并且 (2叶 ) i _。,那么, 和 ()以概率1满足 (1) =0,f=8+1,口; (2) ()=0,k=d+1,P 因为 (7, )在原点是奇异的,因此普通的梯度计算方法将

15、不能直接应用因此,我们对惩罚函 数 ()利用二次逼近方法给出一个迭代计算过程具体地,对任意给定的初始解 满足 10, f=1,q,以及7 满足fig) 0,k:1,P,结合局部二次逼近12】,并经简单计算可得 n ( ) ( )一nZ(a。 )OL, (37) t=1 其中 =( T, T)T, , , , 日) 因此,基于(37),令厅( )=0,简单计算可得 几 ( 磊 +(1一 ) ( ) =( 磊 +(1一 ) ( ), (38) t=1 i=1 其中磊=( , )T, ( )= 妨 j(u)2j 和 ( )=n 妨 J( )匆 进而,基于(38),我 们得到了如下迭代计算过程: 第1步初始化 (0): 第2步令 (。)= ( ,基于(3,8)通过解方程而( )=0得 ( +1); 第3步重复上面的第2步,直到收敛,并记 的最终估计为a那么, =( g,OqpL)a,并且 =(OpLq, LpL)a 在第1步,我们基于(37)右边的第一项,利用普通的借补估计方程方法给出OL的初

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 其它文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号