半参数变系数部分线性模型的统计推断

资源描述

《半参数变系数部分线性模型的统计推断》由会员分享，可在线阅读，更多相关《半参数变系数部分线性模型的统计推断（12页珍藏版）》请在金锄头文库上搜索。

1、赵培信：半参数变系数部分线性模型的统计推断法，并且在没有欠光滑的条件下，证明了所构造的经验对数似然比统计量均渐近服从标准卡方分布因此，在估计过程中可以利用数据驱动的方法选择最优带宽其次，在模型的参数分量和非参数分量均含有测量误差的情况下，研究了半参数变系数部分线性EV模型的变量选择问题，提出了一个“纠偏”的变量选择方法通过选择适当的惩罚参数，证明了该变量选择方法可以相合地识别出真实模型，并且所得的正则估计具有oracle性质另外，对响应变量随机缺失下的半参数变系数部分线性模型的变量选择问题进行了研究结合基函数逼近以及惩罚借补估计方程，提出了一个变量选择方法证明了所提出的变量选择方

2、法可以相合地识别出真实模型，并且对回归系数的正则估计达到了最优的收敛速度在博士论文之后，我们继续对该模型的变量选择问题进行了研究利用SCAD(smoothly clipped absolute deviation)惩罚估计方法【12研究了纵向数据下半参数变系数部分线性模型的变量选择问题，提出了一个基于分组的变量选择方法13】并且利用SEE(smooththreshold estimating equation)变量选择方法【14研究了带有工具变量的变系数模型的变量选择问题，提出了一个改进的SEE变量选择过程15另外对协变量含有测量误差的变系数模型，我们还提出了一个工具变量类型的经验似

3、然统计推断过程16 2 半参数变系数部分线性模型的经验似然推断 21 纵向数据下半参数变系数部分线性模型的经验似然推断考虑含有礼个个体的样本，并且对第i个个体，在时间点t=til，ti i=1，n对响应变量 (t)以及协变量xi(t)和 (t)进行观测，其中nt表示对第i个个体总的观测次数那么纵向数据下的半参数变系数部分线性模型可写为 ( )= ( 玎)TO(tij)+Zi(tid)T +Ci( )， J=1，， i=1，n， (21) 其中 ()=(o1()， ()T为P X 1未知的函数系数向量， =( 1， )T为q1未知的参数向量，ei(tij)为模型误差，并且满足Eei(

4、tj)I t( )， ( 玎)=0本文假定对来自不同个体的样本是相互独立的，而来自同一个体的样本可以存在相关性另外，在渐近理论研究中，假定n 是有界的，而个体的总数n是趋于无穷的类似文献IT，我们引入计数过程 (t)=n仁i 1 I(tijt)来刻画对第i个个体的观测次数，其中 ()为示性函数具体地，我们把对个体的观测次数看成某一带删失的计数过程的实现，即 (t)=孵min(t， )，其中为可以依赖协变量Xi(t)以及 ( )的删失时问记、T ：f 1( ) (tnnn (11一t)X1(t11) ( 一) (t ) 为2p矩阵，Qt=diagKh(ttl1)，Kh(ttnnn)

5、为NN对角矩阵，其中N=仁n 1 ni另外记( ，Op)(DTatDt)_。DTI2t三(Sll(t)，S1 ( )，sn ()，其中为P X P单位矩阵，0 为PP 零矩阵那么 ()的局部线性估计可写为竹礼 =St(t)Yk(tk1)一 ( f) (22) 中国科学：数学第43卷第7期把(22)代入模型(21)，并经简单计算可得 ( )=磊( )T + ( )， (23) 其中磊( )= ( 巧)一 ( )T ( 巧)， ( 巧)= ( )一五( 巧)T ( )， ()： 1 1 Skl(t)Zk(t z)， ( )= ：1罂1 Skl(t)Yk(tkz)为了构造的经验似然比函数

6、，我们引入如下辅助随机向量： ( )=磊( ) (t)一磊()T例d ( ) (24) J0 由(23)可知，如果是参数真值，那么E ( )=o(1)利用此信息，我们可以定义关于的经验似然比函数为 ( )=-2maxlog(npt)P 0， =1，Pt硗( )=0 对纵向数据，尽管来自不同个体的样本是相互独立的，但是每个个体内部的数据往往是相关的我们通过引入计数过程 ( )把数据分为仡组，从而保证了基于(24)所构造的辅助随机向量 ( )， i=1，n是相互独立的，因此，可以构造关于的经验似然比函数这种构造方法可以有效地处理纵向数据的组内相关性给构造经验似然比函数所带来的困难下面的

7、定理说明我们所构造的经验对数似然比函数渐近服从标准卡方分布下面首先给出一些正则条件： A1带宽满足h=Cn一15，其中C0为某个正常数； A2核函数 ()是对称的概率核函数，且满足rt4K(t)dt0为某一正常数对给定的t，如果 ( )是参数真值，那么在正则条件A1一A6下，有 (t)与)( 记)(；(1一 )为)(；的l一分位数(00为某一正常数对给定的t，如果 ( )是参数真值，那么在正则条件A1一A6下，有 () )(；该定理的详细证明和数据模拟结果参见文献1，第3章 23 缺失数据下半参数变系数部分线性模型的经验似然推断本节将经验似然方法应用于响应变量随机缺失下半参数变系数

8、部分线性模型的研究中；对模型中的参数分量，提出一个基于借补值的经验似然统计推断方法；结合逆边际概率加权方法，并通过构造基于借补值的辅助随机向量，证明所构造的经验对数似然比函数渐近服从标准卡方分布，该结果可以用来构造模型中兴趣参数的置信域设( ，，，， )，i=1，n为来自模型(28)的一个不完全随机样本，即 =砰 ( )+ T +i， i：1，n， (28) 其中协变量，和可以完全观测，并且当 =1时，可以观测，当 =0时，缺失本文假定为随机缺失，即 P(Si=1 l ，，， )=P( =1 I ，， ) 下面给出一个基于借补值的经验似然推断方法定义基于借补值

9、的辅助随机向量为磊 +( 一志) 一 )j (2_9) 其中为响应变量缺失值的借补值，调整因子开( )为丌( )=P(Si=1 l = )的核估计，其定义为亓(钆)= 1 ni( ) ，这里 t( “)= ( 一Ui)h) 1 ( Uj)h)在(29)中，我们引入调整因子开(札)进行加权调整借补可以有效地消除数据缺失对统计推断的影响另外，辅助随机向量 ( ) 中的调整因子也可以取为 7r ( ，，u)=P( =1 l X=X，Z= ，U= )但是，当和z的维数较高 639 赵培信：半参数变系数部分线性模型的统计推断时，对丌 ( ，， )的非参数估计往往会遇到“维数祸根”现象因

10、此，我们采用边际概率丌( )作为调整因子，避免了高维非参数估计的问题进而，关于的借补经验对数似然比函数可以定义为 c =一2max 。gcm 。， i=1 = ， i=1p =。) 如下定理给出经验对数似然比函数袁(卢)的渐近分布定理5 如果为参数真值，那么在正则条件A1一A6下，有袁( ) x；对任意给定的，0 )，其中02，训0以及 (0)=0值得说明的是，在一些正则条件下，本文的结果对其他惩罚函数仍是成立的另外注意到卵(7， )仅仅应用了完全观测的数据，而忽略了缺失数据所包含的信息为了改进正则估计的效，定义惩罚借补估计方程为巧( ， )= ( ， )一nb(7， )，

11、 (36) =1 其中 ( ， )= (7， )+(1一 ) ( ，7， )，rh(u，7， )为E ( ， ) ：钆)的核估计，其定义为 rh0(u，， )= ( ) ( ， )， t=1 其中 ni(u)=Kh(u一 )n_1妨( 一 )， ()：h-1 ( )， ()为核函数，h为带宽令和=(卯， )T为 (7， )=0的解那么，为的正则估计，并且Ok(u)的估计可定义为 ( )=B(札)T饥下面研究所得正则估计的渐近性质为此，首先给出一些记号令 0()和 0分别为 ()和的参数真值，不失一般性，我们假定 0=0，f=s+1，g，并且 0，f=1，s为的所有非零分量进

12、一步，假定 0()=0， =d+1，P，并且Oko()， =1，d为 0()的所有非零分量如下定理给出了以及O(u)的相合性我们首先给出如下一些正则条件： B1 (u)为区间(0，1)上的r次连续可微函数，其中r12 B2 U的密度函数，(u)为区间【0，1上的有界正函数进一步，我们假定，(u)在区间(0，1)上连续可微 B3令G1( )：EgzT I U= )，G2(札)=ExxT f U= )，以及 ( )。=E I U=u)，另么， G1(钆)，G2(，“)和 ( ) 关于u连续另外，对给定的，Gl(u)和G2(u)为正定矩阵 B4令c1，c 为区间0，1的内部节点另外，我们令

13、CO=0，CK+1=1，hi=Cict一1那么，存在常数满足，mxIh州一o( ) B5当n 时，核估计 ( ，7)和rh(u，7， )的带宽满足n 。。，以及nh -0 B6对任给的非零叫，我们有lira _+。n南p (1w1)=0 B7 lim o。infI fGn一 (。 + )入一 p (I姓j1)0，以及lira 。supI lc 一 (2 +1)p (I叫1)=0 定理6 假设内部节点K=o(n (。件 )，那么在一些正则条件B卜B7下，有 (1) 一 ll=Op(n而+n )； (2)l10k(u)一0o(u)ll=Op(佗而+0 )， =1，P，其中0 =mxk

14、,1Ip 。 ( 0I)1，Ip (IIkoII-)I： 00， 00)，r由条件B1所定义进一步，在一些条件下，我们证明了该相合估计具有稀疏性，即定理7 641 赵培信：半参数变系数部分线性模型的统计推断定理7 假设条件B1一B7成立，并且内部节点K=O(n (2r+ )令 =maX 1 ，入2f：k =1，P，f=1，口)，以及 i =min)lk，A2z： =1，P，f=1，q)如果当n_。时， ax _0并且 (2叶 ) i _。，那么，和 ()以概率1满足 (1) =0，f=8+1，口； (2) ()=0，k=d+1，P 因为 (7， )在原点是奇异的，因此普通的梯度计算方法将

15、不能直接应用因此，我们对惩罚函数 ()利用二次逼近方法给出一个迭代计算过程具体地，对任意给定的初始解满足 10， f=1，q，以及7 满足fig) 0，k：1，P，结合局部二次逼近12】，并经简单计算可得 n ( ) ( )一nZ(a。 )OL， (37) t=1 其中 =( T， T)T，，，，日) 因此，基于(37)，令厅( )=0，简单计算可得几 ( 磊 +(1一 ) ( ) =( 磊 +(1一 ) ( )， (38) t=1 i=1 其中磊=( ， )T， ( )= 妨 j(u)2j 和 ( )=n 妨 J( )匆进而，基于(38)，我们得到了如下迭代计算过程：第1步初始化 (0)：第2步令 (。)= ( ，基于(3,8)通过解方程而( )=0得 ( +1)；第3步重复上面的第2步，直到收敛，并记的最终估计为a那么， =( g，OqpL)a，并且 =(OpLq， LpL)a 在第1步，我们基于(37)右边的第一项，利用普通的借补估计方程方法给出OL的初

展开阅读全文

半参数变系数部分线性模型的统计推断

最新文档