误差模型下高维回归参数的置信区间
Confidence Intervals for High-Dimensional Regression When Covariates Contain Errors
在标准的高维回归理论和应用研究中往往假设协变量是完全观察的.然而在实际应用中,这种假设一般并不切实际,我们常常会面对协变量具有测量误差的情形,常见的有高通量测序、传感器网络数据以及基因表达数据等(见Loh and Wainwright(2012)).从而,在具体的模型研究中,研究者不仅要处理参数的高维性,还需要考虑测量误差的存在以避免非消失的偏差.因此给这些模型的统计推断带来了很大的挑战性.为了减轻测量误差的影响,近年来,不断有学者针对具有观测误差的高维回归模型提出了一些新的估计方法.然而,这些方法主要关注点估计问题.且由上述方法得到的估计量是非线性或是非显式的.因此,通常不可能精确刻画这些稀疏估计量概率分布.这也意味着,关于高维误差变量回归模型置信区间的研究还很少有学者涉及.本文在观测协变量具有噪声情形下,基于CoCoLasso(见Datta and H.Zou(2017))的凸最优化思想,通过反向推理CoCoLasso最优化问题提出相应的KKT条件,构造出该模型参数的去偏估计量.并且在一定的正则化条件下,我们证明了 CoCoLasso去偏估计量的渐近正态性,并给出了构造相应置信区间的有效算法.最后通过数值模拟,我们进一步阐明了该方法具有良好性能.
- 作者:
- 王珠冉
- 学位授予单位:
- 安徽师范大学
- 专业名称:
- 统计学
- 授予学位:
- 硕士
- 学位年度:
- 2019年
- 导师姓名:
- 黄旭东
- 中图分类号:
- O212.1
- 关键词:
- 测量误差模型;CoCoLasso估计量;去偏估计量;置信区间;高维回归
- measurement error models; CoCoLasso; de-biased estimator; ADMM; confidence intervals; high-dimensional regression;