充分降维理论和方法的拓展研究【摘要】:这篇论文致力于对充分降维领域中一些理论的深入研究以及方法上的延伸
在充分降维领域中有两个重要的话题
第一个是估计中心(均值)降维空间的基方向
而经典降维方法基方向样本估计的大样本性质至今仍不明了
为了进一步了解这些常用降维方法特别是其方向估计的理论性质,在这篇论文中我们首先研究了这些方法的核矩阵以及基方向样本估计的二阶渐近性质
我们推导了四种常见的降维方法,包括切片逆回归(SlicedInverseRegression,SIR,Li,1991),切片平均方差估计(SlicedAverageVarianceEstimation,CookandWeisberg,1991),海赛主方向(PrincipalHessianDirection,Li,1992)和方向回归(DirectionalRegression,LiandWang,2007),它们样本估计的二阶渐近展开式
利用这些降维方法的二阶渐近展式,我们可以进一步考虑纠正其O(n-1)偏差以提高估计的精度
从已经得到的二阶渐近展式中,我们可以求出降维方法方向估计二阶偏差的显示表达式,继而可以很容易得到二阶偏差的相合样本估计
我们随后提出一种一般的降维方法的偏差纠正策略,其思想很简单:即是将某一种降维方法基方向的样本估计减去其二阶偏差的样本估计
并且我们证明了经过偏差纠正后,这些降维方法方向估计的偏差被缩小到O(n-2)
充分降维领域中的另一个重要的问题是决定中心(均值)降维子空间的结构维数
常用的选取结构维数的方法都有其局限性
序贯检验法依赖于检验的显著性水平
重抽样方法的运算量过大
Zhu,MiaoandPeng(2006)提出的BIC准则虽然可以相合的估计结构维数,但如何基于数据选取最优的惩罚函数是一个难题
更重要的是,一般充分降维的过程分为两步,首先是决定维数,然后再选取相应的基方向