协方差矩阵的谱分析及其应用
【摘要】:随机矩阵谱理论是应用数学和概率统计领域的一个热门的研究方向。它在高维统计应用尤其是高维时间序列的问题中是一个十分强大的理论工具。本文的工作主要集中在时空过程的可分协方差结构的极限谱性质以及高维线性过程的样本协方差阵以及自协方差矩阵的极限谱性质的研究。
第一章简要介绍与本文研究相关的预备知识第二章研究了可分协方差矩阵的极限谱分布。考虑数据模型模型Yn=Ap1/2XnBn1/2,其中Xn具有i.i.d均值为0方差为1,且四阶矩存在的元素。模型的样本协方差矩阵Sn=Ap1/2XnBnXn*Ap1/2在用于时空数据建模中与可分性协方差结构有着十分密切联系。事实上可分性结构是指对向量化后的数据矩阵Yn=Ap1/2XnBn1/2的协方差结构可表示为Ap(?)Bn,这里(?)表示矩阵的Kronecker乘积。此时,Yn的行对应于时空数据中的空间位置而列对应于观测时间。如果在p/n→0的情形下,||Sn-ESn||→0.从Bai and Yin[8]的结论可知,当Ap=Ip,Bn=In且p,n→∞使得p/n→0时,矩阵的谱分布实际上同分布于一个p×p的Wigner矩阵Wp。随后,对于一般的样本协方差矩阵Sn=n-1Ap1/2XnXn*Ap1/2
其中Xn的元素独立同分布于一个四阶矩存在的实值随机变量,Pan and Gao [53]and Bao[18]得到了重新规范化之后的矩阵的极限谱分布。本章进一步考虑重新规范化后的可分协方差矩阵在p,n→∞并且p/n→0情形下的有, Cn的极限谱分布几乎处处收敛到一个非随机分布F,且F的Stieltjes变换满足其中β(z)=且同时,我们也导出了F(x)的密度函数,并给出了在一定条件下,数值计算该密度函数的算法。利用这些理论结果,提出了用于检验数据的协方差结构的检验统计量。其中原假设为数据阵的协方差结构具有特定的Ap(?)Bn型可分结构。本章也通过模拟研究了该检验的表现。文章的另外一个结果是,在Xn的元素具有次高斯性的假设下,且有Ap是混合点分布的条件下,证明了的经验分布的收敛到一个带权的半圆率的和的分布
第三章中,我们研究了p维线性时间序列的重新规范化后的样本协方差矩阵和样本自协方差矩阵的极限谱性质。对于p维的线性时间序列XtZt+∑l=1∞AlZt-l,t∈Z,t∈Z,其中Zt,t∈Z是一列独立的零均值,单位方差,且元素具有有限的四阶矩的p维随机向量。定义其中对称化的自协方差矩阵为且其均值矩阵为
在维数和样本量都很大,但是维数相对样本量趋于0的情形下,给出了重新规范化后的样本协方差矩阵以及样本自协方差矩阵的经验谱分布几乎处处收敛到R+上的确定性分布Fτ,且Stieltjes变换满足其中,此时,βτ(z,a)是方程的唯一解,且满βτ(z,a)是Stieltjes核。证明过程需要需要假设p×p Hermitian矩阵{Al}l=1q可以同时对角化,且满足这个结果提供了一个新的视角研究高维时间序列问题,也提供了一个可以作为模型诊断、模型预测以及系数估计的可行途径。
第四章是本文工作的小结和对下一步的研究工作的展望.