图Lasso及相关方法的研究与应用
【摘要】:在实际应用中经常出现特征维数大于样本数目的情况,传统的方法并不能计算数据的逆协方差矩阵。对于高维数据,即使协方差矩阵不是奇异矩阵,应用传统的方法估计数据的逆协方差矩阵将面临很复杂的计算。同时,当对高维数据进行无向图模型估计时,只有估计的逆协方差矩阵很稀疏时才有意义,否则我们将无法对太复杂的模型进行分析。图Lasso可以快速估计出逆协方差矩阵,通过罚参数可以控制逆协方差矩阵的稀疏性,应用于高维数据时计算速度也很快。首先,本文阐述了图Lasso方法的基本原理和步骤,详细介绍了图Lasso方法应用于二次判别分析的原理,通过仿真实验验证了图Lasso方法的性能,应用图Lasso方法估计流式细胞数据的无向图模型并分析了实验结果,将图Lasso二次判别分析应用于Semeion手写数字数据集中,正确率达92.2%。其次,本文阐述了联合图Lasso方法的基本思想,详细介绍了交替方向乘子法求解联合图Lasso问题的具体过程,分别给出两种罚函数对应的求解过程,并将联合图Lasso方法应用于二次判别分析中,将基于图Lasso和基于联合图Lasso的二次判别分析应用于PAMAP2身体活动监视数据集中,实验结果表明基于融合Lasso的联合图Lasso方法取得了较好的结果。最后,本文简单介绍了稀疏高斯图混合模型,详细介绍了图Lasso期望最大化算法的具体实现过程,通过仿真实验深入分析和讨论基于图lasso方法的稀疏高斯图混合模型的性能,将稀疏高斯图混合模型应用于流式细胞数据并对实验结果进行分析和讨论。