医学图像智能挖掘关键技术研究
【摘要】:复杂数据类型的挖掘是数据挖掘领域的重要研究方向。本文是在完成国家自然科学基金项目“基于医学影像的数据挖掘技术研究”的过程中,针对医学影像数据挖掘所涉及的一些关键技术和主要算法进行了深入的研究。基于乳腺影像数据库,提出了适合乳腺影像的图像增强算法及其量化评价方法、特征的提取和选择以及数据挖掘技术中的分类算法,研究成果已成功应用于计算机辅助诊断系统中。主要工作和创新点在以下几个方面:
1.本文将数据挖掘技术与数字图像处理技术有机结合,研究了图像数据的变换、特征提取和约简,利用支持向量机和粗糙集等方法,构建了进行医学图像数据挖掘的机器学习机制。
2.为了解决高密度乳腺中病灶区域很难分辨的问题,本文提出了适合钼靶X线图像的基于灰度均匀度的图像增强算法,并首次与已实现的算法进行了量化评估。为今后的图像增强量化评价体系和指标的建立,提供了理论和实验基础。
3.建立了一套比较完整的可以表征乳腺图像中肿块各方面特性的纹理特征、形状特征和统计特征,为肿块良、恶性计算机辅助分析提供了前提和基础。
4.本文研究了PCA和粗糙集相结合的图像特征选择方法,并提出了K-L变换结合属性平均依赖程度的算法进行特征选择。该算法能有效提高用于模式分类的特征选择效果。
5.首次提出了基于医学图像特征的近似支持向量机(PSVM)的分类思想。该算法较标准的SVM算法来说,速度更快,对硬件资源要求很低,同时更易于实现,效果也较理想。
6.在样本量有限且两类样本数量悬殊的情况下,PSVM算法的分类能力较低。就此问题,本文提出了DFP—PSVM算法,减弱多样本类对少样本类的影响,从而提高PSVM对于不均衡数据的分类能力。