基于特征学习的模糊图像质量评价与检测分割研究
【摘要】:数字图像已经成为人工智能与大数据时代不可或缺的核心信息载体。数字图像的采集、传播、处理、存储等全生命周期,不可避免地会伴随视觉质量的下降和蕴含信息的失真。而模糊,就是最为常见的一种数字图像降质失真形式之一。图像模糊不但在直观上影响图像的视觉感知,还会导致图像所蕴含重要知识的丢失,因此在图像到达终端前对其质量进行准确评价十分必要。而对于图像局部模糊区域的准确检测和分割,是对图像进行针对性复原的首要前提,同时对场景中所蕴含深层信息的挖掘和利用也尤为重要。因此,对模糊图像的整体质量进行有效评价,对其局部模糊区域进行准确检测分割,在计算机视觉领域是一个极具重要性和挑战性的研究课题。本文以模糊图像为研究对象,在频率域、列率域、深层次、多尺度以及复杂场景下对模糊特征进行深入地挖掘、提取和学习,围绕模糊图像的客观质量评价和区域检测分割展开研究。论文研究成果和创新点主要包含以下四个方面:1.针对全局模糊,提出了一种基于频率域特征的无参考无训练图像质量客观评价算法(NRNT-FIBE)。通过结合再模糊策略与离散余弦变换,NRNT-FIBE算法可以对离焦、运动、抖动等多种模糊形式的全局模糊图像进行有效地量化质量评分。同时,基于离散余弦变换构造的频域特征简洁精炼,相比其他基于人工构造特征的无参考模糊图像质量评价算法,无训练的NRNT-FIBE算法可以快速对图像的模糊程度进行表征和计算,在计算时间上具有优势。2.针对全局模糊,提出了一种基于深度稠密特征的全局模糊图像分类评级算法(DN-BIQC),可实现数字图像的快速Blur/Sharp二元质量分类,也可将待测图像按照模糊程度甄别为Excellent、Good、Fair、Poor和Bad五类,实现不同模糊程度图像的精确筛选和分流。算法基于密集连接卷积神经网络提取深度稠密特征,克服了网络由于深度增加而导致的梯度消失问题,进而提高了网络对特征的挖掘能力和利用效率。实验证明DN-BIQC算法具备较高的分类准确率,并对噪声具有较强的鲁棒性。3.针对局部模糊,提出了一种基于列率域特征的无参考无训练模糊检测算法(NRNT-SBDS)。结合再模糊策略和沃尔什一哈达玛变换,针对局部模糊图像,在列率域中探索出一种可对图像逐像素点模糊程度进行有效衡量的特征,实现局部模糊的快速检测。最后结合K-Means聚类算法和形态学运算可对图像的局部模糊区域进行精准分割。4.针对局部模糊,提出了一种基于多尺度融合特征和金字塔式M形集成模型(PM-Net)的复杂模糊区域检测算法。首先提出了一种全新的多输入多损失编码器-解码器网络(M-net)以学习由粗至细不同尺度的模糊特征。而后,针对尺度混淆问题,提出了多尺度M-net和统一融合层所组成的金字塔式集成模型(PM-Net)。PM-Net能够实现反常认知区域(如均质清晰区域和伪清晰背景)、多源模糊场景等复杂模糊区域的精确检测,且克服尺度混淆问题。重要的是,PM-Net具有毫秒级时间效率,远超秒级时间效率的同类方法,且具有较强的噪声鲁棒性和良好的模型泛化能力。