基于判别性特征表示的图像检索算法研究
【摘要】:随着互联网的发展、社交媒体的兴起以及图像采集设备的普及,大量图像数据涌现在互联网上。图像数量的爆炸式增长,给图像检索带来了巨大的挑战。在图像检索中,通常使用词袋模型(Bag Of Words,简称BOW)对图像进行描述,得到检索结果之后使用RANSAC(RANdom SAmple Consensus,简称RANSAC)进行几何验证或者进行匹配验证实现重排序。这一检索框架存在三方面的不足:1)词袋模型完全忽略了图像中的空间结构信息,在图像的特征表示上没有充分利用空间信息增强判别性;2)面向规模较大的图像检索问题,需要相应的大规模的视觉词典,直接针对视觉词的度量方法,其计算复杂度高;3)基于RANSAC的几何验证或者匹配验证计算复杂度高。后两条导致检索效率不高。
针对以上三点不足,本文主要研究如何利用空间信息提高图像的判别性表示,如何利用哈希算法加快图像的检索速度,如何利用空间位置的粗匹配,加快图像验证。本文进一步研究了如何利用哈希算法解决自然场景中中文字符识别问题。本文的工作主要集中在以下两个方面:
(一)设计一个融合空间判别性信息的图像检索框架:在第一层使用粗粒度的几何信息,设计了空间最小哈希方法。哈希表示是词袋模型的零阶逼近,它随机的抽取了词袋表示的部分视觉词进行比较,提高了计算速度,然而丧失了部分判别信息。为了增加哈希表示的判别性,本文将图像先进行空间金字塔表示,然后在各个局部空间进行最小哈希算法,改善了检索的性能。在第二层图像验证层,使用细粒度的空间信息--局部空间金字塔表示,进行图像之间的配准验证。利用最大极值稳定区域(Maximally Stable Extremal Regions,简称MSER)和角点之间的空间位置关系,进行配准验证。该验证避免了图像之间所有点的完全匹配验证,通过特征分层验证,降低了计算量,加快了验证速度。
(二)针对于自然场景中文字符识别存在的字体不一致、数据集不平衡、常用中文字符类别多、类内样本少等问题,本文将图像检索的技术应用在自然场景汉字识别中。利用迭代量化算法用于中文字符识别,并结合编辑距离对识别的结果进行纠正。
|
|
|
|
1 |
胡君;一种快速求图像目标质心的方法[J];光学精密工程;1998年05期 |
2 |
郭旭平,李在铭;图像目标的可视识别与智能跟踪[J];系统工程与电子技术;1998年08期 |
3 |
袁峰;杜宇人;吴震宇;;基于Gabor小波和神经网络的图像目标识别[J];扬州大学学报(自然科学版);2009年02期 |
4 |
钱博;金林;;基于神经网络集成的SAR图像目标识别[J];现代雷达;2010年04期 |
5 |
邹策千;朱丽波;王亮;;序列图像运动目标的检测与提取[J];内蒙古农业大学学报(自然科学版);2010年02期 |
6 |
沈定刚,戚飞虎,李春茂;智能型目标识别系统[J];红外与毫米波学报;1995年03期 |
7 |
郭旭平,李在铭;跟踪系统中图像目标的快速提取技术研究[J];电子科技大学学报;1998年01期 |
8 |
袁湛;何友;蔡复青;;一种多目标环境下的SAR图像自适应CFAR检测方法[J];中国图象图形学报;2011年04期 |
9 |
魏波,李晓峰,李在铭;任意指定图像目标的实时检测与跟踪[J];系统工程与电子技术;2000年05期 |
10 |
王扬帆;;DSP在视频图像目标检测跟踪中的应用[J];煤矿机械;2008年07期 |
11 |
白成林;红外图像目标动态视觉处理系统[J];电脑学习;1996年03期 |
12 |
徐立亚,林纯青,戚飞虎;图像目标区域定位模糊法实现[J];红外与毫米波学报;1998年03期 |
13 |
刘伏虎,任世宏,朱贵明;一种图像目标实时识别系统[J];北京理工大学学报;1997年06期 |
14 |
宗思光,王江安;一种新的红外图像目标检测方法[J];海军工程大学学报;2004年03期 |
15 |
周庆瑞;原魁;邹伟;王辉;;一种基于FPGA的实时彩色图像目标分类方法[J];机器人;2006年02期 |
16 |
沈翀;;基于灰度梯度共生矩阵最大熵估计的盲视频水印算法[J];硅谷;2010年22期 |
17 |
宋克欧;黄凤岗;兰晓亭;;二值图像目标质心快速搜索跟踪算法[J];模式识别与人工智能;1998年02期 |
18 |
余农,李予蜀,王润生;自动检测图像目标的形态滤波遗传算法[J];计算机学报;2001年04期 |
19 |
陈东,黄勇杰,沈振康;红外图像目标分割方法研究[J];系统工程与电子技术;2002年01期 |
20 |
胡粲彬;刘方;周军红;;基于位平面特征的SAR图像筛选[J];计算机应用;2009年11期 |
|