收藏本站
《浙江大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

基于语义的Web图像分类研究

朱蓉  
【摘要】:随着数码成像产品和大容量存储设备价格的日益低廉,每天都会产生成千上万的数字照片,导致互联网上多媒体信息的数量呈爆炸性增长。此外,图像搜索引擎(如Yahoo!、Google)和在线照片管理与共享应用软件(如Flickr),促使图像信息资源在网络环境中随处可见。网络用户可以方便地建立自己的数字照片集,并在线与他人共享和交流。但如何高效地表示、索引和检索Web图像,有必要分析图像的内容,挖掘隐含在图像中的语义信息。基于语义的图像分类是从海量的Web图像中发现有用信息的重要途径,具有巨大的应用前景。当前,图像分类虽然在低层视觉特征的提取上较为成熟,但高层语义信息获取的有效性却常常无法满足实际需求。其次,Web图像通常具有大规模、高维数、非线性的特性,并且在内容上又表现出丰富性和多样性。因此,基于语义的Web图像分类既是一个迫切需要解决的关键问题,也是一个极具挑战性的研究课题。 本文针对当前Web图像分类中存在的问题,提出了相应的解决方案,获取了一定的创新性成果。本文的主要贡献概括如下: (1)为了缩短存在于图像的低层视觉特征与高层语义信息之间的“语义鸿沟”,首先按照语义信息的抽象程度给出了一个三层的图像语义模型。然后,基于该模型,阐述了用来表述图像内容的具有代表性的语义信息表示方法。最后,从分析Web图像的特点入手,深入研究图像差异性产生的原因,这是获取高效的Web图像分类方法的前提。 (2)图像特征优化是处理Web图像分类中的高维图像数据的重要手段。图像特征优化可被形式化定义成一个五元组模型。采用邻域重建和半径递增搜索策略,提出了一种基于球状邻域的局部线性嵌入(GNLLE)。GNLLE不仅适用于稀疏数据集,而且具有较强的抗外界噪声能力和良好的拓扑结构稳定性。由于非线性维数约简通常采用基于点对的相似性计算去定义距离度量,又提出了一种基于球状邻域和路径聚类的局部线性嵌入(GNPCLLE)。由于GPNCLLE充分利用了数据相关性,有效减轻了数据集的整体拓扑结构的失真现象。在Web图像集上的实验结果显示了GNLLE和GNPCLLE的可行性和有效性。 (3)准确地从Web图像中提取感兴趣区域(ROI)是提升Web图像分类性能的关键。提出了一种新的图像分割策略,包含粗分割和精分割两个阶段。在第一阶段中,采用基于颜色和纹理特征的块聚类方法将一幅图像划分成四个区域,并依照摄影构图法则将ROI从背景中区分出来。此阶段用来确定目标区域。在第二阶段中,利用形状信息和矢量方法构建了一个活动轮廓模型,图像能量来自于色度梯度,外部能量来自于三角形内心引力和补力。此阶段用来精确地提取目标的边界。通过对Web图像进行实验,验证了提出的图像分割方法的有效性。 (4)面向图像集的批处理分类越来越受到研究者的关注。为了提高Web图像分类的准确率,提出了一个建立在图像语义的不同粒度层次上的分层次图像分类模型。定义了两种新的非线性流形:多类对象流形和单类场景模型。在对象层上的分类中,根据不同语义类别图像之间的类内差异和类间差异,利用扩展的局部线性嵌入(ELLE)算法构建了一个多类对象流形。在场景层上的分类中,依照不同场景为同一种语义类别的图像构建了一个单类场景流形,并基于区域增长和线性扰动,提出了一种线性子流形自动生成(LLSE)算法。提出的面向对象的分层次图像分类模型的性能在Web图像集上进行了测试。 (5)针对Web图像分类的复杂性,提出了一种基于双流形学习的图像分类方法,将图像分类问题从高维空间转换到低维空间中解决。首先,利用正例类图像和反例类图像之间的显著差异,分开建立两个带有不同固有维数的非线性流形。然后,借助于GNLLE具有的相似性数据聚集的特性,确定各个流形的聚集中心。最后,应用在基于双流形的距离度量上构造的分类器,实现了基于全局的图像分类,克服了建立在整体流形上的分类方法无法反映数据之间真实关系的缺陷。在Web图像集上的实验结果表明了提出的基于全局的图像分类方法是高效的。
【学位授予单位】:浙江大学
【学位级别】:博士
【学位授予年份】:2011
【分类号】:TP391.41

知网文化
【参考文献】
中国期刊全文数据库 前10条
1 聂青;战守义;;基于区域特征的图像分类技术[J];北京理工大学学报;2008年10期
2 李惠光;李国友;石磊;吴惕华;;基于Fuzzy的隐马尔可夫模型主动轮廓线模型[J];测试技术学报;2006年02期
3 汪祖媛,郑浩然,庄镇泉,王煦法;基于颜色的自组织聚类分析图象检索算法[J];电路与系统学报;2003年01期
4 高永英,章毓晋,罗云;基于目标语义特征的图像检索系统[J];电子与信息学报;2003年10期
5 石先军;于伟东;袁子厚;;基于贝叶斯方法的山羊绒与细羊毛的鉴别[J];纺织学报;2008年01期
6 杨晓敏;吴炜;何小海;陈默;薛磊;;一种基于流形学习的手写体数字识别[J];光电子.激光;2007年12期
7 王惠锋 ,孙正兴 ,王箭;语义图像检索研究进展[J];计算机研究与发展;2002年05期
8 王元全,汤敏,王平安,夏德深,徐晔;Snake模型与深度凹陷区域的分割[J];计算机研究与发展;2005年07期
9 王和勇;郑杰;姚正安;李磊;;基于聚类和改进距离的LLE方法在数据降维中的应用[J];计算机研究与发展;2006年08期
10 张辉;戴芳;赵凤群;胡阳涟;;基于Snake模型的复杂区域图像分割[J];激光与红外;2008年04期
中国博士学位论文全文数据库 前2条
1 江志伟;基于内容的WEB图像过滤技术研究[D];浙江大学;2007年
2 曾璞;面向语义提取的图像分类关键技术研究[D];国防科学技术大学;2009年
【共引文献】
中国期刊全文数据库 前10条
1 程一斌,汪松,任彬;利用弹簧模型提取物体轮廓[J];安徽大学学报(自然科学版);2001年02期
2 张坤,罗立民,舒华忠,杨芳;基于Level Set方法的Visible Human Being虚拟人图像处理[J];安徽大学学报(自然科学版);2005年04期
3 梁祥君,吴国忠,程文娟,朱俊红;颜色直方图在彩色物料识别中的应用[J];安徽机电学院学报;2000年01期
4 张雪飞;;基于GVF模型的蔬果图像快速分割方法[J];安徽农业科学;2010年05期
5 汪慧兰;罗斌;;基于综合特征的彩色图像检索[J];安徽师范大学学报(自然科学版);2007年04期
6 顾红飞,孙光灵,屠菁;一种基于颜色布局的压缩图像检索方法[J];安庆师范学院学报(自然科学版);2005年02期
7 赵莹;张学东;;改进水平集的车辆检测算法[J];辽宁科技大学学报;2010年05期
8 张鹤;董彦麟;;一种改进的变分水平集车辆检测技术[J];辽宁科技大学学报;2011年03期
9 姚洪英,范铁生;基于压缩域的视频摘要技术的研究[J];鞍山师范学院学报;2004年02期
10 李聪;张全法;郑丹;;CCD测量液体折射率时边缘检测算法的改进[J];安阳师范学院学报;2006年05期
中国重要会议论文全文数据库 前10条
1 谭守标;霍剑青;郝建;王晓蒲;赵永飞;谢行恕;;高分辨率软X射线显微成像下细胞的自动提取?[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 程玉宝;;基于数学形态学的红外小目标检测研究[A];光子科技创新与产业化——长三角光子科技创新论坛暨2006年安徽博士科技论坛论文集[C];2006年
3 ;A Hardware-Accelerated Segmentation Algorithm for Moving Object Generation[A];第二十七届中国控制会议论文集[C];2008年
4 周佳男;;一种拓扑纹理图像的相位场模型分割算法[A];第二十七届中国控制会议论文集[C];2008年
5 ;Edge Detection of Wood Defects in X-ray Wood Image Using Neural Network and Mathematical Morphology[A];第二十九届中国控制会议论文集[C];2010年
6 邱雪娜;刘士荣;刘斐;朱伟涛;杜方芳;;一种基于序贯检测机制的运动目标跟踪算法[A];第二十九届中国控制会议论文集[C];2010年
7 侯杰;茅耀斌;孙金生;;基于FDA的快速haar特征选取及其在级联AdaBoost人脸检测中的应用[A];中国自动化学会控制理论专业委员会D卷[C];2011年
8 赵建;刘伟宁;;基于主动轮廓模型的海天线检测算法[A];第九届全国信息获取与处理学术会议论文集Ⅰ[C];2011年
9 高晓阳;王泽京;毕阳;张明艳;李红岭;孔彦龙;毛红玉;;基于单片机和机器视觉的马铃薯品质分级研究[A];中国农业工程学会2011年学术年会论文集[C];2011年
10 谷军霞;姚鸿;;基于内容的视频检索在电视会商多媒体数据检索中的应用[A];2011年中国气象学会气象通信与信息技术委员会暨国家气象信息中心科技年会论文摘要[C];2011年
中国博士学位论文全文数据库 前10条
1 王兴梅;水下声纳图像的MRF目标检测与水平集的轮廓提取方法研究[D];哈尔滨工程大学;2010年
2 梁洪;基于内容的医学图像检索及语义建模关键技术研究[D];哈尔滨工程大学;2010年
3 邬俊;基于交互式语义推理的图像检索算法研究[D];大连海事大学;2010年
4 乔小燕;基于生物