收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于结构化主题模型的图像分类方法研究

潘智勇  
【摘要】:图像分类是计算机视觉研究领域的重要问题之一,其准确性直接影响着人们对图像资源的有效利用。人工智能算法在分类速度和准确性等方面都有效地提高了图像分类的效果,但图像的底层特征表达与上层语义之间存在的“语义鸿沟”,仍然是严重影响图像分类准确率的一个重要因素。主题模型的主题是视觉词汇与上层语义之间的媒介,是克服“语义鸿沟”的有效方法之一。以图像分类问题为研究背景,本文针对隐狄利克雷分配(latent Dirichlet allocation,LDA)模型忽略视觉词汇之间空间位置关系的不足开展研究,从不同方面研究和探索具有空间信息的结构化主题模型的构建方法。结合图像数据特点,所提出的模型增强了对图像的表达能力,进而提高了图像分类的准确率;同时结合当前流行的深度学习方法,在主题模型中引入了卷积神经网络的特征表示,增强了主题模型的表达能力。本文研究的主要内容和贡献包括以下几方面:(1)提出融合图像内相邻主题结构关系的主题模型。LDA模型忽略了视觉词汇的空间位置关系,影响了其对图像表达的准确性。作为生成式模型,主题可以理解为视觉对象的组成部件,因此,相邻视觉词汇由同一主题产生的概率较高。据此,本文提出融合相邻视觉词汇对应主题间依赖关系的主题模型。在其主题采样过程中,模型利用马尔可夫随机场(Markov random fields)描述相邻视觉词汇对应主题之间的结构关系。该方法使主题对于对象组成部件的表达更有效,增强了图像特征表达的准确性,从而提高了图像分类的准确率。该方法明确了主题模型的主题在图像分类问题上的表现形式,从理论和实验两方面论证了在图像分类问题上,主题是以中层特征的形式表示对象的组成部件。(2)提出基于卷积特征的主题模型。卷积神经网络的特征对图像的表达更准确,但要求输入图像必须转换为固定尺寸,这会造成对象的形变或信息缺失。为克服这一问题,同时有效利用卷积特征,本文提出以主题模型替换最后一层池化层的主题模型结构。该模型提取不固定尺寸图像的卷积特征,通过聚类形成视觉词汇,以主题模型分析图像,并以主题分布将图像表示成固定长度的特征。该模型有效地避免了因调整图像尺寸而造成的信息缺失和图像表达不准确的问题。同时,该模型以卷积特征学习视觉词汇,有效地提高了主题对于对象组成部件的表达能力,也为其它模型利用卷积特征提供了参考。因此,该模型从特征表达的有效性和图像信息的完整性两方面,提高了主题模型对于图像的表达能力以及对图像分类问题的处理能力。(3)提出融合多尺度区域结构关系的主题模型。融合相邻主题结构关系的主题模型在主题采样过程中考虑了相邻视觉词汇对应的主题之间的结构关系,但在一定尺度的局部区域内,其他视觉词汇对应的主题也会对当前主题采样产生一定的影响。针对这一问题,本文提出融合多尺度区域主题结构关系的主题模型。该模型通过空间金字塔方法对图像进行多尺度划分,以主题模型分析各尺度区域内主题与视觉词汇之间的关系,从而表达视觉词汇在不同尺度区域内的空间位置信息。该模型组合所有区域的主题分布作为特征来表达图像,有效地反映不同尺度的区域信息,避免小尺寸对象或对象部件等信息的缺失,同时减弱了单一尺度的区域划分造成的对象误拆分等问题的影响。此外,该模型针对不同尺度区域的特点,应用不同的主题模型分析区域特征,使其在应用过程中更灵活并易于扩展。(4)提出并行在线学习的主题模型。融合相邻主题结构关系的主题模型基于批量离线方式学习模型参数,对内存和数据形式有较高的要求,运行效率较低。因此,本文针对其参数学习方式开展研究,利用增量吉布斯采样(incremental Gibbs sampling)算法,提出在线学习模型和并行在线学习模型。在线学习模型从序列数据中初始化模型参数,利用重采样方法更新模型参数。并行在线学习模型是在线学习模型的扩展,实现初始主题分配的并行化,利用服务端的重采样过程实现全局参数的学习和更新。本文提出的两种模型有效地从序列数据中学习模型参数,不需要将所有数据加载到内存,降低了对系统内存的需求,尤其在系统内存无法满足批量学习方式时,可以有效地实现主题采样和参数学习。因此,本文提出的两种模型增强了对于较多数据的处理能力,提高了模型计算速度和参数学习的效率。综上所述,本文针对LDA模型忽略空间结构信息的问题,从不同方面提出了更符合图像分类实际问题的结构化主题模型:融合图像内相邻主题结构关系的主题模型和融合图像内多尺度区域主题结构关系的主题模型,提高了图像中主题分配的准确性和主题对于对象组成部件的表达能力。同时,针对融合相邻主题结构关系的主题模型的参数学习方式,提出具有在线学习和并行学习能力的主题模型,从而提高了模型参数学习的效率,降低了模型学习过程对于系统内存的需求。此外,本文提出结合卷积特征的主题模型结构,提高了主题对于对象部件表达的准确性,为主题模型在图像分类任务的应用提供了新的方向,也为进一步解决卷积神经网络调整图像尺寸的问题提供了新的思路。


知网文化
【相似文献】
中国期刊全文数据库 前18条
1 罗杰;;优化主题信息及材料收集与利用的探讨[J];山东教育;2016年Z2期
2 祁宁;吴齐;赵青;;面向主题信息服务的垂直搜索引擎应用研究[J];图书馆学研究;2008年09期
3 曾利沙;论旅游指南翻译的主题信息突出策略原则[J];上海翻译;2005年01期
4 丁国君;;小学主题信息教育的探索与实践[J];中小学电教;2002年09期
5 唐建;洪宇;刘梦眙;姚亮;姚建民;;融合图片主题信息的图片描述翻译[J];中文信息学报;2019年07期
6 陈雄;都云程;李渝勤;施水才;;基于页面结构分析的论坛主题信息定位方法研究[J];微计算机信息;2010年27期
7 吴筱媛,邓红素,顾宁;基于主题信息和相关信息发现的元数据描述方法[J];计算机工程;2002年02期
8 田丽;;情报分析中提取主题信息核心要素的模型及方法[J];计算机与现代化;2018年10期
9 梁田;;个性化科研主题信息环境构建技术方案实践[J];图书情报工作;2012年S2期
10 罗长寿;康丽;刘国靖;;基于遗传算法的主题信息搜索系统研究[J];现代情报;2009年03期
11 王鑫;;元数据在主题信息网关中的应用[J];情报探索;2009年05期
12 郭亭亭;;主题信息突出原则在广东旅游翻译中的应用[J];青年文学家;2013年08期
13 ;2011年全国“爱牙日”活动主题和主题信息[J];口腔护理用品工业;2011年05期
14 欧健文,董守斌,蔡斌;模板化网页主题信息的提取方法[J];清华大学学报(自然科学版);2005年S1期
15 吴玲达,谢毓湘,栾悉道,肖鹏;互联网多媒体主题信息自动收集与处理系统的研制[J];计算机应用研究;2005年05期
16 蒋卓人;高良才;赵星;刘晓钟;袁珂;汤帜;;中英文科技主题排序相关性的比较研究:以计算机领域为例[J];情报学报;2017年09期
17 曾佳婷;;主题活动中家长资源的有效利用[J];儿童与健康;2018年06期
18 朱梦麟;李光耀;周毅敏;;基于树比较的Web页面主题信息抽取[J];微型机与应用;2011年19期
中国重要会议论文全文数据库 前10条
1 冯少卿;都云程;施水才;;基于模板的网页主题信息抽取[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
2 黄俊;;公共图书馆主题图书馆建设实践与思考——以江西省为例[A];中国图书馆学会年会论文集(2015年卷)[C];2015年
3 李燕;李胜阳;许志辉;朱子建;李长松;;基于本体语义的流域决策主题信息组织研究[A];大数据时代的信息化建设——2015(第三届)中国水利信息化与数字水利技术论坛论文集[C];2015年
4 王琦;唐世渭;杨冬青;王腾蛟;;基于DOM的网页主题信息自动提取[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
5 丁晓阳;王兰成;吴彬;;基于词频与改进余弦相似算法的主题挖掘及索引应用研究[A];2019年中国索引学会年会暨学术研讨会论文集[C];2019年
6 刁宇峰;王昊;林鸿飞;杨亮;;博客中重复评论发现[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
7 刁宇峰;林鸿飞;;基于LDA模型的博客垃圾评论发现[A];第六届全国信息检索学术会议论文集[C];2010年
8 王玉婷;杜亚军;涂腾涛;;基于Web链接的主题爬行虫初始URL的研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
9 何莉;林鸿飞;;分布式检索中基于主题的语言模型集合选择策略[A];2009年全国开放式分布与并行计算机学术会议论文集(下册)[C];2009年
10 田少娟;魏慧楠;王镭;;基于LDA主题模型的评论热点挖掘与手机产品性能分析[A];2017年(第五届)全国大学生统计建模大赛获奖论文选[C];2017年
中国博士学位论文全文数据库 前3条
1 潘智勇;基于结构化主题模型的图像分类方法研究[D];哈尔滨工业大学;2019年
2 梁晓贺;基于超网络分析的微博舆情主题发现研究[D];中国农业科学院;2019年
3 周厚奎;概率主题模型的研究及其在多媒体主题发现和演化中的应用[D];浙江大学;2017年
中国硕士学位论文全文数据库 前10条
1 蒋艺琪;基于情感分析和特征过滤的主题提取方法研究[D];华中科技大学;2019年
2 史盛楠;CTM主题模型在学科主题识别与学科文献分类中的应用研究[D];曲阜师范大学;2019年
3 姚海申;面向网络敏感信息的主题识别及其情感分析技术研究[D];中央民族大学;2019年
4 程梦丽;基于相关性和图分析理论的主题检测研究[D];华中师范大学;2019年
5 彭叶红;基于主题模型与变分自编码的情感对话生成技术研究[D];华中师范大学;2019年
6 李梦颖;基于主题模型的学习方法研究及其在用户画像上的应用[D];北京交通大学;2019年
7 叶康;基于主题模型和注意力机制的短文本方面提取研究[D];南京大学;2019年
8 陈明;基于主题翻译模型的社区问答中问句检索技术研究[D];武汉理工大学;2018年
9 雷俐;基于主题的微博重叠社区发现研究[D];中南财经政法大学;2018年
10 董德鸣;面向主题搜索引擎的若干关键技术的研究[D];沈阳建筑大学;2016年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978