收藏本站
收藏 | 论文排版

基于主题模型的场景视觉理解研究

王一鸣  
【摘要】:场景理解是是计算机视觉研究主要目的之一。场景理解属于高层视觉范畴,其主要任务包括识别复杂场景中的对象、判别对象间的关系、解释事件发生的时间和地点等。场景理解需要综合视觉领域多个方向的研究成果,如在物体识别与分割的基础上,通过结合场景标注、分类等信息可以进一步解决场景理解问题。近年来,基于词包表示的主题模型已广泛应用于物体识别与分割中,并取得了较好的结果。但是现有模型大多存在缺陷,特别是假设主题的生成与像素块的生成均是独立的,缺少对场景中不同对象关系的建模,且一般难以更好地利用场景中其它模态的信息。 本文提出了一种新的统一概率图模型,采用基于主题的一致区域标注方法来自动标注图像区域。本文模型在以下两方面扩展了经典的LDA模型:在主题层次通过将Markov随机场引入空间相邻关系的约束,以及加入标注模块来学习和推断图像的区域标注。本文给出了平均场变分推断法进行模型学习和推断的具体方法。本文模型有如下两个优点。第一,我们对空间信息作显式建模,以获得更加连续一致的区域标注;第二,在训练模型时我们只需要对图像整体的标注,而不必把标注关联到特定的像素或区域,这种标注和图像区域的关联可以自动推断,有效地减轻了人工标注的成本,提高了效率。基于本文学习所获得的模型,可以给定一张无文字信息的场景图像,自动标注其中的场景区域。最后.我们通过在2个公开数据库上的实验评估了本文模型和方法的性能。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王瑞芳,程晓舫;一种新型的视觉系统——原理和概念设计[J];光学技术;2001年05期
2 徐菁睛;;“视觉音乐”全球总动员[J];多媒体世界;2007年01期
3 刘俊鲜;;多媒体环境中的音乐教学探索[J];广东广播电视大学学报;2007年06期
4 杨雪荣;张湘伟;成思源;黄曼慧;;实物表面数字化技术研究进展[J];机床与液压;2008年08期
5 胡丹;邱模庆;;电视新闻现场报道的动作视觉之美——以北京奥运直播为例[J];新闻界;2008年04期
6 罗国昭;;海尔电脑推出首款视觉PC[J];新电脑;2008年08期
7 梁富伟;;多媒体视听教材制作中素材组接探析[J];现代教育技术;2009年S1期
8 许增朴,于德敏;光-象平面自动标定方法的研究——用于三维计算机视觉系统[J];天津科技大学学报;1993年S1期
9 唐国维,王东,刘显德,李永树,何明革;基于统计测试的道路图象边界提取方法[J];大庆石油学院学报;1999年03期
10 李允明;;国外仿人机器人发展概况[J];机器人;2005年06期
11 王卫星;崔冰;赵芳;;金属矿山数字化[J];金属矿山;2005年11期
12 左森;郭晓松;万敬;郭君斌;;一种导航线快速检测算法[J];计算机工程;2007年04期
13 夏长念;吴超;刘晓明;;应用人机工程学原理制作Powerpoint[J];现代教育技术;2007年04期
14 陈艳欢;;论新时期档案馆形象设计[J];兰台世界;2007年10期
15 钱震;;多媒体教学系统检测方法与标准的制订[J];甘肃科技纵横;2009年01期
16 秦丽娟;胡玉兰;魏英姿;王红;;一种基于平面四边形的视觉定位算法[J];沈阳理工大学学报;2009年02期
17 徐澄;;先天耳聋者有“超级视觉”[J];记者观察(下半月);2011年05期
18 郑贱德;;视觉新闻及其写作[J];衡阳师范学院学报;1987年04期
19 顾嗣扬;施鹏飞;李介谷;;一种基于直线Hough变换的识别曲线及参数估计方法[J];模式识别与人工智能;1994年01期
20 鞠胜利;;明天上演Web剧[J];每周电脑报;1998年19期
中国重要会议论文全文数据库 前10条
1 程燕;周军英;单正军;;农药生态风险评估中的暴露场景研究[A];中国毒理学会环境与生态毒理学专业委员会第二届学术研讨会暨中国环境科学学会环境标准与基准专业委员会2011年学术研讨会会议论文集[C];2011年
2 石自强;杨静;郑铁然;韩纪庆;;基于锚空间的音频场景识别[A];第十一届全国人机语音通讯学术会议论文集(一)[C];2011年
3 周智洪;陈琅琅;;2/3G互操作场景优化案例[A];广东通信2010青年论坛优秀论文集[C];2010年
4 钱丽勋;李卓;李平;李艳红;范增明;;红外场景生成新技术[A];第九届全国光电技术学术交流会论文集(上册)[C];2010年
5 刘佳;张爱武;杨丽萍;;室内场景激光点云数据的三维建模[A];《测绘通报》测绘科学前沿技术论坛摘要集[C];2008年
6 郑海滨;代俊雅;乐小燕;;电影视觉特效制作技术的现状与发展趋势[A];全国数字媒体技术专业建设与人才培养研讨会论文集[C];2011年
7 韩世亮;;视觉影响力之于环保清洁产品的发展[A];第31届[2011]中国洗涤用品行业年会论文集[C];2011年
8 王君珂;王柏;艾波;;电信运营支撑系统的业务场景体系结构模式[A];2004年全国通信软件学术会议论文集[C];2004年
9 田宏杰;;场景对物体视觉记忆的作用[A];第十一届全国心理学学术会议论文摘要集[C];2007年
10 屠珺;;一种基于迭代式RELIEF算法的农业机器人导航场景在线特征选取方法[A];中国农业工程学会2011年学术年会(CSAE 2011)论文摘要集[C];2011年
中国博士学位论文全文数据库 前10条
1 刘硕研;面向感知的图像场景及情感分类算法研究[D];北京交通大学;2011年
2 李晟;视觉假体装置模型建立及视觉信息处理研究[D];上海交通大学;2011年
3 刘海鹏;语言的视觉语义表征及其在场景自动描述系统中的应用研究[D];北京邮电大学;2011年
4 李建忠;综采工作面场景及覆岩垮落的动态虚拟[D];太原理工大学;2010年
5 刘峰;大规模森林场景的实时绘制及动态模拟[D];浙江大学;2011年
6 张莹莹;自然刺激下小鸡视网膜神经节细胞群体放电活动时空特性的研究[D];上海交通大学;2011年
7 姚其;民机驾驶舱LED照明工效研究[D];复旦大学;2012年
8 周文罡;基于局部特征的视觉上下文分析及其应用[D];中国科学技术大学;2011年
9 蒋萍;融合机器人视/嗅觉信息的气体泄漏源定位[D];天津大学;2010年
10 苏琼;“她人”场景:现代女性戏剧论[D];南京大学;2001年
中国硕士学位论文全文数据库 前10条
1 王一鸣;基于主题模型的场景视觉理解研究[D];南京大学;2012年
2 张晨晨;基于历史还原与再创造的新媒体游戏场景研究[D];华中师范大学;2011年
3 胡珺;面向倒装芯片拾取的视觉系统设计与开发[D];上海交通大学;2010年
4 王雷;基于多源传感器的视觉合成增强技术研究[D];合肥工业大学;2010年
5 程琳;目标识别中视觉稳定性特征提取方法的研究[D];青岛科技大学;2010年
6 李华峰;当代“图像模拟”话语的结构与传达[D];吉林大学;2010年
7 高洁;性别视野下的目光政治[D];复旦大学;2010年
8 向永嘉;行星无人探测车视觉系统算法的研究[D];湖南大学;2010年
9 卢文玉;基于视觉的车辆防撞预警研究[D];南京航空航天大学;2011年
10 王迪;综合实验风格在动画场景中的表现[D];湖北工业大学;2011年
中国重要报纸全文数据库 前10条
1 砺岩;视觉形象识别系统正式投入使用[N];中国工商报;2010年
2 范宏国 程仕栋;神州视觉展峥嵘[N];人民日报海外版;2010年
3 上海纺织有限公司高级工程师 陈邦伟;橱窗陈列的视觉营销[N];中国纺织报;2011年
4 孙慨;2008中国摄影:在起伏中蓄聚力量[N];中国摄影报;2009年
5 李国敏;欧特克软件为《特种部队》装备震撼视觉武器[N];科技日报;2009年
6 本报记者 许泳;视觉标签:贴上就跑不掉![N];计算机世界;2010年
7 周展;透视“复原战争场景”热潮[N];解放军报;2011年
8 特约作者 红人氽氽;3D动作网游 激战2010[N];电脑报;2010年
9 通讯员 李慧 记者 王夏斐;2010杭州生活品质视觉点评摄影大赛揭晓[N];杭州日报;2010年
10 本报记者 岳纲举;场景搭配技术 把精彩轻松留住[N];中国消费者报;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978