收藏本站
《中国科学技术大学》 2008年
收藏 | 手机打开
二维码
手机客户端打开本文

面向结构化数据的视频检索研究

顾志伟  
【摘要】: 视频数据在近几年呈现出爆炸式的增长,在人们的日常生活中占据越来越重要的地位,而视频分享在未来数年甚至数十年也都将会是热点,这使得视频内容分析以及视频检索成为当前视频研究领域的重点。基于内容的视频检索(CBVR)是一项集理论性、实用性和挑战性为一体的技术,经过十几年的研究,取得了巨大的进展,已经有一些原型系统开发出来,并在小型商用搜索引擎中使用。在CBVR中,广义的视频结构化起着非常关键的作用。由于原始视频为无结构的数据流,在检索时首先需要采用合适的模型将视频组织为结构化数据,并根据结构化的组织形式对视频进行分析、索引与查询。本文的主要工作目标是研究视频的数据结构化特性,并充分利用其结构特性设计高效的机器学习算法用于高层语义理解,能够自动地或以较少的人工参与缩小底层特征与高层语义之间的“语义鸿沟”,最终改善视频检索的性能。 本文以视频的结构为主线,分别从图像层次结构、镜头层次结构和场景层次结构进行研究,提出在这些层次结构下的机器学习算法。本文的主要工作和创新点总结如下: 1.针对基于全局信息的图像层检索,提出采用AdaBoost方法与SVM相结合进行多次样本抽样,将分类精度作为特征性能的判据进行特征选择,选取少量有利于检索的特征,将弱分类器增强为强分类器,从而较好的融合多种特征。 2.对基于区域信息的图像层检索,采用多示例学习进行建模,并利用多示例主动学习以减少人工标注的工作量,解决标注样本缺乏问题。文中详细分析多示例主动学习的特点,归纳为包层、示例层和混合层次三种主动学习模式;针对包层多示例主动学习问题,提出一种结合示例数目统计特征和不确定性的样本选择策略,实验验证了该方法的有效性。 3.镜头是视频的基本物理单元,因此视频检索通常都是在镜头级别进行。本文分析视频本身所具有的多层次结构特性,首次提出多层次多示例学习框架,该框架结合了结构学习和多示例学习的特点,能对视频内容有效建模。文中探讨多层次多示例学习需要解决的关键问题,并针对这些问题设计多个算法构成一个完整的框架。本文首先设计多层次多示例核来度量这种特定结构下样本的相似度;然后利用边缘化核的思想对多层次多示例核进行改进得到边缘化多层次多示例核,解决示例贡献的权重问题;继而提出多层次多示例正则化框架,引入多重约束显式地表达多层次结构和多示例关系特性,最终较好地解决了多层次多示例学习问题。 4.场景是视频中的语义单元,比镜头具有更高的抽象和概括能力,在视频语义理解时有效地结合场景信息将对视频检索、管理等语义级应用提供支持。本文提出一种将全局分布特性和局部相似性约束结合的基于能量最小化的方法进行场景分割(EMS);同时,提出一种将场景分割结果与自动语音识别(ASR)结果融合的方法用于视频检索中,得到更加优异的性能。
【学位授予单位】:中国科学技术大学
【学位级别】:博士
【学位授予年份】:2008
【分类号】:TP391.41

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 龚书;瞿有利;田盛丰;;基于维基语义的多文档文摘研究[J];南京大学学报(自然科学版);2011年04期
2 宁慧;文雪巍;邹韵;吴良杰;;基于语义分析的数据驱动型漏洞检测方法[J];应用科技;2011年06期
3 程录庆;;数据依赖的语义分析[J];南阳师范学院学报;2011年09期
4 侯琰霖;;微博分析:外媒业务拓展新方向[J];中国记者;2011年07期
5 朱志国;;基于URL语义分析的Web用户会话识别方法[J];大连理工大学学报;2011年05期
6 王水利;黄广君;霍亚格;;基于语义分析的查询扩展方法[J];计算机工程;2011年16期
7 张玉峰;何超;;基于领域本体的语义文本挖掘研究[J];情报学报;2011年08期
8 孙淑娟;牟德昆;;软插件模式在Windows语音助手中的应用[J];潍坊学院学报;2011年04期
9 张志林;;人民出版社数字出版堆叠创新初探[J];中国出版;2011年17期
10 闫青;翟瑞生;;基于本体的智能检索技术研究[J];中小企业管理与科技(上旬刊);2011年09期
中国重要会议论文全文数据库 前10条
1 陈银科;;非陈述句的语义分析[A];1998年逻辑研究专辑[C];1998年
2 潘新玲;;我的地盘——表总括的“都”的语义分析及其左邻右舍的限制[A];2007年福建省辞书学会第18届年会论文提要集[C];2007年
3 贾君枝;刘焘;李景峰;;基于Web保险信息的语义分析初探[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
4 王美娟;;矛盾修辞法的语言学研究[A];福建省外国语文学会2009年年会暨学术研讨会论文集[C];2009年
5 高路;杨玉芳;;口语语篇中语句焦点确定的研究[A];第十届全国心理学学术大会论文摘要集[C];2005年
6 蔡骋;林健文;谈正;;面向视频检索的自适应最优阿而发裁减均值直方图[A];第十三届全国图象图形学学术会议论文集[C];2006年
7 续子恺;林晔;;基于语义的新闻采集和分析系统在报业的应用[A];中国新闻技术工作者联合会2008年学术年会论文集(上)[C];2008年
8 董文莉;孟洛明;;XML网管接口一致性测试中XML解析器的开发[A];第六届全国计算机应用联合学术会议论文集[C];2002年
9 邓辉;林柏钢;;一种基于《知网》的敏感信息预测技术[A];第十届中国科协年会论文集(三)[C];2008年
10 刘怀军;车万翔;刘挺;;中文语义角色标注的特征工程[A];第三届学生计算语言学研讨会论文集[C];2006年
中国重要报纸全文数据库 前10条
1 迟晓春 译;第一生命联合IBM 共同研发语义分析解决方案[N];中国保险报;2010年
2 吴思、杨春、王雁凌;掀起多媒体检索革命[N];中国计算机报;2002年
3 樊洪业;科学精神的历史线索与语义分析[N];大众科技报;2002年
4 刘仁;“语义分析”升级专利机器翻译[N];中国知识产权报;2008年
5 樊洪业;科学精神的历史线索与语义分析[N];大众科技报;2002年
6 樊洪业;科学精神的历史线索与语义分析[N];中华读书报;2001年
7 ;SurfControl: 强劲的反垃圾邮件引擎[N];计算机世界;2006年
8 陆元婕;聪明的搜索引擎[N];中国计算机报;2001年
9 海量智能计算技术研究中心 霍刚;新兴技术为互联网加速[N];计算机世界;2007年
10 特约记者 颜世宗;Blinkx:传统搜索终结者?[N];电脑报;2005年
中国博士学位论文全文数据库 前10条
1 顾志伟;面向结构化数据的视频检索研究[D];中国科学技术大学;2008年
2 吴平;汉语部分句式的形式语义分析[D];北京语言大学;2005年
3 史迎春;基于内容的视频检索语义提取若干问题研究[D];南京理工大学;2005年
4 余继宏;基于符号学理论的家具形态研究[D];南京林业大学;2009年
5 智敏;基于内容的视频检索和浏览的关键技术[D];北京邮电大学;2006年
6 耿玉亮;基于内容的视频结构化技术的研究[D];北京交通大学;2006年
7 唐波;视频数据检索关键技术研究[D];国防科学技术大学;2005年
8 韩冰;基于智能软计算的视频镜头分割算法研究[D];西安电子科技大学;2006年
9 由丽萍;构建现代汉语框架语义知识库技术研究[D];上海师范大学;2006年
10 曹建荣;基于内容的风光记录片检索技术研究[D];北京邮电大学;2007年
中国硕士学位论文全文数据库 前10条
1 邢宣宇;基于主题会话的语义分析工具的研制[D];湖南大学;2005年
2 张明芹;AB式象声词的重叠形式研究[D];广西师范大学;2006年
3 阮贵义;汉语借用动量词及相关问题研究[D];北京语言大学;2007年
4 简榕蓉;现代汉语动词计量的语义分析及教学策略[D];华中科技大学;2006年
5 宋光鹏;文本的情感倾向分析研究[D];北京邮电大学;2008年
6 谢慧萍;现代汉语动词表层语义研究[D];湘潭大学;2005年
7 梁良;异种程序设计语言间的翻译模型设计及方法研究[D];电子科技大学;2005年
8 李利霞;微型数据库引擎的研究[D];武汉理工大学;2006年
9 贺阳剑;基于格语法和VerbNet的问答系统研究[D];中南大学;2007年
10 肖伟;基于语义的BLOG社区文本倾向性分析[D];上海交通大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026