收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

视频搜索结果的重排序研究

刘媛  
【摘要】: 互联网中视频数据在近几年呈爆炸式增长并且广泛分布,使得视频搜索成为当前视频研究的重点和热点。由于文本搜索的成功应用,现今通用的大型视频搜索引擎,如Google、Yahoo!、Live、百度等主要还是利用视频数据周围的文本信息,采用基于文本搜索的方法实现视频搜索和排序。然而,视频内容及其所包含的复杂意义通常是语言工具难以完整描述与表达的。为了解决这种原始文本搜索的缺陷,视频搜索结果的重排序逐渐引起了众多研究者的关注。重排序,是指基于原始搜索排序的基础上,通过挖掘数据内在关联、或者借鉴外部知识和人工干预,对原始搜索结果进行重新排序的过程,目的是提高搜索质量和提升用户搜索体验。 本论文首先提出一种新颖的基于查询独立的学习框架,接着从三个阶段研究了视频搜索结果的重排序中的关键问题,即自重排序(仅从自身挖掘相关知识)、样例重排序(利用用户提供的查询样例)和群重排序(利用从外部搜索引擎的结果中挖掘的知识)。显然这三个阶段涵盖了现今的大部分视觉信息重排序的框架和方法。本文对视频重排序方法进行了深入的研究,主要工作和创新之处归纳为以下几点: (1)对于查询独立的学习框架,本文提出了在“查询-镜头”对中学习相关性关系。与传统的查询依赖的学习框架不同,该种方法的训练模型和任何查询没有直接关系,故训练样本在所有的查询中能达到共享,更适用于实际的应用。在这种查询独立的学习框架下,各种机器学习的方法都可以扩张并应用,从而进一步提出了一种基于SVM模型的全监督查询独立的学习方法和一种基于多图模型的半监督的查询独立学习方法。经过大量实验证实,查询独立的学习方法明显优于传统的查询依赖的学习方法,从算法的运算量角度看,查询独立的学习方法也更具有实用性。 (2)对于自重排序,本文提出一种基于典型性的视频结果的重排序方法。传统的基于学习的重排序方法往往只关心训练样本的相关性或多样性,却忽略了样本的典型性。本文提出在考虑相关性和多样性的同时应兼顾样本的典型性。首先根据样本的概率分布定义视频/图像的典型性,并将样本选择看成一个既考虑样本典型性又兼顾原始搜索结果的优化问题,最后基于选择的高典型性样本并利用SVM构建重排序模型,实验表明该模型具有较好的泛化能力和较强的鲁棒性。 (3)对于样例重排序,本文提出一种基于查询样例的全监督视频重排序方法。传统的全监督的视频重排序方法常根据经验将重排序问题转化为二类的分类问题,样本完全根据分类的置信度进行排序。文中提出了重排序实际上应是一个优化问题,即一个序列中的任意两个样本都能正确排序即可达到全局最优,而不是简单地区分每一个样本是否相关。在这样的框架下,进一步提出两种重排序算法,即直接重排序和插入重排序。实验证实,新的重排序方法可以较大程度地改进原始的搜索结果,与其他一些经典的重排序方法相比,也具有较大的优势。 (4)对于群重排序,是本文中提出的重排序问题的新的发展阶段,旨在从互联网中挖掘相关的视觉原型并利用到重排序中。据大量资料的调研,群重排序是首次将互联网中的群包数据应用到搜索结果的重排序当中,与传统的自重排序和样例重排序有显著的不同。首先利用多个搜索引擎返回的结果图像构建一组视觉单词;接着在此视觉单词中挖掘两种视觉原型(显著度和共存性);最终基于该视觉原型将重排序问题转化为一个优化问题,并给出封闭解。实验表明,群重排序对原始搜索结果的提高是较稳定的,与传统的重排序方法相比有较明显的提升。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 杨绪兵;潘志松;陈松灿;;半监督型广义特征值最接近支持向量机[J];模式识别与人工智能;2009年03期
2 赵莹;张健沛;杨静;王冠军;;一种改进的分枝定界半监督支持向量机学习算法[J];电子学报;2010年02期
3 许洪贵;赵琨;田英杰;;鲁棒半监督ν-支持向量分类机[J];系统科学与数学;2010年02期
4 赵琨;孔祥纬;田英杰;;带有多面体扰动的半监督v-支持向量分类机[J];中国管理科学;2010年01期
5 常志勇;刘叶青;谷明涛;;用于在线数据分类的半监督最接近支持向量机[J];计算机工程与应用;2010年29期
6 张健沛;赵莹;杨静;;最小二乘支持向量机的半监督学习算法[J];哈尔滨工程大学学报;2008年10期
7 王雪松;张晓丽;程玉虎;李立晶;;一种基于谱聚类的聚类核半监督支持向量机[J];中国矿业大学学报;2010年06期
8 孙晓燕;任洁;巩敦卫;;基于半监督学习的变种群规模区间适应值交互式遗传算法[J];控制理论与应用;2011年05期
9 杨剑;王珏;钟宁;;流形上的Laplacian半监督回归[J];计算机研究与发展;2007年07期
10 李永忠;王汝山;张念贵;王玉雷;;基于半监督模糊聚类的入侵检测技术[J];江苏科技大学学报(自然科学版);2010年04期
11 傅向华,冯博琴,马兆丰,何明;可在线增量自学习的聚焦爬行方法[J];西安交通大学学报;2004年06期
12 丁磊,钱云涛;不同程度的监督机制在自动文本分类中的应用[J];计算机应用与软件;2004年06期
13 张晨光;李玉鑑;;基于半监督学习的眉毛图像分割方法[J];计算机工程与应用;2009年21期
14 刘叶青;刘三阳;谷明涛;;一种多项式光滑的半监督支持向量机分类算法[J];计算机科学;2009年07期
15 鲁珂,赵继东,叶娅兰,曾家智;一种用于图像检索的新型半监督学习算法[J];电子科技大学学报;2005年05期
16 董建设;任丽;周燕玲;;中文自动文摘在搜索引擎中的应用[J];情报科学;2006年02期
17 张亮;黄河燕;胡春玲;;中文问答系统模型研究[J];情报学报;2006年02期
18 吴华;徐甜;;机器翻译中源语分析的研究与探讨[J];安阳工学院学报;2006年02期
19 李妍妍;李媛媛;叶世伟;;基于流形正则化的分类与回归算法及应用[J];计算机仿真;2007年10期
20 罗进;周学君;;半监督学习中非标记数据的利用[J];湖北大学学报(自然科学版);2008年01期
中国重要会议论文全文数据库 前10条
1 陶俊明;;基于作业计划编制方法的运输组织研究方式探讨[A];2009年山东省科协学术年会胶济客运专线相关技术研讨会论文集[C];2009年
2 傅一栋;;多目标规划理论在新建隧道开挖顺序优化问题中的应用[A];自主创新与持续增长第十一届中国科协年会论文集(2)[C];2009年
3 宝音;;小行星探测中的动力学与优化问题[A];第三届全国动力学与控制青年学者研讨会论文摘要集[C];2009年
4 廖成林;赵鹏;;基于灰色局势模型的营销产品决策[A];2000中国控制与决策学术年会论文集[C];2000年
5 桂卫华;黄泰松;阳春华;;一种改进遗传算法及其在原料采购优化中的应用[A];第十九届中国控制会议论文集(二)[C];2000年
6 樊印海;赵宏革;朱景伟;;优化课程设置,全面推进素质教育进程[A];第一届全国高校电气工程及其自动化专业教学改革研讨会论文集[C];2002年
7 王林生;;四维指标组合投资优化[A];第六届中国青年运筹与管理学者大会论文集[C];2004年
8 张国华;;CDMA网络接续优化的几点经验[A];黑龙江省通信学会学术年会论文集[C];2005年
9 祁振强;杨照华;;基于遗传算法的飞行轨道优化[A];2006中国控制与决策学术年会论文集[C];2006年
10 卓永强;方祥麟;;狭水域内船舶避碰行为优化的遗传算法研究[A];船舶避让与安全操作[C];2007年
中国博士学位论文全文数据库 前10条
1 刘媛;视频搜索结果的重排序研究[D];中国科学技术大学;2009年
2 孔怡青;半监督学习及其应用研究[D];江南大学;2009年
3 王娇;多视图的半监督学习研究[D];北京交通大学;2010年
4 由雪梅;求解复杂优化问题的差分演化算法研究[D];山东大学;2011年
5 兰远东;基于图的半监督学习理论、算法及应用研究[D];华南理工大学;2012年
6 徐雪;样本的几何信息在半监督学习中的应用研究[D];中国科学技术大学;2010年
7 朱岩;面向文本数据的半监督学习研究[D];北京交通大学;2012年
8 桂杰;基于图的半监督学习和维数约简方法及其应用研究[D];中国科学技术大学;2010年
9 吴平;汉语部分句式的形式语义分析[D];北京语言大学;2005年
10 龙文;求解两类优化问题的混合进化算法及其应用[D];中南大学;2011年
中国硕士学位论文全文数据库 前10条
1 杨伟;半监督学习方法研究[D];国防科学技术大学;2011年
2 邢宣宇;基于主题会话的语义分析工具的研制[D];湖南大学;2005年
3 梁;基于多目标函数改进的多核学习在半监督学习和迁移学习场景中的应用[D];中山大学;2011年
4 谢慧萍;现代汉语动词表层语义研究[D];湘潭大学;2005年
5 梁良;异种程序设计语言间的翻译模型设计及方法研究[D];电子科技大学;2005年
6 李利霞;微型数据库引擎的研究[D];武汉理工大学;2006年
7 张明芹;AB式象声词的重叠形式研究[D];广西师范大学;2006年
8 阮贵义;汉语借用动量词及相关问题研究[D];北京语言大学;2007年
9 贺阳剑;基于格语法和VerbNet的问答系统研究[D];中南大学;2007年
10 简榕蓉;现代汉语动词计量的语义分析及教学策略[D];华中科技大学;2006年
中国重要报纸全文数据库 前10条
1 迟晓春 译;第一生命联合IBM 共同研发语义分析解决方案[N];中国保险报;2010年
2 程胜;解决IP网络传输层优化问题[N];通信产业报;2004年
3 樊洪业;科学精神的历史线索与语义分析[N];大众科技报;2002年
4 刘仁;“语义分析”升级专利机器翻译[N];中国知识产权报;2008年
5 樊洪业;科学精神的历史线索与语义分析[N];大众科技报;2002年
6 樊洪业;科学精神的历史线索与语义分析[N];中华读书报;2001年
7 北京邮电大学无线理论与技术研究室 吴交韦再雪;TD催生网优“新政”[N];通信产业报;2007年
8 ;SurfControl: 强劲的反垃圾邮件引擎[N];计算机世界;2006年
9 陆元婕;聪明的搜索引擎[N];中国计算机报;2001年
10 学生记者 肖佳平;人生是一个不断学习的过程[N];新清华;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978