收藏本站
《北京交通大学》 2008年
收藏 | 手机打开
二维码
手机客户端打开本文

基于网络视频业务的搜索引擎的设计与实现

任严  
【摘要】: 随着Internet和Web技术的飞速发展,WWW已经成为人们进行信息交流不可缺少的巨大信息空间。面对如此大量的信息,人们在寻找自己所需要的信息时常常迷失方向。如何快速、准确的从浩瀚的信息资源中找到自己所需要的信息已经成为困扰用户的一大难题。 随着搜索引擎的广泛应用,人们对于搜索引擎的要求也越来越高,查准率和查全率成为衡量搜索引擎的重要标志,无用信息过滤也成为人们开始关注的问题。另外,通用搜索引擎已经不能满足人们对于特定领域的检索要求,多元化的搜索引擎开始应运而生,专业性和专题性的搜索引擎层出不穷。 另外,随着现在网络的普及,网络已经慢慢融入人们的生活和娱乐。网络视频具有可以在线观看、不需要下载、短小精悍、内容丰富等特点,因此受到越来越多网络用户的欢迎。 目前,用户要想在传统的通用搜索引擎上搜索某一个特定的网络视频,其返回结果往往是很多无用的网页信息,因此,针对通用搜索引擎的不足,本课题结合搜索引擎的原理和网络视频的特点,开发了基于网络视频业务的搜索引擎,用来解决用户在搜索网络视频方面的问题。 本文研究并实现了基于网络视频业务的搜索引擎系统。实现该系统时,引入了搜索引擎的架构模型,即网络蜘蛛、索引器和检索器,并且加入了分词和搜索自动提示功能。该搜索引擎系统主要基于全文检索引擎Apache Lucene构建,本文详细论述了该搜索引擎所需要的相关理论,并给出了系统的整体框架结构图以及各个部分的详细设计方案,最后给出了该系统的运行效果。
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2008
【分类号】:TP391.3

【引证文献】
中国硕士学位论文全文数据库 前1条
1 李靖;基于Lucene的在线客服机器人的研究与实现[D];西南交通大学;2009年
【参考文献】
中国期刊全文数据库 前6条
1 阳小华;分布式WWW信息收集技术[J];计算机工程与应用;2000年05期
2 蒋澄,马范援,蒋思杰;中英文WWW搜索引擎的信息处理[J];计算机工程;1999年04期
3 邹涛,黄源,张福炎;基于WWW的文本信息挖掘[J];情报学报;1999年04期
4 郑琳;搜索引擎的质量评价研究[J];情报杂志;2003年09期
5 曾春,邢春晓,周立柱;基于内容过滤的个性化搜索算法[J];软件学报;2003年05期
6 李晓明,刘建国;搜索引擎技术及趋势[J];中国计算机用户;2000年09期
【共引文献】
中国期刊全文数据库 前10条
1 汪洁;朱军;;基于Linux的中文垃圾邮件过滤系统设计与实现[J];安徽农业大学学报;2011年02期
2 姚克娟,李晋宏;应用Agent技术实现个性化信息服务[J];北方工业大学学报;2004年03期
3 季元叶;;服务发现体系架构发展现状及新架构的研究[J];办公自动化;2012年10期
4 李伟;黄颖;;基于HtmlParser的网页信息提取[J];兵工自动化;2007年07期
5 李晓明;对中国曾有过静态网页数的一种估计[J];北京大学学报(自然科学版);2003年03期
6 韩杏容,田登山,夏自谦;林业经济信息集成平台的构建[J];北京林业管理干部学院学报;2005年01期
7 汪涛,樊孝忠,顾益军,刘林;基于概念分析的主题爬虫设计[J];北京理工大学学报;2004年10期
8 暴海龙,李金林;专利检索中的IPC和主题词识别方法研究[J];北京理工大学学报(社会科学版);2003年05期
9 陈治昂;张毅;李大学;;基于Web智能的网络广告监测器研究与设计[J];重庆邮电大学学报(自然科学版);2009年01期
10 丛荣华;;网络教育中的数据收集技术[J];长春师范学院学报;2006年10期
中国重要会议论文全文数据库 前10条
1 汤薇;曾艳;;构建校园网搜索引擎必要性分析[A];广西计算机学会2008年年会论文集[C];2008年
2 周小平;梁一平;邓左祥;;元搜索引擎研究[A];2009年中国高校通信类院系学术研讨会论文集[C];2009年
3 张赪军;刘祥瑞;李军;黄红梅;;基于本体的语义检索技术研究[A];全国第4届信号和智能信息处理与应用学术会议论文集[C];2010年
4 张赪军;黄红梅;王晨熙;李军;;构建智能信息检索系统[A];全国第4届信号和智能信息处理与应用学术会议论文集[C];2010年
5 吴春胤;陈联诚;俞守华;;基于AgMES的搜索引擎的设计与实现[A];农业工程科技创新与建设现代农业——2005年中国农业工程学会学术年会论文集第三分册[C];2005年
6 ;Web搜索引擎原理与应用[A];四川省通信学会2005年学术年会论文集[C];2005年
7 吐尔地·托合提;维尼拉·木沙江;艾斯卡尔·艾木都拉;;维、哈、柯全文搜索引擎中查询处理研究与实现[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
8 张乃岳;张学燕;;基于个体词语相似度的定制化动态信息检索[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
9 陈丕海;冯建华;邢春晓;郑晓慧;;SiteSearch的关键技术分析及汉化设计[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
10 刘勘;尹承明;陈凡;;图书借阅信息的分析与挖掘[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
中国博士学位论文全文数据库 前10条
1 刘玉国;基于内容的互联网舆情信息挖掘关键技术研究[D];山东大学;2011年
2 田俊华;基于本体知识库的教学资源自动采集技术研究[D];南京师范大学;2011年
3 朱振方;基于微粒群和遗传优化的文本过滤关键技术研究[D];山东师范大学;2012年
4 陈定权;自动主题搜索的应用研究[D];中国科学院研究生院(文献情报中心);2003年
5 白玉琪;空间信息搜索引擎研究[D];中国科学院研究生院(遥感应用研究所);2003年
6 张晓刚;面向软件过程改进的知识管理技术研究[D];中国科学院研究生院(软件研究所);2004年
7 郭秀娟;基于关联规则数据挖掘算法的研究[D];吉林大学;2004年
8 张宏斌;信息获取中的两类不确定问题研究[D];华中科技大学;2004年
9 张景涛;基于多智能主体的炼化企业ERP系统应用研究[D];天津大学;2004年
10 张树人;从社会性软件、Web2.0到复杂适应信息系统研究[D];中国人民大学;2006年
中国硕士学位论文全文数据库 前10条
1 程宾;基于用户兴趣模型的元搜索引擎的研究[D];山东科技大学;2010年
2 吴则则;支持动态演进的用户兴趣模型挖掘方法研究[D];山东科技大学;2010年
3 徐财应;基于Lucene的搜索引擎技术的研究与改进[D];长春理工大学;2010年
4 雷斌;基于Java技术的智能化搜索引擎的研究与设计[D];哈尔滨工程大学;2010年
5 蔡宇虹;基于主题的元搜索引擎关键技术研究[D];哈尔滨工程大学;2010年
6 汪永伟;搜索引擎中网页排序算法的研究与实现[D];哈尔滨工程大学;2010年
7 孟庆海;基于社会书签的个性化查询词扩展技术研究[D];哈尔滨工程大学;2010年
8 秦宏宇;网络舆情热点发现相关技术研究[D];哈尔滨工程大学;2010年
9 韩兆国;电信计费帐务系统核心模块的设计[D];哈尔滨工程大学;2010年
10 唐微;网络信息提取系统关键技术研究[D];大连理工大学;2009年
【同被引文献】
中国期刊全文数据库 前10条
1 王富强;王青山;张立朝;朱浩群;王锐;;基于Lucene的数据库全文信息检索[J];测绘科学;2008年03期
2 郑晓菊;;基于UML的面向对象需求分析[J];电脑开发与应用;2008年10期
3 吴蕾;;面向对象的软件测试技术研究[J];电脑知识与技术(学术交流);2007年02期
4 隋贤俊;高新奇;秦怀斌;;MySQL数据库进行中文全文检索的模拟实现方法[J];福建电脑;2008年01期
5 周军;王艳红;;一种基于词典的中文分词法的设计与实现[J];黑龙江科技信息;2008年25期
6 励子闰;余青松;陈胜东;;基于全文检索引擎的信息检索技术的应用研究[J];计算机与数字工程;2008年09期
7 田鸿立;;Ajax技术应用研究[J];科技信息(学术研究);2008年34期
8 黄昌宁;赵海;;中文分词十年回顾[J];中文信息学报;2007年03期
9 管建和;甘剑峰;;基于Lucene全文检索引擎的应用研究与实现[J];计算机工程与设计;2007年02期
10 向晖;郭一平;王亮;;基于Lucene的中文字典分词模块的设计与实现[J];现代图书情报技术;2006年08期
中国硕士学位论文全文数据库 前2条
1 贺艳艳;基于词表结构的中文分词算法研究[D];中国地质大学(北京);2007年
2 左军;基于Lucene网络视频垂直搜索系统的设计与实现[D];北京邮电大学;2007年
【二级引证文献】
中国期刊全文数据库 前2条
1 杨伟超;刘阳;李淑霞;;基于搜索引擎的一站式检索平台设计与实现[J];计算机与现代化;2012年11期
2 刘阳;杨伟超;李淑霞;;基于Sphinx的资源整合系统平台的设计与实现[J];信息技术;2012年11期
【二级参考文献】
中国期刊全文数据库 前10条
1 阳小华;周龙骧;;World Wide Web的索引与查询技术[J];计算机科学;1997年06期
2 陶跃华,孙茂松,王锡钢;因特网搜索引擎评价系统[J];计算机工程与科学;2001年03期
3 曾福兴;因特网信息资源搜索工具[J];情报科学;2000年11期
4 夏立新;情报检索的理论和方法在改善搜索引擎搜索性能中的应用[J];情报科学;2001年07期
5 张莉扬;网络检索工具性能评价标准浅议[J];情报科学;2001年10期
6 左艺,魏良,赵玉虹;国际互联网上信息资源优选与评价研究方法初探[J];情报学报;1999年04期
7 陆宝益;网络信息资源的评价[J];情报学报;2002年01期
8 曾民族;网络信息检索现状和性能评价[J];情报学报;1997年02期
9 曾春,邢春晓,周立柱;个性化服务技术综述[J];软件学报;2002年10期
10 胡侃,夏绍玮;基于大型数据仓库的数据采掘:研究综述[J];软件学报;1998年01期
【相似文献】
中国期刊全文数据库 前10条
1 马红;;搜索引擎的评价体系研究[J];农业图书情报学刊;2008年02期
2 张海涛;高松;;搜索引擎检索结果的网页组织技术及其优化策略[J];情报科学;2006年06期
3 王渊;;面向用户的搜索引擎检索结果评价[J];河南图书馆学刊;2007年04期
4 曹超;;2002~2007年国外对搜索引擎检索结果研究综述[J];图书情报知识;2009年01期
5 陈晓瑜;;Internet上信息检索方法与技巧的探讨[J];贵图学刊;2001年02期
6 夏旭,方平,方国辉;万维网医学搜索引擎检索性能的比较研究[J];医学信息;2000年12期
7 傅欣;第三代搜索引擎的智能化趋势研究[J];现代图书情报技术;2002年06期
8 朱蓓,朱胜坚,刘艳;网络环境下查找信息资源的方法[J];中华医学图书情报杂志;2003年05期
9 麦淼;;我国视频搜索服务的现状及发展趋势分析[J];中国传媒科技;2008年12期
10 徐家坤;搜索引擎的实用检索技巧[J];科技情报开发与经济;2003年01期
中国重要会议论文全文数据库 前10条
1 贾彦国;李培德;;Web检索结果聚类算法的改进[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
2 李丹;;如何利用搜索引擎查找中医药信息[A];中国中医药信息研究会第二届理事大会暨学术交流会议论文汇编[C];2003年
3 彭轲;廖闻剑;;浅析搜索引擎[A];中国通信学会第五届学术年会论文集[C];2008年
4 陈杰;;应用智能搜索 实现数据挖掘[A];中国新闻技术工作者联合会五届一次理事会暨学术年会论文集(上篇)[C];2009年
5 王灿辉;张敏;马少平;;Web作弊与反作弊技术综述[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
6 邓长寿;郭景峰;杨焱林;邓安远;;下一代Web搜索引擎初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
7 维尼拉·木沙江;吐尔洪·吾司曼;;维、哈、柯文搜索引擎中网页爬行器的设计与实现[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
8 刘之涛;陈清才;孟宪军;王晓龙;;基于特征短语的网页在线聚类方法[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
9 张乃岳;张学燕;;基于个体词语相似度的定制化动态信息检索[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
10 钟炼;;网络体育文献信息检索研究[A];第七届全国体育科学大会论文摘要汇编(二)[C];2004年
中国重要报纸全文数据库 前10条
1 本报记者 陈昌成;陈沛:未来的搜索会更加精确[N];中国企业报;2010年
2 清华大学IT可用性实验室;2005中文搜索引擎质量对比[N];计算机世界;2005年
3 李一鑫;搜索排名的红与黑[N];财经时报;2007年
4 周文林;搜狗3.0能否撼动搜索市场[N];经济参考报;2007年
5 惠正一;比尔·盖茨:微软不怕Google[N];第一财经日报;2005年
6 赛迪顾问股份有限公司互联网与电子商务咨询中心 常燕杰;搜索,还是门户[N];中国计算机报;2005年
7 陈珊;浙江移动推出手机搜索引擎服务[N];人民邮电;2005年
8 赵法忠;搜索引擎还需悠着点[N];中国经营报;2005年
9 金朝力;搜索引擎火拼搜索质量[N];北京商报;2006年
10 本报记者  赵晓辉 孟昭丽;搜索引擎驶入“避风港”[N];中国证券报;2006年
中国博士学位论文全文数据库 前10条
1 费巍;搜索引擎检索功能的性能评价研究[D];武汉大学;2010年
2 岑荣伟;基于用户行为分析的搜索引擎评价研究[D];清华大学;2010年
3 李群;主题搜索引擎聚类算法的研究[D];北京林业大学;2011年
4 苏君华;面向搜索引擎的技术接受模型研究[D];南京大学;2011年
5 刘佐达;分布协作式搜索引擎模型及算法研究[D];清华大学;2011年
6 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年
7 郭眈;中文互联网视频搜索引擎系统策略研究[D];北京交通大学;2012年
8 李岳楠;视频信息内容管理关键问题研究[D];哈尔滨工业大学;2010年
9 王镠璞;基于用户体验的互联网搜索引擎医学信息检索可用性评估研究[D];吉林大学;2010年
10 李莎莎;面向搜索引擎的自然语言处理关键技术研究[D];国防科学技术大学;2011年
中国硕士学位论文全文数据库 前10条
1 任严;基于网络视频业务的搜索引擎的设计与实现[D];北京交通大学;2008年
2 董晨;基于模糊聚类的个性化搜索引擎的研究[D];福州大学;2005年
3 王春花;基于Nutch的农业搜索引擎检索结果排序策略的研究[D];西北农林科技大学;2010年
4 王军;中文搜索引擎的设计与实现[D];华中科技大学;2004年
5 王星辉;搜索引擎设计分析与查询改进[D];电子科技大学;2007年
6 薛云;Internet上元搜索引擎的研究与设计[D];太原理工大学;2003年
7 李雷;基于Nutch的农业信息搜索引擎实现和优化[D];吉林大学;2011年
8 封俊;基于Hadoop的分布式搜索引擎研究与实现[D];太原理工大学;2010年
9 李浩;分布式教育网信息检索系统的研究和实现[D];华南理工大学;2010年
10 尉建兴;基于Lucene搜索引擎的研究与应用[D];太原理工大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026