收藏本站
《北京工业大学》 2012年
收藏 | 手机打开
二维码
手机客户端打开本文

元搜索引擎中结果聚合排序方法的研究

张腾宇  
【摘要】:如何在互联网的海量信息中找到自己所需要的信息已经成为困扰人们的主要问题。元搜索引擎可以综合多个搜索引擎的查询结果,因而提高了搜索的覆盖率,但同时也带来了一些问题。元搜索引擎所得结果往往数目庞大,其中很多结果都与用户的查询没有太大关联。这直接影响了用户检索的质量,大大增加了用户检索的代价。为了帮助用户不受无用的信息干扰只获取所需的信息,本文对元搜索引擎所涉及的用户及网页技术进行了研究,提出了一种基于用户兴趣与网页分类的用户网页模型,并在此基础上对元搜索引擎的结果排序算法进行了改进。具体内容及研究成果如下: 分析了用户与网页之间通过搜索引擎完成交互式的关系,提出用户兴趣与网页分类相匹配的多对多模型,并完成了兴趣与分类的转换规则的制定,建立了用户网页交互模型UPI。 研究了用户兴趣分类的常用算法,提出显式反馈与隐式反馈相结合的用户兴趣信息获取方法,并完成基于UPI模型的用户兴趣自动更新的算法。 深入的研究了网页自动分类技术,选取合适的训练集以及分类算法,完成了网页自动分类器的基本设定。在UPI模型基础上提出了网页类别更新的相关算法。 研究分析了基于位置和基于相关度的结果排序算法,在这两种算法的基础上提出了基于UPI模型的排序算法。该算法通过分别计算网页位置分值,用户兴趣值和用户网页匹配值得出最终的网页分值,其中用户网页匹配值是基于UPI模型得出的。 基于上述算法构建了相应的实验系统,通过实验验证了上述算法的搜索结果的有效性,并对其进行了相应的分析。
【学位授予单位】:北京工业大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:TP391.3

手机知网App
【参考文献】
中国期刊全文数据库 前8条
1 尹中航,王永成,蔡巍;应用支持向量机进行网上信息自动分类[J];高技术通讯;2001年11期
2 罗武;方逵;朱兴辉;;网络搜索引擎排序算法研究进展[J];湖南农业科学;2010年07期
3 罗三定,陆文彦,王浩,贾维嘉;基于概念的文本类别特征提取与文本模糊匹配[J];计算机工程与应用;2002年16期
4 邵华;高凤荣;邢春晓;蒋丽华;;基于VSM的分层网页推荐算法[J];计算机科学;2006年11期
5 毛雪;关佶红;朱付保;;基于语义向量模型的Web服务匹配方法[J];计算机应用研究;2010年10期
6 吴文娟;车明;;搜索引擎倒排索引技术的改进[J];微处理机;2006年06期
7 余丹;;关于查全率和查准率的新认识[J];西南民族大学学报(人文社科版);2009年02期
8 闭小梅;闭瑞华;;KNN算法综述[J];科技创新导报;2009年14期
中国硕士学位论文全文数据库 前4条
1 薛云;Internet上元搜索引擎的研究与设计[D];太原理工大学;2003年
2 贾玉祥;基于概率模型的名人网页相关度评价研究[D];郑州大学;2006年
3 种梅;元搜索引擎中的关键技术研究[D];山东师范大学;2008年
4 张志军;基于本体的个性化元搜索技术的研究和实现[D];江西师范大学;2009年
【共引文献】
中国期刊全文数据库 前10条
1 王一夫;许鹏;杨小林;韩宇;;数据挖掘中两种简单分类算法的比较[J];长沙通信职业技术学院学报;2010年04期
2 吴彦文;黄珍;张昆明;;毕业设计中的个性化推荐服务[J];电化教育研究;2008年05期
3 熊小梅;刘永浪;;基于LSA的二次降维法在中文法律案情文本分类中的应用[J];电子测量技术;2007年10期
4 杨晔,彭宏,林嘉宜,陈绍坚;一种有效特征词发现的贝叶斯文本分类方法[J];系统工程;2004年09期
5 郑瑞娟;张仰森;;基于概念的Web文本分类方法及实现[J];北京信息科技大学学报(自然科学版);2013年02期
6 陶勇;文贵华;齐飞;;基于突出特征的类比联想在专利战略分析中的应用[J];湖北民族学院学报(自然科学版);2007年04期
7 毛林;杨学兵;;一种基于概念层次的文本特征权重计算方法[J];安徽工业大学学报(自然科学版);2008年03期
8 高加旺;孙名松;陈福;;基于相似度曲线的新闻网页分类模型研究[J];信息技术;2008年02期
9 沙莎,曾慧宏,罗三定;一种面向元数据描述文档的概念检索方法[J];计算机工程与应用;2005年25期
10 安娜;谢福鼎;张永;刘绍海;;一种基于GN算法的文本概念聚类新方法[J];计算机工程与应用;2008年14期
中国重要会议论文全文数据库 前1条
1 ;A Method for Building the Index Dictionary Files on Domain-specific Search Engine[A];中国自动化学会控制理论专业委员会B卷[C];2011年
中国博士学位论文全文数据库 前4条
1 孙宗海;支持向量机及其在控制中的应用研究[D];浙江大学;2003年
2 刘炜;智能元搜索引擎中个性化模式库的研究[D];太原理工大学;2007年
3 于洋;组织知识管理中的知识超网络研究[D];大连理工大学;2009年
4 王静;基于本体的中医文献诊疗信息的智能检索示范研究[D];中国中医科学院;2012年
中国硕士学位论文全文数据库 前10条
1 程宾;基于用户兴趣模型的元搜索引擎的研究[D];山东科技大学;2010年
2 于飞;基于搜索引擎的个性化推荐研究[D];哈尔滨理工大学;2010年
3 沙有闯;基于Web文本挖掘的网络口碑监测系统研究[D];安徽大学;2010年
4 席敏;基于单汉字索引的全文检索系统的研究与实现[D];西安电子科技大学;2010年
5 胡畅;用户行为分析系统设计[D];湖北工业大学;2011年
6 黄美宁;基于用户行为分析的网页分类系统的研究与实现[D];北京邮电大学;2011年
7 李帅;基于语义相似度的查询扩展优化[D];杭州电子科技大学;2011年
8 薛煜阳;农业搜索引擎倒排索引缓冲机制研究[D];新疆农业大学;2011年
9 王驰;基于海量网络舆情信息的热点发现[D];电子科技大学;2011年
10 何伟;基于搜索引擎的智能化推荐技术研究[D];电子科技大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 王如海,刘建设;Agent技术与模糊信息[J];电脑与信息技术;1999年06期
2 陈大平;集成搜索引擎与元搜索引擎比较研究[J];大学图书情报学刊;2005年01期
3 傅晓东,李卫华;信息过滤Agent的WWW文档分析实现[J];广东教育学院学报;2001年02期
4 昝红英,俞士汶;CCD及其应用[J];广西师范大学学报(自然科学版);2003年01期
5 王铮,胡永杰;元搜索引擎的设计与实现[J];河北师范大学学报;2001年02期
6 张强弓,喻国宝,廖湖声,隋树林;一种元搜索引擎的查询结果处理模型[J];华南理工大学学报(自然科学版);2004年S1期
7 张健奕;搜索引擎的新发展——元搜索引擎[J];河南图书馆学刊;2002年02期
8 黄佳来;王立波;袁道敏;;基于语义相似度的查询扩展研究[J];杭州电子科技大学学报;2008年05期
9 王继成,邹涛,杨小江,潘金贵,张福炎;基于Internet的信息资源发现技术与实现[J];计算机研究与发展;1999年11期
10 王继成,萧嵘,孙正兴,张福炎;Web信息检索研究进展[J];计算机研究与发展;2001年02期
中国硕士学位论文全文数据库 前3条
1 张俭恭;扩展元搜索引擎(EMSE)的系统设计[D];中国科学院研究生院(文献情报中心);2002年
2 李炎茗;元搜索引擎的现状研究与改进设计[D];华中师范大学;2002年
3 李信利;基于信息类别的元搜索引擎研究[D];山东大学;2006年
【相似文献】
中国期刊全文数据库 前10条
1 楼松斋,张惠惠;中文电子期刊的元搜索引擎[J];情报科学;2003年11期
2 马燕,邹显春,包骏杰,李明;一种互联网智能元搜索引擎模型的设计[J];重庆师范大学学报(自然科学版);2004年03期
3 屈长青,李艳芳;元搜索引擎的关键技术[J];现代计算机;2004年05期
4 胡亮,许永诚,高文,胡利平;个性化高效元搜索引擎的设计与实现[J];计算机工程与设计;2005年04期
5 ;来信[J];电子商务世界;2008年01期
6 仇海峰;元搜索引擎[J];中国计算机用户;1997年32期
7 张卫丰;徐宝文;周晓宇;李东;许蕾;;元搜索引擎研究[J];计算机科学;2001年08期
8 张付志,刘明业;一种基于元搜索引擎的数字图书馆系统集成框架[J];北京理工大学学报;2004年08期
9 伏汉英,黄永忠,陈新,杨凯,郭金庚;一种基于Java的元搜索引擎的设计与实现[J];信息工程大学学报;2004年04期
10 刘炜,陈俊杰;一种基于Agent的智能元搜索引擎框架[J];计算机工程与应用;2005年03期
中国重要会议论文全文数据库 前10条
1 阳小华;刘振宇;谭敏生;刘杰;左贵启;;元搜索引擎查询结果的合成方法[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
2 李慧;张民;宋源清;;网络搜索引擎[A];2009全国计算机网络与通信学术会议论文集[C];2009年
3 孟奇奎;;一种基于数据库和用户反馈信息的元搜索引擎数据库选择算法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
4 余晋;邓志鸿;田敬;唐世渭;;PinkySearch:基于聚类的元搜索引擎[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
5 吴冷冬;童云海;唐世渭;;面向在线音乐视频的元搜索引擎VMS[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
6 夏小玲;祁博民;廖顺和;;基于Web服务和元搜索引擎的数字图书馆中元数据互操作框架[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
7 陈伟雄;马少平;步建华;;基于元搜索引擎的多关键词检索技术[A];广东省电机工程学会2003-2004年度优秀论文集[C];2005年
8 梁伟贤;;网络搜索引擎发展现状的探讨[A];2007中国科协年会——通信与信息发展高层论坛论文集[C];2007年
9 周小平;梁一平;邓左祥;;元搜索引擎研究[A];2009年中国高校通信类院系学术研讨会论文集[C];2009年
10 吴远红;徐妙君;范银琛;;元搜索引擎中基于OWA算子的查询结果合成研究[A];2007年全国开放式分布与并行计算机学术会议论文集(上册)[C];2007年
中国重要报纸全文数据库 前10条
1 山东 张蕊;“闻香识引擎”[N];中国计算机报;2000年
2 壮壮;批量保存网页信息[N];电脑报;2004年
3 彭岩 艾迪明;网络信息“拉取”技术[N];计算机世界;2001年
4 ITBOY;探索出来的世界[N];电脑报;2004年
5 赵敏超;利用因特网查找信息三步骤[N];中国图书商报;2003年
6 王旭;中文智能搜索引擎[N];计算机世界;2001年
7 易观网络咨询公司;引航“?”年代[N];中国计算机报;2000年
8 东方早报记者 李伟;要名还是要利,这是个问题[N];东方早报;2011年
9 搜索引擎9238;英文搜索四当家[N];中国计算机报;2001年
10 应晓敏 窦文华;他山之石[N];计算机世界;2003年
中国博士学位论文全文数据库 前10条
1 李红梅;智能元搜索引擎关键技术研究[D];西安电子科技大学;2009年
2 李强;基于本体论的个性化和社会化元搜索引擎的研究[D];浙江大学;2006年
3 刘炜;智能元搜索引擎中个性化模式库的研究[D];太原理工大学;2007年
4 焦斌星;用于搜索的网页可视化摘要技术研究[D];中国科学技术大学;2012年
5 陈冬玲;基于潜在语义的个性化搜索关键技术研究[D];东北大学;2009年
6 孟宪军;互联网文本聚类与检索技术研究[D];哈尔滨工业大学;2009年
7 张长利;面向特定领域的互联网舆情分析技术研究[D];吉林大学;2011年
8 黄河;农业复杂自适应搜索模型研究及实现[D];中国科学技术大学;2010年
9 王镠璞;基于用户体验的互联网搜索引擎医学信息检索可用性评估研究[D];吉林大学;2010年
10 刘守群;海量网络视频快速检索关键技术研究[D];中国科学技术大学;2010年
中国硕士学位论文全文数据库 前10条
1 张腾宇;元搜索引擎中结果聚合排序方法的研究[D];北京工业大学;2012年
2 王莎莎;元搜索引擎结果合成技术的研究[D];燕山大学;2011年
3 李彦威;基于用户兴趣的个性化元搜索引擎研究[D];燕山大学;2010年
4 邹本友;基于本体的个性化元搜索引擎研究[D];山东科技大学;2011年
5 刘林;基于语义的元搜索引擎关键技术研究[D];河南工业大学;2010年
6 程宾;基于用户兴趣模型的元搜索引擎的研究[D];山东科技大学;2010年
7 张维华;基于聚类的中文元搜索引擎技术研究[D];南京邮电大学;2011年
8 王金栋;元搜索引擎调度策略及结果排序算法的研究[D];燕山大学;2010年
9 张鑫;基于本体论的领域元搜索引擎的研究与设计[D];兰州大学;2010年
10 王春艳;元搜索引擎的研究与实现[D];吉林大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026