收藏本站
《武汉理工大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

基于群体特性的搜索方法研究

白瑾  
【摘要】:Internet的普及和应用十分迅速,已成为人们获取信息和知识的重要途径。互联网体系结构具有开放、异构和分布式等特点,互联网上的信息具有海量、冗余、更新快等特点。搜索引擎是人们获取网络信息的有效途径,伴随着互联网和人们信息需求的发展,如何在互联网上获取有价值的信息还是存在很大困难。一般情况下,不同搜索用户的搜索意图和信息需求是不相同的,具有一定的特定性和互异性。传统的搜索技术中没有考虑信息需求的差异性,相同的搜索关键词,返回一样的结果,搜索准确度较差,不能满足人们的信息需求。对用户兴趣特性建立用户兴趣模型,在搜索引擎中引入用户兴趣模型,能够达到提高搜索准确度的目的。针对传统搜索引擎系统的局限性,人们信息需求的特性,本文进行了基于群体特性用户兴趣模型的搜索引擎技术研究。 主要研究工作有以下几个方面: (1)分析研究通用搜索引擎的原理、结构和组成,以及发展现状,重点对存在的问题进行了深入分析,为后面的研究奠定了基础。 (2)构建了基于群体特性的用户兴趣模型,设计了基于用户兴趣模型的搜索引擎体系框架。对用户兴趣模型进行了重点研究,研究了用户兴趣模型的表示和建立技术。在分析改进模糊ISODATA算法等文本聚类算法的基础上,提出了用户兴趣模型的更新算法,实现模型对用户群体兴趣特征的实时、准确反映。 (3)研究了搜索意图分析和扩展的相关技术,给出了分析扩展算法,对于提高搜索效率,效果比较明显。 (4)研究了搜索引擎排序算法,提出了基于用户模型的全局加权相关度排序算法,算法结合用户兴趣模型计算搜索关键词和搜索结果的相似度,依据相似度对结果进行排序,提高排序效果。 (5)设计了基于群体特性用户兴趣模型的搜索引擎原型系统,划分了功能模块。利用Lucene和Java等开源软件和工具,实现了系统主要功能。重点对系统各项功能进行了实验研究,验证了设计思路和各算法的合理性,有效性。 实验表明,在搜索引擎中加入具有群体特性的用户兴趣模型,搜索引擎的性能有一定的提高,说明研究思路合理,相关算法是有效的,同时方法存在着很多不足之处,有待于进一步的改进。
【学位授予单位】:

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 何雄,方金云,唐志敏;基于用户兴趣模型的程序性能改善[J];计算机应用;2004年12期
2 许湘,黄林鹏;基于概率模型的个性化算法及其在证券业的应用[J];计算机工程;2004年S1期
3 张卫丰,徐宝文;基于WWW缓冲的用户实时二维兴趣模型[J];计算机学报;2004年04期
4 熊拥军,刘卫国,张建中;基于资源分类树的读者兴趣模型设计与实现[J];情报理论与实践;2005年03期
5 孔芳芳;;元搜索引擎系统的研究[J];科技创新导报;2009年35期
6 马建国,邢玲,何军;信息过滤技术及Visual J++实现[J];系统工程与电子技术;2004年03期
7 徐德兴;李建民;林振荣;;基于聚类和用户兴趣分析结合的个性化元搜索[J];计算机与现代化;2009年11期
8 许黎明;宋转;马跃;;车辆监控调度系统中兴趣模型设计与研究[J];计算机与现代化;2011年04期
9 魏小梅;;个性化搜索引擎技术探讨[J];农业网络信息;2006年04期
10 刚春燕;吴恩斯;;基于MAS兴趣模型的搜索引擎设计[J];计算机与信息技术;2009年04期
11 石季辉;于长锐;刘兰娟;;基于领域本体的社区用户兴趣模型[J];情报科学;2011年04期
12 黄珍珍;;基于读者兴趣度的高校图书馆书籍推荐方法研究[J];中国科教创新导刊;2011年29期
13 潘红艳,林鸿飞,赵晶;基于Ontology的个性化推送系统[J];计算机工程与应用;2005年20期
14 张卫丰,徐宝文;WWW缓冲挖掘中基于粗糙集的用户模糊兴趣建模[J];计算机应用;2005年09期
15 曾义聪;;基于兴趣模型的主题搜索机器人技术探讨[J];科技信息(学术研究);2008年24期
16 蒋翀;费洪晓;;基于线性衰减的用户兴趣建模[J];计算机系统应用;2010年06期
17 张宏丽;田振清;;基于WEB使用挖掘的个性化推荐系统的研究[J];内蒙古师范大学学报(自然科学汉文版);2009年04期
18 单蓉;;一种基于用户浏览行为更新的兴趣模型[J];电子设计工程;2010年04期
19 刘鑫;张曾杰;李晓城;钱松荣;;主题兴趣度提取方法及其在用户兴趣模型中的应用研究[J];微型电脑应用;2011年03期
20 魏小梅;李石君;;一种投票再分级的个性化元搜索系统模型[J];计算机应用研究;2006年02期
中国重要会议论文全文数据库 前1条
1 陈晓;王建民;;面向网络招聘的个性化简历推荐算法研究[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
中国重要报纸全文数据库 前1条
1 商报记者 金朝力;奇艺推3套推荐引擎抢夺视频新制高点[N];北京商报;2011年
中国博士学位论文全文数据库 前1条
1 宋巍;基于主题的查询意图识别研究[D];哈尔滨工业大学;2013年
中国硕士学位论文全文数据库 前10条
1 叶彧;基于用户行为的兴趣模型的研究[D];东华大学;2012年
2 王刚;微博媒体个性化信息推荐方法的研究[D];哈尔滨工业大学;2012年
3 刘靖媛;个性搜索引擎中用户兴趣模型研究[D];哈尔滨工程大学;2010年
4 胡敏;基于智能代理的个性化元搜索引擎的设计与实现[D];华中科技大学;2007年
5 谢创丰;基于兴趣模型的个性化信息推荐系统研究与设计[D];暨南大学;2010年
6 彭喜化;基于Agent的元搜索引擎结果优化研究[D];西南农业大学;2004年
7 刘红星;基于Agent的Web服务发现与选择策略研究[D];大连海事大学;2006年
8 方兰;基于局域网的信息推送系统[D];江西师范大学;2004年
9 何苾菲;基于微博用户行为的兴趣模型构建和可视化方法研究[D];哈尔滨工业大学;2013年
10 赵梦;博客用户的个性化建模研究与实现[D];浙江大学;2007年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978