收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

个性化网络搜索引擎研究

郭晓刚  
【摘要】: 随着信息技术的进步与互联网络的飞速发展,Web已经成为了人们获取信息的一种重要途径。为了满足用户的信息检索需求,搜索引擎应运而生,但因为技术的发展,现在的搜索引擎已经越来越无法令用户完全满意。本文针对搜索引擎的不足,在已有研究工作的基础上,对个性化网络搜索引擎进行了研究,并给出了相应的解决方法。 论文首先对搜索引擎进行了综述包括搜索引擎的原理、现状、存在的问题、发展趋势等。针对个性化的网络搜索引擎的独特之处,分析了个性化网络搜索引擎所需要的一些关键技术。进一步,针对其中的中文分词技术和用户兴趣挖掘技术做了重点研究。分析了常用的自动分词算法,针对最大匹配法(MM算法)中存在的问题,把其中的减字规则改为增字规则,提出了一种改进的分词算法。通过对标准PageRank算法的深入研究发现,可以利用用户先前访问过的导航路径图来修正标准PageRank算法,同时,在考虑到不同用户访问不同网页的实际情况不同时,将当前网页对不同链出网页的推荐能力设定为非均衡的,由此得出一个优化的PageRank算法——基于用户访问日志的个性化PageRank算法。 最后在上述研究基础上,使用PHP和MySQL实现了一个搜索原型系统MySearch。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 宋立军;;浅论网络数学搜索中的数学查询语言与索引的研究[J];科技创新导报;2011年21期
2 郭绍华;;网络信息检索技术的现状及发展趋势[J];黑龙江教育学院学报;2011年06期
3 郭菲;;网络引擎搜索对热点问题的追踪分析[J];科技促进发展(应用版);2010年10期
4 ;微软捡便宜[J];上海微型计算机;1998年33期
5 ;视野[J];新闻实践;2011年09期
6 黄梦萦;;国内高校图书馆ALEPH500系统Web OPAC功能及使用情况比较[J];新闻传播;2011年07期
7 ;新软物语[J];电脑爱好者;2011年01期
8 周博;刘奕群;张敏;金奕江;马少平;;锚文本检索有效性分析[J];软件学报;2011年08期
9 红客王子;;装个文件监控器 保护网站安全[J];电脑爱好者;2011年09期
10 梁永演;;浅析搜索引擎的超链接分析排序算法[J];晋图学刊;2011年04期
11 王福海;;基于PageRank的主题过滤算法改进[J];科技信息;2011年15期
12 李远方;邓世昆;闻玉彪;韩月阳;;Hadoop-MapReduce下的PageRank矩阵分块算法[J];计算机技术与发展;2011年08期
13 杨超;李杰;李浩宇;;基于PageRank的页面排序算法研究[J];电脑编程技巧与维护;2011年16期
14 东兴;贾宇波;王义;范红丹;;Web挖掘技术在网络结构优化中的应用研究[J];工业控制计算机;2011年08期
15 梁佳;;标记监补模式下的网站监视反病毒系统[J];电脑编程技巧与维护;2011年15期
16 李云祥;陆光顺;韦燕萍;;馆藏目录数据库技术改造的实践[J];科技情报开发与经济;2011年25期
17 李少芳;;图书馆参考咨询服务现状及发展的思考[J];内蒙古科技与经济;2011年12期
18 程超;;试论高校图书馆服务营销[J];科教新报(教育科研);2011年25期
19 孙海生;韩红;;引用认同用于科研人员评价的实证分析[J];情报杂志;2011年07期
20 倪靖;;一种基于云计算的Web结构挖掘算法[J];电脑知识与技术;2011年24期
中国重要会议论文全文数据库 前10条
1 吴颖;;对网络搜索引擎辅助翻译的反思[A];全国首届翻译硕士(MTI)教育与翻译产业研讨会论文集[C];2009年
2 张星星;穗志方;;基于网页中深度并列结构的实例提取算法[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 岑荣伟;刘奕群;茹立云;张敏;马少平;;基于虚拟主题的网络关键资源页面定位技术研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
4 蔺继国;徐锡山;;一种基于用户点击数据的个性化PageRank算法[A];第六届全国信息检索学术会议论文集[C];2010年
5 陈小飞;王轶彤;冯小军;;一种基于网页质量的PageRank算法改进[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
6 李文;李淼;张建;朱海;陈雷;;基于混淆网络和PageRank的Nbest重排序[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
7 葛正荣;李婷玉;姚天昉;;汉语情感问题类型分类研究[A];第五届全国青年计算语言学研讨会论文集[C];2010年
8 刘建毅;王菁华;王枞;;基于语言网络的关键词抽取[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
9 陆勇;侯汉清;;基于词典注释的汉语同义词自动识别[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
10 刘菁菁;林鸿飞;杨志豪;;基于PageRank和锚文本的网页排序研究[A];第三届学生计算语言学研讨会论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 王菁华;文本中知识的获取[D];北京邮电大学;2008年
2 黄华军;网页信息隐藏与隐秘信息检测研究[D];湖南大学;2007年
3 涂锟;基于自然语言与记忆再重构的常识推理模型[D];华南理工大学;2010年
4 吴永辉;面向专业领域的网络信息采集及主题检测技术研究与应用[D];哈尔滨工业大学;2010年
5 梁浩;Deep Web信息集成架构及相关问题研究[D];吉林大学;2010年
6 陈德品;基于迁移学习的跨领域排序学习算法研究[D];中国科学技术大学;2010年
7 余俊丰;Web程序与数据安全研究[D];华中科技大学;2011年
8 沈慧锋;远程富媒体的呈现[D];中国科学技术大学;2010年
9 赵洁;基于粒计算的Web使用挖掘研究[D];华南理工大学;2010年
10 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年
中国硕士学位论文全文数据库 前10条
1 郭晓刚;个性化网络搜索引擎研究[D];吉林大学;2010年
2 张婷;分布式网络搜索引擎的研究与实现[D];解放军信息工程大学;2011年
3 陈瑜芳;主题爬虫系统的研究[D];武汉理工大学;2010年
4 屠辉;中文重复网页的检测算法研究[D];北京邮电大学;2010年
5 文敬斌;基于网络设备的网页过滤设计与实现[D];电子科技大学;2011年
6 黄伟光;网页木马的防御与检测技术研究[D];北京交通大学;2011年
7 易方昶;基于网页后门木马监测系统的研究和设计[D];北京化工大学;2010年
8 卢承山;基于领域的主题信息采集技术研究[D];武汉理工大学;2011年
9 尹力;网页防篡改系统在校园网中的应用研究[D];河北科技大学;2011年
10 史晶晶;基于CRF的Web机构实体信息抽取系统[D];吉林大学;2011年
中国重要报纸全文数据库 前10条
1 陆影;网络搜索引擎也要收费了[N];中国信息报;2001年
2 康乐;漫谈搜索引擎技术[N];中国化工报;2002年
3 本报记者 施嘉奇;你也会得“搜索病”吗[N];文汇报;2010年
4 本报记者 刘丽丽;我是机器人[N];计算机世界;2011年
5 康乐;技术与人文的结晶[N];计算机世界;2002年
6 记者 柴丽;刘义权先进事迹在全社会引起热烈反响[N];中国档案报;2009年
7 京 勇;兴奋的布林和佩奇[N];中国企业报;2004年
8 魏 薇;微软Google正式上演龙虎斗?[N];中国信息报;2004年
9 靖红;GoTo.com服务特定消费者[N];国际经贸消息;2001年
10 王军贤;医院涌进“电子病人”[N];西部时报;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978