收藏本站
《暨南大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于Web挖掘与信息分类的个性化搜索引擎研究

欧建斌  
【摘要】: 由于互联网的发展十分迅速,网上的数据呈现出爆炸式的增长。初期的搜索引擎只是把互联网上的数据通过索引的方式积累起来,然后通过用户搜索把相同的数据展示给不同的用户群体。在信息时代,上述普通搜索引擎已经无法满足信息时代人们的特定的搜索需要。 本文首先介绍了搜索引擎的工作原理和体系结构,对搜索引擎相关技术进行了描述,对搜索引擎相关技术中的信息性能评价、向量空间模型(VSM)、PankRage算法进行总结,讨论了实现个性化搜索引擎的关键问题和技术,描述了W.eb数据挖掘和用户行为特征挖掘的特点。总结了现有的搜索引擎的技术特点,提出了实现个性化搜索引擎的理论方法,随后在基于向量空间模型和贝叶斯分类技术结合对网页实现自动分类,结合基于挖掘的个性化模型:1.基于行为挖掘与内容挖掘的个性化实现;2.直接输入自己感兴趣的关键词然后在庞大的搜索引擎数据库中查找与关键词相关的信息。接着叙述了基于nutch的信息分类个搜索引擎的实现方法、实现过程。使新的搜索引擎,会针对不同的搜索用户给出不同的搜索数据查找结果。最后对个性化搜索引擎技术研究工作方向进行了总结展望。
【学位授予单位】:暨南大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP391.3

【相似文献】
中国期刊全文数据库 前10条
1 ;李彦宏论搜索引擎三个定律[J];新电子;2001年02期
2 相春雷;;2009年中国搜索引擎市场趋势分析[J];软件世界;2010年02期
3 ;揭秘搜索引擎收录网站的秘密[J];计算机与网络;2010年Z1期
4 马玥;;王小川:绝境之外[J];中国经济和信息化;2011年12期
5 魏蕾如;;基于搜索引擎的网络中文信息检索工具评价[J];数字技术与应用;2011年06期
6 ;创新工业搜索引擎[J];中国制造业信息化;2011年12期
7 胡风华;王磊;;基于知识库系统的智能搜索引擎研究[J];中国新技术新产品;2011年18期
8 方亚会;;Google失败后快速切换搜索引擎[J];电脑迷;2011年11期
9 ;成长中的谷歌[J];IT时代周刊;2011年18期
10 徐浩;严帅;;基于web的实验报告提交系统[J];科技创新导报;2011年17期
中国重要会议论文全文数据库 前10条
1 邓长寿;郭景峰;杨焱林;邓安远;;下一代Web搜索引擎初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
2 陶冶;刘建勋;唐明董;;基于Map/Reduce的分布式Web服务搜索引擎设计与实现[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
3 殷华蓓;李通;唐常杰;张天庆;左志松;;从Web文件中挖掘个性化导航知识[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
4 姚静;郑佳谦;徐隽;牛军钰;;Intranet中Web对象的属性挖掘[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
5 袁柳;李战怀;;基于语义搜索的Web服务匹配[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
6 邓志鸿;张铭;陈捷;杨冬青;唐世渭;;基于本体的Web信息检索模型初探[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
7 石晶;龚震宇;裘杭萍;;基于Web挖掘的个性化服务技术[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
8 雷景生;康耀红;;基于模糊相关的Web文档分类方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
9 买买提依明·哈斯木;维尼拉·木沙江;;研究维吾尔文Web文档聚类算法设计与实现[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
10 李利波;刘明利;;一种改进的无回溯反向Web服务动态组合方法[A];2011年全国通信安全学术会议论文集[C];2011年
中国重要报纸全文数据库 前10条
1 本报记者 边歆;八大安全威胁预示Web安全新变化[N];网络世界;2010年
2 陈琳;挑战搜索引擎的游戏规则[N];第一财经日报;2009年
3 边歆;动态阻断Web2.0威胁[N];网络世界;2009年
4 ;HTML5[N];人民邮电;2010年
5 ;有关社交Web的安全建议[N];网络世界;2009年
6 本报记者 汤浔芳;企业级Web 2.0很难突破10%[N];计算机世界;2010年
7 清水 编译;Web 3.0:互联网是你的私人助理[N];计算机世界;2010年
8 乐天 编译;语义Web:电脑能懂的网络[N];计算机世界;2011年
9 ;“云安全”技术被滥用几率将增[N];计算机世界;2008年
10 本报记者 胡钰;携程状告“去哪儿” 再设搜索雷区[N];华夏时报;2008年
中国博士学位论文全文数据库 前10条
1 许笑;分布式Web信息采集关键技术研究[D];哈尔滨工业大学;2011年
2 岑荣伟;基于用户行为分析的搜索引擎评价研究[D];清华大学;2010年
3 孙静宇;基于CBR的协同Web搜索研究[D];太原理工大学;2010年
4 钟美;基于Web的空间本体构建方法研究[D];武汉大学;2010年
5 朱鲲鹏;基于Web日志挖掘的智能信息检索研究[D];哈尔滨工业大学;2009年
6 张建武;面向Web应用的安全评测技术研究[D];北京邮电大学;2012年
7 朱俊武;基于本体的Web服务语义支撑技术研究[D];南京航空航天大学;2008年
8 李常宝;基于索引的web服务发现研究[D];北京邮电大学;2011年
9 魏登萍;语义Web服务发现中匹配策略的研究与实现[D];国防科学技术大学;2011年
10 杨卉;Web文本观点挖掘及隐含情感倾向的研究[D];吉林大学;2011年
中国硕士学位论文全文数据库 前10条
1 王磊;基于Web数据挖掘的搜索引擎设计与实现[D];解放军信息工程大学;2010年
2 欧建斌;基于Web挖掘与信息分类的个性化搜索引擎研究[D];暨南大学;2010年
3 黄华;基于搜索引擎和语义的Web服务发现研究[D];武汉理工大学;2011年
4 杨小林;语义Web及其在搜索引擎上的应用[D];湖南师范大学;2011年
5 李建林;基于Lucene的Web搜索引擎的研究[D];兰州理工大学;2010年
6 宗明超;基于Web搜索引擎的汽车服务平台的设计与实现[D];电子科技大学;2011年
7 王伟;搜索引擎下Web分类技术研究[D];内蒙古科技大学;2011年
8 周晔;一种增量式并行Web信息采集系统[D];暨南大学;2005年
9 于芳;面向用户兴趣的Web搜索策略的研究与实现[D];东北大学;2008年
10 廖继东;基于DotLucene网站全文搜索系统的实现[D];郑州大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026