收藏本站
《华南理工大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

面向农产品信息的主题搜索引擎与信息推荐

陈冰泉  
【摘要】:随着Internet的不断发展,人们习惯将数据存放在Web上,也习惯从Web去浏览、查找他们所需要的信息。近10年Web信息每天以指数级的速度爆炸性地增长,且不断更新变化,使我们陷入了"Rich Data, Poor Information"的尴尬局面。我们面临一个很关键的问题,如何从浩瀚的Web海洋里面找到我们所需要的、对我们有用的信息。 通用搜索引擎的出现解决了这个问题,它给用户提供了一个到达互联网的接口。但这个接口对任何用户都是一样的,无法满足用户对多样化信息的多样化要求。当用户需要深入互联网,获得分类细致即时更新的信息时,通用搜索显得力不从心,主题搜索随之诞生。 本文致力于设计并实现一个面向农产品信息的主题搜索系统,并在该系统的基础上实现用户推荐。文中首先介绍了目前的搜索行业背景、垂直搜索在国内外的发展现状和趋势;接下来以搜索引擎原理、数据挖掘理论基础展开研究;分析并研究垂直搜索核心问题:如何解析与主题相关的Web信息并反馈给用户;在此基础上实现搜索的可定制;最后在得到领域相关信息的基础上,又考虑并实现如何能更进一步地方便用户,为用户作一些有价值的推荐信息。 在为用户推荐信息环节,文中实现了两种算法,一种是在用户推荐领域久负盛名的关联规则挖掘算法,另一种也是典型的用户推荐算法协同过滤,具体采用的是协同过滤中item-based基于评分的简单易于实现的Weighted Slope One算法,最后比较算法的结果,采用了Weighted Slope One算法。
【学位授予单位】:华南理工大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP391.3

【参考文献】
中国期刊全文数据库 前2条
1 刘林,汪涛,樊孝忠;主题爬虫的解决方案[J];华南理工大学学报(自然科学版);2004年S1期
2 张成洪,王向安,古晓洪;利用Ontology和规则表达式的Web信息抽取[J];计算机工程;2004年05期
中国硕士学位论文全文数据库 前1条
1 邓凯;基于Web使用挖掘和关联规则的页面推荐模型的研究与实现[D];华东师范大学;2007年
【共引文献】
中国期刊全文数据库 前10条
1 陈霞;;如何加强企业文化建设[J];北方经济;2006年20期
2 韩毅,李融;情报学研究的层次性和研究模式探讨[J];大学图书馆学报;2002年02期
3 沈记全,张行文;基于Multi-Agent的Web文本挖掘系统[J];福建电脑;2005年11期
4 李孝明,曹万华;舰载作战指挥系统软件构件库技术研究(续三):检索和管理[J];舰船电子工程;2005年03期
5 沈记全,唐菁,杨炳儒;Web文本挖掘系统及其分类算法的研究与实现[J];计算机工程;2003年17期
6 余强;张海盛;;个性化Web信息服务技术研究[J];计算机应用研究;2006年02期
7 刘文斌;谢强;张磊;;多本体中子本体抽取的研究[J];计算机应用研究;2006年03期
8 喻金平;齐先锋;罗珊梅;;一种c#实现改进的关联规则挖掘算法[J];科技广场;2006年02期
9 石鸿飞;;基于网络的信息资源开发与服务[J];图书馆理论与实践;2006年01期
10 陈萍丽;Web挖掘及其在竞争情报系统的应用[J];情报科学;2003年09期
中国重要会议论文全文数据库 前3条
1 Meeyeon Kang;Yoonho Cho;Jaekyeong Kim;;An Extended Collaborative Filtering-based Recommendation Procedure forMultimedia Contents in M-Commerce[A];第四届电子商务国际会议论文集(Ⅱ)[C];2004年
2 GAO Linqi*, LI Congdong* *Management School of Tianjin University, Tianjin 300073, China Management School of Tianjin Normal University, Tianjin 300387, China,;COLLABORATIVE FILTERING RECOMMENDATION ALGORITHM BASED ON LOOK-AHEAD SELECTIVE SAMPLING[A];2006年中国机械工程学会年会暨中国工程院机械与运载工程学部首届年会论文集[C];2006年
3 梁循;杨健;陈华;曾月卿;;互联网金融信息搜索[A];中国优选法统筹法与经济数学研究会第七届全国会员代表大会暨第七届中国管理科学学术年会论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 陈定权;自动主题搜索的应用研究[D];中国科学院研究生院(文献情报中心);2003年
2 姜韶华;科研项目管理中的文本挖掘方法研究及应用[D];大连理工大学;2006年
3 何丽;基于Web挖掘的决策支持系统模型研究[D];天津大学;2005年
4 王宏宇;商务推荐系统的设计研究[D];中国科学技术大学;2007年
5 王德兴;基于概念格模型关联规则挖掘的关键问题研究[D];合肥工业大学;2007年
6 余小高;电子商务环境中分布式数据挖掘的研究[D];武汉理工大学;2007年
7 刘平峰;基于知识网格的电子商务智能推荐理论方法研究[D];武汉理工大学;2006年
8 席运江;组织知识的网络表示模型及分析方法[D];大连理工大学;2007年
9 宗校军;中文网页定题采集及分类研究[D];华中科技大学;2006年
10 刘康苗;自适应网络信息获取服务技术研究[D];浙江大学;2008年
中国硕士学位论文全文数据库 前10条
1 鲍人世;基于Internet的信息主动服务技术的研究与应用[D];浙江大学;2002年
2 韦艳;基于系统科学的辽宁省科技计划知识管理系统分析与设计[D];大连理工大学;2002年
3 梅震君;企业电子协作原理及其信息平台的研究开发[D];大连理工大学;2002年
4 唐剑锋;知识管理中的知识供需匹配新方法与实例研究[D];大连理工大学;2002年
5 王金霞;现代OA系统的研究[D];大连理工大学;2002年
6 李宁;用知识挖掘技术实现网络信息的学科知识分类与智能查询[D];四川大学;2003年
7 黄影;基于网络的交互式智能化咨询系统的研究与设计[D];四川大学;2001年
8 刘钢;基于神经网络的文本分类系统NNTCS的设计和实现[D];中国科学院研究生院(软件研究所);2003年
9 刘岩芳;论图书馆的知识管理[D];黑龙江大学;2003年
10 张承明;基于Web的数据挖掘研究[D];山东科技大学;2003年
【同被引文献】
中国期刊全文数据库 前1条
1 赵艳霞;梁昌勇;;基于关联规则的推荐系统在电子商务中的应用[J];价值工程;2006年05期
中国硕士学位论文全文数据库 前2条
1 李期位;农业信息智能推送技术的研究与实现[D];中国农业科学院;2006年
2 蒋就;快速Web开发与Super架构的研究与应用[D];西安电子科技大学;2007年
【二级参考文献】
中国期刊全文数据库 前10条
1 宋爱波,胡孔法,董逸生;Web日志挖掘[J];东南大学学报(自然科学版);2002年01期
2 李煊,汪晓岩,庄镇泉;基于关联规则挖掘的个性化智能推荐服务[J];计算机工程与应用;2002年11期
3 陈新中,李岩,谢永红,杨炳儒;Web挖掘研究[J];计算机工程与应用;2002年13期
4 胡建武,何贞铭,张贻权;WEB日志挖掘及其实现[J];计算机工程与应用;2004年14期
5 郭岩;白硕;于满泉;;Web使用信息挖掘综述[J];计算机科学;2005年01期
6 彭波;;大规模搜索引擎检索系统框架与实现要点[J];计算机工程与科学;2006年03期
7 邹显春,谢中,周彦晖;电子商务与Web数据挖掘[J];计算机应用;2001年05期
8 熊馨,王卫平,叶跃祥;基于概念分层的个性化推荐算法[J];计算机应用;2005年05期
9 刘玮;;电子商务系统中的信息推荐方法研究[J];情报科学;2006年02期
10 许欢庆,王永成;基于用户访问路径分析的网页预取模型[J];软件学报;2003年06期
中国博士学位论文全文数据库 前1条
1 邓爱林;电子商务推荐系统关键技术研究[D];复旦大学;2003年
【相似文献】
中国期刊全文数据库 前10条
1 王继民;龚笔宏;孟涛;;多任务中文Web查询分析[J];计算机工程;2006年14期
2 黄云;唐世民;罗宇;;基于关联规则的站内搜索引擎设计[J];软件导刊;2010年01期
3 王太成;Web数据挖掘在搜索引擎中的应用[J];西南民族大学学报(自然科学版);2005年03期
4 付晓翠;许盈;;基于Web数据挖掘的个性化搜索引擎研究综述[J];现代计算机(专业版);2008年03期
5 ;计算机管理[J];电子科技文摘;2002年10期
6 苏晓珂;张勇敢;黄青松;;Deep Web查询接口的复杂模式匹配[J];石河子大学学报(自然科学版);2007年01期
7 张继刚;搜索引擎使用技巧[J];网络与信息;1999年09期
8 ;关键词搜索[J];每周电脑报;2000年38期
9 陈冰;;饿狼一样的网站提交工具——“提交饿狼”[J];科学之友;2000年07期
10 许斗;从Google看新一代搜索引擎的发展趋向[J];芜湖职业技术学院学报;2001年01期
中国重要会议论文全文数据库 前10条
1 李阳;徐锡山;韩伟红;郑黎明;徐镜湖;;网络安全事件关联规则的自动化生成方法研究与实践[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
2 左万利;刘居红;;包含正负属性的关联规则及其挖掘[A];第十六届全国数据库学术会议论文集[C];1999年
3 王宁;董淳;胡运发;陶晓鹏;;面向集合的关联规则挖掘算法[A];第十五届全国数据库学术会议论文集[C];1998年
4 周焕银;张永;;关联规则候选项频度规律研究[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
5 方艳;别荣芳;;关联规则的有趣性研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
6 黄晓燕;许龙飞;;基于关联规则的网络入侵检测技术的应用研究[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
7 李庆忠;张世栋;董国庆;;在数据多维体中进行关联规则的挖掘[A];第十六届全国数据库学术会议论文集[C];1999年
8 韩涛;张春海;;关系数据库中关联规则的高效挖掘算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
9 潘海为;李建中;张炜;;挖掘脑部医学图像中的关联规则[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
10 周水庚;胡运发;陶晓鹏;;分布数据库关联规则的递增挖掘[A];第十五届全国数据库学术会议论文集[C];1998年
中国重要报纸全文数据库 前10条
1 李一鑫;搜索排名的红与黑[N];财经时报;2007年
2 周文林;搜狗3.0能否撼动搜索市场[N];经济参考报;2007年
3 惠正一;比尔·盖茨:微软不怕Google[N];第一财经日报;2005年
4 赛迪顾问股份有限公司互联网与电子商务咨询中心 常燕杰;搜索,还是门户[N];中国计算机报;2005年
5 陈珊;浙江移动推出手机搜索引擎服务[N];人民邮电;2005年
6 赵法忠;搜索引擎还需悠着点[N];中国经营报;2005年
7 金朝力;搜索引擎火拼搜索质量[N];北京商报;2006年
8 本报记者  赵晓辉 孟昭丽;搜索引擎驶入“避风港”[N];中国证券报;2006年
9 孙琎;搜索引擎惊喜侵权官司止于“避风港”?[N];第一财经日报;2006年
10 姜蕊;问天下谁识搜索?[N];中国高新技术产业导报;2006年
中国博士学位论文全文数据库 前10条
1 岑荣伟;基于用户行为分析的搜索引擎评价研究[D];清华大学;2010年
2 李群;主题搜索引擎聚类算法的研究[D];北京林业大学;2011年
3 苏君华;面向搜索引擎的技术接受模型研究[D];南京大学;2011年
4 刘佐达;分布协作式搜索引擎模型及算法研究[D];清华大学;2011年
5 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年
6 郭眈;中文互联网视频搜索引擎系统策略研究[D];北京交通大学;2012年
7 肖波;可信关联规则挖掘算法研究[D];北京邮电大学;2009年
8 王越;分布式关联规则挖掘的方法研究[D];重庆大学;2003年
9 王镠璞;基于用户体验的互联网搜索引擎医学信息检索可用性评估研究[D];吉林大学;2010年
10 叶小飞;基于自发呈报系统与循证医学的药品不良反应信号挖掘[D];第二军医大学;2011年
中国硕士学位论文全文数据库 前10条
1 彭程;关联规则在搜索引擎中的应用及研究[D];西安理工大学;2010年
2 薛云;Internet上元搜索引擎的研究与设计[D];太原理工大学;2003年
3 王春花;基于Nutch的农业搜索引擎检索结果排序策略的研究[D];西北农林科技大学;2010年
4 李雷;基于Nutch的农业信息搜索引擎实现和优化[D];吉林大学;2011年
5 董晨;基于模糊聚类的个性化搜索引擎的研究[D];福州大学;2005年
6 封俊;基于Hadoop的分布式搜索引擎研究与实现[D];太原理工大学;2010年
7 李浩;分布式教育网信息检索系统的研究和实现[D];华南理工大学;2010年
8 涂明;关联规则增量式更新算法研究[D];合肥工业大学;2010年
9 尉建兴;基于Lucene搜索引擎的研究与应用[D];太原理工大学;2011年
10 李建平;智能化WEB信息搜索引擎的研究与实现[D];大庆石油学院;2003年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026