收藏本站
《暨南大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

后缀树算法在元搜索引擎中的应用

冯冰洁  
【摘要】: 随着网络与通信技术的迅速发展,Web信息爆炸性的增长,已经成为一个巨大的海量信息空间,搜索引擎成为网络必不可少的工具。通常单个搜索引擎能找到的相关信息不超过所有信息的一半,用户一般要通过多个搜索引擎进行检索才能较全面的检索到所需的信息,并且现在搜索引擎的搜索结果都是用列表的形式展现给用户的,用户还要从列表中挑选自己需要的信息,这对于用户来说很不方便。 因此,本文将后缀树算法应用到元搜索引擎中,设计了一个带聚类的元搜索引擎系统。用户只需提交一次搜索请求,由元搜索引擎负责转换处理后提交给多个预先选定的独立搜索引擎,并将各独立搜索引擎返回的查询结果集中起来进行聚类处理,创建类目体系,生成类标签,最后再把搜索结果以类目的形式呈现给用户,使用户能够在更高的主题层次上来查看搜索引擎返回的结果,从而可以大大缩小用户所需浏览的结果数量,缩短用户查询所需的时间。最后本文将STC算法与其他聚类算法进行比较,用实验证明STC算法在准确度和时间效率方面都高于传统的聚类算法。
【学位授予单位】:暨南大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP391.3

手机知网App
【参考文献】
中国期刊全文数据库 前10条
1 刘岭峰;;Vivísimo元搜索引擎技术特征[J];广东教育学院学报;2008年03期
2 李红宇;刘庆江;;中文自动分类在搜索引擎中的应用研究[J];计算机科学;2008年05期
3 朱茂盛,王斌,程学旗;元搜索引擎及其实现[J];计算机工程;2002年11期
4 房志峰;;中文搜索引擎中的分词技术研究[J];科学技术与工程;2008年09期
5 李红梅;丁振国;周水生;周利华;;搜索引擎中的聚类浏览技术[J];中文信息学报;2008年03期
6 李广建,黄崑;元搜索引擎及其主要技术[J];情报科学;2002年02期
7 夏治坤;周宁;;元搜索引擎对成员搜索引擎的选择研究[J];情报探索;2007年02期
8 孙吉贵;刘杰;赵连宇;;聚类算法研究[J];软件学报;2008年01期
9 王国强;郑海清;牛军钰;;基于STC的中文文本聚类算法[J];上海师范大学学报(自然科学版);2006年05期
10 胡亮,许永诚,高文,胡利平;个性化高效元搜索引擎的设计与实现[J];计算机工程与设计;2005年04期
中国硕士学位论文全文数据库 前3条
1 芦立华;基于后缀树的中文文本聚类算法研究[D];上海海事大学;2005年
2 王艳芬;基于本体技术的元搜索引擎XXYJ系统的设计与实现[D];苏州大学;2007年
3 马飞;数据挖掘中的聚类算法研究[D];南京理工大学;2008年
【共引文献】
中国期刊全文数据库 前10条
1 李广水;宋丁全;;数据分析在森林资源调查中的应用及发展研究[J];安徽农业科学;2009年22期
2 王锡钢,刘振文;搜索引擎技术的分析与研究[J];鞍山钢铁学院学报;2002年06期
3 洪颖;;基于改进VSM算法的智能个性化信息检索系统研究[J];北京服装学院学报(自然科学版);2010年01期
4 周文鹃;刘自伟;陈昌平;;基于DC3算法的非编码区序列最大串联重复识别[J];兵工自动化;2009年03期
5 左国才;周荣华;符开耀;;基于DBSCAN算法的电信客户分类的应用研究[J];北京联合大学学报(自然科学版);2012年03期
6 陈爽;陈福;杜天苍;;一种启发式网络信息采集系统设计与实现[J];北京石油化工学院学报;2007年04期
7 周燕;网络信息资源组织研究[J];图书与情报;2003年01期
8 刘松涛;祝忠明;;基于Web2.0的个人学术信息门户设计[J];图书与情报;2007年05期
9 李晓方;武仲科;樊亚春;周明全;柳勇光;;一种新的用于三维检索的快速邻域搜索方法[J];北京师范大学学报(自然科学版);2011年05期
10 章林柯;崔立林;;潜艇机械噪声源分类识别的小样本研究思想及相关算法评述[J];船舶力学;2011年08期
中国重要会议论文全文数据库 前10条
1 曾成;赵锡均;徐红;;基于量子遗传算法的聚类方法[A];第二十九届中国控制会议论文集[C];2010年
2 梁伟贤;;网络搜索引擎发展现状的探讨[A];2007中国科协年会——通信与信息发展高层论坛论文集[C];2007年
3 ;A Fuzzy Neural Network System Modeling Method Based on Data-driven[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
4 刘保政;汪定伟;;基于多因素的相近距离聚类方法研究[A];Proceedings of the 2011 Chinese Control and Decision Conference(CCDC)[C];2011年
5 张立涛;张宇峰;;基于聚类分析的大型桥梁结构健康监测数据异常识别研究[A];第21届全国结构工程学术会议论文集第Ⅱ册[C];2012年
6 苏俊杰;胡欣杰;;基于人工免疫算法的搜索引擎结果聚类技术研究[A];2011年全国电子信息技术与应用学术会议论文集[C];2011年
7 周小平;梁一平;邓左祥;;元搜索引擎研究[A];2009年中国高校通信类院系学术研讨会论文集[C];2009年
8 ;A Chinese Web Page Clustering Algorithm Based on the Suffix Tree[A];Proceedings of the First Conference on Web Information System and Applications[C];2004年
9 吴继兵;李心科;;基于分治融合的混合属性数据聚类算法研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(下册)[C];2009年
10 龚才春;贺敏;张华平;许洪波;程学旗;;大规模语料的频繁模式快速发现算法[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
中国博士学位论文全文数据库 前10条
1 徐森;文本聚类集成关键技术研究[D];哈尔滨工程大学;2010年
2 于翔;基于网格的数据流聚类方法研究[D];哈尔滨工程大学;2010年
3 熊晶;海洋生态本体的建模方法研究及应用[D];中国海洋大学;2010年
4 徐红波;基于空间填充曲线高维空间查询算法研究[D];哈尔滨理工大学;2010年
5 刘卫红;垃圾邮件检测与过滤关键技术研究[D];华南理工大学;2010年
6 尹可挺;Internet环境中基于QoS的Web服务组合研究[D];浙江大学;2010年
7 李炳龙;文档碎片取证关键技术研究[D];解放军信息工程大学;2007年
8 皋军;智能识别中的降维新方法及其应用研究[D];江南大学;2010年
9 陈曦;基于子串的文本分割与主题标注研究[D];武汉大学;2009年
10 苏晓珂;基于聚类的异常挖掘算法研究[D];东华大学;2010年
中国硕士学位论文全文数据库 前10条
1 程宾;基于用户兴趣模型的元搜索引擎的研究[D];山东科技大学;2010年
2 岳广飞;基于二次搜索的搜索引擎技术研究[D];山东科技大学;2010年
3 刘文昊;基于模糊聚类和纹版辅助的织物疵点检测算法研究[D];浙江理工大学;2010年
4 李振;网络舆情预测关键技术研究[D];郑州大学;2010年
5 丁金凤;基于网格与密度的数据流聚类算法研究[D];哈尔滨工程大学;2010年
6 蔡宇虹;基于主题的元搜索引擎关键技术研究[D];哈尔滨工程大学;2010年
7 刘萍;软件体系结构恢复的研究与实现[D];大连理工大学;2010年
8 姜荣;时间序列的聚类和关联规则挖掘研究[D];辽宁师范大学;2010年
9 李丹丹;基于权重设计的聚类融合算法研究及应用[D];辽宁工程技术大学;2009年
10 刘琼;基于群体智能的聚类算法研究[D];长沙理工大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 邓志鸿,唐世渭,张铭,杨冬青,陈捷;Ontology研究综述[J];北京大学学报(自然科学版);2002年05期
2 胡誉耀;元搜索引擎在数字图书馆中的运用[J];图书与情报;2003年05期
3 高新波,裴继红,谢维信;模糊c-均值聚类算法中加权指数m的研究[J];电子学报;2000年04期
4 罗敏,王丽娜,张焕国;基于无监督聚类的入侵检测方法[J];电子学报;2003年11期
5 李洁;高新波;焦李成;;基于特征加权的模糊聚类新算法[J];电子学报;2006年01期
6 张强弓,喻国宝,廖湖声,隋树林;一种元搜索引擎的查询结果处理模型[J];华南理工大学学报(自然科学版);2004年S1期
7 张健奕;搜索引擎的新发展——元搜索引擎[J];河南图书馆学刊;2002年02期
8 陈栋,徐洁磐;Knight:一个通用知识挖掘工具[J];计算机研究与发展;1998年04期
9 阳小华;周龙骧;;World Wide Web的索引与查询技术[J];计算机科学;1997年06期
10 韩洁;周勇;刘少辉;史忠植;;基于WWW的未登录词识别研究[J];计算机科学;2002年12期
中国博士学位论文全文数据库 前1条
1 魏立梅;聚类分析新方法的研究与应用[D];西安电子科技大学;1998年
中国硕士学位论文全文数据库 前5条
1 吕传宇;答疑系统中专题式智能型元搜索引擎的研究[D];重庆大学;2004年
2 寿周翔;专业搜索引擎的研究与设计[D];浙江大学;2005年
3 孟增辉;聚类算法研究[D];河北大学;2005年
4 陈默;基于神经网络的元搜索引擎[D];浙江大学;2006年
5 呼延琢;基于决策树算法的数据挖掘的应用[D];西安电子科技大学;2007年
【相似文献】
中国期刊全文数据库 前10条
1 马燕,邹显春,包骏杰,李明;一种互联网智能元搜索引擎模型的设计[J];重庆师范大学学报(自然科学版);2004年03期
2 屈长青,李艳芳;元搜索引擎的关键技术[J];现代计算机;2004年05期
3 胡亮,许永诚,高文,胡利平;个性化高效元搜索引擎的设计与实现[J];计算机工程与设计;2005年04期
4 ;来信[J];电子商务世界;2008年01期
5 仇海峰;元搜索引擎[J];中国计算机用户;1997年32期
6 张卫丰;徐宝文;周晓宇;李东;许蕾;;元搜索引擎研究[J];计算机科学;2001年08期
7 蔡耿青;搜索引擎——互联网之神[J];教育信息化;2003年09期
8 张付志,刘明业;一种基于元搜索引擎的数字图书馆系统集成框架[J];北京理工大学学报;2004年08期
9 伏汉英,黄永忠,陈新,杨凯,郭金庚;一种基于Java的元搜索引擎的设计与实现[J];信息工程大学学报;2004年04期
10 刘炜,陈俊杰;一种基于Agent的智能元搜索引擎框架[J];计算机工程与应用;2005年03期
中国重要会议论文全文数据库 前10条
1 阳小华;刘振宇;谭敏生;刘杰;左贵启;;元搜索引擎查询结果的合成方法[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
2 余晋;邓志鸿;田敬;唐世渭;;PinkySearch:基于聚类的元搜索引擎[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
3 李慧;张民;宋源清;;网络搜索引擎[A];2009全国计算机网络与通信学术会议论文集[C];2009年
4 孟奇奎;;一种基于数据库和用户反馈信息的元搜索引擎数据库选择算法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
5 吴冷冬;童云海;唐世渭;;面向在线音乐视频的元搜索引擎VMS[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
6 夏小玲;祁博民;廖顺和;;基于Web服务和元搜索引擎的数字图书馆中元数据互操作框架[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
7 陈伟雄;马少平;步建华;;基于元搜索引擎的多关键词检索技术[A];广东省电机工程学会2003-2004年度优秀论文集[C];2005年
8 梁伟贤;;网络搜索引擎发展现状的探讨[A];2007中国科协年会——通信与信息发展高层论坛论文集[C];2007年
9 周小平;梁一平;邓左祥;;元搜索引擎研究[A];2009年中国高校通信类院系学术研讨会论文集[C];2009年
10 吴远红;徐妙君;范银琛;;元搜索引擎中基于OWA算子的查询结果合成研究[A];2007年全国开放式分布与并行计算机学术会议论文集(上册)[C];2007年
中国重要报纸全文数据库 前10条
1 山东 张蕊;“闻香识引擎”[N];中国计算机报;2000年
2 ITBOY;探索出来的世界[N];电脑报;2004年
3 赵敏超;利用因特网查找信息三步骤[N];中国图书商报;2003年
4 王旭;中文智能搜索引擎[N];计算机世界;2001年
5 彭岩 艾迪明;网络信息“拉取”技术[N];计算机世界;2001年
6 易观网络咨询公司;引航“?”年代[N];中国计算机报;2000年
7 应晓敏 窦文华;他山之石[N];计算机世界;2003年
8 搜索引擎9238;英文搜索四当家[N];中国计算机报;2001年
9 应晓敏 窦文华;条条道路通罗马[N];计算机世界;2003年
10 刘洋;数字时代如何写好英语论文[N];中华读书报;2002年
中国博士学位论文全文数据库 前10条
1 李红梅;智能元搜索引擎关键技术研究[D];西安电子科技大学;2009年
2 李强;基于本体论的个性化和社会化元搜索引擎的研究[D];浙江大学;2006年
3 刘炜;智能元搜索引擎中个性化模式库的研究[D];太原理工大学;2007年
4 薛陈;复杂环境下视频目标跟踪技术的算法和应用研究[D];中国科学院研究生院(长春光学精密机械与物理研究所);2010年
5 徐明;对等网络中的查询路由与重构机制[D];复旦大学;2010年
6 何贤芒;隐私保护中k-匿名算法和匿名技术研究[D];复旦大学;2011年
7 姜维财;地震记录评价方法研究及系统开发[D];中国地质大学(北京);2005年
8 梁晓雯;OFDM系统中自适应分配算法及其计算量的研究[D];中国科学技术大学;2006年
9 梁作鹏;面向Web的XML检索关键技术研究[D];东南大学;2005年
10 龚才春;短文本语言计算的关键技术研究[D];中国科学院研究生院(计算技术研究所);2008年
中国硕士学位论文全文数据库 前10条
1 冯冰洁;后缀树算法在元搜索引擎中的应用[D];暨南大学;2010年
2 张维华;基于聚类的中文元搜索引擎技术研究[D];南京邮电大学;2011年
3 胡国东;基于后缀数组聚类的元搜索引擎的设计与实现[D];吉林大学;2010年
4 郭瑾;基于元搜索的Web网络军事情报信息搜索技术研究[D];中国石油大学;2010年
5 张腾宇;元搜索引擎中结果聚合排序方法的研究[D];北京工业大学;2012年
6 王金栋;元搜索引擎调度策略及结果排序算法的研究[D];燕山大学;2010年
7 王新;一种垂直元搜索引擎的研究[D];西北大学;2010年
8 张鑫;基于本体论的领域元搜索引擎的研究与设计[D];兰州大学;2010年
9 蔡宇虹;基于主题的元搜索引擎关键技术研究[D];哈尔滨工程大学;2010年
10 刘林;基于语义的元搜索引擎关键技术研究[D];河南工业大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026