收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

专题搜索引擎关键技术的研究

杨治秋  
【摘要】: 随着Internet技术的飞速发展,WWW已成为人们进行信息交流不可缺少的巨大的信息空间。面对如此巨大的海量信息,人们在寻找自己所需的信息时常常迷失方向。如何快速、准确的从浩瀚的信息资源中找到自己所需的信息已成为困扰用户的一大难题。 本课题针对现有搜索引擎的不足,提出专题搜索引擎的解决方案,实现搜索引擎的专题化需求,并就方案中涉及到的一系列理论和技术问题进行研究,主要包括: 首先,改进专题搜索引擎开发模型框架,并给出工作原理,在元搜索引擎的基础上,实现搜索引擎的专题性服务。 其次,文本自动分类技术是专题搜索引擎开发的一个重要环节,针对文本自动分类中存在的不足,重点论述了对特征提取技术、特征加权技术、词干提取技术和日志分析技术的改进和完善。从而有效地保证了设计的专题搜索引擎在查全率和查准率方面的提高。 然后,分词技术是专题搜索引擎的一个重要研究方面,本文在搜索引擎分词方面采用了一种基于数据视图的实用分词匹配方法,该方法实现简单,效果较好。同时,构造了专题分词词典,为用户进行检索提供了便利,提高了工作效率。 最后,在分析了传统k平均聚类方法不足的基础上,提出了一种文本聚类算法,通过选取较优的初始聚类中心,为更好的进行文本聚类提供了前提条件。实验表明该聚类算法可以提高聚类的稳定性并改善聚类效果。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张士靖;试论搜索引擎的发展和专题搜索引擎的建立[J];医学情报工作;2001年05期
2 李盼池;基于核聚类算法的高校图书借阅信息分类方法[J];现代情报;2003年09期
3 何瑗,蒋明,肖建华,符江东,徐洁磐;SISE:一个基于机器学习的中文专题搜索引擎[J];计算机工程;2002年10期
4 金应渊;基于知识挖掘技术的模糊信息聚类及联想设计[J];情报杂志;2004年03期
5 王行勇,戴丽,于建华;基于后向链接的查询路由研究[J];计算机工程;2002年12期
6 杨治秋;;专题搜索引擎的构建[J];牡丹江师范学院学报(自然科学版);2009年01期
7 张惠君,雷震;关于中文搜索引擎的性能分析与研究[J];现代情报;2000年05期
8 张民朝;;面向课程信息的专题搜索引擎的设计[J];制造业自动化;2011年06期
9 曹可劲;赵宗贵;江汉;;基于证据理论和硬c-均值法的不确定性信息聚类[J];模式识别与人工智能;2006年03期
10 郑凤萍;;基于数据挖掘技术的文献借阅信息分类方法[J];情报探索;2007年02期
11 张瑞;;城市公交专题搜索引擎的实现[J];电脑知识与技术;2010年30期
12 章成志;徐小琴;;信息检索系统的相关词提示技术与评测[J];情报理论与实践;2007年01期
13 张培宾;;WEB信息检索综述[J];黑龙江科技信息;2011年14期
14 沈磊;郑超雷;叶勇武;诸葛斌;;智能建站CMS系统的研究[J];计算机时代;2010年07期
15 ;下期待发表论文摘要预报[J];系统工程理论方法应用;2004年04期
16 黄颖;唐承秀;;网络环境下经济信息资源利用中存在的问题与对策[J];图书馆论坛;2006年04期
17 郑煜;钱榕;;一个基于链接分析的相关度排序算法及其在专题搜索引擎中应用[J];计算机应用与软件;2007年07期
18 赵仲孟,戚晓光,沈钧毅;分布式搜索引擎系统中协作检索机制的研究[J];微电子学与计算机;2005年05期
19 刘高勇;汪会玲;吴金红;;基于语义Web Service的Deep Web动态竞争情报采集[J];情报杂志;2008年03期
20 王志晓;张大陆;王玉红;王东;;P2P语义搜索研究进展[J];计算机科学;2010年04期
中国重要会议论文全文数据库 前5条
1 徐小琴;章成志;;Web信息检索中相关词提示技术与评测[A];第三届学生计算语言学研讨会论文集[C];2006年
2 王新民;汤兵勇;邵世煌;;智能系统理论中的语言形式与开放逻辑[A];1998年中国智能自动化学术会议论文集(上册)[C];1998年
3 王力;任彦硕;罗云林;朱瑞平;;中板轧机模糊聚类融合控制系统研究[A];2003中国控制与决策学术年会论文集[C];2003年
4 李乐强;唐常杰;左劼;邱源枞;段磊;李川;;基于同现度和自学习的中文字符组合发现[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
5 黄明初;钟威;何拥军;蒙斌;;基于查询扩展的数字档案检索策略[A];广西计算机学会2010年学术年会论文集[C];2010年
中国硕士学位论文全文数据库 前4条
1 杨治秋;专题搜索引擎关键技术的研究[D];燕山大学;2006年
2 林雪楠;一种改进的专题搜索结果排序算法的研究[D];大连海事大学;2008年
3 丁宬杰;搜索引擎技术的研究与实现[D];上海交通大学;2007年
4 董晨;基于本体的语义网爬虫的算法研究与应用实现[D];北京工业大学;2010年
中国重要报纸全文数据库 前3条
1 本报记者 卢旭成;百度和讯结盟是共赢还是共输?[N];中国计算机报;2008年
2 本报记者 董颖实习生 王汐玥;和讯构建盈利模式[N];市场报;2008年
3 本报记者 田梦;百度和讯结盟打造新商业模式[N];计算机世界;2008年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978