收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于分类语义的Web信息检索系统

马纪颖  
【摘要】:随着WWW上信息资源数量成几何级数的增多,如何在海量数据空间中快速、准确的获取用户所需Web信息成为研究的焦点。本文设计并实现了一个基于分类语义的检索系统——SECS,该系统自动构建Web信息分类体系,通过Web数据抽取机制以及Web信息分类技术,实现了检索结果的分类和层次化展示,使用户面对海量的检索结果能够快速准确的定位所需信息。 本文首先讨论了Web信息检索的相关背景及研究基础;然后提出一种新的web信息自动分类方法——通过web信息在网站结构中的位置实现自动分类;以此为基础,提出并设计了进行基于分类语义的检索系统——SECS的体系结构;实现了包括获取页面信息的高性能T-Spider程序在内的几种算法;最后通过实验,实现检索结果的分类和层次化展示。 实验采用Java以及动态Web技术实现了SECS原型系统,系统部署在Window平台上,以Tomcat5作为JSP/Serlvet容器,SQL Server为数据库服务器。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 李学勇,田立军,谭义红,欧阳柳波,李国徽;一种基于非贪婪策略的网络蜘蛛搜索算法[J];计算技术与自动化;2004年02期
2 骆庆;;中文搜索引擎中的网络蜘蛛[J];福建电脑;2006年12期
3 柳婷;;网络蜘蛛的简单设计与研究[J];大众商务;2010年16期
4 李学勇,欧阳柳波,李国徽;非贪婪策略在WEB搜索中的应用[J];中央民族大学学报(自然科学版);2004年03期
5 欧阳柳波,李学勇,李国徽,王鑫;专业搜索引擎搜索策略综述[J];计算机工程;2004年13期
6 李学勇,谭义红,田立军,欧阳柳波,李国徽;ε-贪婪策略在网络蜘蛛搜索策略中的应用[J];湖南工程学院学报(自然科学版);2004年02期
7 李旭倩;甄力;;MFC网络蜘蛛流程分析[J];电脑编程技巧与维护;2008年09期
8 陈治平,林亚平,李军义;智能门户搜索引擎技术[J];计算机工程;2004年03期
9 王勇,李杨;网上信息搜索、采集与整理技巧[J];山东电子;2002年02期
10 华伟臣;张秀琼;;网络蜘蛛搜索研究[J];乐山师范学院学报;2006年05期
11 包桂燕;;网络蜘蛛搜索策略评价[J];民营科技;2010年04期
12 李国锋;李春伟;;网络搜索引擎技术探析[J];廊坊师范学院学报;2005年04期
13 云健;王春霞;;搜索引擎技术综述[J];河西学院学报;2008年02期
14 宋春阳;金可音;;Web搜索引擎技术综述[J];现代计算机(专业版);2008年05期
15 赵善明;崔翔;杨书涛;;主题搜索引擎搜索浅析[J];才智;2008年13期
16 郑志材;张晶;;基于JAVA的网络蜘蛛的设计与实现[J];硅谷;2009年14期
17 葛宇;梁静;陈晓敏;;搜索引擎系统中热点问题的探讨[J];成都电子机械高等专科学校学报;2009年04期
18 周纯;;垂直搜索引擎技术进展[J];知识经济;2011年09期
19 李静媛;浅谈搜索引擎应用技术[J];天津市财贸管理干部学院学报;2005年01期
20 陈灶芳 ,黄国涛;用于互联网信息搜索系统的网络蜘蛛设计与实现[J];广东科技;2005年01期
中国重要会议论文全文数据库 前10条
1 李贺华;付鹤岗;;多Agent Web信息检索应用研究[A];2008年计算机应用技术交流会论文集[C];2008年
2 张敏;马少平;高剑锋;;基于链接的方法进行Web信息检索的TREC实验研究(英文)[A];第一届学生计算语言学研讨会论文集[C];2002年
3 张敏;马亮;马少平;陈群秀;;TREC2002介绍及清华大学实验研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
4 廉成洋;毛宇光;;一种基于二叉树的HTML到XML的转换方法研究[A];2009年中国高校通信类院系学术研讨会论文集[C];2009年
5 梁一平;刘连芳;周小平;申文明;;网络蜘蛛Nutch的分析、定制与二次开发[A];2009年中国高校通信类院系学术研讨会论文集[C];2009年
6 邵辉;李芳;;基于树模型算法的动态网页信息抽取研究[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
7 袁特;顾新建;胡恒杰;许琦;;一种企业竞争情报系统的研究[A];先进制造技术论坛暨第五届制造业自动化与信息化技术交流会论文集[C];2006年
8 耿涛;;Web日志分析在电子数据取证中的应用[A];第二十一次全国计算机安全学术交流会论文集[C];2006年
9 林欢欢;王文杰;史忠植;;移动环境下垂直搜索引擎[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
10 李国华;昝红英;;基于语句相似度的网页标题抽取方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
中国博士学位论文全文数据库 前8条
1 朱征宇;Web资源组织与服务性能研究[D];重庆大学;2003年
2 沈筱彦;Web信息检索若干关联挖掘问题的研究[D];北京邮电大学;2009年
3 王灿;基于半监督流形学习的Web信息检索技术研究[D];浙江大学;2009年
4 管子玉;基于图学习的Web信息检索技术研究[D];浙江大学;2010年
5 王德吉;复杂环境下自适应智能决策支持系统研究[D];中国科学技术大学;2007年
6 冯国臻;基于结构分析的大规模WWW文本信息检索技术的研究[D];中国科学院研究生院(计算技术研究所);2001年
7 陈治平;智能搜索引擎理论与应用研究[D];湖南大学;2003年
8 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年
中国硕士学位论文全文数据库 前10条
1 马纪颖;基于分类语义的Web信息检索系统[D];东北大学;2006年
2 李富萍;基于多Agent的信息搜索引擎技术研究与应用[D];中北大学;2005年
3 张玲;智能信息采集搜索策略研究[D];湖南大学;2004年
4 何源源;迅雷资源搜索引擎的研究与实现[D];西北工业大学;2007年
5 薛建春;垂直搜索引擎中网络蜘蛛的设计与实现[D];中国地质大学(北京);2007年
6 胡晓翠;站点搜索引擎的研究与实现[D];武汉科技大学;2009年
7 王嘉杰;面向博客领域的垂直搜索引擎的研究与实现[D];北京邮电大学;2009年
8 刘海峰;垂直搜索引擎的研究与实现[D];大连理工大学;2009年
9 何世林;基于Java技术的搜索引擎研究与实现[D];西南交通大学;2006年
10 何娟;DynamicView中信息抽取系统的设计与实现[D];东南大学;2006年
中国重要报纸全文数据库 前10条
1 江苏 刘波;网络蜘蛛[N];中国电脑教育报;2000年
2 于发修;寻找搜索的技巧[N];中国计算机报;2001年
3 ;搜索引擎为自由信息导航[N];中国电脑教育报;2005年
4 姜姝;娱乐至死 肉搜成疯[N];中国电脑教育报;2008年
5 清华大学计算机系智能技术与系统国家重点实验室 张敏 金奕江;“海”中捞“珍”[N];计算机世界;2003年
6 秦可;普加启用新搜索引擎[N];中国工业报;2007年
7 胡海啸 华滨 张梦谦;手机搜索:信息尽在手中[N];中国税务报;2005年
8 胡金喜;搜索引擎如何搜到用户心?[N];中华工商时报;2000年
9 彭静;我为搜索狂[N];中国计算机报;2004年
10 刘成;自主创新是提高综合国力的关键[N];经济日报;2007年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978