收藏本站
《河北大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

WEB主题检索系统的性能优化设计

李树成  
【摘要】:随着Internet的快速发展,Web已成为全球最大的分布式信息知识库。一方面为信息资源的共建共享提供了一个良好的平台,另一方面大幅度地提升了信息检索和知识获取的成本,使得信息索取越来越难。Web主题检索系统作为一个将采集技术与过滤方法结合的新兴检索工具,越来越成为了Web信息检索技术的研究热点。 本文首先分析了当前Web资源的现状和特点、通用搜索引擎的不足,指出了开发新一代基于Web主题信息检索工具的理论意义和应用前景;然后,针对现有主题检索系统在Web页面文本的主题相关性判断存在的问题,提出TDT事件主题识别模型,优化系统的主题识别性能;最后,重点探讨了事件主题知识库自动构建,并借鉴现有主题系统,设计一个基于TDT事件主题识别模型的Web主题检索原型系统。
【学位授予单位】:河北大学
【学位级别】:硕士
【学位授予年份】:2006
【分类号】:TP391.3

【引证文献】
中国硕士学位论文全文数据库 前1条
1 姜胜辉;基于Web的超硬刀具综合信息检索系统[D];哈尔滨理工大学;2007年
【参考文献】
中国期刊全文数据库 前9条
1 吴志峰,田学东;人名、机构名在基于概念的文本分类中的应用研究[J];河北大学学报(自然科学版);2004年06期
2 陆玉昌,鲁明羽,李凡,周立柱;向量空间法中单词权重函数的分析和构造[J];计算机研究与发展;2002年10期
3 邹涛,王继成,朱华宇,金翔宇,张福炎;WWW上的信息挖掘技术及实现[J];计算机研究与发展;1999年08期
4 欧阳柳波,李学勇,李国徽,王鑫;专业搜索引擎搜索策略综述[J];计算机工程;2004年13期
5 印鉴,陈忆群,张钢;搜索引擎技术研究与发展[J];计算机工程;2005年14期
6 卜东波,白硕,李国杰;聚类/分类中的粒度原理[J];计算机学报;2002年08期
7 夏天,樊孝忠,刘林;利用JNI实现ICTCLAS系统的Java调用[J];计算机应用;2004年S2期
8 郑家恒,王兴义,李飞;信息抽取模式自动生成方法的研究[J];中文信息学报;2004年01期
9 陈治纲,何丕廉,孙越恒,郑小慎;基于向量空间模型的文本分类系统的研究与实现[J];中文信息学报;2005年01期
【共引文献】
中国期刊全文数据库 前10条
1 李文斌;刘椿年;陈嶷瑛;;基于特征信息增益权重的文本分类算法[J];北京工业大学学报;2006年05期
2 李玉鑑;操卫平;周兰珍;;结构化向量空间模型及其在Web信息检索中的应用[J];北京工业大学学报;2008年04期
3 王飞;魏法杰;;大型复杂装备研发成本控制专家系统[J];北京航空航天大学学报;2010年04期
4 张国英,沙云,刘旭红,刘玉树;高维云模型及其在多属性评价中的应用[J];北京理工大学学报;2004年12期
5 顾益军,樊孝忠,王建华,汪涛,黄维金;中文停用词表的自动选取[J];北京理工大学学报;2005年04期
6 张国英,沙芸,余有明,刘玉树;基于属性相似度的云分类器[J];北京理工大学学报;2005年06期
7 刘达;张国英;刘冠洲;沙芸;;基于特征筛选的云分类器[J];北京石油化工学院学报;2011年01期
8 李业丽,陆利坤;数据挖掘在虚拟企业联盟中的应用研究[J];北京印刷学院学报;2004年01期
9 吴琦;;浅谈如何提高学校图书馆的服务质量[J];才智;2011年03期
10 张巍;滕少华;;粒计算在决策支持中的应用[J];江西师范大学学报(自然科学版);2010年05期
中国重要会议论文全文数据库 前10条
1 叶远波;;故障后配网系统网络重构的研究[A];华东六省一市电机(电力)工程学会输配电技术研讨会2004年年会论文集[C];2004年
2 叶远波;;故障后配网系统网络重构的研究[A];安徽省电机工程学会优秀学术论文集(2002-2003)[C];2005年
3 胥永康;岳筱玲;;浅谈网络信息挖掘应用技术[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
4 栾悉道;谢毓湘;文军;吴玲达;;基于知识库的主动式专题搜索引擎[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
5 廖祝华;刘建勋;易爱平;;基于用户兴趣的Web服务发现[A];2006年全国开放式分布与并行计算机学术会议论文集(三)[C];2006年
6 刘雪芹;齐大朝;;基于robot的全文搜索引擎原理剖析[A];2011年全国电子信息技术与应用学术会议论文集[C];2011年
7 ;Chinese Text Emotion Classification Based On Emotion Dictionary[A];Proceedings 2010 IEEE 2nd Symposium on Web Society[C];2010年
8 陶兰;李四明;冯爽;;面向领域的网上信息挖掘系统研究与实现[A];第六届全国计算机应用联合学术会议论文集[C];2002年
9 邢延铭;诸克军;李春平;;一种基于遗传算法和模糊规则的分类算法[A];科学发展观与系统工程——中国系统工程学会第十四届学术年会论文集[C];2006年
10 李振星;徐泽平;;基于兴趣模型的WEB信息预测采集过滤方法[A];第一届学生计算语言学研讨会论文集[C];2002年
中国博士学位论文全文数据库 前10条
1 曲建华;基于群体智能的聚类分析[D];山东师范大学;2010年
2 魏建香;学科交叉知识发现及其可视化研究[D];南京大学;2010年
3 张翔;文本挖掘技术研究及其在综合风险信息网络中的应用[D];西北大学;2011年
4 许相莉;基于智能计算的图像检索算法研究[D];吉林大学;2011年
5 杨抒;基于WEB的林产品信息资源整合方法研究[D];北京林业大学;2011年
6 田俊华;基于本体知识库的教学资源自动采集技术研究[D];南京师范大学;2011年
7 胡军;基于覆盖的粒计算模型及其应用研究[D];西安电子科技大学;2010年
8 单建芳;面向事件的文本表示研究[D];上海大学;2012年
9 陈燕;数据仓库的设计与实现[D];大连理工大学;2000年
10 高飞;关联规则挖掘算法研究[D];西安电子科技大学;2001年
中国硕士学位论文全文数据库 前10条
1 王丽敬;地理案例的空间相似性计算[D];山东科技大学;2010年
2 吕万里;中文文本分类技术研究[D];山东科技大学;2010年
3 徐财应;基于Lucene的搜索引擎技术的研究与改进[D];长春理工大学;2010年
4 孙原;基于酉变换的权威页面挖掘算法研究[D];哈尔滨工程大学;2010年
5 刘伟丽;基于粒子群算法和支持向量机的中文文本分类研究[D];河南工业大学;2010年
6 吴志龙;改进的模糊遗传算法在医学中的应用和研究[D];天津理工大学;2010年
7 艾伟;基于本体的Web信息文本挖掘与检索服务研究[D];北京信息控制研究所;2010年
8 余璟飞;企业信息网用户决策支持系统设计[D];哈尔滨理工大学;2010年
9 李永春;主题搜索引擎的研究与实现[D];哈尔滨理工大学;2010年
10 巫昌凯;企业知识库系统中复杂查询系统的设计与实现[D];华南理工大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 林鸿飞,姚天顺;基于示例的中文文本过滤模型[J];大连理工大学学报;2000年03期
2 于启勋;超硬刀具材料的发展与应用[J];工具技术;2004年11期
3 邹涛,王继成,朱华宇,金翔宇,张福炎;WWW上的信息挖掘技术及实现[J];计算机研究与发展;1999年08期
4 欧阳柳波,李学勇,李国徽,王鑫;专业搜索引擎搜索策略综述[J];计算机工程;2004年13期
5 印鉴,陈忆群,张钢;搜索引擎技术研究与发展[J];计算机工程;2005年14期
6 黄卫农,卢振宇,陈健;基于网络使用的数据库系统的设计与实现[J];计算机应用研究;2001年04期
7 陈秉均,胡绍猫;超硬刀具材料的研究进展及发展趋势[J];机电工程技术;2005年09期
8 王枝军;强俊;程效军;;基于Web的信息检索系统的设计与实现[J];计算机工程与设计;2006年06期
9 薛鸿民;;Web数据挖掘技术研究[J];现代电子技术;2006年15期
10 蒋林森;超硬刀具在现代加工技术中的地位和作用[J];超硬材料工程;2005年02期
中国硕士学位论文全文数据库 前5条
1 崔鹏;基于WEB构建项目管理信息系统[D];哈尔滨理工大学;2004年
2 甘泉福;数字图象视频检索的研究和应用[D];哈尔滨工程大学;2006年
3 王默;基于个性化的石油专业网络信息检索技术研究[D];西南石油大学;2006年
4 尹西杰;基于智能Agent的Web个性化信息检索系统[D];山东大学;2006年
5 李盛韬;基于主题的Web信息采集技术研究[D];中国科学院研究生院(计算技术研究所);2002年
【二级参考文献】
中国期刊全文数据库 前10条
1 李晓黎,刘继敏,史忠植;概念推理网及其在文本分类中的应用[J];计算机研究与发展;2000年09期
2 王继成,萧嵘,孙正兴,张福炎;Web信息检索研究进展[J];计算机研究与发展;2001年02期
3 苏伟峰,李绍滋,李堂秋;一个基于概念的中文文本分类模型[J];计算机工程与应用;2002年06期
4 王丽坤;王宏;陆玉昌;;文本挖掘及其关键技术与方法[J];计算机科学;2002年12期
5 李亚东,夏雨佳,席裕庚;基于JNI的跨平台软件设计[J];计算机工程;2000年09期
6 王珏,王任,苗夺谦,郭萌,阮永韶,袁小红,赵凯;基于Rough Set理论的“数据浓缩”[J];计算机学报;1998年05期
7 秦进,陈笑蓉,汪维家,陆汝占;文本分类中的特征抽取[J];计算机应用;2003年02期
8 庞剑锋,卜东波,白硕;基于向量空间模型的文本自动分类系统的研究与实现[J];计算机应用研究;2001年09期
9 黄萱菁,吴立德,石崎洋之,徐国伟;独立于语种的文本分类方法[J];中文信息学报;2000年06期
10 刘少辉,董明楷,张海俊,李蓉,史忠植;一种基于向量空间模型的多层次文本分类方法[J];中文信息学报;2002年03期
【相似文献】
中国期刊全文数据库 前10条
1 王晓黎;王文杰;;基于向量空间模型的文本检索系统[J];微电子学与计算机;2006年06期
2 郑国忠;;主题检索原理及结构模型[J];科技信息(科学教研);2008年18期
3 唐明伟;卞艺杰;陶飞飞;;基于语义向量空间模型的文档检索系统研究[J];情报杂志;2010年05期
4 丁立恺;夏勇明;钱松荣;;基于词关联度的文本检索系统[J];微型电脑应用;2011年03期
5 王秀兰;;图书馆目录的主题检索——简述当前美国研究状况[J];图书情报知识;1984年03期
6 居斌;;潜在语义标引在中文信息检索中的研究与实现[J];计算机工程;2007年05期
7 冯艳娟;主题标引和主题检索的关系剖析[J];中华医学图书馆杂志;1997年04期
8 胡蓉;基于用户兴趣文本的个性化信息服务研究[J];湘潭师范学院学报(社会科学版);2005年06期
9 叶正;林鸿飞;杨志豪;;基于问句相似度的中文FAQ问答系统[J];计算机工程与应用;2007年09期
10 王自力;;基于WEB的文本检索模型[J];天津电力技术;2001年05期
中国重要会议论文全文数据库 前10条
1 黄永光;刘挺;车万翔;胡晓光;;面向变异短文本的快速聚类算法[A];全国网络与信息安全技术研讨会'2005论文集(下册)[C];2005年
2 吴坚;;上海市高校自然科学学报被“SCI”等检索系统收录情况分析[A];学报编辑论丛(第十集)[C];2002年
3 罗先碧;蒋红;彭雪雪;朱和平;;国际重要检索系统及其对科技期刊的影响[A];科技编辑出版研究文集(第六集)[C];2001年
4 尹承恕;;论建立我国自主权威的论文评价体系[A];加入WTO和中国科技与可持续发展——挑战与机遇、责任和对策(上册)[C];2002年
5 刘云峰;杨冬青;唐世渭;;基于语义网络的信息源局部模式提取[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
6 王克黎;;美国5种著名检索系统[A];第7届中国科技期刊青年编辑学术研讨会暨中国科技期刊的经营与发展论坛文集[C];2007年
7 杨光复;;论年鉴的检索系统和信息开发[A];创新与发展——云南省年鉴论文选(续集)[C];2006年
8 陈光宇;顾凤南;;《数学年刊》走向世界与国际接轨的探索[A];学报编辑论丛(第六集)[C];1996年
9 张秀峰;;国际医学英文文献检索系统的介绍及思考[A];学报编辑论丛(第七集)[C];1998年
10 马春雷;;基于向量空间模型的中文文本检索研究[A];2007年河北省电子学会、河北省计算机学会、河北省自动化学会、河北省人工智能学会、河北省计算机辅助设计研究会、河北省软件行业协会联合学术年会论文集[C];2007年
中国重要报纸全文数据库 前10条
1 清华大学计算机系智能技术与系统国家重点实验室 张敏 金奕江;寻“宝”有术[N];计算机世界;2003年
2 中国科学院计算技术研究所 王 斌;内容为王[N];计算机世界;2004年
3 艾文;让检索系统更人性化[N];中国计算机报;2004年
4 柯文;找音乐?会哼几句就行[N];人民日报;2006年
5 致蓝;知识管理的利器[N];科技日报;2001年
6 俞晓燕 刘景武;电子档案检索系统的探索[N];中国档案报;2003年
7 陈玉荣;更多、更快、更新的检索系统[N];中国企业报;2000年
8 记者 侯梅竹;汉语语料检索系统问世[N];计算机世界;2004年
9 章言;炎黄在线信息检索系统建立[N];中国质量报;2001年
10 记者 刘洁;陕西:群众查找“红头文件”不再难[N];中国纪检监察报;2007年
中国博士学位论文全文数据库 前10条
1 刘少辉;知识发现中粗糙集理论的研究[D];中国科学院研究生院(计算技术研究所);2003年
2 王立宏;信息系统的约简与粒度分析及其在数据挖掘中的应用[D];上海大学;2004年
3 杨为民;基于场论的信息检索模型的研究[D];安徽大学;2007年
4 王君泽;基于大规模问答语料的问题检索系统[D];华中科技大学;2010年
5 孙道军;文本挖掘预处理相关基础技术分析与应用研究[D];北京邮电大学;2008年
6 邢军;领域本体构造中数据源选取及构造方法的研究[D];大连理工大学;2008年
7 夏迎炬;文本过滤关键技术研究[D];复旦大学;2003年
8 杜卫锋;粗糙集理论在中文文本分类中的应用[D];西南交通大学;2006年
9 马晖男;信息检索中浅层语义模型的研究[D];大连理工大学;2007年
10 王修力;基于描述复杂性的信息检索理论与若干模型研究[D];北京语言大学;2006年
中国硕士学位论文全文数据库 前10条
1 李树成;WEB主题检索系统的性能优化设计[D];河北大学;2006年
2 万莉莉;中国生物医学工程文献相关性数据库建设研究[D];中国协和医科大学;2007年
3 孙英慧;基于向量空间模型的数据挖掘技术的研究[D];东北师范大学;2005年
4 胡长春;基于Lucene的中文自然语言搜索引擎[D];上海交通大学;2009年
5 褚金正;面向特定领域的文本识别和分类[D];湖南大学;2005年
6 张波;个性化Web搜索系统研究[D];燕山大学;2006年
7 郭妍;基于市长公开电话文本为背景的两种自动分类算法的比较[D];东北师范大学;2006年
8 董梅;文本内容的信息过滤技术研究[D];合肥工业大学;2006年
9 李洋;企业注册登记文件聚类软件设计与实现[D];大连理工大学;2007年
10 吴新涛;基于向量空间模型的网页信息过滤方法研究[D];大连理工大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026