收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

稳定的信息检索方法及其在分布式环境下的应用

杨志峰  
【摘要】: 随着人类知识的增长和网络应用的普及,以电子形式存在的自然语言信息的数量迅速膨胀。一方面,这种现象使人们可以方便快捷地获取信息;另一方面,如果没有合理的检索手段,人们将很难充分地利用这些数据。 信息检索技术可以帮助人们有效地对大量文本数据进行检索。但是,由于目前尚未在自然语言理解领域取得突破,信息检索方法主要利用统计手段。它常常依赖于特定的经验参数,参数优化过程繁琐,且不利于实际应用。本文试图寻找一种较为稳定的文本检索算法和WEB信息检索方法,可以在不同的数据集和不同的检索任务中都取得较好的检索效果。同时,它是一种平滑函数,参数在一定范围内变动时不会对结果造成剧烈的影响。利用本文提出的检索算法和过程,在2002年文本检索会议(TREC)的Web Track中取得了满意的成绩,同时也在2001年TREC的数据集以及早期的数据集上取得了较好的效果。本文在TREC检索任务及其相关性判定的基础上,探讨了利用遗传算法改善检索质量和进行参数优化的可能性。在有相关性判定的遗传算法中,通过谨慎地选择遗传算子和遗传算法的形式以提高算法的全局和局部搜索能力,并避免早熟现象,取得了比手工调整结果更好的检索效果。在无相关性判定的遗传算法中,本文设计了投票算法以产生伪相关性信息,并在进化过程中调整目标函数的计算,取得了令人满意的结果。本文还把内容检索算法应用于P2P环境,利用检索算法对不同任务的稳定性,给出了接近单一数据库的性能水平。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 成奋华;吴家强;;数字图书馆中基于向量空间模型的文档分类系统[J];上海高校图书情报工作研究;2004年02期
2 徐莹;杜习英;;一种基于遗传算法的查询优化方法[J];电脑知识与技术(学术交流);2007年20期
3 张玲;秦拯;易先卉;;基于遗传算法的Web信息采集策略研究[J];情报理论与实践;2008年02期
4 姜传菊;浅谈P2P在数字图书馆中的应用[J];现代情报;2005年08期
5 傅间莲;陈群秀;;一种基于遗传算法的主题划分方法[J];计算机工程;2006年11期
6 牛玲;;一种基于向量空间模型的改进文本分类算法[J];情报杂志;2006年06期
7 赵正文;康耀红;方磊坤;王国金;彭显根;;信息检索中的遗传算法应用研究[J];郑州大学学报(理学版);2006年04期
8 王春红;张敏;;隐含语义索引模型的分析与研究[J];计算机应用;2007年05期
9 曾宇斌;刘贵全;;P2P网络中基于多关键字的信息检索研究[J];计算机应用与软件;2007年08期
10 徐衍;蒋运韫;;信息管理中的中文信息检索[J];商场现代化;2008年12期
11 高宏宾;杨海振;张小彬;;一种改进的文本聚类方法[J];自动化技术与应用;2008年09期
12 龙军;彭毅;;基于LSI/SVD的文本分类方法研究[J];微计算机信息;2009年30期
13 唐明伟;卞艺杰;陶飞飞;;基于语义向量空间模型的文档检索系统研究[J];情报杂志;2010年05期
14 王宏生;王芳芳;;信息检索中移动Agent迁移策略的研究[J];微计算机信息;2011年01期
15 王晓黎;王文杰;;基于向量空间模型的文本检索系统[J];微电子学与计算机;2006年06期
16 居斌;;潜在语义标引在中文信息检索中的研究与实现[J];计算机工程;2007年05期
17 汪帆;黄春毅;;不同P2P网络拓扑结构下的检索机制研究[J];现代图书情报技术;2007年02期
18 安玉艳;赵煜辉;杨德国;高远;;基于遗传算法的P2P流媒体多播模型[J];计算机工程;2007年12期
19 迟学芝;董春玲;朱晓丽;;基于BP神经网络与GA算法的信息过滤模型研究[J];信息技术与信息化;2007年03期
20 高晓燕;余镇危;史银龙;;基于QoS的P2P网络服务组合聚集遗传算法模型[J];计算机工程;2007年19期
中国重要会议论文全文数据库 前10条
1 陈志玮;肖诗斌;施水才;王昕;;一种基于HTML位置信息的查询扩展技术[A];第三届学生计算语言学研讨会论文集[C];2006年
2 马春雷;;基于向量空间模型的中文文本检索研究[A];2007年河北省电子学会、河北省计算机学会、河北省自动化学会、河北省人工智能学会、河北省计算机辅助设计研究会、河北省软件行业协会联合学术年会论文集[C];2007年
3 杨艳春;孟祥武;;P2P网络服务环境中的节点相似性度量研究[A];CCF NCSC 2011——第二届中国计算机学会服务计算学术会议论文集[C];2011年
4 吐尔地·托合提;维尼拉·木沙江;艾斯卡尔·艾木都拉;;维吾尔文Web信息检索中基于改进VSM的文档表示及相似度研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
5 吴晓;李丹宁;林洁;冀肖榆;李丹;;个性化搜索引擎中用户兴趣模型的研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
6 廖光忠;黄泽鑫;;基于HowNet语义算法的研究[A];2008'中国信息技术与应用学术论坛论文集(一)[C];2008年
7 樊景超;周国民;周义桃;;基于SDD改进算法的中文农业搜索引擎的研究[A];农业工程科技创新与建设现代农业——2005年中国农业工程学会学术年会论文集第三分册[C];2005年
8 袁野;王国仁;张莹;;P2P环境下度量空间中的相似查询处理[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
9 李钧;王新;;P2P存储网络中的冗余维持[A];第15届全国信息存储技术学术会议论文集[C];2008年
10 徐陈锋;奚宏生;江琦;殷保群;;一类分层非结构化P2P系统的随机优化[A];第二十六届中国控制会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 杨志峰;稳定的信息检索方法及其在分布式环境下的应用[D];中国科学院研究生院(计算技术研究所);2003年
2 张旭;具有拓扑结构布局优化的理论及算法[D];大连理工大学;2004年
3 张需溥;小型化微带天线的设计与数值分析[D];上海大学;2004年
4 廖平;基于遗传算法的形状误差计算研究[D];中南大学;2002年
5 杨春成;空间数据挖掘中聚类分析算法的研究[D];解放军信息工程大学;2004年
6 方娟;基于移动代理的网格资源监控技术的研究[D];北京工业大学;2005年
7 崔晓芳;箱型结构焊接变形预测、控制及应用[D];大连交通大学;2005年
8 张材;薄带坯铸轧板形智能识别与控制系统研究[D];中南大学;2004年
9 田方;遗传算法的改进研究及其在压缩机性能分析与优化中的应用[D];东北大学;2006年
10 谷峰;柔性作业车间调度中的优化算法研究[D];中国科学技术大学;2006年
中国硕士学位论文全文数据库 前10条
1 赵显亮;基于小世界理论的P2P文本检索研究[D];西安电子科技大学;2011年
2 唐培丽;基于语义的汉语文本主题词提取算法研究与实现[D];吉林大学;2005年
3 张智鹏;基于语义检索的结构化P2P网络模型研究[D];西华大学;2010年
4 刘玉国;基于遗传算法的网络信息过滤模型研究[D];山东师范大学;2006年
5 牛庆建;基于遗传算法多目标P2P任务调度策略研究[D];大连理工大学;2010年
6 郭磊;P2P系统中的信息检索理论及应用研究[D];山东师范大学;2011年
7 张静;文化算法在P2P教育平台负载均衡中的研究与应用[D];北方工业大学;2010年
8 李纯;P2P网络中基于内容的音乐信息检索[D];大连理工大学;2010年
9 都云琪;中文文本自动分类的研究与实现[D];西安电子科技大学;2002年
10 石磊;基于P2P环境中的Web服务选择研究[D];河北大学;2006年
中国重要报纸全文数据库 前10条
1 何清 史忠植 王伟;搜索引擎的前沿技术[N];计算机世界;2006年
2 李磊;让电子政务更聪明[N];计算机世界;2001年
3 本报记者 陈嘉颂;P2P:生存还是死亡[N];电脑报;2002年
4 希安;微软试水信息检索[N];经济日报;2004年
5 记者 朱周;昆明P2P信贷探秘[N];昆明日报;2011年
6 本报记者 李彦赤;国内P2P信贷热潮再探[N];中国城乡金融报;2011年
7 本报记者 杨庆广;P2P破解移动互联网流量激增难题[N];中国电子报;2009年
8 农总行农户金融部 黄迈;P2P小额信贷机制创新及面临问题[N];中国城乡金融报;2009年
9 马莉 撰稿;P2P突破传统网络模式新鲜出炉[N];国际经贸消息;2000年
10 本报记者 王丽娟;P2P信贷试水农村金融“蓝海”[N];中国经济时报;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978