收藏本站
《大连理工大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于分布式多索引融合的专利信息检索研究

朴红吉  
【摘要】: 信息检索在社会经济发展、人们日常生活中扮演着越来越重要的角色,专利信息的检索受到越来越广泛的关注和重视。然而,信息检索发展至今,在理论和应用上仍有许多不完善之处,与人们日益增长的对信息检索的需求相差较远。本文主要工作体现在分布式专利检索、索引池、信息融合等三方面。本文中文专利信息检索为研究背景,对中文专利检索相关理论和方法进行了研究。 本文首先给出了基于分布式的专利信息检索方法,对分布式环境下索引建立、检索过程进行了讨论,这也是索引池研究的基础。 对于海量数据挖掘中的信息检索问题,如何建立索引是一个重要的研究课题。本文提出了面向应用的索引池概念,对索引对检索结果的影响进行了讨论,并实现了基于Nutch索引池的一个应用。 本文提出将现有的关键词检索方法与语义检索方法检索出的结果进行融合,提高一次查询的查全率。在融合过程中采用了结果集相关性调整的策略,使得相关专利在结果集中的位置得以提前,方便检索人员进行检索。 本文主要研究内容如下: (1)对分布式环境下专利检索进行的研究,主要对专利信息的分布式爬取、分布式建立索引和分布式检索进行了研究和实现。 (2)提出了面向具体应用的索引池的概念和索引池模型,并针对索引池模型,给出了索引评价方法。实现了基于Nutch的索引池搜索工具。基于Nutch,实现了在分布式环境下的爬虫、索引、检索一整套索引池应用,通过实验验证了索引池理论。 (3)给出了一种信息融合的模型。针对中文专利检索的特点,设计了RSSI融合模型。该模型将基于关键词检索与基于语义检索的结果集进行融合,在融合策略上考虑到了不同结果集长度、相关性分值大小等条件,优化了最终的检索结果的查全率与平均查准率。
【学位授予单位】:大连理工大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP391.3

【参考文献】
中国期刊全文数据库 前5条
1 雷鸣,王建勇,赵江华,单松巍,陈葆珏;第三代搜索引擎与天网二期[J];北京大学学报(自然科学版);2001年05期
2 金博,史彦军,滕弘飞;基于语义理解的文本相似度算法[J];大连理工大学学报;2005年02期
3 胡冉;关于搜索引擎的几个理论问题的综述[J];晋图学刊;2003年01期
4 戴青云,李海鹏;基于纹理和形状特征的外观设计专利图像的检索方法[J];计算机工程与应用;2002年03期
5 谭宇红,胡德华,柳晓春;中文搜索引擎分类体系研究[J];情报科学;2001年06期
中国硕士学位论文全文数据库 前4条
1 乔冬梅;搜索引擎现状与发展研究[D];郑州大学;2002年
2 毛平;基于领域本体的文本信息语义检索研究[D];南京理工大学;2007年
3 陈戈;面向图书检索的图书摘要概念图标引研究[D];上海交通大学;2008年
4 胡晓光;基于语言模型的文本检索技术及检索结果重排序的研究[D];哈尔滨工业大学;2006年
【共引文献】
中国期刊全文数据库 前10条
1 卢效峰,郑权;基于用户行为分析的搜索引擎模型[J];北方工业大学学报;2004年03期
2 暴海龙,朱东华;专利情报分析方法综述[J];北京理工大学学报(社会科学版);2002年S1期
3 王琪;中小企业技术创新需要政府支持[J];商业研究;2003年15期
4 高文杰,刘素兰;一种基于WWW的INTERNET信息开采系统[J];电脑与信息技术;2000年03期
5 李立耀;;基于页面链接结构Page Rank算法的改进——有向访问模型[J];福建师大福清分校学报;2006年02期
6 张宜;基于内容的图象检索技术研究综述[J];广西广播电视大学学报;2003年03期
7 李蕾;实施建筑业企业技术创新战略的对策研究[J];国外建材科技;2005年03期
8 赵鑫,武刚;搜索引擎的发展与展望[J];河北林果研究;2004年01期
9 郭卫军;己内酰胺工业技术创新的思考[J];石油化工管理干部学院学报;2001年03期
10 张春元,康耀红,王曙光,张莉;中文搜索引擎的缺陷与改进[J];海南大学学报(自然科学版);2004年01期
中国重要会议论文全文数据库 前1条
1 赵勇;;企业技术创新初探[A];十二省区市机械工程学会学术年会论文集[C];2007年
中国博士学位论文全文数据库 前9条
1 施建军;科技与创新的统计研究[D];厦门大学;2001年
2 尹子民;工业企业竞争力与可持续发展评价方法的研究[D];辽宁工程技术大学;2002年
3 陈定权;自动主题搜索的应用研究[D];中国科学院研究生院(文献情报中心);2003年
4 李章维;基于多Agent的数据广播信息平台研究及在远程教育中的应用[D];浙江大学;2004年
5 章琰;大学技术转移的界面移动及模式选择研究[D];清华大学;2004年
6 石跃祥;计算机视觉图像语义模型的描述方法研究[D];中南大学;2005年
7 肖条军;纵向型企业集团的R&D及其经济增长的信号博弈分析[D];东南大学;2000年
8 周旭;基于区域特色的重庆市技术创新模式研究[D];重庆大学;2007年
9 吕俊涛;基于纵向差异化的企业产品创新策略博弈分析[D];上海交通大学;2008年
中国硕士学位论文全文数据库 前10条
1 罗方芳;智能化搜索引擎关键技术研究[D];福州大学;2006年
2 李富萍;基于多Agent的信息搜索引擎技术研究与应用[D];中北大学;2005年
3 丁一;基于Web挖掘的个性化推荐服务研究[D];华中科技大学;2004年
4 李明;广州市施工企业技术素质调查分析及相关对策研究[D];西安建筑科技大学;2001年
5 张才明;石材工业技术创新的综合分析[D];北京工业大学;2001年
6 乔智勇;Web数据挖掘系统的设计及关键技术研究[D];西安电子科技大学;2002年
7 丁学明;生物医药产业技术创新的风险控制[D];中南大学;2002年
8 魏子衡;企业技术创新体系研究[D];河北工业大学;2002年
9 胡平;中国光纤光缆企业发展战略研究[D];武汉理工大学;2002年
10 蔡传宝;论企业核心竞争力的培育及实证分析[D];武汉理工大学;2002年
【同被引文献】
中国期刊全文数据库 前9条
1 游湘涛,叶施仁,史忠植;多策略通用数据采掘工具MSMiner[J];计算机研究与发展;2001年05期
2 杨丹丹;;基于数据挖掘的企业专利价值评估方法研究[J];科学学与科学技术管理;2006年02期
3 张翠玲;论自然语言检索[J];情报理论与实践;2003年04期
4 黄晓霞,萧蕴诗;一种新型的基于多智能体的KDD系统结构[J];同济大学学报(自然科学版);2002年07期
5 暴海龙,朱东华,李金林;专利文献中的知识发现[J];预测;2003年04期
6 赵庆龄,钱平,苏晓路,杨娟,赵明;基于本体论的土壤知识体系智能检索系统的设计与Web实现[J];中国农业大学学报;2003年S1期
7 王永成;;信息检索中的查全率与查准率[J];情报科学;1984年06期
8 唐爱民,真溱,樊静;基于叙词表的领域本体构建研究[J];现代图书情报技术;2005年04期
9 刘艳春;语境的两个次范畴及其作用[J];锦州师范学院学报(哲学社会科学版);2001年01期
中国博士学位论文全文数据库 前2条
1 何婷婷;语料库研究[D];华中师范大学;2003年
2 王进;基于本体的语义信息检索研究[D];中国科学技术大学;2006年
中国硕士学位论文全文数据库 前7条
1 庄新妍;基于SVM的中文文本分类系统的研究与实现[D];吉林大学;2007年
2 褚晓雷;基于机器学习的专利分类研究[D];上海交通大学;2008年
3 姚清耘;基于向量空间模型的中文文本聚类方法的研究[D];上海交通大学;2008年
4 王伟琼;专利信息采集及分析系统设计与开发[D];浙江大学;2008年
5 谢炜;中国专利产出研究[D];电子科技大学;2005年
6 张尔谦;基于语料库的计算机辅助英语教学研究[D];山东师范大学;2007年
7 毛平;基于领域本体的文本信息语义检索研究[D];南京理工大学;2007年
【二级参考文献】
中国期刊全文数据库 前10条
1 雷鸣,王建勇,赵江华,单松巍,陈葆珏;第三代搜索引擎与天网二期[J];北京大学学报(自然科学版);2001年05期
2 穗志方,俞士汶;汉语单句谓语中心词识别知识的获取及应用[J];北京大学学报(自然科学版);1998年Z1期
3 吕学强,任飞亮,黄志丹,姚天顺;句子相似模型和最相似句子查找算法[J];东北大学学报(自然科学版);2003年06期
4 董振东,董强;知网和汉语研究[J];当代语言学;2001年01期
5 金博,史彦军,滕弘飞;基于语义理解的文本相似度算法[J];大连理工大学学报;2005年02期
6 陈大平;集成搜索引擎与元搜索引擎比较研究[J];大学图书情报学刊;2005年01期
7 任瑞娟,李洪建;中文WWW搜索引擎比较研究[J];大学图书馆学报;1999年05期
8 马颖华,王永成,苏贵洋,韩客松,赵海;自动标引中基于概念层次树的主题词轮排选择的算法实现[J];高技术通讯;2003年06期
9 施兵;语义成分分析法综述[J];合肥工业大学学报(社会科学版);2003年04期
10 雷鸣,刘建国,王建勇,陈葆珏;一种基于词典的搜索引擎系统动态更新模型[J];计算机研究与发展;2000年10期
中国重要会议论文全文数据库 前2条
1 王洋;秦兵;郑实福;;句子相似度计算在FAQ中的应用[A];第一届学生计算语言学研讨会论文集[C];2002年
2 车万翔;刘挺;秦兵;李生;;面向双语句对检索的汉语句子相似度计算[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
中国博士学位论文全文数据库 前5条
1 潘谦红;分布式信息检索的研究与应用[D];中国科学院研究生院(计算技术研究所);1999年
2 贾自艳;Web信息智能获取若干关键问题研究[D];中国科学院研究生院(计算技术研究所);2004年
3 张磊;个性化信息分发及概念检索的研究[D];中国科学院研究生院(计算技术研究所);2002年
4 朱海平;基于概念图匹配的语义搜索[D];上海交通大学;2006年
5 方曙;基于专利信息分析的技术创新能力研究[D];西南交通大学;2007年
中国硕士学位论文全文数据库 前3条
1 秦文燕;基于语义网格的信息检索技术的研究[D];东南大学;2006年
2 俞春阳;基于专利本体的产品创新设计技术研究[D];浙江大学;2007年
3 李武;面向现代服务业的大规模分布式文件存储系统设计和实现[D];浙江大学;2008年
【相似文献】
中国期刊全文数据库 前10条
1 陈芨熙;顾新建;陈国海;魏江;;基于本体的专利检索技术[J];浙江大学学报(工学版);2009年12期
2 刘伟成;张志清;孙吉红;;基于KCCA的跨语言专利信息检索研究[J];情报科学;2010年05期
3 梁璐;;网络中医药专利信息检索[J];情报探索;2010年03期
4 伊雯雯;孙涌;张书奎;;基于本体的专利信息检索系统设计与实现[J];计算机应用与软件;2009年07期
5 朱江岭,靳红;如何从专利号辨别真假专利[J];情报探索;1999年03期
6 蔡志勇;CA与WPI在化学化工专利文献检索中的应用比较[J];情报理论与实践;1995年06期
7 王义星;试论专利检索在专利中的作用[J];情报探索;1999年04期
8 陈雅芝;专利检索——申请专利的必要条件[J];发明与革新;2002年11期
9 吴江;如何网上检索中内、外专利[J];现代情报;2004年02期
10 雷燕;介绍因特网上的六个专利文献数据库[J];图书情报知识;1998年02期
中国重要会议论文全文数据库 前10条
1 杨帆;;浅谈企业研发过程中的专利信息检索[A];发展知识产权服务业,支撑创新型国家建设-2012年中华全国专利代理人协会年会第三届知识产权论坛论文选编(第二部分)[C];2011年
2 张晓光;张璐;;国内LED显示专利信息检索与行业协会专利统计情况简述[A];2010全国LED显示应用技术交流暨产业发展研讨会文集[C];2010年
3 闫继红;董捷;;利用专利文献信息开发新的蜂产品[A];2005年全国蜂产品市场信息交流会论文集[C];2005年
4 陈英超;;我国部分农机企业专利状况分析[A];走中国特色农业机械化道路——中国农业机械学会2008年学术年会论文集(上册)[C];2008年
5 陈英超;;2007上半年我国部分农机企业专利状况分析[A];拖拉机、农用运输车、农用发动机行业背景资料(第七集)[C];2007年
6 陈英超;;2008上半年我国部分农机企业专利状况分析[A];拖拉机、农用运输车、农用发动机行业背景资料(第九集)[C];2008年
7 刘国伟;;关于专利无效程序请求人主体资格若干问题的思考[A];专利法研究(2007)[C];2008年
8 叶新峰;;弯曲不明感光纤专利的检索与分析[A];中国通信学会2009年光缆电缆学术年会论文集[C];2009年
9 郭燕;;我国服装行业专利保护现状研究[A];中国纺织工业发展报告(2008/2009)[C];2009年
10 梁田;;中国专利文献检索系统比较分析[A];新环境下图书馆建设与发展——第六届中国社区和乡镇图书馆发展战略研讨会征文集(下册)[C];2007年
中国重要报纸全文数据库 前10条
1 蒋培新 刘亚芬;我市首家专利信息检索中心成立[N];宜兴日报;2010年
2 本报记者 贺延芳 通讯员 葛富斌;专利检索与服务系统开通运行[N];中国知识产权报;2011年
3 记者 王慧 实习生 阿柔娜;首府专利信息检索对外开放日活动首次开启[N];呼和浩特日报(汉);2010年
4 张建纲 李旦华;如何进行专利检索[N];中国农机化导报;2011年
5 记者 薛飞;高级专利信息服务研讨会在京举行[N];中国知识产权报;2010年
6 温旭;专利检索的三种有效途径[N];中国知识产权报;2005年
7 石志宏 莫瑶江;中国企业应自觉利用专利检索保护知识产权[N];国际商报;2002年
8 卢慧生;WIPO酝酿实施补充国际专利检索制度[N];中国知识产权报;2007年
9 吴艳;专利检索咨询中心升级外观设计检索系统[N];中国知识产权报;2009年
10 通讯员 葛富斌;中国专利检索与服务系统项目启动[N];中国知识产权报;2008年
中国博士学位论文全文数据库 前1条
1 金博;面向专利和零部件的设计知识检索方法[D];大连理工大学;2009年
中国硕士学位论文全文数据库 前10条
1 朴红吉;基于分布式多索引融合的专利信息检索研究[D];大连理工大学;2010年
2 刘卫秋;专利信息检索系统的研究与实现[D];中南大学;2010年
3 缪涵琴;融合本体和用户兴趣的专利信息检索系统的研究与实现[D];苏州大学;2007年
4 于海斌;基于知识发现的专利检索系统分析与设计[D];东北林业大学;2012年
5 林晖;专利信息检索实验系统的研究与实现[D];北京邮电大学;2009年
6 刘镇滔;面向中小企业的专利知识服务及其平台研究[D];上海交通大学;2007年
7 唐和东;服务木材加工行业的TRIZ专利分析系统研究[D];东北林业大学;2009年
8 羊帅;基于自动查询扩展的专利文档检索方法[D];浙江大学;2013年
9 赵薇;P2P技术在分布式数据检索中的应用研究[D];东北财经大学;2007年
10 俞春阳;基于专利本体的产品创新设计技术研究[D];浙江大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026