收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于倒排索引的关系数据库全文检索查询效率研究

吕晓旭  
【摘要】: 作为近年来的研究热点,全文检索领域取得了很多新成果和新突破。尤其以文本数据库为代表的新技术,在各项性能上有了突飞猛进的发展,并能满足当今大部分的文本检索需求。但是当面对全文检索和结构化数据检索的双重需求时,许多功能比较单一的文本数据库就显得力不从心。另一方面,除一些费用昂贵的商用关系数据库(Oracle,DB2等)外,以PostgreSQL为代表的开源关系数据库,在全文检索性能表现上显得十分不足,不能很好的满足全文检索的需要。所以寻找一种即能够满足全文检索和结构化数据检索的双重需求,且价格低廉的方案就显得具有重要的现实意义。 为了满足以上需求,本论文研究了已有的全文检索研究成果,并根据倒排索引模型的原理,对PostgreSQL关系数据库的全文检索方法进行了深入的分析,发现其在查询性能上有很大提升空间。通过对PostgreSQL全文检索索引结构和检索流程的学习和研究,本文找到了其全文检索性能不佳的原因,同时提出一套基于倒排索引的PostgreSQL数据库全文检索改进方案。这套方案主要包括倒排索引结构的改造、索引的扫描方法等内容。 最后,根据对比测试结果,改进后的PostgreSQL全文检索性能有了很大提升,它满足了全文检索和结构化检索的双重需求,证明了从内部改进开源关系数据库,以达到课题目标的可行性。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王宏宇;;基于Native-XML数据库倒排索引算法研究[J];情报科学;2006年07期
2 乔长昭;廖畅;;基于全文检索的XML存储查询系统[J];计算机应用与软件;2011年03期
3 熊本海 ,庞之洪,罗清尧,杨宝良;全文检索技术在国家饲料数据中心网站中的应用[J];中国饲料;2002年23期
4 董春晓;万维网上的全文检索技术及其发展[J];情报理论与实践;2000年01期
5 杨文亮;张泉;李鹏;;基于WEB的IETM全文检索设计与实现[J];舰船电子工程;2007年01期
6 李尚初;;Oracle的全文检索技术[J];哈尔滨师范大学自然科学学报;2009年04期
7 孙建平;;第二代计算机信息检索技术——全文检索[J];常德高专学报;1995年02期
8 蒙辉;陈燕;;Oracle Text技术在复杂结构数据库中的应用[J];计算机技术与发展;2007年04期
9 常征;;SQL Server 2000全文检索的实现[J];科技信息(科学教研);2007年16期
10 李永春;丁华福;;Lucene的全文检索的研究与应用[J];计算机技术与发展;2010年02期
11 杨缨;;全文检索技术在办公自动化系统中的应用[J];天津职业院校联合学报;2007年02期
12 杨应全;;Oracle全文检索技术在高校图书馆的应用[J];现代情报;2008年09期
13 王晓;张健;;基于Lucene检索引擎的电子病历全文检索系统[J];医疗卫生装备;2008年12期
14 方雪华;刘祖润;;中小型中文报刊全文数据库的建立及其应用[J];邵阳学院学报(自然科学版);2006年01期
15 张荣;欧阳芬;吕燕;;浅析基于个性化理论的全文检索技术[J];电力信息化;2008年05期
16 ;路遥知马力,日久见真金——TRS资料数据库管理和全文检索技术在竞争中独占鳌头[J];中国传媒科技;2001年07期
17 许敏;周伟灿;;CAD电子图管理系统中全文检索的研究[J];微计算机信息;2006年19期
18 贾桂霞;李祥林;马宏锋;;基于Lucene的中小型WEB应用全文检索引擎的研究[J];自动化与仪器仪表;2011年02期
19 吴恒山,刘兴宇,左琼;一种基于可扩展散列表的倒排索引更新策略[J];计算机工程;2004年08期
20 王智强,刘建毅;一种实时更新索引结构的设计与实现[J];计算机系统应用;2005年10期
中国重要会议论文全文数据库 前10条
1 刘小珠;孙莎;曾承;彭智勇;;基于缓存的倒排索引机制研究[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
2 毛楚祥;;全文检索技术和CGRS软件[A];第十一届全国数据库学术会议论文集[C];1993年
3 王黎维;彭智勇;林兰佳;杨巍;邹现军;;PostgreSQL事务处理的分析与扩展[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
4 李栋;史晓东;;对搜索引擎中倒排索引更新策略的研究和改进[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
5 罗昌明;王朝坤;王建民;;基于PostgreSQL的执行计划缓存研究与实现[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
6 肖静静;李双峰;彭智勇;;用多线程方式优化PostgreSQL的查询处理[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
7 陈足先;叶晓俊;;回滚段在PostgreSQL中的实现[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
8 吴亮;陆锋;刘兴权;申排伟;;基于Libpq的PostgreSQL空间几何对象实现方法研究[A];中国地理信息系统协会第八届年会论文集[C];2004年
9 田美红;陈岭;陈根才;;PostgreSQL口令认证机制的分析与改进[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
10 李慧;柏琳;纪越峰;;PostgreSQL数据库的备份与恢复[A];第九届全国青年通信学术会议论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 田翠华;基于WSRF的交通信息服务网格的研究[D];东北大学;2008年
2 吴炜;密文全文检索系统中的索引机制研究[D];华中科技大学;2009年
3 王淑嫱;轨道交通工程施工安全监控管理信息系统设计与应用研究[D];武汉理工大学;2010年
4 龙柏;并行计算平台上的数据索引技术研究[D];中国科学技术大学;2011年
5 邝砾;基于接口和行为语义的Web服务发现与适配研究[D];浙江大学;2009年
6 胥正川;基于关系数据库的XML数据存储、更新和检索[D];复旦大学;2003年
7 陈旭毅;基于索引云的企业搜索引擎实现研究[D];武汉大学;2011年
8 李支成;时空数据库复杂查询方法研究[D];华中科技大学;2012年
9 刘红;近重复视频检测算法研究[D];复旦大学;2012年
10 郇天笑;肿瘤Biomarker的计算系统生物学研究及生物网络可视化软件的开发[D];山东大学;2010年
中国硕士学位论文全文数据库 前10条
1 吕晓旭;基于倒排索引的关系数据库全文检索查询效率研究[D];北京工业大学;2009年
2 曾晔垠;全文索引技术中索引归并算法的研究与分析[D];电子科技大学;2008年
3 苏潭英;面向中文的数据库全文检索及其相关安全技术研究[D];解放军信息工程大学;2007年
4 黄欢;达梦数据库全文检索关键技术研究[D];华中科技大学;2007年
5 陈健;基于数据块采样的PostgreSQL统计信息估算方法的研究[D];中南林业科技大学;2007年
6 刘雪芹;单汉字全文检索技术研究[D];河北工业大学;2005年
7 陈震伟;教育资源共享系统中全文检索技术的研究[D];西安电子科技大学;2008年
8 郑萍;军用文献检索系统的设计与实现[D];复旦大学;2009年
9 吴俊森;维哈柯多语种搜索引擎倒排索引模块的实现[D];新疆大学;2007年
10 董长春;基于Hadoop的倒排索引技术的研究[D];辽宁大学;2011年
中国重要报纸全文数据库 前10条
1 郭莹;全文检索市场空间大[N];中国计算机报;2006年
2 肖诗斌;全文检索技术的深层剖析[N];中国计算机报;2003年
3 潘亚南;中国科学院全文档案信息检索应用取得好效果[N];中国档案报;2004年
4 ;开放源码数据库日趋升温[N];计算机世界;2004年
5 ;“门户+搜索”[N];中国计算机报;2007年
6 谌力 吴治电;开源之旅——数据库篇[N];网络世界;2005年
7 ;Linux数据库多多益善[N];网络世界;2005年
8 记者 陈姝;深圳“云计算”产业爆发式增长[N];深圳商报;2010年
9 记者 王晓晴;深圳80余家企业试水云计算[N];深圳特区报;2010年
10 薛启康;Linux环境下的数据库[N];中国计算机报;2001年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978