收藏本站
《哈尔滨工程大学》 2009年
收藏 | 手机打开
二维码
手机客户端打开本文

高性能精确单模式串匹配算法研究

范洪博  
【摘要】: 串匹配问题是计算机科学的基础问题之一,几乎所有涉及字符串处理的应用中都或多或少的存在字符串匹配的要求。特别是在信息检索,网络安全,计算生物学等领域,字符串匹配为这些领域的核心问题。在所有字符串匹配问题中,精确单模式匹配算法设计又是串匹配问题的基础。目前,随着网络安全问题的凸显,网络技术、计算生物学的高速发展,以及“信息爆炸”现象愈加严重,字符串匹配应用对字符串匹配性能的要求越来越高,这对高性能字符串匹配应用的串匹配算法设计(特别是精确单模式匹配算法)提出了新的挑战。 本文主要对高性能精确单模式串匹配算法进行研究。首先对现有高性能精确单模式算法发展进行分析,给出目前在英文语料匹配下,性能最高的精确单模式串匹配算法。并分别对当前英文语料匹配下性能最高的两个串匹配算法Tuned BM和SBNDM2提出改进,提出了DQM算法和S2BNDM算法。 具体来说,本文成果主要在于: 1.总结前人研究结果,分析了现有精确单模式串匹配算法,并给出了目前进行字符串匹配领域研究的研究方向,以及目前性能最高的精确单模式串匹配算法。 2.提出一种基于后缀匹配机制的高性能精确单模式串匹配算法—DQM算法。DQM算法以tuned BM算法为基础算法,在tuned BM算法基础上引入两个判定字交替进行跳跃的方法降低了随跳跃进行判定字匹配概率动态增长对算法性能的影响;引入了一种改进的越界保护机制以降低越界检查的开销;并通过位操作和合并操作的方法改进算法在判定字匹配后的动作,使分支与跳转的次数降至最低。实验表明,DQM性能比Tuned BM算法更高。 3.提出了一种基于位并行、循环展开、按子串匹配机制的高性能精确单模式串匹配算法—S2BNDM系列算法。S2BNDM算法以SBNDM2算法为基础算法,通过修改BNDM类算法的位掩码定义,成功将BNDM类算法的核心循环化简至五条指令的最简形式。同时,本文在SBNDM2算法中引入下标越界保护,将下标越界检查的开销也降至最低。实验数据显示,在模式长度不超过机器字长的英文语料检索应用中,和模式长度不超过8的DNA序列检索应用中,S2BNDM算法是目前所有精确单模式串匹配算法中性能最高的算法。
【学位授予单位】:哈尔滨工程大学
【学位级别】:硕士
【学位授予年份】:2009
【分类号】:TP301.6

【引证文献】
中国期刊全文数据库 前1条
1 蓝维洲;朱杰;;POSIX库正则表达式的算法研究和实现[J];信息技术;2011年04期
中国硕士学位论文全文数据库 前2条
1 黄海;字符串匹配算法通用并行加速技术研究[D];西安建筑科技大学;2010年
2 孟庆庆;计算机证据搜索与分析技术研究[D];北京化工大学;2010年
【参考文献】
中国期刊全文数据库 前1条
1 王海峰,李生,赵铁军,刘鹏;机器翻译中模式匹配算法的研究[J];哈尔滨工业大学学报;1998年04期
【共引文献】
中国期刊全文数据库 前10条
1 戴酉,李涛,胡德明;多媒体影像处理的压缩技术[J];安徽广播电视大学学报;2000年01期
2 杨睿,郑学仁;8×8矩阵高速DCT的硬件实现[J];半导体技术;1999年06期
3 刁力力,黄厚宽;用人工智能和神经网络的方法组建数据压缩系统[J];北方交通大学学报;1998年02期
4 刘文超,成跃;基于TCP/IP的多媒体技术支持系统设计[J];兵工自动化;2005年02期
5 张京,宋培义;多模式自适应混合压缩法[J];北京广播学院学报(自然科学版);1998年03期
6 杨博,周孝宽;基于低通滤波的彩色图像多模式自适应系统[J];北京航空航天大学学报;2002年02期
7 姜宏旭,周孝宽;基于局域纹理特征的图像无损压缩[J];北京航空航天大学学报;2003年06期
8 刘来旸,樊孝忠,李淑芳;基于变长编码集合扩展的中文文本压缩算法[J];北京理工大学学报;2001年04期
9 许晓燕,张家谋;多模式活动序列图象存贮及变速率显示系统[J];北京邮电大学学报;1997年01期
10 李晓民,郑建宏;一种基于分形的图象压缩编码方法[J];重庆邮电学院学报;1998年03期
中国重要会议论文全文数据库 前4条
1 张帆;李晓峰;李在铭;;基于视觉特征模型的离散彩色图象特征保持型压缩技术[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
2 董怡;金伟其;黄富元;张淼;;红外压缩图像的质量评价研究[A];2007年中国南京第三届全国光学技术(光学制造技术与装备)交流会论文集[C];2007年
3 刘萍;谭建龙;;XML内容筛选中的快速串匹配算法[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
4 周学广;张焕国;;一种柔性中文字符串匹配算法[A];第二十七届中国控制会议论文集[C];2008年
中国博士学位论文全文数据库 前10条
1 应益荣;微分方程中的小波方法[D];西安电子科技大学;1999年
2 张文涛;视频多目标分割、宏特征描述与状态检测技术[D];电子科技大学;2000年
3 王学良;基于成像光谱图像特征的处理方法研究[D];中国科学院长春光学精密机械与物理研究所;2000年
4 李清军;新型多媒体视频判读技术研究[D];中国科学院长春光学精密机械与物理研究所;2000年
5 屈稳太;基于小波变换的图像压缩与信号检测技术研究[D];浙江大学;2003年
6 齐越;自由虚拟实景空间的研究与实现[D];中国人民解放军国防科学技术大学;2001年
7 张文耀;基于匹配跟踪的低位率语音编码研究[D];中国科学院研究生院(软件研究所);2002年
8 张晓冬;基于脊提取的信号表示和重建[D];东南大学;2003年
9 赵健;小波与分形理论在图像处理中的应用研究[D];西北工业大学;2003年
10 许祥滨;抗强多途径干扰的水声数字语音通信研究[D];厦门大学;2003年
中国硕士学位论文全文数据库 前10条
1 励崇德;视频会议终端软件系统的设计与开发[D];杭州电子科技大学;2010年
2 张利香;基于后缀数组的字符串模式查找的算法[D];西北师范大学;2010年
3 马思博;基于矢量量化的高光谱图像无损压缩算法研究[D];哈尔滨工业大学;2010年
4 何水霞;基于B-Tree索引和BerkeleyDB的中文词库的设计和实现[D];华中科技大学;2009年
5 赵丽丽;图像数据压缩编码及其应用技术[D];河北工业大学;2000年
6 周运红;自然景物建模及图像压缩分形反问题的研究[D];大连理工大学;2000年
7 覃海平;WINDOWS图形界面的压缩与传输[D];北京工业大学;2000年
8 刘枫;数字图象压缩算法的应用研究[D];成都理工学院;2001年
9 姚世超;合成孔径雷达原始数据压缩算法研究[D];中国科学院电子学研究所;2001年
10 陈文兵;GIS遥感图像压缩技术的研究[D];新疆大学;2001年
【同被引文献】
中国期刊全文数据库 前10条
1 龚汉明,周长胜;汉语分词技术综述[J];北京机械工业学院学报;2004年03期
2 于淼;孙睿;;计算机取证综述[J];北京联合大学学报(自然科学版);2007年02期
3 王文发;马燕;李宏达;;回溯法求解多约束分配问题[J];江西师范大学学报(自然科学版);2008年06期
4 方跃华,王卫国;检索引擎的重大突破──询问型检索引擎Ask Jeeves[J];电脑技术;1998年05期
5 杨兴旺;;基于回溯法的排课算法[J];电脑知识与技术;2009年19期
6 李玉龙;;计算机取证技术的探讨与研究[J];计算机安全;2007年05期
7 林亚平,刘云中,周顺先,陈治平,蔡立军;基于最大熵的隐马尔可夫模型文本信息抽取[J];电子学报;2005年02期
8 吴永春;黄毓瑜;;软件界面设计技术探讨与实践[J];工程图学学报;2007年06期
9 丛明煜,王丽萍;现代启发式算法理论研究[J];高技术通讯;2003年05期
10 王海峰,李生,赵铁军,刘鹏;机器翻译中模式匹配算法的研究[J];哈尔滨工业大学学报;1998年04期
中国博士学位论文全文数据库 前1条
1 王烁;字符串模式匹配的硬件加速研究[D];中国科学技术大学;2008年
中国硕士学位论文全文数据库 前4条
1 罗朝晖;计算机犯罪侦查取证技术——计算机证据研究[D];北京工业大学;2003年
2 王大萌;入侵检测系统中模式匹配算法的研究[D];哈尔滨工程大学;2006年
3 杨文一;Windows磁盘信息分析处理系统的研究与实现[D];厦门大学;2008年
4 鲁恩铭;硬盘格式化数据恢复技术研究与实现[D];四川师范大学;2009年
【相似文献】
中国期刊全文数据库 前10条
1 廖明涛;张德运;李金库;;基于网络处理器的高效中英文多模式匹配算法[J];计算机工程;2007年05期
2 王秀华;刘爱霞;;字符串匹配器的设计与实现[J];黑龙江纺织;2008年02期
3 贺川斌,周明全,王长缨;基于像素字符串比较的图像快速匹配算法[J];微机发展;2005年01期
4 张克农;陆佳华;常羽飞;;入侵检测系统中高速字符串匹配协处理的实现方法[J];微电子学与计算机;2006年04期
5 万晓榆;杨波;樊自甫;;改进的Sunday模式匹配算法[J];计算机工程;2009年07期
6 周泽辉;;浅谈高职学院数据结构课程的“算法驱动”教学[J];科教文汇(中旬刊);2009年03期
7 张国煊,王小华,周必水;快速书面汉语自动分词系统及其算法设计[J];计算机研究与发展;1993年01期
8 梁跃进;;水利计算软件开发的基本方法[J];广西水利水电;1993年03期
9 何宁,谢磊,郭明,王树青;基于独立成分的动态多变量过程的故障检测与诊断方法[J];化工学报;2005年04期
10 李帮义;数据传输选择问题:算法设计和复杂性分析[J];系统工程学报;2005年03期
中国重要会议论文全文数据库 前10条
1 李永强;刘杰;李允公;李祥;;Daubechies小波基的算法设计[A];全面建设小康社会:中国科技工作者的历史责任——中国科协2003年学术年会论文集(上)[C];2003年
2 钟章建;黄玮;马万经;姚佼;;面向协调控制的交通小区划分算法设计与实现[A];2008第四届中国智能交通年会论文集[C];2008年
3 张晋;;嵌入式电脑鼠运行算法的研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
4 孔垂柳;田地;;基于程序设计思想的C语言教学方案[A];2005全国计算机程序设计类课程教学研讨会论文集[C];2005年
5 陈家照;罗寅生;;群智能优化算法研究[A];第三届中国智能计算大会论文集[C];2009年
6 张家超;孔媛媛;;结合SVM与免疫遗传算法设计IDS的检测算法[A];2008年全国开放式分布与并行计算机学术会议论文集(下册)[C];2008年
7 宁泽洪;董占勇;徐达旺;;基于CCDF的微波功率统计测量的算法设计[A];2011年全国微波毫米波会议论文集(下册)[C];2011年
8 周学广;张焕国;;一种柔性中文字符串匹配算法[A];第二十七届中国控制会议论文集[C];2008年
9 洪露;穆志纯;;一种新的克隆混沌调节算法的研究[A];第二十六届中国控制会议论文集[C];2007年
10 王英伟;薛林福;潘保芝;;字符串匹配在测井沉积相分析中的应用[A];中国地球物理学会第二十三届年会论文集[C];2007年
中国重要报纸全文数据库 前10条
1 ;算法设计的策略[N];电脑报;2003年
2 李剑 朱延峰 吴畏;勇于挑战“最高峰”[N];新清华;2007年
3 ;IPS的春天来了[N];中国计算机报;2004年
4 杨杨;姚期智:归去来兮[N];人民日报海外版;2007年
5 PALADIN;化整为零,变繁为简[N];电脑报;2003年
6 ;突破五道“关”[N];计算机世界;2003年
7 中国消费者报 胡军;国产DC品牌面临困局[N];中国消费者报;2005年
8 覃特;上海交大的胜利,谁的隐忧?[N];中国计算机报;2005年
9 王慧芳;江苏首届大学生程序设计竞赛举行[N];中国电子报;2008年
10 陈学宏;程序设计教学中的“紧”与“松”[N];中国电脑教育报;2003年
中国博士学位论文全文数据库 前10条
1 胡扬;人工代谢算法若干问题研究[D];中南大学;2010年
2 孙贺;算法设计中的若干前沿问题[D];复旦大学;2009年
3 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年
4 黄建;入侵检测系统中字符串匹配算法与实现[D];华中科技大学;2008年
5 李奇越;网络内容分析中基于硬件的字符串匹配算法的研究[D];中国科学技术大学;2008年
6 王赞;基于染色体自交叉Memetic算法的教学调度问题研究[D];天津大学;2010年
7 尤明厚;MIMO接收机技术与编码优化研究[D];北京邮电大学;2010年
8 徐悦竹;机会发现算法及其应用研究[D];哈尔滨工程大学;2010年
9 牛云云;求解计算困难问题的膜计算模型与算法研究[D];华中科技大学;2012年
10 姜海涛;基因组比较算法研究[D];山东大学;2011年
中国硕士学位论文全文数据库 前10条
1 范洪博;高性能精确单模式串匹配算法研究[D];哈尔滨工程大学;2009年
2 黄海;字符串匹配算法通用并行加速技术研究[D];西安建筑科技大学;2010年
3 陈熠;基于代谢路径的生物网络比对算法[D];西安电子科技大学;2009年
4 何畏;快速精确字符串匹配算法研究[D];合肥工业大学;2010年
5 王丽;图论在算法设计中的应用[D];西安电子科技大学;2010年
6 熊卫卫;高校排课系统算法设计与实现[D];吉林大学;2004年
7 李海生;蜂群算法及其在垂直Web搜索中的应用[D];广州大学;2010年
8 韩孟江;集装箱配载关键问题的高效能求解算法[D];电子科技大学;2011年
9 李洪宇;基于Snort系统特殊字符串匹配算法的研究[D];哈尔滨理工大学;2005年
10 王振华;Memetic算法及其在机翼优化设计中的应用研究[D];上海交通大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026