收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

快速精确字符串匹配算法研究

何畏  
【摘要】: 字符串匹配算法是计算机应用、信息检索及计算生物学等的重要研究内容,在日常生活及科学研究中有着广阔的应用。随着计算机技术和网络技术的发展,新的应用对匹配实时性的要求不断提高。本文在对精确字符串匹配问题的研究与现状及其各种方法进行深入探讨的基础上,针对单模式精确字符串匹配及多模式字符串匹配中,被广泛使用的BM和WM两种算法进行深入系统的研究,并提出相应的改进算法并通过实验验证了新算法的优越性。全文主要内容如下: 1.分析了字符串匹配算法的国内外研究现状,详细讨论了精确字符串匹配下的三种搜索方式,研究并实现了单模式字符串匹配及多模式字符串匹配下的若干典型算法,包括Shift-And及Shift-Or算法、Horspool算法、BNDM及BOM算法、AC算法、WM算法、SBOM算法。 2.传统的BM算法在不匹配发生时,匹配窗口移动的最大距离较小并且匹配窗口能够移动的最大安全距离也不够大。因此,字符串匹配速度仍有提升空间。针对这种情况,本文提出了一种新的可以增加平均移动距离的改进的BM算法。该算法首先在预处理阶段使用任意的两个字符作为字符块来计算移动距离,并设置最大移动距离为模式串长度加一;然后在查找阶段通过比较连续的两个字符块来增加大距离移动的概率。实验结果表明该算法相比于原算法在速度性能上提高明显。 3.传统的WM算法在发生不匹配时安全移动距离明显较小,而当与模式串匹配后的移动距离又较保守,并且存在单次匹配而整个模式串不匹配的概率较大的情况。针对这些问题,本文提出了一种新的改进的WM算法,该算法首先对SHIFT表进行改进,使得安全移动的距离有了较为明显的提高;其次改进搜索查找算法,通过增加比较字符块使得单次匹配而整个模式串不匹配的概率下降并使与模式串匹配后的移动距离不再为1。实验表明,本算法较原算法在匹配速度上具有较好的实验效果。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 廖明涛;张德运;李金库;;基于网络处理器的高效中英文多模式匹配算法[J];计算机工程;2007年05期
2 王秀华;刘爱霞;;字符串匹配器的设计与实现[J];黑龙江纺织;2008年02期
3 莫德敏;刘耀军;;Wu-Manber算法的一种综合改进[J];太原师范学院学报(自然科学版);2008年02期
4 贺川斌,周明全,王长缨;基于像素字符串比较的图像快速匹配算法[J];微机发展;2005年01期
5 张克农;陆佳华;常羽飞;;入侵检测系统中高速字符串匹配协处理的实现方法[J];微电子学与计算机;2006年04期
6 万晓榆;杨波;樊自甫;;改进的Sunday模式匹配算法[J];计算机工程;2009年07期
7 何宁,谢磊,郭明,王树青;基于独立成分的动态多变量过程的故障检测与诊断方法[J];化工学报;2005年04期
8 刘伟;;高速网络下的字符串匹配技术[J];知识经济;2009年05期
9 杨毅夫;刘燕兵;刘萍;郭牧怡;郭莉;;正则表达式的DFA压缩算法[J];通信学报;2009年S1期
10 万国根;秦志光;;改进的AC-BM字符串匹配算法[J];电子科技大学学报;2006年04期
11 姚小威;黄建;唐兴旺;;一种高性能的字符串匹配硬件实现法[J];微电子学与计算机;2006年07期
12 杨昆;秦拯;;一种报文二层预处理策略在高速NIDS上的应用[J];东莞理工学院学报;2009年03期
13 林小兰;王晓光;王晖;;基于内容的音乐检索关键技术研究[J];中国传媒大学学报(自然科学版);2010年04期
14 屈玉贵;李奇越;赵保华;刘桂英;;基于ABNF的高速硬件解码方法的研究[J];电子学报;2006年09期
15 殷丽华;方滨兴;张宏莉;;快速的多模式匹配算法[J];哈尔滨工业大学学报;2007年12期
16 冯安;;基于Bloom Filter的硬件字符串匹配设计与验证[J];电子科技;2009年12期
17 佟欣;韩玉琢;;房产自动应答系统的分析与设计[J];赤峰学院学报(自然科学版);2010年01期
18 林建秋,杨书华,孙建东;一种针对网络流式文本数据的匹配算法[J];齐齐哈尔大学学报;2005年02期
19 赖兴邦;;宋词字-音转换中多音字处理研究[J];福建电脑;2008年05期
20 杨家蓉;;基于特征字符串匹配的P2P流量控制[J];中国新技术新产品;2009年14期
中国重要会议论文全文数据库 前10条
1 周学广;张焕国;;一种柔性中文字符串匹配算法[A];第二十七届中国控制会议论文集[C];2008年
2 王英伟;薛林福;潘保芝;;字符串匹配在测井沉积相分析中的应用[A];中国地球物理学会第二十三届年会论文集[C];2007年
3 张鑫;程学旗;谭建龙;王映;;一种快速的多模式串匹配算法及其在实时汉语文本分类系统中的应用[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
4 王艳秋;兰巨龙;;基于Wu-Manber的快速跳跃多模式匹配算法[A];第四届中国软件工程大会论文集[C];2007年
5 运正佳;李轶男;杨晓春;;支持带有通配符的字符串匹配算法[A];NDBC2010第27届中国数据库学术会议论文集A辑二[C];2010年
6 任晓峰;董占球;;IDS中Snort的研究与改进[A];第十八次全国计算机安全学术交流会论文集[C];2003年
7 王德正;;网络入侵检测系统中模式匹配算法的研究与改进[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
8 王小凤;周明全;耿国华;郭红波;;一种基于字符距离的特征字符串近似匹配算法[A];图像图形技术与应用进展——第三届图像图形技术与应用学术会议论文集[C];2008年
9 曾宇;刘朝晖;云晓春;孙凝晖;;一种可重构智能网卡的设计及实现[A];全国网络与信息安全技术研讨会论文集(下册)[C];2007年
10 江涛;于洪志;徐涛;;互联网藏文内容安全检测过滤系统研究[A];全国计算机安全学术交流会论文集(第二十四卷)[C];2009年
中国博士学位论文全文数据库 前10条
1 范洪博;快速精确字符串匹配算法研究[D];哈尔滨工程大学;2011年
2 黄建;入侵检测系统中字符串匹配算法与实现[D];华中科技大学;2008年
3 李奇越;网络内容分析中基于硬件的字符串匹配算法的研究[D];中国科学技术大学;2008年
4 张树壮;面向网络安全的高性能特征匹配技术研究[D];哈尔滨工业大学;2011年
5 熊正大;链式几何结构的拟人型优化方法[D];华中科技大学;2011年
6 李云照;高速网数据过滤若干关键技术研究[D];国防科学技术大学;2009年
7 胡昌慧;车载自组网络安全协议和安全字符串匹配协议研究[D];山东大学;2012年
8 黄昆;高性能内容过滤与分发技术研究[D];湖南大学;2009年
9 万国根;面向内容的网络安全监控模型及其关键技术研究[D];电子科技大学;2005年
10 屠晓;英文地址图像识别与翻译研究[D];华东师范大学;2011年
中国硕士学位论文全文数据库 前10条
1 何畏;快速精确字符串匹配算法研究[D];合肥工业大学;2010年
2 黄海;字符串匹配算法通用并行加速技术研究[D];西安建筑科技大学;2010年
3 李洪宇;基于Snort系统特殊字符串匹配算法的研究[D];哈尔滨理工大学;2005年
4 张娜;内容过滤防火墙的设计与实现[D];合肥工业大学;2006年
5 万晓桐;出版物审读系统的设计与实现[D];电子科技大学;2010年
6 彭江锋;基于CPU+GPU异构平台的字符串匹配算法研究与实现[D];华南理工大学;2011年
7 谷赫;时间序列的数据挖掘在证券预测分析中的应用研究[D];吉林大学;2005年
8 王洪波;基于马尔科夫链的算法复杂度分析[D];大连理工大学;2007年
9 孙德才;相似字符串匹配过滤算法研究[D];湖南大学;2009年
10 刘燕兵;串匹配算法优化技术研究[D];中国科学院研究生院(计算技术研究所);2006年
中国重要报纸全文数据库 前7条
1 ;IPS的春天来了[N];中国计算机报;2004年
2 宁夏 刘君;SQL Server中全文检索的使用[N];电脑报;2001年
3 陈长松;IDS重在应用[N];中国计算机报;2002年
4 宁夏数据通信局 刘君;SQL Server 2000中全文检索的使用[N];计算机世界;2002年
5 湖南 张学峰;Mail2G操作技巧点滴[N];电脑报;2001年
6 拔刀斋;不到两公斤的轻薄本本[N];中国计算机报;2004年
7 本报记者 陈芳丹;抵御软件漏洞攻击可用网络IPS[N];计算机世界;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978