收藏本站
《哈尔滨工程大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

快速精确字符串匹配算法研究

范洪博  
【摘要】:字符串匹配问题是在给定符号序列(称为文本)中按照一定的匹配条件,搜索给定符号序列或给定符号序列集合中元素(称为模式)出现位置的搜索问题。该问题是计算机科学的基础问题之一,被广泛的应用于各种涉及文字和符号处理的领域中,是网络安全、信息检索、计算生物学等重要领域的关键问题。随着网络安全问题凸显、海量信息检索、计算生物学高速发展,现有串匹配算法已经无法满足应用对匹配性能的需要,急需性能更高的串匹配算法出现。本文对串匹配领域中的精确单模式匹配和精确多模式匹配子领域进行研究。通过对现有算法进行改进,提出了具有更高性能的串匹配算法。 在精确单模式匹配领域,本文对Q-Hash、EBOM、TVSBS算法进行了改进,先后提出了SQ-Hash、TQ-Hash、SEBOM、BOMq、BOMq’、SufOMq、Suf_SEBOM、TVSBSq、TVSBSqA、FQ-Hash共十个(系列)算法。实验表明在精确单模式匹配领域,64.3%的匹配条件下,本文所提出的算法性能高于已知算法。 在精确多模式匹配领域,本文对AAC、Set BOM算法进行改进,先后提出了AACS、AACF、Set EBOM、Set SEBOM、Set BOMq、Set SufOMq共六个(系列)算法。本文所述算法在多数条件下,性能高于经典算法。 在时间复杂度分析领域,本文对Q-Hash系列算法进行分析,证明Q-Hash系列算法能达到精确单模式串匹配算法平均时间复杂度的下界,并基于此结论,本文证明了Wu-Manber算法在选择合适的Hash函数时,能达到多模式匹配平均时间复杂度的下界。 本文还提出了后缀匹配类研究中的一种通用方法,图例法。图例法简单清晰,可达到按后缀匹配的最大跳跃距离,并可以直接转换为算法的预处理过程,为今后后缀匹配类算法的研究提供了方便。 同时,本文还提出了与AAC自动机一致的Set DFA自动机,该自动机构建时,时间复杂度和AAC一致,但无需借助失败函数,简单易懂,操作更少,而且可以方便的人工实现,Set DFA自动机的构建时间只有AAC自动机构建时间的50%左右。
【学位授予单位】:哈尔滨工程大学
【学位级别】:博士
【学位授予年份】:2011
【分类号】:TP391.3

【参考文献】
中国期刊全文数据库 前10条
1 魏景芝;辛阳;杨义先;钮心忻;;用于检测过滤的多模式匹配[J];北京邮电大学学报;2007年06期
2 罗大光;郝玉洁;刘乃琦;;一种非常快速的字符串匹配算法[J];电子科技大学学报;2005年06期
3 宋明秋;张国权;邓贵仕;;IDS中新的快速多模式匹配算法及其设计(英文)[J];大连理工大学学报;2006年04期
4 张伟;薛一波;周宗伟;汪东升;;一种面向大规模特征集的高效特征匹配算法[J];高技术通讯;2009年06期
5 殷丽华;方滨兴;张宏莉;;快速的多模式匹配算法[J];哈尔滨工业大学学报;2007年12期
6 范洪博;姚念民;;一种高速精确单模式串匹配算法[J];计算机研究与发展;2009年08期
7 刘燕兵;刘萍;谭建龙;郭莉;;基于存储优化的多模式串匹配算法[J];计算机研究与发展;2009年10期
8 杨东红;徐恪;崔勇;;改进的Wu-Manber多模式串匹配算法[J];清华大学学报(自然科学版);2006年04期
9 贺龙涛,方滨兴,余翔湛;一种时间复杂度最优的精确串匹配算法[J];软件学报;2005年05期
10 孙钦东;黄新波;王倩;;面向中英文混合环境的多模式匹配算法[J];软件学报;2008年03期
中国博士学位论文全文数据库 前1条
1 谭建龙;串匹配算法及其在网络内容分析中的应用[D];中国科学院研究生院(计算技术研究所);2003年
中国硕士学位论文全文数据库 前6条
1 戴正华;面向体系结构的串匹配算法优化研究[D];中国科学院研究生院(计算技术研究所);2006年
2 李雪;大规模特征串匹配技术的研究[D];北京邮电大学;2008年
3 范洪博;高性能精确单模式串匹配算法研究[D];哈尔滨工程大学;2009年
4 姚保峰;模式匹配算法研究及其在IDS中的应用[D];合肥工业大学;2009年
5 邓惠俊;多模式匹配算法的研究[D];合肥工业大学;2009年
6 何畏;快速精确字符串匹配算法研究[D];合肥工业大学;2010年
【共引文献】
中国期刊全文数据库 前10条
1 叶煜;;适合中文的双向比较模式匹配算法[J];成都大学学报(自然科学版);2011年03期
2 满鹏;;海量文档信息的高效检索算法[J];长春大学学报;2008年02期
3 黄勇;平玲娣;潘雪增;陈健;;基于划分的模式匹配改进算法[J];大连海事大学学报;2008年01期
4 申晋祥;杨秋翔;;模式匹配算法的研究与改进[J];电脑开发与应用;2007年07期
5 王灿明;肖峰;;一种面向入侵检测的Wu-Manber算法研究[J];电脑知识与技术;2008年12期
6 丁浩;李跃华;;广告审查系统中绝对化词语自动审查的实现[J];电脑知识与技术;2009年28期
7 马明;;串匹配算法的简单并行实现[J];电脑知识与技术;2009年34期
8 孙钦东;郭晓军;黄新波;;基于多模式匹配的网络视频流识别与分类算法[J];电子与信息学报;2009年03期
9 ;A Parallel String Searching Algorithm for Information Filtering[J];Engineering Sciences;2007年03期
10 王瑞莹;邱亮;;一种新的应用于数据流关联分析的多模式匹配算法[J];东北电力大学学报;2012年04期
中国重要会议论文全文数据库 前8条
1 侯整风;张谷原;;一种基于中文的多模式匹配算法[A];2011中国仪器仪表与测控技术大会论文集[C];2011年
2 张文波;蒋春华;姚天昉;;基于贝叶斯及多模式串模糊匹配算法的不良短消息甄别混合模型[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 江涛;于洪志;徐涛;;互联网藏文内容安全检测过滤系统研究[A];全国计算机安全学术交流会论文集(第二十四卷)[C];2009年
4 王成江;冉兵;戴迪;吴磊;;基于滑动窗口的动态手写签名局部相关性研究[A];湖北省机械工程学会青年分会2006年年会暨第2届机械学院院长(系主任)会议论文集(下)[C];2006年
5 刘萍;刘燕兵;谭建龙;郭莉;;对多模式串匹配算法性能评测方法的探讨[A];全国网络与信息安全技术研讨会论文集(下册)[C];2007年
6 贺龙涛;隋杰;;网络内容检测中的串匹配算法实现研究[A];全国网络与信息安全技术研讨会论文集(下册)[C];2007年
7 白硕;程学旗;郭莉;王斌;余智华;刘群;;大规模内容计算[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
8 刘萍;谭建龙;;XML内容筛选中的快速串匹配算法[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 眭新光;文本信息隐藏及分析技术研究[D];解放军信息工程大学;2007年
2 张树壮;面向网络安全的高性能特征匹配技术研究[D];哈尔滨工业大学;2011年
3 金舒;入侵检测系统性能提高新技术研究[D];南京理工大学;2006年
4 王小凤;基于内容的音乐检索关键技术研究[D];西北大学;2008年
5 李奇越;网络内容分析中基于硬件的字符串匹配算法的研究[D];中国科学技术大学;2008年
6 魏景芝;超宽带无线网络若干安全问题研究[D];北京邮电大学;2008年
7 张宝军;网络入侵检测若干技术研究[D];浙江大学;2010年
8 谢红薇;应急决策知识模型及其进化推理研究[D];太原理工大学;2009年
9 李云照;高速网数据过滤若干关键技术研究[D];国防科学技术大学;2009年
10 张震;基于流量测量的高速IP业务感知技术研究[D];解放军信息工程大学;2012年
中国硕士学位论文全文数据库 前10条
1 黄飞;嵌入式Linux逆向解析技术研究[D];解放军信息工程大学;2010年
2 夏军波;基于硬件支持的高速DPI算法研究[D];解放军信息工程大学;2009年
3 陈功照;城市地理信息检索服务研究[D];福建师范大学;2010年
4 陈余超;安全日志审计系统及其快速匹配机制的研究与实现[D];浙江工商大学;2011年
5 孙东霞;嵌入式平台下的内网监视系统的研究与实现[D];电子科技大学;2011年
6 张昌运;基于Windows API的VB编程题自动评分系统的研究与实现[D];大连海事大学;2011年
7 韩玉婷;入侵防御系统的研究与关键技术的实现[D];北京邮电大学;2011年
8 厉海涛;多模式匹配算法及其在入侵检测系统中的应用研究[D];杭州电子科技大学;2011年
9 张春燕;基于自然语言处理的文本分类分析与研究[D];江西理工大学;2011年
10 罗兵;基于协作过滤的反垃圾邮件网关的设计与实现[D];电子科技大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 段富奇;网络安全分析及防范措施[J];安防科技;2003年04期
2 陈伟,汪琼;网络安全与防火墙技术[J];东莞理工学院学报;2002年01期
3 万国根;秦志光;;改进的AC-BM字符串匹配算法[J];电子科技大学学报;2006年04期
4 程志鹏;蔚雪洁;谭建明;;基于Snort的入侵检测系统的研究与实现[J];电脑开发与应用;2007年11期
5 余琨;伍孝金;;Snort体系结构的研究与分析[J];电脑知识与技术(学术交流);2007年18期
6 晏金;苗放;;入侵检测系统Snort工作原理简析[J];电脑知识与技术;2009年25期
7 韩忠秋;;基于Snort的入侵检测系统性能优化[J];计算机安全;2009年06期
8 王海峰,李生,赵铁军,刘鹏;机器翻译中模式匹配算法的研究[J];哈尔滨工业大学学报;1998年04期
9 殷丽华;方滨兴;张宏莉;;快速的多模式匹配算法[J];哈尔滨工业大学学报;2007年12期
10 巫喜红;凌捷;;单模式精确匹配算法研究[J];合肥工业大学学报(自然科学版);2007年07期
中国博士学位论文全文数据库 前1条
1 刘海峰;安全操作系统若干关键技术的研究[D];中国科学院研究生院(软件研究所);2002年
中国硕士学位论文全文数据库 前3条
1 庞剑锋;基于向量空间模型的自反馈的文本分类系统的研究与实现[D];中国科学院研究生院(计算技术研究所);2001年
2 丁方;基于策略的防火墙技术的研究与实现[D];西北工业大学;2007年
3 曹莉兰;基于防火墙技术的网络安全机制研究[D];电子科技大学;2007年
【相似文献】
中国期刊全文数据库 前10条
1 韩忠秋;刘晓洁;李涛;梁刚;龚勋;姚隽兮;;一种入侵检测系统的模式匹配算法[J];计算机应用研究;2009年08期
2 叶建伟,季振洲,胡铭曾;自动机算法在文本不精确匹配中的应用[J];计算机工程与应用;2004年06期
3 廖明涛;张德运;李金库;;基于网络处理器的高效中英文多模式匹配算法[J];计算机工程;2007年05期
4 王秀华;刘爱霞;;字符串匹配器的设计与实现[J];黑龙江纺织;2008年02期
5 江明德,菊燕;面向对象程序设计体裁嵌入FFP-AST系统[J];软件学报;1990年04期
6 王世昌;基于自动机的分析与综合因素神经网络的自动实现方法[J];计算机研究与发展;1996年09期
7 王世昌;字符串匹配的自动机方法[J];计算机应用;1996年04期
8 贺川斌,周明全,王长缨;基于像素字符串比较的图像快速匹配算法[J];微机发展;2005年01期
9 孙跃,余嘉,胡友强,莫智锋;基于元胞自动机原理的微观交通仿真模型[J];重庆大学学报(自然科学版);2005年05期
10 张克农;陆佳华;常羽飞;;入侵检测系统中高速字符串匹配协处理的实现方法[J];微电子学与计算机;2006年04期
中国重要会议论文全文数据库 前10条
1 周学广;张焕国;;一种柔性中文字符串匹配算法[A];第二十七届中国控制会议论文集[C];2008年
2 周博;孙冰;王钊;王国仁;于戈;;基于自动机的Twig路径查询技术研究[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
3 王英伟;薛林福;潘保芝;;字符串匹配在测井沉积相分析中的应用[A];中国地球物理学会第二十三届年会论文集[C];2007年
4 张鑫;程学旗;谭建龙;王映;;一种快速的多模式串匹配算法及其在实时汉语文本分类系统中的应用[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
5 孙冰;贾福林;王国仁;于戈;周博;;用自动机匹配技术解决XML数据的RPE查询问题[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
6 吴青娥;舒兰;;模糊无限状态自动机及其收敛性(英文)[A];第12届全国模糊系统与模糊数学学术年会论文集[C];2004年
7 许伟;杨正球;;基于SaaS的企业问题管理系统设计与实现[A];2010通信理论与技术新发展——第十五届全国青年通信学术会议论文集(下册)[C];2010年
8 杜艳平;陈光伟;;智能车流预测决策支持系统模型的研究[A];科技、工程与经济社会协调发展——中国科协第五届青年学术年会论文集[C];2004年
9 罗平;;元胞自动机的地理过程模拟机制及扩展应用[A];中国地理学会2004年学术年会暨海峡两岸地理学术研讨会论文摘要集[C];2004年
10 古天龙;周春晖;;实时离散事件问题的扩展自动机描述与控制[A];1997中国控制与决策学术年会论文集[C];1997年
中国重要报纸全文数据库 前10条
1 林文;“你的需要 我来创造”[N];中国包装报;2007年
2 赵吉祥;精工制造 天泽太行[N];中国包装报;2007年
3 贾昆;高级环保PP打包带是市场发展的必然[N];中国包装报;2009年
4 ;IPS的春天来了[N];中国计算机报;2004年
5 翁崇喜 陈怀林;浅谈即涂型自动覆膜机[N];中国包装报;2007年
6 王申侃 编译;“中国制造”走向品质化高档化[N];国际商报;2006年
7 记者 梁庆华 邱德生;全球70%的缝制设备产自中国[N];消费日报;2006年
8 特约记者 殷俊峰 通讯员 李景生;多渠道供应 零距离服务[N];中国人口报;2008年
9 本报记者 李爽 实习生 武爱青;首府出租行业模样一年一变[N];呼和浩特日报(汉);2007年
10 李大勇特约通讯员 谭长俊;“复杂电磁环境在哪里?”[N];解放军报;2008年
中国博士学位论文全文数据库 前10条
1 范洪博;快速精确字符串匹配算法研究[D];哈尔滨工程大学;2011年
2 黄建;入侵检测系统中字符串匹配算法与实现[D];华中科技大学;2008年
3 李奇越;网络内容分析中基于硬件的字符串匹配算法的研究[D];中国科学技术大学;2008年
4 胡圣明;基于内存自动机与模式的动态引擎构造技术研究[D];西安电子科技大学;2009年
5 张文涛;E-Service接口行为分析及其在服务组合中的应用[D];北京邮电大学;2007年
6 陈优广;边界跟踪、区域填充及链码的应用研究[D];华东师范大学;2006年
7 王湛;智能化细粒度软件抗衰策略及相关技术研究[D];南京理工大学;2007年
8 刘万伟;扩展时序逻辑的推理及符号化模型检验技术[D];国防科学技术大学;2009年
9 谢清;定制产品功能—结构映射原理、方法及关键技术研究[D];浙江大学;2007年
10 李云照;高速网数据过滤若干关键技术研究[D];国防科学技术大学;2009年
中国硕士学位论文全文数据库 前10条
1 孙根胜;火炮自动机模拟试验装置总体设计与仿真[D];南京理工大学;2004年
2 黄建才;入侵检测中高效的模式匹配算法的研究[D];河北大学;2004年
3 周子力;城市交通流智能控制及仿真研究[D];华东师范大学;2004年
4 邝华;混合车辆元胞自动机交通流模型的研究[D];广西师范大学;2004年
5 吴大艳;三车道元胞自动机交通流模型的研究[D];广西师范大学;2004年
6 邱冰;楼房内人员逃生流的自动机模拟研究[D];广西师范大学;2004年
7 肖世发;城市交通瓶颈的交通流元胞自动机模拟研究[D];广西师范大学;2004年
8 盛慧;链编码技术及区域标定自动机在图像处理中的应用[D];华东师范大学;2004年
9 王晓龙;Z规格说明中一阶逻辑算子自动求精的研究与实现[D];沈阳工业大学;2005年
10 吴静杰;下推格值自动机与模糊系统[D];陕西师范大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026