收藏本站
《湖南大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

面向深度包检测的存储高效的正则表达式匹配算法研究

金军航  
【摘要】: 随着网络及其应用的迅猛发展,网络安全已变得越来越重要。网络入侵检测和防御系统是网络安全防御的主要手段,即通过实时监测网络流量,检查和阻止网络攻击。而深度包检测,(DPI, Deep Packet Inspection)是网络入侵检测和防御系统的核心,它定义了一组特征规则集,不仅检查数据包头,也检查数据包的有效荷载。由于正则表达式具有灵活、高效等特点,目前已广泛用于表示特征规则集。传统的正则表达式匹配算法实现方式主要基于非确定有限自动机(NFA,Nondeterministic Finite Automaton)和确定有限自动机(DFA, Deterministic Finite Automaton)。 正则表达式匹配算法面临高性能挑战。一方面,为了达到数据包线速匹配,研究者利用现代嵌入式存储器,提出了面向硬件实现的正则表达式匹配算法。另一方面,基于硬件的正则表达式匹配算法实现存在嵌入式片上存储空间受限的问题,难以适应日益增大的特征规则集。因此,设计一种快速且存储高效的正则表达式匹配算法是高性能深度包检测的关键。 本文详细阐述了正则表达式匹配算法的研究现状,分析了传统正则表达式匹配算法NFA和DFA无法满足高性能需求的原因,并研究了现有一些存储高效的正则表达式匹配算法的特点。针对目前缺乏相关工作对已有正则表达式匹配算法进行综合性能评估的问题,本文采用C++实现了DFA、mDFA、D2FA、CD2FA和XFA等算法,建立了一个正则表达式匹配算法的性能评估平台。同时,采用Snort的规则集综合评估了这些算法的存储空间、匹配效率以及可伸缩性。评估实验结果显示XFA是最好的存储空间和匹配效率的折衷算法。在正则表达式匹配算法评估工作基础上,本文提出了一种基于字母表压缩的扩展有限自动机(ACFA, Alphabet-Compressed-Based Extend Finite Automaton),即采用启发式策略合理划分XFA的状态集合,对所划分的各个状态集分别建立一张字母压缩表,并利用这些字母压缩表压缩XFA的迁移表,进一步减少了XFA的存储空间。实验结果显示ACFA是一种快速且存储高效的正则表达式匹配算法。
【关键词】:深度包检测 确定有限自动机 扩展有限自动机 性能评估 字母表压缩
【学位授予单位】:湖南大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP393.08
【目录】:
  • 摘要5-6
  • Abstract6-10
  • 插图索引10-12
  • 附表索引12-13
  • 第1章 绪论13-17
  • 1.1 研究背景和意义13
  • 1.2 研究现状13-16
  • 1.3 本文的主要内容和安排16-17
  • 第2章 正则表达式匹配算法概述17-26
  • 2.1 正则表达式相关定义17-18
  • 2.2 传统正则表达式匹配算法18-22
  • 2.2.1 基于NFA的正则表达式匹配算法18-20
  • 2.2.2 基于DFA的正则表达式匹配算法20-22
  • 2.3 高性能正则表达式匹配算法22-25
  • 2.3.1 分组DFA22
  • 2.3.2 输入延迟DFA22-23
  • 2.3.3 扩展有限自动机23-25
  • 2.4 小结25-26
  • 第3章 高性能正则表达式匹配算法实现和评估26-50
  • 3.1 扩展有限自动机实现26-40
  • 3.1.1 基本数据结构设计26-28
  • 3.1.2 构造算法实现28-40
  • 3.1.3 匹配算法实现40
  • 3.2 分组DFA实现40-43
  • 3.2.1 构造算法实现41-42
  • 3.2.2 匹配算法实现42-43
  • 3.3 实验评估43-48
  • 3.3.1 实验方法43-44
  • 3.3.2 实验结果44-48
  • 3.4 小结48-50
  • 第4章 基于字母表压缩的扩展有限自动机50-60
  • 4.1 动机50
  • 4.2 基于字母表压缩的扩展有限自动机50-55
  • 4.2.1 算法思想50-51
  • 4.2.2 构造算法51-54
  • 4.2.3 匹配算法54-55
  • 4.3 实验评估55-59
  • 4.3.1 实验方法55-56
  • 4.3.2 实验结果56-59
  • 4.4 小结59-60
  • 结论60-62
  • 参考文献62-66
  • 致谢66-67
  • 附录A 攻读硕士学位期间所发表的学术论文目录67-68
  • 附录B 攻读硕士学位期间所参加的科研活动68

【引证文献】
中国硕士学位论文全文数据库 前1条
1 田健;IDS中VLDC模式匹配算法的研究与应用[D];吉林大学;2011年
【参考文献】
中国期刊全文数据库 前3条
1 贺龙涛,方滨兴,余翔湛;一种时间复杂度最优的精确串匹配算法[J];软件学报;2005年05期
2 李伟男;鄂跃鹏;葛敬国;钱华林;;多模式匹配算法及硬件实现[J];软件学报;2006年12期
3 徐乾;鄂跃鹏;葛敬国;钱华林;;深度包检测中一种高效的正则表达式压缩算法[J];软件学报;2009年08期
【共引文献】
中国期刊全文数据库 前10条
1 叶煜;;适合中文的双向比较模式匹配算法[J];成都大学学报(自然科学版);2011年03期
2 张阳;张海;;一种系统测试中的快速多协议匹配算法[J];电光与控制;2010年07期
3 姚振军;黄德根;纪翔宇;;正则表达式在汉英对照中国文化术语抽取中应用[J];大连理工大学学报;2010年02期
4 申晋祥;杨秋翔;;模式匹配算法的研究与改进[J];电脑开发与应用;2007年07期
5 韩光辉;曾诚;;正则表达式方程组的最小解[J];电脑与信息技术;2011年05期
6 肖武德;;一种正则表达式的高效分组算法[J];计算机安全;2010年04期
7 刘威;郭渊博;黄鹏;;基于Bloom filter的多模式匹配引擎[J];电子学报;2010年05期
8 ;A Parallel String Searching Algorithm for Information Filtering[J];Engineering Sciences;2007年03期
9 张速;王锐利;;Hash函数对WM算法性能的影响[J];华北水利水电学院学报;2011年03期
10 李万新;;基于Windows日志分析的网络入侵取证系统的研究[J];黑龙江科技信息;2008年16期
中国重要会议论文全文数据库 前6条
1 韦兴军;卢泽新;;基于TCAM的入侵检测系统硬件加速技术[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(上册)[C];2008年
2 张光斌;谢维盛;吴鸿伟;;基于CUDA的多模式匹配技术[A];第26次全国计算机安全学术交流会论文集[C];2011年
3 王成江;冉兵;戴迪;吴磊;;基于滑动窗口的动态手写签名局部相关性研究[A];湖北省机械工程学会青年分会2006年年会暨第2届机械学院院长(系主任)会议论文集(下)[C];2006年
4 张莹莹;段翔;周彬;王晓云;;移动通信网络中的内容安全[A];2007年中国通信学会“移动增值业务与应用”学术年会论文集[C];2007年
5 刘萍;刘燕兵;谭建龙;郭莉;;对多模式串匹配算法性能评测方法的探讨[A];全国网络与信息安全技术研讨会论文集(下册)[C];2007年
6 贺龙涛;隋杰;;网络内容检测中的串匹配算法实现研究[A];全国网络与信息安全技术研讨会论文集(下册)[C];2007年
中国博士学位论文全文数据库 前10条
1 许宪成;基于网络处理器的入侵检测系统设计与性能优化研究[D];华南理工大学;2010年
2 眭新光;文本信息隐藏及分析技术研究[D];解放军信息工程大学;2007年
3 张树壮;面向网络安全的高性能特征匹配技术研究[D];哈尔滨工业大学;2011年
4 金舒;入侵检测系统性能提高新技术研究[D];南京理工大学;2006年
5 陈一骄;网络入侵检测系统高速处理技术研究[D];国防科学技术大学;2007年
6 黄建;入侵检测系统中字符串匹配算法与实现[D];华中科技大学;2008年
7 邵晶波;SoC测试资源优化方法研究[D];哈尔滨工程大学;2008年
8 谢红薇;应急决策知识模型及其进化推理研究[D];太原理工大学;2009年
9 姚振军;基于双语领域本体的典籍英译批评研究[D];大连理工大学;2010年
10 王洁;基于FPGA的硬件防火墙内容过滤技术研究[D];哈尔滨工业大学;2009年
中国硕士学位论文全文数据库 前10条
1 黄飞;嵌入式Linux逆向解析技术研究[D];解放军信息工程大学;2010年
2 于强;高效存储的深度包检测算法[D];西安电子科技大学;2009年
3 段海生;基于正则表达式的深度包压缩算法研究[D];西安电子科技大学;2010年
4 张辉;面向网络流识别的正则表达式匹配技术研究[D];首都师范大学;2011年
5 韩玉婷;入侵防御系统的研究与关键技术的实现[D];北京邮电大学;2011年
6 厉海涛;多模式匹配算法及其在入侵检测系统中的应用研究[D];杭州电子科技大学;2011年
7 潘鹏;基于片上网络多核处理器的软件优化和硬件加速设计[D];南京大学;2011年
8 崔保良;基于稀疏表示的协同入侵检测[D];广东工业大学;2011年
9 张奇;基于UCON访问控制模型的信息安全监控系统的研究[D];南京航空航天大学;2010年
10 吕东伟;入侵检测匹配过程与算法改进研究[D];河南科技大学;2009年
【同被引文献】
中国期刊全文数据库 前10条
1 杨文;入侵检测系统的现状及发展趋势[J];电脑知识与技术;2005年18期
2 闵孝忠,郑成增,查志琴;Snort的Windows接口的设计和实现[J];福建电脑;2004年05期
3 恽俊;唐屹;;Snort系统的动态配置研究[J];广州大学学报(自然科学版);2007年01期
4 张悦连,郭文东;Snort规则及规则处理模块分析[J];河北科技大学学报;2003年04期
5 王杰;王同军;孙珂珂;;提高Snort规则匹配速度的新方法[J];计算机工程与应用;2009年28期
6 杨武,方滨兴,云晓春,张宏莉;入侵检测系统中高效模式匹配算法的研究[J];计算机工程;2004年13期
7 刘鹏;姚远;邰铭;张铮;;一种高效匹配PCRE的扩展自动机[J];计算机工程;2010年12期
8 张树壮;罗浩;方滨兴;云晓春;;一种面向网络安全检测的高性能正则表达式匹配算法[J];计算机学报;2010年10期
9 丁晶;陈晓岚;吴萍;;基于正则表达式的深度包检测算法[J];计算机应用;2007年09期
10 黄昆;张大方;谢高岗;金军航;;一种面向深度数据包检测的紧凑型正则表达式匹配算法[J];中国科学:信息科学;2010年02期
中国硕士学位论文全文数据库 前9条
1 赵月爱;高速网络入侵检测负载均衡算法研究[D];太原理工大学;2006年
2 张娜;基于正则表达式的深度包检测研究[D];华东师范大学;2007年
3 张庆平;一种基于snort的入侵检测系统的实现和应用[D];吉林大学;2008年
4 刘胤;深度包检测技术的研究与设计[D];贵州大学;2008年
5 李树政;基于Snort系统快速模式匹配算法的研究[D];吉林大学;2009年
6 齐慧玲;模式匹配算法的研究及其在Snort系统中的应用[D];西南交通大学;2010年
7 王喜聪;入侵检测系统snort下的模式匹配算法研究[D];太原理工大学;2010年
8 张伟;基于Snort的入侵检测系统的设计和实现[D];北京邮电大学;2010年
9 张洁坤;时空高效的正则表达式匹配算法研究[D];湖南大学;2010年
【二级参考文献】
中国期刊全文数据库 前3条
1 王永成,沈州,许一震;改进的多模式匹配算法[J];计算机研究与发展;2002年01期
2 李伟男;鄂跃鹏;葛敬国;钱华林;;多模式匹配算法及硬件实现[J];软件学报;2006年12期
3 王永成,陈桂林,韩客松;一种快速单模式准确匹配算法[J];上海交通大学学报;2001年02期
【相似文献】
中国期刊全文数据库 前10条
1 李惠;贝佳;翟磊;孙元浩;龚震宇;潘金贵;;分布式虚拟环境中的定位服务[J];计算机科学;2004年09期
2 贺川斌,周明全,王长缨;基于像素字符串比较的图像快速匹配算法[J];微机发展;2005年01期
3 马惟哲,张燕华;一种基于曲率匹配的抛物面回归算法的研究[J];计算机应用与软件;2005年06期
4 卢达,陈琦玮,谢铭培;基于模糊规则和相似测量的手写汉字预分类法[J];计算机工程与应用;2005年25期
5 江杰;胡晓莉;李杰;;一种新的指纹细节点匹配算法的研究[J];计算机应用;2005年S1期
6 刘壮;张娟娟;郭荷清;;Web Services发现和集成句法匹配算法研究[J];计算机工程与应用;2006年20期
7 徐罡;马建刚;黄涛;;一种基于OBDD图的事件复合匹配方法[J];计算机研究与发展;2006年10期
8 杨永健;孙永雄;李树秋;张伟;;网格计算中一种负载均衡聚类匹配迁移算法[J];微电子学与计算机;2006年10期
9 戴芳;张学;徐大华;;曲线识别的变形匹配法的实现[J];科学技术与工程;2007年03期
10 苏俊宏;朱日宏;陈磊;何勇;李建欣;;基于样本匹配的干涉图延拓技术研究[J];红外与激光工程;2007年01期
中国重要会议论文全文数据库 前10条
1 李瑜;郭俊波;虎嵩林;;一种基于发布订阅模型的博客搜索系统[A];2009年全国开放式分布与并行计算机学术会议论文集(下册)[C];2009年
2 王新龙;申功勋;;机载捷联子惯导系统快速传递对准匹配方法研究[A];中国惯性技术学会第五届学术年会论文集[C];2003年
3 应捷;袁一方;张仁杰;;一种新的实时指纹特征点匹配算法[A];第七届青年学术会议论文集[C];2005年
4 何芳芳;孙继银;孙向东;郭文普;孙振;;基于模糊集的神经网络景象匹配算法[A];中国系统仿真学会第五次全国会员代表大会暨2006年全国学术年会论文集[C];2006年
5 潘景昌;程马勇;阎峥;黄垚;黄晓选;;相似度可调的匹配算法的分析与设计[A];2005年全国理论计算机科学学术年会论文集[C];2005年
6 王翠茹;高丽鲜;;发布订阅系统中匹配算法的研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
7 李文清;张常有;段淑凤;;一种分布式Web服务内容的匹配方法研究[A];2010年全国开放式分布与并行计算机学术会议论文集[C];2010年
8 卢达;浦炜;谢铭培;;基于SEART网和模糊相似测量的手写汉字预分类法[A];2005年全国自动化新技术学术交流会论文集[C];2005年
9 卢达;浦炜;谢铭培;;基于SEART网和模糊相似测量的手写汉字预分类法[A];2005全国自动化新技术学术交流会论文集(二)[C];2005年
10 秦军;岑敏仪;张同刚;邓芳;;遥感图像中泥石流松散固体物质四维信息的分析与应用研究[A];2006年铁道勘测技术学术会议论文集[C];2006年
中国重要报纸全文数据库 前10条
1 东南大学计算机科学与工程学院 万维网科学研究所 胡伟瞿裕忠;本体匹配:搭桥异构本体[N];计算机世界;2007年
2 彭福祥 张钧;ASP.NET基本数值处理技巧[N];计算机世界;2006年
3 田捷 陈新建 杨鑫;指纹识别算法仍有优化空间[N];计算机世界;2006年
4 义川;Web 3.0更有前途?[N];网络世界;2006年
5 ;在论坛中自动显示超链接[N];计算机世界;2006年
6 义川;Google沉浮[N];网络世界;2006年
7 王洁;中国雅虎推出“一页到位”搜索平台[N];科技日报;2007年
8 赵正;推介业务暂停 广告联盟继续[N];中国经营报;2008年
9 清水编译;Apache 2.2.0带来了什么?[N];计算机世界;2006年
10 左琦;浅谈指纹识别技术[N];新乡日报;2005年
中国博士学位论文全文数据库 前10条
1 王文晶;基于重力和环境特征的水下导航定位方法研究[D];哈尔滨工程大学;2009年
2 梁莹;INS/地磁匹配组合导航系统技术研究[D];哈尔滨工程大学;2010年
3 俞一彪;基于互信息理论的说话人识别研究[D];上海大学;2004年
4 池凌鸿;立体匹配算法的研究和应用[D];中国科学技术大学;2011年
5 钟平;机载电子稳像技术研究[D];中国科学院研究生院(长春光学精密机械与物理研究所);2004年
6 周石林;非规则碎片匹配关键技术的研究及实现[D];南京航空航天大学;2005年
7 张勤拓;机载导弹SINS动基座传递对准技术研究[D];哈尔滨工程大学;2010年
8 张树壮;面向网络安全的高性能特征匹配技术研究[D];哈尔滨工业大学;2011年
9 张颖星;面向复杂系统应用的并行离散事件仿真性能优化技术研究[D];国防科学技术大学;2011年
10 刘而云;指纹加密域匹配算法研究[D];西安电子科技大学;2011年
中国硕士学位论文全文数据库 前10条
1 张洁坤;时空高效的正则表达式匹配算法研究[D];湖南大学;2010年
2 金军航;面向深度包检测的存储高效的正则表达式匹配算法研究[D];湖南大学;2010年
3 李飚;自动指纹识别系统中匹配算法研究与应用[D];湖北工业大学;2011年
4 任俊杰;快速星像匹配算法的比较[D];暨南大学;2010年
5 谢睿;指纹识别系统中图像质量评估与匹配算法的研究及实现[D];电子科技大学;2011年
6 李云飞;双目立体视觉中的稠密匹配算法研究[D];浙江大学;2011年
7 刘鹏;面向存储的正则表达式匹配算法研究[D];解放军信息工程大学;2010年
8 邓如军;自动指纹识别匹配算法研究[D];大连理工大学;2010年
9 王剑;多特征融合的手掌静脉匹配算法研究[D];河南科技大学;2009年
10 刘英杰;基于动态规划和置信传播的立体匹配算法的研究[D];燕山大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026