一种面向移动互联网的业务识别方法研究
【摘要】:随着移动互联网业务的蓬勃发展,业务种类不断丰富,移动网络运营商既要支撑本公司提供的各种IP业务,还要为用户自由使用的种类繁多的IP业务提供承载功能。
本论文首先介绍了深度包检测技术的原理,阐明了DPI技术的优势和弊端,并介绍了典型的业务识别方法,包括基于特征字的检测技术,应用层网关识别技术和行为模式识别技术。基于特征字的检测技术就是通过对网络中数据流负载部分的特征信息进行模式匹配,从而识别出网络数据流量的特征字。应用层网关技术首先识别出网络业务的控制流,然后根据控制流的协议内容中解析出业务流的相关信息,再对业务流进行解析,从而识别出业务流。行为模式识别技术适用于无法根据协议判断的业务。这三类识别技术适用的协议类型不同,也不可相互替代,若想有效准确地识别网络上的各种应用,必须要综合运用这三大技术。
本论文主要分析了CMNET承载的移动互联网业务的网络特征和业务特征,研究了重点业务的识别方法,包括飞信、彩信、WAP、移动QQ、BT下载,分析了这几种业务的协议解析方法,通过对各类业务的协议分析及数据包解码分析,对几类业务的协议特征及识别方法做出了详细的阐述,给出了详细的业务识别方法。提出了适用于以上几种业务的业务识别方法,即关联流分析法和打孔式特征串概率匹配法。深入研究了典型业务的特征,实现对WAP浏览、彩信、飞信和移动QQ等移动特色业务的识别,实现对代表性的P2P业务即BT下载业务的识别。
关联流分析法的基本思想是基于流完成业务识别,适用于TCP业务。将提取的数据包按五元组分类,每一类就是一个数据流,称为关联流。如果能够准确识别出一个关联流中的任意一个数据包的业务类型,则完成流识别。
打孔式特征串匹配算法的思想是在整个IP包数据的几个固定位置取得字段并与固定特征字符串匹配识别,是针对具有在固定位置出现固定特征字符串的协议采用的一种区别于逐字搜索的识别方法。
本论文提出了高效的关联流识别和打孔式特征匹配相结合的识别方法。即先按照TCP关联将数据包分类,利用打孔式特征串匹配算法或者逐比特匹配的方法从中找到有业务特征的数据包,然后将该关联下的所有数据包归为一类业务。
这两种方法具有识别效率高、准确性高、容易实现等特点。基于提出的业务识别的方法和算法,编写了业务识别软件,DPI软件。应用该软件对现网的混合业务数据包做深度业务识别。识别结果证明,所提出的关联流分析法和打孔式特征串概率匹配法简单高效,识别准确度较高。