收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于聚类算法的流量识别方法研究及系统实现

苏欣  
【摘要】: 准确而快速的识别流量是确保网络安全和流量控制的基础。尤其是在如今Internet技术飞速发展,不断涌现出新型的协议及应用软件,如P2P(Peer-To-Peer)等。新业务不断增加,使得出口网络带宽利用率居高不下,甚至引起网络拥塞,对于企业或者校园网络来说尤为明显。同时,通过不安全的网络环境获得的应用程序,可能使得病毒和恶意代码入侵。本文的主要工作如下: 1.研究了应用在网络传输的各个属性,以及几种面向流量识别的聚类算法,并分析了各个属性的优势和劣势,以及面向流量识别的聚类算法的优点和存在的缺陷,为本文的研究目标确定了方向。 2.在流量识别算法设计环节,首先本文确定了以应用在进行网络连接时候的前4个数据包的长度和方向为流量识别指标;其次,以K-means算法为例,由于原始的K-means算法的初始化簇中心的选择存在缺陷,通过对这个环节的改进,并引入NMI值来对聚类效果进行验证,得到了一种改进的K-means算法,使用这个算法来对所选取的识别指标进行聚类和特征提取。 3.在聚类算法提取出特征后,针对现今网络流量的特征变化较快,而修改程序中的特征参数带来编译时间较长,降低系统性能的问题。本文提出使用XML脚本语言来对流量特征进行描述,程序通过读取特征描述文件在线匹配流量。这种方法在遇到特征变化的时候,只需修改脚本文件里面的特征参数即可。 4.基于上述3点,本文设计与实现了基于聚类算法的流量识别系统。该系统能支持多种聚类算法,并将所得到的流量特征使用XML脚本语言描述。通过加载特征描述文件来在线识别流量。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 夏士雄;李文超;周勇;张磊;牛强;;一种改进的k-means聚类算法(英文)[J];Journal of Southeast University(English Edition);2007年03期
2 戴文华;焦翠珍;何婷婷;;基于并行遗传算法的K-means聚类研究[J];计算机科学;2008年06期
3 步媛媛;关忠仁;;基于K-means聚类算法的研究[J];西南民族大学学报(自然科学版);2009年01期
4 黄志华;温步瀛;王国乾;;可间断运行的K-means聚类算法[J];计算机应用研究;2009年06期
5 许礼捷;;网络入侵检测中聚类算法的研究[J];电脑知识与技术;2009年02期
6 王桐;刘大昕;;一种新的混合XML文档聚类方法[J];哈尔滨工程大学学报;2007年06期
7 苏欣;杨建华;张大方;谢高岗;;面向流量识别系统的聚类算法的比较与分析[J];计算技术与自动化;2008年03期
8 吴夙慧;成颖;郑彦宁;潘云涛;;K-means算法研究综述[J];现代图书情报技术;2011年05期
9 宋铭利;宋振方;;基于距离排序的点对多重归约聚类算法探讨[J];矿山机械;2007年05期
10 刘敏;;K-means聚类算法在高校图书馆读者群细分中的应用研究[J];中国科教创新导刊;2010年22期
11 张维化;杨国林;;数据挖掘技术在数据抽取中的研究与应用[J];内蒙古师范大学学报(自然科学汉文版);2008年04期
12 王荇;郑成增;;聚类算法在证券公司CRM中的应用[J];常州工学院学报;2008年04期
13 杨瑞龙;朱庆生;谢洪涛;;快速混合Web文档聚类[J];计算机工程与应用;2010年22期
14 林江云;雷良桃;;聚类算法在证券公司CRM中客户细分的应用[J];心智与计算;2010年04期
15 茹蓓;赵芳;;聚类算法在图书馆中的应用[J];新乡学院学报(自然科学版);2011年01期
16 钱线;黄萱菁;吴立德;;初始化K-means的谱方法[J];自动化学报;2007年04期
17 黄美璇;;一种基于Kmax的K-means改进算法[J];佛山科学技术学院学报(自然科学版);2010年02期
18 杨照峰;樊爱宛;樊爱京;;改进的SOM和K-Means结合的入侵检测方法[J];制造业自动化;2010年15期
19 李艳霞;史一民;李冠宇;;基于概念格的K-Means算法研究[J];计算机工程与设计;2011年02期
20 李业丽;秦臻;;一种改进的k-means算法[J];北京印刷学院学报;2007年02期
中国重要会议论文全文数据库 前10条
1 梁红;李伟生;;XML文档的并行聚类算法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
2 姚俊杰;崔斌;;一种基于频繁路径特征的XML文档结构聚类算法改进实现[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
3 潘志明;郑骏;钱卫宁;周傲英;;构造XML相似相关结构库的一种有效方法[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
4 魏昕路;洪志令;姜青山;;一种基于样本缩减策略的新窗口式聚类算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
5 王守强;朱大铭;史士英;;基于输入点集求解k-Means聚类算法[A];第二十六届中国控制会议论文集[C];2007年
6 李政涛;夏树倩;王大玲;冯时;张一飞;;一种基于语义引力及密度分布的聚类算法[A];第六届全国信息检索学术会议论文集[C];2010年
7 吴继兵;李心科;;基于分治融合的混合属性数据聚类算法研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(下册)[C];2009年
8 李世峰;黄磊;刘昌平;;几种聚类方法的比较[A];第八届全国汉字识别学术会议论文集[C];2002年
9 刘洋;江志纲;丁增喜;王大玲;鲍玉斌;于戈;;一种基于图的聚类算法GB-Cluster[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
10 邓敏;刘启亮;李光强;程涛;;一种基于场模型的空间聚类算法[A];现代测量技术与地理信息系统科技创新及产业发展研讨会论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 管仁初;半监督聚类算法的研究与应用[D];吉林大学;2010年
2 万淼;基于群智能和随机索引的网络聚类算法研究[D];北京邮电大学;2011年
3 刘位龙;面向不确定性数据的聚类算法研究[D];山东师范大学;2011年
4 叶镇清;自适应聚类算法挖掘网络模块结构及其在酵母蛋白作用网络中的应用[D];浙江大学;2008年
5 张鸿雁;基于DNA计算的聚类算法研究[D];山东师范大学;2011年
6 沈洁;基于自动机的XML数据过滤研究[D];哈尔滨工程大学;2010年
7 叶晓峰;基于XML的冲压模具设计知识重用技术研究[D];华中科技大学;2010年
8 曲建华;基于群体智能的聚类分析[D];山东师范大学;2010年
9 殷丽凤;不完全信息环境下XML数据库规范化问题的研究[D];哈尔滨理工大学;2009年
10 张晨静;XML关键字过滤技术[D];复旦大学;2011年
中国硕士学位论文全文数据库 前10条
1 苏欣;基于聚类算法的流量识别方法研究及系统实现[D];湖南大学;2008年
2 谭颖;文本挖掘中的聚类算法研究[D];吉林大学;2009年
3 卜德云;自适应谱聚类算法的研究与应用[D];南京航空航天大学;2010年
4 石洪竺;量子进化聚类算法研究[D];西安电子科技大学;2010年
5 温程;并行聚类算法在MapReduce上的实现[D];浙江大学;2011年
6 张珠玉;聚类算法及其在日志数据处理中的应用研究[D];山东师范大学;2011年
7 叶冲轶;高维海量数据联合聚类算法的研究与应用[D];浙江工商大学;2010年
8 崔月婷;基于分类算法与聚类算法流量识别系统的研究[D];北京邮电大学;2010年
9 姚毓凯;一种有效的自适应网格密度聚类算法研究[D];兰州大学;2011年
10 王帆;基于优化目标可调控的免疫聚类算法的研究[D];太原理工大学;2010年
中国重要报纸全文数据库 前10条
1 秦林;《XML完全探索》[N];中华读书报;2001年
2 本报记者 李瀛寰;XML推了网络一把[N];中国计算机报;2000年
3 ;分化并不能阻止XML发展[N];中国计算机报;2000年
4 ;为XML标准定标准[N];中国计算机报;2001年
5 IDG电讯;Microsoft、IBM共同制定XML标准[N];计算机世界;2000年
6 北京邮电大学 张剑;XML与HTML的结合(上)[N];计算机世界;2001年
7 本报记者 陆 杰;XML丛林的新秀[N];中华读书报;2002年
8 侯青;国际电子商务XML/EDI特点及现状[N];国际商报;2001年
9 北京邮电大学 张剑;XML技术预览[N];计算机世界;2001年
10 北京邮电大学 张剑;XML与HTML的结合(下)[N];计算机世界;2001年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978