收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于机器学习的P2P流量识别

祝好  
【摘要】: 近年来飞速发展的P2P业务在推动INTERNET发展的同时也带来了许多问题。(1)带宽问题:P2P业务不断增加,造成了网络带宽的巨大消耗,甚至引起网络拥塞,使网络性能降低,服务质量下降;(2)版权问题:在网络时代,数字内容很容易被复制与传输,尤其P2P共享软件的繁荣加速了盗版媒体的分发,增加了知识产权保护的难度;(3)网络安全问题:P2P网络中每个节点都是独立的,系统对于节点的约束就变的很小。在没有控制中心的系统中,没有人知道其他结点共享的是什么,这就为病毒和不良消息的传播提供了条件。随着INTERNET重要性的日益提高和网络结构的日益复杂,网络的安全性,可管理性及传统应用的可用性受到了挑战,人们明显越来越意识到有必要对P2P流量和网络行为深入了解,分析,为监控与管理P2P提供技术支持,因此,实现P2P流量的有效识别已经成为急需解决的问题,如何进一步有效的识别出P2P业务成为课题研究的热点。 论文课题来源于国家自然科学基金(No.60672025)资助项目的研究任务之一,在课题研究过程中,作者做了以下工作: 1.文章从P2P流量识别的工作原理入手,总结了现有P2P流量识别技术,包括基于端口识别,基于应用层签名的识别,基于传输层特征的识别三大类,分析他们的利弊,提出将数据挖掘技术应用在P2P的流量识别,并且将P2P流量识别概念深入到具体单个P2P业务识别。 2.根据P2P网络的网络节点对等基本特点,结合机器学习中聚类与分类的算法,选取上行流量与下行流量的比值作为最主要的特征值,通过采集大量的数据建立训练集和测试集,设计出能够实时识别P2P业务的模块和系统,整个系统包括学习和识别两个阶段。 3.编码实现系统,通过测试系统识别P2P业务的准确率和CPU占有率证明了该方法具有较高的准确度和较低的复杂度。 论文共分为六章。第一章介绍了P2P的概念,数据挖掘技术的发展以及P2P的现状并且提出了课题研究的方向。第二章介绍了P2P与C/S模式的关系以及由此引出的P2P业务识别的相关原理和方法,分析了P2P业务识别技术的发展趋势。第三章阐述了数据挖掘和机器学习的原理以及步骤。第四章介绍了如何利用机器学习的方法进行P2P业务的识别,并对流量数据进行了提取和分析,给出了具体的步骤建立了相关模型。第五章实现了P2P业务识别系统软件的看法并进行了测试,描述了测试条件和环境,得出了基于机器学习方法识别P2P业务的准确率和CPU占有率。第六章对全文进行总结,对今后的工作做出了展望。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 贾纳豫;试论数据挖掘与机器学习、统计学、数据库的关系[J];玉溪师范高等专科学校学报;2000年04期
2 王涛;;遗传算法及其应用[J];新乡学院学报(自然科学版);2008年01期
3 周志华;;通过集成学习进行知识获取[J];重庆邮电大学学报(自然科学版);2008年03期
4 马世欢;张今;;一种基于遗传算法的优化分类器方法[J];襄樊职业技术学院学报;2008年06期
5 许孝元;韩国强;闵华清;;多步原子规则的大规模关联分类[J];控制理论与应用;2007年03期
6 邓甦;付长贺;;四种贝叶斯分类器及其比较[J];沈阳师范大学学报(自然科学版);2008年01期
7 郭萌;王珏;;数据挖掘与数据库知识发现:综述[J];模式识别与人工智能;1998年03期
8 朱明;王俊普;;一种聚类学习的新方法[J];模式识别与人工智能;2000年03期
9 徐从富;陈峰;范晶;;人工智能若干前沿技术及其在信息对抗中的应用展望[J];通信对抗;2007年03期
10 王强;沈永平;陈英武;;支持向量机规则提取[J];国防科技大学学报;2006年02期
11 李思广;周雪梅;;基于机器学习的入侵检测系统[J];硅谷;2008年08期
12 亢俊健;杜在林;张新东;朱群英;;使用信息增益方法选择分类器[J];计算机工程与应用;2009年14期
13 李文斌;陈嶷瑛;张娟;张新东;;使用Fisher线性判别方法的提取分类器[J];计算机工程与应用;2010年14期
14 乐毅,郑诚;入侵检测系统自适应的研究[J];微机发展;2003年06期
15 赵斌,戴英侠;基于Unix系统调用的数据挖掘算法[J];计算机工程;2004年03期
16 王斌;;从信息检索到搜索引擎[J];术语标准化与信息技术;2009年04期
17 汤亚玲,崔志明;遗传算法在Web关联挖掘中的应用研究[J];微电子学与计算机;2005年10期
18 汤亚玲;崔志明;;遗传算法在Web关联挖掘中的应用研究[J];微电子学与计算机;2006年06期
19 张丽娟;李舟军;;分类方法的新发展:研究综述[J];计算机科学;2006年10期
20 游星雅;杨清;;一个基于网络的智能个性化学习系统的设计与应用[J];计算机工程与科学;2006年07期
中国重要会议论文全文数据库 前10条
1 汤俊;;自适应反洗钱辅助信息系统开发框架设计[A];第10届计算机模拟与信息技术会议论文集[C];2005年
2 关雪飞;杨军;马小兵;;决策树在航空发动机状态数据分析中的应用[A];中国现场统计研究会第十三届学术年会论文集[C];2007年
3 郭学军;陈晓云;;粗集方法在数据挖掘中的应用[A];第十六届全国数据库学术会议论文集[C];1999年
4 徐慧;;基于Web的文献数据挖掘[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
5 孙迎;;医院信息的数据挖掘与方法研究[A];中华医学会第十次全国医学信息学术会议论文汇编[C];2004年
6 薛晓东;李海玲;;数据挖掘的客户关系管理应用[A];科技、工程与经济社会协调发展——河南省第四届青年学术年会论文集(下册)[C];2004年
7 郭建文;黄燕;印鉴;杨小波;梁兆辉;;建立中风病“阴阳类证”辨证规范的数据挖掘研究[A];中华医学会第十三次全国神经病学学术会议论文汇编[C];2010年
8 薛鲁华;张楠;;聚类分析在Web数据挖掘中的应用[A];北京市第十三次统计科学讨论会论文选编[C];2006年
9 朱扬勇;黄超;;基于多维模型的交互式数据挖掘框架[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
10 陈涛;胡学钢;陈秀美;;基于数据挖掘的教学质量评价体系分析[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 赵玉鹏;机器学习的哲学探索[D];大连理工大学;2010年
2 孙丽;工艺知识管理及其若干关键技术研究[D];大连交通大学;2005年
3 胡志坤;复杂有色金属熔炼过程操作模式智能优化方法研究[D];中南大学;2005年
4 黄静华;支持向量机算法研究及在气象数据挖掘中的应用[D];中国矿业大学(北京);2011年
5 刘革平;基于数据挖掘的远程学习评价研究[D];西南师范大学;2005年
6 刘寨华;基于临床数据分析的病毒性心肌炎证候演变规律研究[D];黑龙江中医药大学;2006年
7 王川;基因芯片数据管理及数据挖掘[D];中国科学院研究生院(上海生命科学研究院);2004年
8 王涛;挖掘序列模式和结构化模式的精简集[D];华中科技大学;2006年
9 郭斯羽;动态数据中的数据挖掘研究[D];浙江大学;2002年
10 李旭升;贝叶斯网络分类模型研究及其在信用评估中的应用[D];西南交通大学;2007年
中国硕士学位论文全文数据库 前10条
1 向光;基于机器学习和数据挖掘的入侵检测技术研究[D];东北大学;2005年
2 刘孟旭;基于EP的多分类器表决分类算法[D];郑州大学;2004年
3 曹倬瑝;基于数据挖掘的设备故障诊断[D];北京化工大学;2005年
4 那力嘉;基于个人信息管理的邮件处理系统[D];天津大学;2004年
5 樊聪;利用web抽取双语翻译对的研究与实现[D];重庆大学;2007年
6 祝好;基于机器学习的P2P流量识别[D];北京邮电大学;2010年
7 廖赛恩;养生方数据挖掘分析系统的研制[D];湖南中医药大学;2010年
8 李坤然;数据挖掘在股市趋势预测的应用研究[D];中南林业科技大学;2008年
9 郑宏;数据挖掘可视化技术的研究与实现[D];西安电子科技大学;2010年
10 杜金刚;数据挖掘在电信客户关系管理及数据业务营销中的应用[D];北京邮电大学;2010年
中国重要报纸全文数据库 前10条
1 李开宇 黄建军 田长春;把“数据挖掘”作用发挥出来[N];中国国防报;2009年
2 华莱士;“数据挖掘”让银行赢利更多[N];国际金融报;2003年
3 记者 晏燕;数据挖掘让决策者告别“拍脑袋”[N];科技日报;2006年
4 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
5 张立明;数据挖掘之道[N];网络世界;2003年
6 中圣信息技术有限公司 李辉;数据挖掘在CRM中的作用[N];中国计算机报;2001年
7 田红生;数据挖掘在CRM中的应用[N];中国经济时报;2002年
8 王广宇;数据挖掘 加速银行CRM一体化[N];中国计算机报;2004年
9 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
10 张舒博;数据挖掘 提升品牌的好帮手[N];首都建设报;2009年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978