收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于用户行为挖掘的数据流管理技术研究

李军  
【摘要】:日益增长的网络安全威胁促使各种安全防御机制应运而生,这些安全机制大都需要分析网络数据流,以发现违规行为和有害信息。当前的数据流安全管理主要基于关键字分析,未全面考虑关键字所在的网络上下文环境信息,比如关键字所在网页的内容语义和浏览该页面的网络用户类别信息。为此,本文从影响数据流安全管理的用户行为、内容分析和管理调度三个方面开展研究,主要贡献为: 1.在用户维度,提出一种用户行为预测模型,该模型使得数据流安全管理系统可以针对用户类别实行差别化管理。具体来说,该模型通过收集网络用户的网页点击行为数据和搜索行为数据,构造一个关联用户行为和用户类别的预测模型。对比于以往的用户行为分析方法,该模型有以下创新:(i)构建全而的行为类别体系和行为特征空间,借鉴概率潜在语义分析思想,提出了一种用户潜在行为倾向发现方法来挖掘“用户-行为”共现中的倾向语义;(ii)该模型结合安全管理的应用背景,发现倾向的描述能力较弱,设计了一种“倾向-类别”映射关系学习算法,同时对该学习算法的信息转换等价性进行了理论分析;(iii)针对预测结果,设计了相应的度量指标和评估办法,实验证明:在不对用户标注的情况下,该模型可准确预测用户的行为类别。 2.在流内容维度,提出了多分类器快速内容判别模型。对每一个高速到来的元组,联合多个分类器对其进行综合判别。虽然该方法提高了判别的精度和稳定性,但是判别的速度会严重下降。为此,考虑利用多分类器之间的共享部分来提高判断的速度。具体来说,设计了两种集成模型索引结构(E-Tree和SVM-Index),理论上证明了这两种结构可以达到亚线性(O(logN)和O(1))判别速度。进一步地,在UCI公开数据集上的实验结果验证了预测开销平均可以降至原来的25%和3%左右。 3.在整体调度上,提出利用数据挖掘和机器学习的方法来构建自适应的过滤器排序模型。一方面,针对较稳定的数据流环境,基于K-means思想,提出了一种层次化聚类排序模型KHO,来提升过滤器排序算法的鲁棒性;另一方面,针对非平稳数据流环境,基于指数平滑和层次决策的思想,提出了一种自适应的平滑排序模型AHES。以上方法解决了当前数据流过滤器排序算法无法随着数据流上下文环境自适应调节的问题。最后,大量实验结果证明:提出的模型能够表现出较好的性能和环境感知能力。 4.基于上述关键技术的研究探索,设计并实现了一个用户行为数据安全管理引擎IceStream,并详细介绍了核心模块的主要功能和设计思路。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 赵以强;张龙波;;数据流管理系统研究现状分析[J];科技信息;2010年28期
2 羌晨晨;;数据流关键技术研究概论[J];装备制造技术;2009年11期
3 孟军;张航黎;张建英;郭禾;;分布式数据流的渐增式聚集维护算法[J];微电子学与计算机;2006年10期
4 魏定国;吴时霖;;数据流复杂查询处理的研究[J];计算机科学;2004年02期
5 王金栋;张磊;丁秋林;黄添强;;一种支持分布式数据流处理的双层重叠网络模型[J];应用科学学报;2006年04期
6 李岩;王惠文;叶明;;数据流分析与技术研究[J];计算机工程与应用;2008年15期
7 张龙波,李战怀,闫剑锋;一种面向数据流处理的直方图增量维护算法[J];计算机工程;2005年14期
8 安红,孟建;基于数据流处理的雷达对抗仿真框架研究[J];电子对抗技术;2004年06期
9 俞研;郭山清;黄皓;;基于数据流的异常入侵检测[J];计算机科学;2007年05期
10 谢应科,张涛,韩承德;实时SAR成像系统中矩阵转置的设计和实现[J];计算机研究与发展;2003年01期
11 杜威,邹先霞;基于数据流的滑动窗口机制的研究[J];计算机工程与设计;2005年11期
12 李浪;李仁发;;基于数据流异常挖掘的入侵检测系统设计[J];科学技术与工程;2008年13期
13 俞研;黄皓;;基于小样本标记实例的数据流集成入侵检测模型[J];电子学报;2007年02期
14 孔英会;安静;车辚辚;刘云峰;;基于增量DFT概要的数据流聚类算法[J];华北电力大学学报(自然科学版);2007年05期
15 陈磊松;;数据流处理系统的负载控制策略研究[J];漳州师范学院学报(自然科学版);2009年03期
16 安红;;基于数据流处理的雷达对抗仿真系统[J];现代雷达;2006年05期
17 蒋建军;王以群;;农村社会保障体系数据流关联规则挖掘[J];计算机工程;2009年17期
18 王金栋;周良;张磊;丁秋林;;基于分枝路径分析的连续查询降载算法[J];应用科学学报;2007年01期
19 胡彧;王顺平;;事务型滑动窗口下的数据流频繁模式挖掘[J];计算机工程与应用;2010年22期
20 闵思鹤,王甲池,江太辉;DS/CDMA扩频通信接收机数据流处理方案[J];通信技术;2003年06期
中国重要会议论文全文数据库 前10条
1 张冬冬;李建中;王伟平;郭龙江;;分布式复式数据流的处理[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
2 魏永超;陈立军;;数据流上复杂事件处理系统Eagle的设计与实现[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
3 蔡致远;熊方;钱卫宁;周傲英;;核合并分析及其在数据流密度估计上的应用[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
4 周锐;肖川;王国仁;韩东红;霍欢;;数据流滑动窗口连接上的卸载技术的研究[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
5 尹婷;李红燕;;窗口模型下数据流查询流水化执行的研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
6 宋宝燕;陆岩;张俊宁;;数据流上的一种适应性查询优化及调度策略[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
7 吕雁飞;武珊珊;谷峪;许嘉;于戈;;一种数据流上统计性查询QoS的保证方法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
8 霍欢;王国仁;陈庆奎;彭敦陆;;基于Hole-Filler模型的XML数据流上的SLCA算法[A];第26届中国数据库学术会议论文集(A辑)[C];2009年
9 楚红涛;寒枫;张燕;王婷;;基于数据流的挖掘研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
10 武珊珊;宋宝燕;袁锋;于亚新;于戈;;数据流模型研究[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
中国博士学位论文全文数据库 前10条
1 李军;基于用户行为挖掘的数据流管理技术研究[D];北京邮电大学;2012年
2 朱小栋;基于扩展预测模型标记语言的数据流挖掘系统建模研究[D];南京航空航天大学;2009年
3 吴枫;数据流挖掘若干关键技术研究[D];国防科学技术大学;2009年
4 郭立超;数据流挖掘若干技术研究及其在电信行业的应用[D];浙江大学;2011年
5 于翔;基于网格的数据流聚类方法研究[D];哈尔滨工程大学;2010年
6 王修君;高效数据流和海量文本处理算法研究[D];中国科学技术大学;2011年
7 由育阳;数据流容错挖掘算法研究[D];哈尔滨工程大学;2011年
8 欧阳震诤;不平稳数据流的分类技术研究[D];国防科学技术大学;2009年
9 冯博;基于半结构化数据的数据流挖掘算法研究[D];北京邮电大学;2011年
10 Mahmoud Sami Soliman;[D];中南大学;2010年
中国硕士学位论文全文数据库 前10条
1 罗秀;数据流在线分类算法的研究与实现[D];东北大学;2009年
2 何登成;数据流上复杂序查询的研究与实现[D];浙江大学;2010年
3 周驰;数据流上概念漂移的检测和分类[D];郑州大学;2010年
4 李有生;一种改进的数据流处理算法的研究与实现[D];吉林大学;2010年
5 何江燕;基于数据流的聚类分析算法研究[D];兰州交通大学;2010年
6 李燕;面向含噪数据流的概念漂移集成分类研究[D];合肥工业大学;2011年
7 由欣;基于有向图构造的数据流预测算法的研究[D];哈尔滨工程大学;2011年
8 姚晨;高纬数据流的异常检测[D];电子科技大学;2011年
9 吴亚娟;数据流连续查询的自适应降裁策略研究[D];大庆石油学院;2010年
10 梅铮;商业数据流降维方法及其聚类算法研究[D];浙江工商大学;2011年
中国重要报纸全文数据库 前10条
1 记者 刘浪 通讯员 廖雅琴;中国首套数字化“可视人”数据集在渝通过成果鉴定[N];重庆日报;2003年
2 山水;艾斯本与NIST集合数据集[N];中国石化报;2007年
3 秦笃烈;解读 中国造女性数字人[N];健康报;2006年
4 李宇;港交所明年试验上市预披露计划[N];中国证券报;2007年
5 李宇;上市预披露将成市场常规[N];中国证券报;2008年
6 郭立;荣昌猪实现数字化[N];中国畜牧兽医报;2005年
7 上海 陈纯;初识T-SQL,恋情的开始[N];电脑报;2004年
8 本报记者 周仲全 实习生 蔡为伟;数字虚拟人:为承受人类苦痛而来[N];辽宁日报;2005年
9 周青 编译;CDP:与快照相得益彰[N];计算机世界;2006年
10 本报记者  郝宗强;为社会和谐作贡献[N];人民日报;2006年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978