基于日志数据的域名访问源多尺度分析
【摘要】:互联网作为全球性的信息网络对人们的生产和生活产生着深刻影响,在用户从互联网上获取信息的同时,服务器会对用户的访问行为进行相应的记录,生成互联网日志数据。互联网日志数据蕴含了大量的空间信息。目前,对于互联网日志数据的研究主要是利用数据挖掘、机器学习等技术对用户访问行为和系统安全性等进行分析和监测,而在空间层面上的研究还相对较少。对互联网日志数据的研究与地理空间相结合,利用地理信息系统中的技术手段和方法对互联网日志数据进行空间上的挖掘,可以有效的获取其隐含的空间规律,在为互联网日志数据的分析提供了更宽的视野和角度的同时,也可促进以信息流为研究对象的信息地理学研究,具有重要的理论意义和实践价值。
本文以从中国互联网络信息中心获取的连续24小时的cn域名服务器日志数据为研究基础数据,针对cn域名服务器日志数据的特点,实现对cn域名服务器日志数据的海量数据处理、地理编码和空间化,并从全球、地区和局域三个尺度对其进行空间分析,旨在理论上为信息地理学拓展研究领域,在技术上构建网络日志数据处理和空间化表达的技术体系,在实践上为网络基础设施建设提供参考。主要研究内容及结论如下:
(1)对信息地理学、互联网DNS服务以及属性数据空间化的相关理论体系进行梳理。总结了信息地理学的内涵以及研究方向。归纳了互联网DNS服务的概念、体系结构以及工作原理,指出域名服务器日志数据具有结构化和海量性的特点。概括了属性数据空间化的涵义和基本方法。在理论梳理的基础之上,构建顶级域名网络访问空间特征分析的理论体系。
(2)针对cn域名服务器日志数据结构化、海量性的特点以及传统地理信息系统在海量数据处理方面的不足,构建了海量数据处理框架,实现对日志数据的高效处理。经过对日志数据中地理信息的提取和对访问量空间分布的影响因素的分析,设计了cn域名服务器日志数据的空间化方法并对其进行实现。
(3)从全球、地区以及局域三个尺度对cn域名服务器日志数据进行了空间分析,揭示了cn域名下网络服务的访问量在空间上的分布格局。探索了这种分布格局形成的原因以及反映出的问题。这些分析结果将为未来中文网络在中国乃至全球的发展提供参考和指导。
|
|
|
|
1 |
赵树枫;龚宇花;;分布式入侵检测日志分析系统[J];科技信息(科学教研);2008年13期 |
2 |
杨青;陈卫红;;BQS系统业务功能之四——文件日志和清除[J];气象科技;1984年02期 |
3 |
琚生根;陈黎;骆学春;王东方;;基于角色的个性化WEB日志挖掘模型研究[J];四川大学学报(自然科学版);2008年02期 |
4 |
赖翔;;Arp欺骗病毒源的自动定位研究[J];科技资讯;2006年28期 |
5 |
T·D·Burton,Z·Ranman,蒋利众;强非线性受迫振动的多尺度分析[J];邵阳高等专科学校学报;1989年Z1期 |
6 |
翁时辉;余从军;;小波分析在人口控制中的应用[J];中山大学研究生学刊(自然科学版);1994年03期 |
7 |
侯遵泽,杨文采;中国重力异常的小波变换与多尺度分析[J];地球物理学报;1997年01期 |
8 |
侯遵泽,杨文采,高德章;二维小波分析程序(Ⅱ)—安装与使用[J];物探化探计算技术;2001年02期 |
9 |
王昕;基于子波变换的周期扰动下壁湍流涡结构多尺度分析[J];实验力学;2003年03期 |
10 |
付敏,徐长发,李艳;基于多尺度分析的数据非线性压缩和恢复[J];华中科技大学学报(自然科学版);2003年11期 |
11 |
邓彩霞,马晓剑,邓中兴;再生核空间H~1[0,1]中的多尺度分析[J];哈尔滨工程大学学报;2003年04期 |
12 |
王本洋,余世孝;种群分布格局的多尺度分析[J];植物生态学报;2005年02期 |
13 |
高雷;任慧玉;;基于小波分析的上证综指预测[J];统计与决策;2006年14期 |
14 |
章全;;经管类实验室实验日志管理模式探讨[J];科技广场;2008年12期 |
15 |
杨孝英;;一类时滞系统的多尺度分析[J];硅谷;2009年19期 |
16 |
王华;王治和;王平;;Web用户聚类研究[J];甘肃联合大学学报(自然科学版);2010年01期 |
17 |
沙昱;;土壤景观研究综述[J];中国科技信息;2011年09期 |
18 |
刘名生;一族非正交小波基[J];数学杂志;1997年04期 |
19 |
杨守志,杨晓忠,谢长珍;求解多尺度差分方程的一种快速算法[J];数学杂志;1998年S1期 |
20 |
文成林,潘泉,张洪才,戴冠中;多传感器单模型动态系统多尺度分布式融合估计(英文)[J];控制理论与应用;2000年06期 |
|