收藏本站
《解放军信息工程大学》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

基于数据挖掘技术的电子邮件地址聚类系统设计与实现

张丹  
【摘要】: 目前流行的电子邮件信息处理方法大部分只是针对单个电子邮件内容进行分析筛选,但仅仅凭借电子邮件本身内容无法实现高精确度的分类。如何利用目前各种成熟的数据挖掘技术,从海量电子邮件信息中挖掘出有用的知识和信息,成为了亟待解决的热点问题。 数据挖掘中的聚类分析技术是数据挖掘领域一个重要研究方向,其作用是将样本数据区分为若干个类或簇,在同一个类或簇中样本之间具有较高的相似度,而不同类或簇中样本差别较大。 本文描述了一个基于数据挖掘技术的电子邮件地址聚类系统。系统根据电子邮件地址之间的收发关系,构建出电子邮件地址的相似度测量属性,利用基于密度聚类方法中的DBSCAN算法,对电子邮件地址关系紧密程度进行划分,找出较为活跃的电子邮件地址,从而缩小了电子邮件地址查阅范围,提高电子邮件信息分析处理的针对性和有效性。在电子邮件信息抽取过程中,系统实现了海量电子邮件信息解码和属性分类存储。在不影响数据原有特征的前提下,通过去重、填补、剪枝和遍历查找的方法,对电子邮件信息进行预处理,最大限度的缩减了数据规模,解决了处理海量信息时的速度问题。另外,系统使用了特定地址邮件收发数量统计和特定地址联系状况统计的两种统计方法,为分析数据规律,了解数据概貌提供了一种直观的方法,同时也为验证电子邮件地址聚类结果有效性提供了参考。 最后,本文还对开发的系统进行了验证分析。验证结果表明,系统在保证较快运行速度的前提下,达到了对电子邮件地址关系紧密程度的划分和电子邮件地址信息统计结果可视化表示的设计目标。验证了系统的有效性。
【学位授予单位】:解放军信息工程大学
【学位级别】:硕士
【学位授予年份】:2007
【分类号】:TP311.13;TP311.52

手机知网App
【参考文献】
中国期刊全文数据库 前3条
1 刘明吉;王秀峰;黄亚楼;;数据挖掘中的数据预处理[J];计算机科学;2000年04期
2 唐常杰;刘威;温粉莲;乔少杰;;社会网络分析和社团信息挖掘的三项探索——挖掘虚拟社团的结构、核心和通信行为[J];计算机应用;2006年09期
3 梁力,严建伟,聂影;基于源地址约束的垃圾邮件过滤模型[J];西安交通大学学报;2005年04期
【共引文献】
中国期刊全文数据库 前10条
1 王恩德,刘国斌;基于经济景气分析数据仓库的设计与实现[J];吉林大学学报(信息科学版);2005年04期
2 荣波;夏正友;;基于聚类的BBS成员交互网络特性研究[J];重庆科技学院学报(自然科学版);2009年06期
3 夏葵;基于数据挖掘的三层入侵检测模型研究及应用[J];重庆职业技术学院学报;2005年02期
4 马建斌;滕桂法;常淑惠;;基于作者身份识别的社会网络构建方法研究[J];河北农业大学学报;2011年05期
5 林华;;现代医院病案统计分析存在的问题与对策[J];当代经济;2009年24期
6 杨明;;水文信息共享的应用研究[J];东北水利水电;2009年11期
7 罗艳霞;;基于数据仓库的无线网络优化数据预处理[J];电脑编程技巧与维护;2010年24期
8 范哲;;基于数据挖掘的分布式入侵检测系统模型的设计[J];电脑知识与技术;2006年05期
9 张学琴;;决策树算法的研究及其改进[J];电脑知识与技术;2009年30期
10 李雪婵;基于数据挖掘的选课指导研究[J];广东广播电视大学学报;2005年02期
中国重要会议论文全文数据库 前4条
1 王皓;曹永锋;孙洪;;基于流域变换的聚类分析[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
2 张建锋;蔡开裕;朱培栋;;基于前缀劫持的垃圾邮件攻击及其对策[A];中国通信学会第五届学术年会论文集[C];2008年
3 彭玉青;何华;顾军华;;基于粗集理论的归纳依赖关系的研究[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
4 刘震宇;郭宝龙;杨林耀;;数据仓库技术及其与数据挖掘的关系[A];2001年中国智能自动化会议论文集(下册)[C];2001年
中国博士学位论文全文数据库 前9条
1 谭婷婷;网络微内容推荐方法及支持系统研究[D];华中科技大学;2011年
2 赵楠;基于机器学习的供应链绩效智能分析方法研究[D];天津大学;2010年
3 王天真;智能融合数据挖掘方法及其应用[D];上海海事大学;2006年
4 白爱民;基于客户集群和拓扑理论的CRM模型与算法研究[D];天津大学;2006年
5 陈平;数据挖掘网格若干关键技术研究[D];北京邮电大学;2007年
6 叶范波;基于本体的制造企业业务过程知识集成研究[D];浙江大学;2008年
7 刘继;基于网络社团分析的协作推荐方法研究[D];大连理工大学;2010年
8 马建斌;中文Web信息作者同一认定技术研究[D];河北农业大学;2010年
9 孙登第;基于随机点积图理论的模式识别方法研究[D];安徽大学;2012年
中国硕士学位论文全文数据库 前10条
1 黄学辉;数据挖掘分类技术在企业人才招聘中的应用研究[D];中国海洋大学;2010年
2 陈凤萍;寿光人才求职招聘网站中资源检索算法的研究[D];中国海洋大学;2010年
3 高新;银行客户信息数据仓库的实现与应用[D];华南理工大学;2010年
4 韩瑞凯;基于社区发现的网络舆论导向系统研究与应用[D];北京交通大学;2010年
5 甄涛;基于社团发现的Blog信息收集原型系统的研究[D];解放军信息工程大学;2009年
6 黄显华;转子振动信号特征数据库架构方法研究[D];兰州理工大学;2011年
7 朱丹;基于数据仓库的学生成绩和教学质量的分析与应用[D];华东理工大学;2011年
8 胡小圆;沥青路面温度场的测试与分析[D];长安大学;2011年
9 付珍栋;少数民族流动人口社会支持网络研究[D];云南大学;2011年
10 彭剑芳;基于数据挖掘的网络购物行为分析[D];云南大学;2011年
【二级参考文献】
中国期刊全文数据库 前2条
1 曹玖新,张德运,吴瞻,刘伟娜;基于内容的邮件安全审计系统及实现[J];西安交通大学学报;2002年06期
2 丁岳伟;基于SM TP协议电子邮件的还原[J];小型微型计算机系统;2002年03期
【相似文献】
中国期刊全文数据库 前10条
1 王芳;王正兰;;数据挖掘方法在电信行业客户流失分析中的应用研究[J];现代商贸工业;2010年24期
2 关心;王新;;基于k-means改进算法的入侵检测系统的研究[J];计算机系统应用;2007年09期
3 刘淑瑞;秦文珍;张聪;;基于数据挖掘技术的图书馆采购管理研究[J];重庆文理学院学报(自然科学版);2010年01期
4 刘艳霞;;数据挖掘中聚类分析技术的研究与应用[J];科技情报开发与经济;2008年06期
5 张建萍;刘希玉;;基于聚类分析的K-means算法研究及应用[J];计算机应用研究;2007年05期
6 易国洪;章瑾;;基于本体的数据挖掘方法研究[J];计算机与数字工程;2007年07期
7 陈娟;周家纪;;采用数据挖掘的入侵检测技术研究[J];铁路计算机应用;2007年09期
8 徐建锋;董桂娟;朱颖;袁家三;;谈数据挖掘技术在高校图书馆中的应用[J];吉林化工学院学报;2008年05期
9 屈正庚;唐晓琴;;基于电子商务中的数据挖掘技术研究[J];电子设计工程;2009年03期
10 黄宁;李玉龙;陕永飞;周强;;数据挖掘在网络入侵检测系统中的应用[J];计算机安全;2010年10期
中国重要会议论文全文数据库 前10条
1 常郝;周国祥;;基于自组织特征映射神经网络的数据挖掘研究[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年
2 肖健华;吴今培;;数据挖掘技术及其应用实例[A];2001年中国智能自动化会议论文集(下册)[C];2001年
3 金妮;;一种基于数据仓库和OLAP技术的聚类挖掘系统[A];中国仪器仪表学会第九届青年学术会议论文集[C];2007年
4 姚小磊;彭清华;;数据挖掘技术在中医眼科应用的设想[A];中华中医药学会第七次眼科学术交流会论文汇编[C];2008年
5 马洪杰;曲晓飞;;数据挖掘技术和过程的特点[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
6 戈欣;吴晓芬;许建荣;;数据挖掘技术在放射科医疗管理中的潜在作用[A];2009中华医学会影像技术分会第十七次全国学术大会论文集[C];2009年
7 肖一敏;罗树籽;;浅析数据挖掘在报业客户分析中的应用[A];中国新闻技术工作者联合会五届一次理事会暨学术年会论文集(上篇)[C];2009年
8 武森;郑锡村;国宏伟;;数据挖掘技术在高炉炉型管理中的应用[A];全国第十届企业信息化与工业工程学术年会论文集[C];2006年
9 刘海存;杨印生;马琨;;基于知识数据挖掘技术的企业聚类研究[A];中国现场统计研究会第十三届学术年会论文集[C];2007年
10 王伟;殷国富;;基于数据挖掘的多维联机分析处理系统研究[A];全国先进制造技术高层论坛暨制造业自动化、信息化技术研讨会论文集[C];2005年
中国重要报纸全文数据库 前10条
1 记者 向杰;万圣节小心病毒“凑热闹”[N];科技日报;2005年
2 黄山松;IRM,为邮件上“锁”[N];电脑报;2005年
3 杜鹃;电子邮件地址实现汉化[N];中华工商时报;2004年
4 诺盛电信咨询;中国移动“PUSH”mail受阻四大因素[N];中国电子报;2006年
5 ;三莓竞秀:手机邮件全接触[N];电脑报;2007年
6 记者  姚春鸽;移动电邮:引领商务应用风[N];人民邮电;2006年
7 高博;微软服务新基石[N];电脑报;2006年
8 杨忠奎;邮件蠕虫结伴而来骚扰用户邮箱[N];大众科技报;2005年
9 刘红岩、何军;利用数据挖掘技术获得商业智能[N];中国计算机报;2003年
10 ;互联网电子邮件服务管理办法[N];人民邮电;2006年
中国博士学位论文全文数据库 前10条
1 赵恒;数据挖掘中聚类若干问题研究[D];西安电子科技大学;2005年
2 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年
3 庞淑英;三江并流带旅游地质景观数据挖掘及旅游价值评价研究[D];昆明理工大学;2008年
4 赵晨;过程控制中的数据挖掘技术研究及其智能控制策略探讨[D];浙江大学;2005年
5 高清东;复杂供矿条件矿山技术指标整体动态优化系统及应用[D];北京科技大学;2005年
6 李兴;高光谱数据库及数据挖掘研究[D];中国科学院研究生院(遥感应用研究所);2006年
7 王玉峰;变电站瞬态电磁环境及微机保护系统EMC研究[D];大连理工大学;2007年
8 潘海天;数据挖掘技术在聚合过程建模与控制的应用研究[D];浙江大学;2003年
9 程其云;基于数据挖掘的电力短期负荷预测模型及方法的研究[D];重庆大学;2004年
10 束志恒;化学化工数据挖掘技术的研究[D];浙江大学;2005年
中国硕士学位论文全文数据库 前10条
1 张丹;基于数据挖掘技术的电子邮件地址聚类系统设计与实现[D];解放军信息工程大学;2007年
2 王洪艳;基于聚类的数据挖掘技术在CRM中的研究与应用[D];武汉大学;2005年
3 王晋;数据挖掘技术在电信企业客户关系管理中的应用研究[D];兰州理工大学;2007年
4 胡曼;交叉销售在中国保险业的应用分析[D];山东大学;2009年
5 谭华琴;基于蚁群算法的数据挖掘方法研究[D];武汉理工大学;2006年
6 张智钦;基于数据挖掘的客户细分研究[D];暨南大学;2007年
7 汪瑛;数据挖掘在燃气系统中的应用研究[D];南京理工大学;2009年
8 曹丹阳;数据挖掘在教务系统中的应用研究[D];北方工业大学;2006年
9 宋宝亚;基于数据挖掘的信息过滤系统的设计与实现[D];山东师范大学;2006年
10 蔡春丽;数据流挖掘中聚类算法的研究与实现[D];哈尔滨工程大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026