收藏本站
《哈尔滨工程大学》 2012年
收藏 | 手机打开
二维码
手机客户端打开本文

面向电信领域的数据挖掘关键技术研究

巩建光  
【摘要】:随着电信行业竞争的不断加剧,数据挖掘作为一种知识提取和决策支持的手段,已得到了广泛的应用。然而,由于电信企业数据采集系统人为和非人为的扰动,造成各个数据源的数据质量参差不齐,加之数据仓库的ETL机制本身的某些问题,导致在数据集成时发生数据缺失和错误,造成数据的整体质量不高,从而对数据挖掘的结果产生影响。因此,合理地解决上述问题,提高数据挖掘的准确性和效率,利用数据挖掘技术促进电信领域各类业务的正常运行,具有重要的实际意义。 虽然人们对电信领域的数据挖掘技术进行了近十多年的研究,提出了若干技术并试图解决电信领域数据挖掘技术在应用中遇到的各类问题,但这些技术并没有很好地适应电信领域数据复杂多样和规模庞大的特性。 本文以电信实际业务数据特征为研究对象,以提高电信领域数据挖掘效能为研究内容,从数据挖掘方案的实用角度出发,深入研究了可满足电信领域数据挖掘准确性、效率和决策支持等多方面需求的数据挖掘技术。本文的创新工作主要包括以下几个方面: 首先,结合电信数据规模异常庞大,管理极具复杂性的现实情况,提出一种高效、准确的数据挖掘方案。为了提高K均值方法知识发现的准确性,分别提出运用遗传算法优化初始值空间,以及通过加权方式获得子空间内最有价值知识的方案。 其次,按照电信领域知识发现的实际需求,在面临数据规模呈几何模式增加时,数据挖掘算法的效率会持续下降,数据挖掘网格作为一种有效的解决手段,提出了基于网格技术的并行计算调度方案,并对方案进行了性能分析。 最后,随着3G网络时代的快速发展,电信用户网络访问行为数据规模以每天几十T级的数量激增,传统的计算方式早已无法适应这种数据场景。引入Hadoop平台等云技术手段,合理解决数据存储问题。从实际的应用角度出发,设计出对应的数据挖掘算法。提出了对传统的决策树SPRINT算法进行改进,提出了并行化计算方案,并成功应用到Hadoop平台。
【学位授予单位】:

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 邓娜,边小凡,黄炜,王东方;数据挖掘及其在教学实践中的应用[J];河北农业大学学报(农林教育版);2004年04期
2 王红霞;人才市场多媒体信息服务系统中的聚类模型解析方法[J];武汉理工大学学报(信息与管理工程版);2005年02期
3 蔡江辉,张继福;基于聚类的离群数据挖掘及应用[J];太原重型机械学院学报;2004年04期
4 孙友友;郭晓燕;;决策树与聚类算法在数据挖掘中的研究及应用[J];科技创新导报;2007年34期
5 彭玉楼,刘亚辉;利用决策树和聚类理论对XML文档数据挖掘的研究[J];株洲工学院学报;2005年04期
6 王善侠;王振华;王吉永;;基于决策树和聚类理论的XML文档数据挖掘的研究[J];科技信息(科学教研);2007年34期
7 钱宇;;数据聚类中基于浓度噪音消除的可视化参数选择方法(英文)[J];软件学报;2008年08期
8 史望聪;耿健;;数据挖掘中的一种数据预处理方法[J];科技资讯;2009年17期
9 武森;俞晓莉;倪宇;王瑞峰;;数据挖掘中的聚类技术在学生成绩分析中的应用[J];中国管理信息化;2009年15期
10 汤效琴,戴汝源;数据挖掘中聚类分析的技术方法[J];微计算机信息;2003年01期
11 翟立波;数据挖掘与知识发现[J];潍坊学院学报;2005年02期
12 李世明;朱桂英;;基于模糊聚类算法的入侵检测技术研究[J];科技信息(学术研究);2008年28期
13 于承敏;郑丽萍;刘永涛;;数据挖掘在高校学生综合测评成绩分析中的应用[J];电脑与电信;2009年10期
14 牛力;数据挖掘中的统计分析技术应用研究[J];广西师范大学学报(哲学社会科学版);2002年S1期
15 王惠琴,李明,王志祥,彭铎;小波变换的多分辨率特性在聚类分析中的应用[J];兰州理工大学学报;2004年02期
16 陈勍;数据挖掘技术及其应用[J];医学信息;2004年04期
17 郭玉滨;基于聚类的周期关联规则的数据挖掘[J];菏泽学院学报;2004年04期
18 陈阳,崔英敏;基于WEB日志的数据挖掘在校园网应用中的探索[J];广东轻工职业技术学院学报;2005年01期
19 石军;数据挖掘在高校图书馆的应用[J];江西图书馆学刊;2005年03期
20 刘红艳;张景生;;房地产信息化中的数据挖掘应用[J];科技资讯;2007年26期
中国重要会议论文全文数据库 前10条
1 薛晓东;李海玲;;数据挖掘的客户关系管理应用[A];科技、工程与经济社会协调发展——河南省第四届青年学术年会论文集(下册)[C];2004年
2 郭学军;陈晓云;;粗集方法在数据挖掘中的应用[A];第十六届全国数据库学术会议论文集[C];1999年
3 徐慧;;基于Web的文献数据挖掘[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
4 孙迎;;医院信息的数据挖掘与方法研究[A];中华医学会第十次全国医学信息学术会议论文汇编[C];2004年
5 于波;王宏鼎;唐世渭;童云海;;基于数据挖掘的数据质量分析研究[A];全国第16届计算机科学与技术应用(CACIS)学术会议论文集[C];2004年
6 郭建文;黄燕;印鉴;杨小波;梁兆辉;;建立中风病“阴阳类证”辨证规范的数据挖掘研究[A];中华医学会第十三次全国神经病学学术会议论文汇编[C];2010年
7 薛鲁华;张楠;;聚类分析在Web数据挖掘中的应用[A];北京市第十三次统计科学讨论会论文选编[C];2006年
8 朱扬勇;黄超;;基于多维模型的交互式数据挖掘框架[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
9 陈涛;胡学钢;陈秀美;;基于数据挖掘的教学质量评价体系分析[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
10 王星;谢邦昌;戴稳胜;;数据挖掘在保险业中的应用[A];北京市第十二次统计科学讨论会论文选编[C];2003年
中国重要报纸全文数据库 前10条
1 李开宇 黄建军 田长春;把“数据挖掘”作用发挥出来[N];中国国防报;2009年
2 华莱士;“数据挖掘”让银行赢利更多[N];国际金融报;2003年
3 记者 晏燕;数据挖掘让决策者告别“拍脑袋”[N];科技日报;2006年
4 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
5 张立明;数据挖掘之道[N];网络世界;2003年
6 中圣信息技术有限公司 李辉;数据挖掘在CRM中的作用[N];中国计算机报;2001年
7 田红生;数据挖掘在CRM中的应用[N];中国经济时报;2002年
8 王广宇;数据挖掘 加速银行CRM一体化[N];中国计算机报;2004年
9 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
10 张舒博;数据挖掘 提升品牌的好帮手[N];首都建设报;2009年
中国博士学位论文全文数据库 前10条
1 巩建光;面向电信领域的数据挖掘关键技术研究[D];哈尔滨工程大学;2012年
2 孙丽;工艺知识管理及其若干关键技术研究[D];大连交通大学;2005年
3 胡志坤;复杂有色金属熔炼过程操作模式智能优化方法研究[D];中南大学;2005年
4 刘革平;基于数据挖掘的远程学习评价研究[D];西南师范大学;2005年
5 刘寨华;基于临床数据分析的病毒性心肌炎证候演变规律研究[D];黑龙江中医药大学;2006年
6 王川;基因芯片数据管理及数据挖掘[D];中国科学院研究生院(上海生命科学研究院);2004年
7 王涛;挖掘序列模式和结构化模式的精简集[D];华中科技大学;2006年
8 王明春;基于粗糙集的数据及文本挖掘方法研究[D];天津大学;2005年
9 郭斯羽;动态数据中的数据挖掘研究[D];浙江大学;2002年
10 李旭升;贝叶斯网络分类模型研究及其在信用评估中的应用[D];西南交通大学;2007年
中国硕士学位论文全文数据库 前10条
1 童建飞;数据挖掘在电信移动客户行为分析中的应用研究[D];南昌大学;2010年
2 叶小旺;面向社区服务的数据挖掘关键技术研究与实现[D];西安电子科技大学;2009年
3 廖赛恩;养生方数据挖掘分析系统的研制[D];湖南中医药大学;2010年
4 李坤然;数据挖掘在股市趋势预测的应用研究[D];中南林业科技大学;2008年
5 郑宏;数据挖掘可视化技术的研究与实现[D];西安电子科技大学;2010年
6 杜金刚;数据挖掘在电信客户关系管理及数据业务营销中的应用[D];北京邮电大学;2010年
7 徐路;基于决策树的数据挖掘算法的研究及其在实际中的应用[D];电子科技大学;2009年
8 梁小鸥;数据挖掘在高职教学管理中的应用[D];华南理工大学;2011年
9 王浩;数据挖掘在上海市职业能力考试院招录考试优化管理项目中的运用研究[D];华东理工大学;2012年
10 黎卫英;数据挖掘在中职幼教课程改革中的应用[D];福建师范大学;2009年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978