收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于多分类器集成的聚类算法研究

刘净  
【摘要】: 随着网络技术和数据库技术的快速发展,数据挖掘技术应运而生。聚类分析是数据挖掘中的重要分支之一,是一种数据划分或分组处理的重要手段和方法。聚类的应用是非常广泛的,无论是在商务领域,还是在生物学、Web文档分类、图像处理等其它领域,都得到了有效的应用。 由于混合型数据集自身的复杂性,在传统的聚类算法中适合于处理这种数据集的算法较少,而且聚类的效果也不佳。另外,聚类簇数的确定一直是聚类分析难以解决的问题。近年来,随着集成学习技术在分类和预测领域的成功应用,形成了较成熟的多分类器集成技术,然而由于在聚类分析中缺乏数据集的先验知识,导致聚类集成的研究起步较晚,在很多方面还值得进一步研究。目前的聚类集成算法大多是一种并联式结构,由于需要对聚类成员的聚类结果进行匹配和融合,所以时间复杂度较高;同时聚类簇数的确定问题依然存在,特别是聚类成员的簇数、最终的聚类簇数以及两者之间的关系更是一个难以确定的问题。 针对上述问题,本论文借鉴了多分类器集成技术,以k-prototype算法为基础聚类算法,设计了一种多层次的聚类集成算法。该算法适合于混合型数据集,采用了级联式结构,避免了匹配和融合的过程,并且只需给出聚类簇数的一个初步估计值,随着聚类层次的增加对簇数进行自适应的调整。在本论文中以UCI标准数据集进行实验,从各方面验证了该算法的性能,证明了该算法具有较高的聚类准确率,明显提高了混合型数据集的聚类效果;其时间复杂度较低,具有很好的可扩展性;同时还具备一定的分类预测能力。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 关心;王新;;基于k-means改进算法的入侵检测系统的研究[J];计算机系统应用;2007年09期
2 刘淑瑞;秦文珍;张聪;;基于数据挖掘技术的图书馆采购管理研究[J];重庆文理学院学报(自然科学版);2010年01期
3 刘艳霞;;数据挖掘中聚类分析技术的研究与应用[J];科技情报开发与经济;2008年06期
4 张建萍;刘希玉;;基于聚类分析的K-means算法研究及应用[J];计算机应用研究;2007年05期
5 易国洪;章瑾;;基于本体的数据挖掘方法研究[J];计算机与数字工程;2007年07期
6 陈娟;周家纪;;采用数据挖掘的入侵检测技术研究[J];铁路计算机应用;2007年09期
7 徐建锋;董桂娟;朱颖;袁家三;;谈数据挖掘技术在高校图书馆中的应用[J];吉林化工学院学报;2008年05期
8 屈正庚;唐晓琴;;基于电子商务中的数据挖掘技术研究[J];电子设计工程;2009年03期
9 黄宁;李玉龙;陕永飞;周强;;数据挖掘在网络入侵检测系统中的应用[J];计算机安全;2010年10期
10 宋磊;;数据挖掘在电子商务系统中的应用[J];福建金融管理干部学院学报;2011年03期
11 杨新泉,谢佳,齐俊;基于聚类分析的入侵检测模型[J];福建电脑;2005年07期
12 王晓红;苏伟明;周玉凤;;WWW聚类引擎的研究[J];吉林化工学院学报;2006年02期
13 汪赫瑜;丛喜宾;;数据挖掘技术在C2C电子商务中的应用[J];辽宁工程技术大学学报(自然科学版);2008年S1期
14 崔立新;赵蕾;李海玉;;聚类算法在入侵检测中的应用[J];电脑编程技巧与维护;2009年S1期
15 孙亦博;;电子商务中数据挖掘技术的应用研究[J];电脑知识与技术;2010年09期
16 朱屹;刘安丰;;空间数据挖掘中的聚类算法[J];黑龙江科技信息;2011年13期
17 宋慧勇;;数据挖掘技术在CRM中的应用[J];黑龙江科技信息;2007年24期
18 赵悦;陈凌晖;;基于数据挖掘的入侵检测系统[J];计算机系统应用;2008年09期
19 付永贵;;基于数据挖掘技术的校园网电子交易平台分析[J];山西科技;2008年06期
20 李燕;;蚁群聚类算法研究现状的分析[J];中国科技信息;2009年09期
中国重要会议论文全文数据库 前10条
1 常郝;周国祥;;基于自组织特征映射神经网络的数据挖掘研究[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年
2 肖健华;吴今培;;数据挖掘技术及其应用实例[A];2001年中国智能自动化会议论文集(下册)[C];2001年
3 金妮;;一种基于数据仓库和OLAP技术的聚类挖掘系统[A];中国仪器仪表学会第九届青年学术会议论文集[C];2007年
4 姚小磊;彭清华;;数据挖掘技术在中医眼科应用的设想[A];中华中医药学会第七次眼科学术交流会论文汇编[C];2008年
5 马洪杰;曲晓飞;;数据挖掘技术和过程的特点[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
6 戈欣;吴晓芬;许建荣;;数据挖掘技术在放射科医疗管理中的潜在作用[A];2009中华医学会影像技术分会第十七次全国学术大会论文集[C];2009年
7 武森;郑锡村;国宏伟;;数据挖掘技术在高炉炉型管理中的应用[A];全国第十届企业信息化与工业工程学术年会论文集[C];2006年
8 刘海存;杨印生;马琨;;基于知识数据挖掘技术的企业聚类研究[A];中国现场统计研究会第十三届学术年会论文集[C];2007年
9 肖一敏;罗树籽;;浅析数据挖掘在报业客户分析中的应用[A];中国新闻技术工作者联合会五届一次理事会暨学术年会论文集(上篇)[C];2009年
10 王伟;殷国富;;基于数据挖掘的多维联机分析处理系统研究[A];全国先进制造技术高层论坛暨制造业自动化、信息化技术研讨会论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 赵恒;数据挖掘中聚类若干问题研究[D];西安电子科技大学;2005年
2 冯变玲;基于数据挖掘技术的心脑血管用药ADR关联模型构建研究[D];天津大学;2012年
3 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年
4 庞淑英;三江并流带旅游地质景观数据挖掘及旅游价值评价研究[D];昆明理工大学;2008年
5 赵晨;过程控制中的数据挖掘技术研究及其智能控制策略探讨[D];浙江大学;2005年
6 高清东;复杂供矿条件矿山技术指标整体动态优化系统及应用[D];北京科技大学;2005年
7 李兴;高光谱数据库及数据挖掘研究[D];中国科学院研究生院(遥感应用研究所);2006年
8 王玉峰;变电站瞬态电磁环境及微机保护系统EMC研究[D];大连理工大学;2007年
9 潘海天;数据挖掘技术在聚合过程建模与控制的应用研究[D];浙江大学;2003年
10 程其云;基于数据挖掘的电力短期负荷预测模型及方法的研究[D];重庆大学;2004年
中国硕士学位论文全文数据库 前10条
1 刘净;基于多分类器集成的聚类算法研究[D];河海大学;2007年
2 王晋;数据挖掘技术在电信企业客户关系管理中的应用研究[D];兰州理工大学;2007年
3 胡曼;交叉销售在中国保险业的应用分析[D];山东大学;2009年
4 谭华琴;基于蚁群算法的数据挖掘方法研究[D];武汉理工大学;2006年
5 张智钦;基于数据挖掘的客户细分研究[D];暨南大学;2007年
6 汪瑛;数据挖掘在燃气系统中的应用研究[D];南京理工大学;2009年
7 曹丹阳;数据挖掘在教务系统中的应用研究[D];北方工业大学;2006年
8 宋宝亚;基于数据挖掘的信息过滤系统的设计与实现[D];山东师范大学;2006年
9 蔡春丽;数据流挖掘中聚类算法的研究与实现[D];哈尔滨工程大学;2007年
10 李翼;数据挖掘技术在高校人力资源管理中的应用[D];兰州商学院;2007年
中国重要报纸全文数据库 前10条
1 刘红岩、何军;利用数据挖掘技术获得商业智能[N];中国计算机报;2003年
2 陈晓 山西财经大学教师;数据挖掘技术在高校教学管理中的应用[N];山西经济日报;2010年
3 记者 吕贤如;大力加强数据挖掘技术研究应用[N];光明日报;2006年
4 主持人 李禾;数据挖掘技术如何驱动经济车轮[N];科技日报;2007年
5 首之;数据挖掘并不神秘[N];金融时报;2006年
6 ;IBM公司推出新型数据挖掘技术[N];中国高新技术产业导报;2001年
7 山西银行学校 王林芳;数据挖掘在银行业务中的应用[N];山西科技报;2005年
8 任中华;财务数据挖掘六步走[N];中国计算机报;2007年
9 诺达咨询高级咨询顾问 周连升;数据挖掘拓展3G增值空间[N];通信产业报;2007年
10 徐扬;如何从数据中“挤出”效益[N];中国计算机报;2002年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978