收藏本站
收藏 | 论文排版

基于粗糙集理论的聚类研究

陈界碑  
【摘要】: 数据挖掘技术是机器学习、数据库和统计理论相结合的产物,是从大量的、不完全的、有噪声的、模糊的、随机的实际数据中,提取隐含的、先前未知的并有潜在价值的信息的非平凡过程。在数据挖掘领域中,聚类分析是一项重要的研究课题。与分类不同,聚类的目标是在没有任何先验知识的前提下,根据数据的相似性将数据聚合成不同的簇,使得相同簇中的元素尽可能相似,不同簇中的元素差别尽可能大,因此又被称为非监督分类。聚类分析作为数据挖掘系统中的一个模块,既可以作为一个单独的工具以发现数据库中数据分布的深层信息,也可以作为其他数据挖掘分析算法的一个预处理步骤,因此研究如何提高聚类算法的性能具有重要的意义。 粗糙集理论是一种刻画不确定性和不完整性知识的数学工具,由波兰数学家Pawlak在上世纪八十年代初首先提出的。粗糙集理论善于分析隐藏在数据中的事实而不需要关于数据的任何附加知识。该理论以其独特的优势正赢得越来越多的研究者的关注,并在各个领域获得了广泛的应用。在数据挖掘领域,粗糙集最初主要用于分类,而今有关粗糙集的研究已深入到该领域的各个方面。 本文首先介绍了数据挖掘的定义和主要方法,重点对聚类分析技术的各种算法作了详细的介绍和比较,并提出了一种改进的层次聚类算法;本文仔细学习了粗糙集理论,提出了一种基于代数运算的属性约简方法,针对粗糙集理论善于处理不精确和不确定性知识的特点,将粗糙集理论引入聚类分析中,对传统聚类方法作了相应的改进,然后通过实验验证了这种改进有效性;本文最后分析了粒度和聚类的关系,在粒度框架下研究了粗糙集理论在聚类中的应用,并提出了一种基于粒度原理的聚类算法,然后对UCI数据库中两个数据集进行了实验,结果表明与没有引入粒度概念的传统聚类算法相比,该基于粒度原理的聚类算法明显提高了对数据点的分类正确率,验证了在粒度框架下将粗糙集理论用于聚类可以有效的提高聚类质量。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 郑世明;徐顺福;宋自林;苗壮;;网格环境下基于Weka4WS的分布式聚类算法[J];计算机应用研究;2010年11期
2 孙华梅;;数据挖掘及其在企业管理中的应用[J];商业研究;2008年05期
3 邢培;;数据挖掘的主要技术——聚类[J];科技信息;2010年20期
4 罗菲菲;刘贵全;安景琪;张婷慧;;一种分层聚类方法及其应用研究[J];成都理工大学学报(自然科学版);2005年06期
5 薛洁;刘希玉;;数据挖掘技术与网上购物推荐系统[J];网络安全技术与应用;2011年03期
6 李雪梅;张素琴;;数据挖掘中聚类分析技术的应用[J];武汉大学学报(工学版);2009年03期
7 刘斓冰;高学东;王沙骋;;基于Web的文本信息挖掘技术[J];情报探索;2007年07期
8 黄兰;郭志敏;习万球;;利用聚类技术对图书馆读者社群的研究分析[J];计算机工程与设计;2007年22期
9 韩文峰;张晓;关爽;;数据挖掘中数据预处理技术在教育研究中的应用[J];伊犁师范学院学报(自然科学版);2008年03期
10 史玉珍;赵伟艇;;数据挖掘下新农村决策支持系统的构建[J];电脑开发与应用;2009年12期
11 杜冰;数据挖掘在电信行业中的应用[J];科技和产业;2005年11期
12 黄咏梅;;读者需求分析中的数据挖掘技术[J];大学图书情报学刊;2006年04期
13 胡艳慧;陈俊杰;;空间数据库的数据挖掘[J];科技情报开发与经济;2007年05期
14 杨文君;;基于模糊聚类分析的税务决策支持系统的研究[J];商场现代化;2007年14期
15 柏冬梅;;基于数据挖掘技术视角下的图书管理[J];林区教学;2008年11期
16 侯宇;范杰;;浅谈数据挖掘技术在金融业中的应用[J];华南金融电脑;2008年09期
17 何永进;饶思军;;数据挖掘在农业数字图书馆中的应用[J];安徽农业科学;2009年19期
18 刘淑瑞;秦文珍;张聪;;基于数据挖掘技术的图书馆采购管理研究[J];重庆文理学院学报(自然科学版);2010年01期
19 陶昀煜;;数据挖掘技术在钢铁行业价格关联分析的应用研究[J];苏州科技学院学报(工程技术版);2007年04期
20 倪现君;;在客户建模中如何选择数据挖掘方法[J];中国科技信息;2005年21期
中国重要会议论文全文数据库 前10条
1 王云龙;李逊;;基于数据场的数据挖掘方法在入侵检测中的应用[A];第十九次全国计算机安全学术交流会论文集[C];2004年
2 马洪杰;曲晓飞;;数据挖掘技术和过程的特点[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
3 戈欣;吴晓芬;许建荣;;数据挖掘技术在放射科医疗管理中的潜在作用[A];2009中华医学会影像技术分会第十七次全国学术大会论文集[C];2009年
4 魏元珍;杨沂凤;;数据挖掘技术及其在数字图书馆中的应用[A];网络信息资源的搜集与应用——全国高校社科信息资料研究会第十次年会论文集[C];2004年
5 肖健;沈彩霞;;浅谈数据挖掘技术现状[A];广西计算机学会2008年年会论文集[C];2008年
6 巩耀亮;邱晓东;孙丽君;李树强;;数据挖掘技术在企业竞争情报系统中的应用研究[A];信息时代——科技情报研究学术论文集(第三辑)[C];2008年
7 王洪锋;;数据挖掘在客户关系管理中的应用研究[A];河南省通信学会2005年学术年会论文集[C];2005年
8 姚小磊;彭清华;;数据挖掘技术在中医眼科应用的设想[A];中华中医药学会第七次眼科学术交流会论文汇编[C];2008年
9 张婧;;数据挖掘技术在进销存系统中的应用[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
10 杨利军;勾学荣;;数据挖掘在移动客户流失预测中的研究和应用[A];2008年中国高校通信类院系学术研讨会论文集(上册)[C];2009年
中国博士学位论文全文数据库 前10条
1 赵恒;数据挖掘中聚类若干问题研究[D];西安电子科技大学;2005年
2 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年
3 庞淑英;三江并流带旅游地质景观数据挖掘及旅游价值评价研究[D];昆明理工大学;2008年
4 赵晨;过程控制中的数据挖掘技术研究及其智能控制策略探讨[D];浙江大学;2005年
5 高清东;复杂供矿条件矿山技术指标整体动态优化系统及应用[D];北京科技大学;2005年
6 李兴;高光谱数据库及数据挖掘研究[D];中国科学院研究生院(遥感应用研究所);2006年
7 王玉峰;变电站瞬态电磁环境及微机保护系统EMC研究[D];大连理工大学;2007年
8 潘海天;数据挖掘技术在聚合过程建模与控制的应用研究[D];浙江大学;2003年
9 程其云;基于数据挖掘的电力短期负荷预测模型及方法的研究[D];重庆大学;2004年
10 束志恒;化学化工数据挖掘技术的研究[D];浙江大学;2005年
中国硕士学位论文全文数据库 前10条
1 吴孙丹;基于聚类的入侵检测方法的研究[D];华中科技大学;2007年
2 朱小凡;基于距离的边缘抛弃聚类算法及其在入侵检测中的应用[D];南京理工大学;2007年
3 关心;面向税务稽查选案的数据挖掘研究[D];辽宁工程技术大学;2005年
4 兰妥;基于聚类分析的入侵检测方法研究[D];厦门大学;2009年
5 俞乐克;基于遗传编程的数据挖掘分类和聚类算法的研究与实践[D];华东师范大学;2010年
6 步新玉;基于数据挖掘的智能入侵检测系统研究[D];西安电子科技大学;2009年
7 盛文峰;面向数据挖掘的遗传算法的研究与应用[D];上海交通大学;2007年
8 蔡文君;基于数据挖掘的入侵检测方法研究[D];中南大学;2008年
9 马军;一种聚类方法在入侵检测中的应用[D];电子科技大学;2008年
10 刘剑;改进聚类分析算法及其在成绩分析中的应用研究[D];大连交通大学;2008年
中国重要报纸全文数据库 前10条
1 陈晓 山西财经大学教师;数据挖掘技术在高校教学管理中的应用[N];山西经济日报;2010年
2 记者 吕贤如;大力加强数据挖掘技术研究应用[N];光明日报;2006年
3 主持人 李禾;数据挖掘技术如何驱动经济车轮[N];科技日报;2007年
4 首之;数据挖掘并不神秘[N];金融时报;2006年
5 刘红岩、何军;利用数据挖掘技术获得商业智能[N];中国计算机报;2003年
6 ;IBM公司推出新型数据挖掘技术[N];中国高新技术产业导报;2001年
7 徐扬;如何从数据中“挤出”效益[N];中国计算机报;2002年
8 山西银行学校 王林芳;数据挖掘在银行业务中的应用[N];山西科技报;2005年
9 任中华;财务数据挖掘六步走[N];中国计算机报;2007年
10 ;数据挖掘阻止银行客户流失[N];计算机世界;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978