收藏本站
《山东师范大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

数据挖掘中聚类分析算法的研究

王鑫  
【摘要】:随着计算机应用的普及,信息系统产生的数据量日益增大,如何有效地利用巨量的原始数据分析现状和预测未来,己经成为人类面临的一大挑战。由此数据挖掘技术应运而生并得以迅猛发展,这是快速增长的数据量和日益贫乏的信息量之间矛盾运动的必然结果。 数据挖掘(Data Mining),又称为数据库中的知识发现(简称KDD),是从大量数据中提取可信的、新颖的、有效的并能被人们理解的模式的处理过程。数据挖掘是一门新兴的技术,它以数据库技术作为基础,把逻辑学、统计学、机器学习、模糊学、可视化计算等多门学科的成果综合在一起,进行如何从数据库中得到有用信息的研究。数据挖掘技术得到了人们的普遍关注,广泛应用于银行金融、保险、公共设施、政府、教育、远程通讯、软件开发、运输等各个企事业单位及国防科研上。 聚类分析是数据挖掘中的一个重要研究领域。所谓聚类,就是把没有类别标记的样本集按某种准则划分成若干类,使类内样本的相似性尽可能大,而类间样本的相似性尽量小,是一种无监督的学习方法。聚类分析通常是在没有先验知识支持的前提下进行的,它所要解决的就是在这种前提下,实现满足要求的类的聚合。聚类分析的研究主要集中在聚类算法上,产生性能好而且实用的聚类算法是其终极目的。迄今为止,人们提出了很多种不同的适用于数据挖掘的聚类算法,但这些算法仅适用于特定的问题及用户,而且它们在理论和方法上仍不完善,甚至还有严重的不足之处。对聚类算法的进一步优化研究将不仅有助于算法理论的完善,更有助于算法的推广和应用。 本文对数据挖掘技术,尤其是聚类分析进行了较为系统地分析和研究,提出了一些改进的算法,主要包括以下一些内容: (1)数据挖掘技术的概述。介绍了数据挖掘的基本概念、分类、主要功能、关键技术以及典型应用等等。 (2)数据挖掘工具的研究。介绍了进行数据挖掘的常用工具,通过具体实例对当今国际上先进的数据挖掘工具(SPSS和DBMiner)的性能进行了对比,并得出了结论。 (3)聚类分析的综述。本文对数据挖掘领域的聚类分析方法及代表算法进行了分析,提出了数据挖掘对聚类的典型要求,并基于这些要求对数据挖掘中常用的聚类算法作了比较,以便于人们更容易、更快速地选择一种适用于具体问题的聚类算法。
【学位授予单位】:山东师范大学
【学位级别】:硕士
【学位授予年份】:2006
【分类号】:TP311.13

【相似文献】
中国期刊全文数据库 前10条
1 薛福星;;数据挖掘的应用[J];金融经济;2005年20期
2 雷墨林;雷翔宇;;聚类分析在图书馆书籍管理中的应用[J];江西科学;2011年03期
3 刘犇;毛燕琴;沈苏彬;;一种基于数据挖掘技术的入侵检测方法的设计[J];计算机技术与发展;2011年08期
4 肖生苓;牟娌娜;王维;高晓红;;基于数据挖掘技术的超市顾客群研究[J];资源开发与市场;2011年08期
5 刘艳青;;数据挖掘技术在网络课程管理中的应用研究[J];电脑知识与技术;2011年23期
6 冯研;刘薇薇;张兵兵;王馨;;国内图书馆数据挖掘研究及应用的文献计量分析[J];医学信息学杂志;2011年06期
7 金育婵;;数据挖掘技术中基于关联规则算法的研究[J];科技传播;2011年12期
8 张焕国;吕莎;李玮;;C均值算法的电信客户细分研究[J];计算机仿真;2011年06期
9 李晓妹;;数据挖掘在金融欺诈检测中的应用[J];知识经济;2011年13期
10 张邦文;;数据挖掘在财务信息系统中的应用研究[J];电脑知识与技术;2011年20期
中国重要会议论文全文数据库 前10条
1 常郝;周国祥;;基于自组织特征映射神经网络的数据挖掘研究[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年
2 肖健华;吴今培;;数据挖掘技术及其应用实例[A];2001年中国智能自动化会议论文集(下册)[C];2001年
3 金妮;;一种基于数据仓库和OLAP技术的聚类挖掘系统[A];中国仪器仪表学会第九届青年学术会议论文集[C];2007年
4 姚小磊;彭清华;;数据挖掘技术在中医眼科应用的设想[A];中华中医药学会第七次眼科学术交流会论文汇编[C];2008年
5 马洪杰;曲晓飞;;数据挖掘技术和过程的特点[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
6 戈欣;吴晓芬;许建荣;;数据挖掘技术在放射科医疗管理中的潜在作用[A];2009中华医学会影像技术分会第十七次全国学术大会论文集[C];2009年
7 武森;郑锡村;国宏伟;;数据挖掘技术在高炉炉型管理中的应用[A];全国第十届企业信息化与工业工程学术年会论文集[C];2006年
8 刘海存;杨印生;马琨;;基于知识数据挖掘技术的企业聚类研究[A];中国现场统计研究会第十三届学术年会论文集[C];2007年
9 肖一敏;罗树籽;;浅析数据挖掘在报业客户分析中的应用[A];中国新闻技术工作者联合会五届一次理事会暨学术年会论文集(上篇)[C];2009年
10 魏元珍;杨沂凤;;数据挖掘技术及其在数字图书馆中的应用[A];网络信息资源的搜集与应用——全国高校社科信息资料研究会第十次年会论文集[C];2004年
中国重要报纸全文数据库 前10条
1 刘红岩、何军;利用数据挖掘技术获得商业智能[N];中国计算机报;2003年
2 陈晓 山西财经大学教师;数据挖掘技术在高校教学管理中的应用[N];山西经济日报;2010年
3 主持人 李禾;数据挖掘技术如何驱动经济车轮[N];科技日报;2007年
4 记者 吕贤如;大力加强数据挖掘技术研究应用[N];光明日报;2006年
5 首之;数据挖掘并不神秘[N];金融时报;2006年
6 ;IBM公司推出新型数据挖掘技术[N];中国高新技术产业导报;2001年
7 山西银行学校 王林芳;数据挖掘在银行业务中的应用[N];山西科技报;2005年
8 徐扬;如何从数据中“挤出”效益[N];中国计算机报;2002年
9 任中华;财务数据挖掘六步走[N];中国计算机报;2007年
10 ;数据挖掘阻止银行客户流失[N];计算机世界;2007年
中国博士学位论文全文数据库 前10条
1 赵恒;数据挖掘中聚类若干问题研究[D];西安电子科技大学;2005年
2 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年
3 庞淑英;三江并流带旅游地质景观数据挖掘及旅游价值评价研究[D];昆明理工大学;2008年
4 赵晨;过程控制中的数据挖掘技术研究及其智能控制策略探讨[D];浙江大学;2005年
5 高清东;复杂供矿条件矿山技术指标整体动态优化系统及应用[D];北京科技大学;2005年
6 李兴;高光谱数据库及数据挖掘研究[D];中国科学院研究生院(遥感应用研究所);2006年
7 王玉峰;变电站瞬态电磁环境及微机保护系统EMC研究[D];大连理工大学;2007年
8 潘海天;数据挖掘技术在聚合过程建模与控制的应用研究[D];浙江大学;2003年
9 程其云;基于数据挖掘的电力短期负荷预测模型及方法的研究[D];重庆大学;2004年
10 束志恒;化学化工数据挖掘技术的研究[D];浙江大学;2005年
中国硕士学位论文全文数据库 前10条
1 王晋;数据挖掘技术在电信企业客户关系管理中的应用研究[D];兰州理工大学;2007年
2 胡曼;交叉销售在中国保险业的应用分析[D];山东大学;2009年
3 谭华琴;基于蚁群算法的数据挖掘方法研究[D];武汉理工大学;2006年
4 张智钦;基于数据挖掘的客户细分研究[D];暨南大学;2007年
5 汪瑛;数据挖掘在燃气系统中的应用研究[D];南京理工大学;2009年
6 曹丹阳;数据挖掘在教务系统中的应用研究[D];北方工业大学;2006年
7 宋宝亚;基于数据挖掘的信息过滤系统的设计与实现[D];山东师范大学;2006年
8 蔡春丽;数据流挖掘中聚类算法的研究与实现[D];哈尔滨工程大学;2007年
9 李翼;数据挖掘技术在高校人力资源管理中的应用[D];兰州商学院;2007年
10 王洪艳;基于聚类的数据挖掘技术在CRM中的研究与应用[D];武汉大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026