收藏本站
《西安电子科技大学》 2005年
收藏 | 手机打开
二维码
手机客户端打开本文

数据挖掘中聚类若干问题研究

赵恒  
【摘要】:数据挖掘是为了满足人们对数据中所蕴涵的信息和知识的充分理解和有效应用而发展起来的一门新兴技术。数据库、人工智能和数理统计是知识发现和数据挖掘的三个强大的技术支柱。发展自统计学的聚类分析作为数据挖掘的一项主要功能和任务,成为数据挖掘中的一个重要的研究领域,至今已提出了大量的理论和方法,取得了丰硕的研究成果。尽管如此,聚类中还存在许多问题,尤其随着数据挖掘技术的广泛应用,数据挖掘所面对的数据对象日趋复杂,聚类研究也面临更多新的内容和挑战。这就要求对现有聚类技术进行改进,同时不断提出新的聚类理论和方法以适应新的应用。 本文对聚类有效性问题,迭代优化聚类的初始化问题,分类属性数据聚类算法及高维数据聚类方法进行了较为深入的研究,主要内容如下: 第一章简单介绍了数据挖掘技术和数据挖掘中的聚类分析的特点,详细论述了聚类有效性问题、迭代优化聚类的初始化、分类属性数据聚类方法以及高维数据聚类的研究现状,最后介绍了本文的主要研究工作成果及内容安排。 第二章介绍了数据挖掘中的聚类分析,包括聚类分析的数据结构和数据类型,聚类准则的确定,聚类算法的分类,并详细论述了数据挖掘中用到的主要聚类算法,最后对聚类结果的评价方法进行了简要介绍。 第三章主要研究聚类有效性函数。首先介绍了模糊聚类的划分系数与划分熵,研究了基于几何结构的聚类有效性函数,从聚类的“紧致度”和“分离度”角度出发,提出了一种新的基于几何结构的加性聚类有效性函数;研究了改进的HubertГ统计量,将其与聚类分离度相结合,提出了一种基于HubertГ统计量和分离度的聚类有效性函数。此外,研究了聚类算法的实验结果的评价,指出了现有聚类结果评价方法的不足,阐明了聚类精确度是反映聚类效率的观点,用FowlkesMallows划分相似测度作为聚类精确度,来评价后续章节中聚类算法的实验结果。 第四章研究了现有的迭代优化聚类的初始化方法:即采样法,距离优化法以及密度估计法,分析了它们的优缺点,提出一种新的基于距离的初始化方法,它不需要设定门限,不受数据集的顺序影响,而且对孤立点和噪声有较强的抑制,适用于较大规模数据的聚类初始化;分析了对初值不敏感的k-harmonicmeans算法,提出了模糊k-harmonic means算法,并导出了该算法在中心迭代统一框架下的描述。 第五章研究了k-modes、k-prototypes和fuzzy k-modes聚类算法,通过仿真讨论了k-prototypes算法的性能;在新的差异度函数的基础上提出了一种新的
【学位授予单位】:

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 魏晓云;;基于数据挖掘的CRM分析[J];电脑知识与技术(学术交流);2007年09期
2 李良,陈钢;数据挖掘技术——模糊聚类分析在客户关系管理中的应用研究[J];工业控制计算机;2003年08期
3 方喜峰,吴洪涛,赵良才;基于数据挖掘的计算机辅助质量功能配置应用与研究[J];华东船舶工业学院学报(自然科学版);2005年05期
4 ;基于模糊聚类的网络文本数据检测方法[J];技术与市场;2011年07期
5 李剑锋,李一军,祁威,金世伟;数据挖掘在公司财务分析中的应用[J];计算机工程与应用;2005年02期
6 高新波;李洁;谢维信;;模糊c均值聚类算法中参数m的优选[J];模式识别与人工智能;2000年01期
7 郑小松,王绍霖;基于最优分类系数及分类熵准则的模糊c均值聚类算法[J];电子学报;1994年07期
8 黄晨;胡红云;蒋安东;谢俊元;;分布式安全审计系统设计与实现[J];计算机工程与设计;2007年04期
9 冯春辉;;Web日志挖掘在网络教学中的应用研究[J];计算机技术与发展;2010年06期
10 刘云龙;林宝军;;一种人工免疫算法优化的高有效性模糊聚类图像分割[J];控制与决策;2010年11期
11 余琳;;电信用户呼叫行为的模糊聚类研究[J];电脑知识与技术;2008年14期
12 刘秀峰 ,詹秀菊;面向电子商务的数据挖掘技术[J];现代通信;2003年06期
13 孙京兰;;OLAP技术及数据挖掘 技术[J];中文信息;2003年04期
14 冯进;利用数据挖掘技术 深入挖掘图书馆工作[J];现代情报;2005年03期
15 王小燕;数据挖掘技术在超市中的应用研究[J];商场现代化;2005年05期
16 方忠祥,屠立;数据挖掘技术在客户关系管理中的应用研究[J];机床与液压;2005年06期
17 龙腾芳;数据挖掘技术在农业领域中的应用研究[J];微计算机信息;2005年08期
18 周勇;数据挖掘技术发展综述[J];中国科技信息;2005年16期
19 徐守军,高波,甄蓓,彭奕,王东根,王玉民,吴乐山;数据挖掘技术在科研管理中应用前景初探[J];中华医学科研管理杂志;2005年04期
20 张特来,刘万军;数据挖掘在医学领域的应用研究[J];自动化技术与应用;2005年10期
中国重要会议论文全文数据库 前10条
1 马洪杰;曲晓飞;;数据挖掘技术和过程的特点[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
2 戈欣;吴晓芬;许建荣;;数据挖掘技术在放射科医疗管理中的潜在作用[A];2009中华医学会影像技术分会第十七次全国学术大会论文集[C];2009年
3 魏元珍;杨沂凤;;数据挖掘技术及其在数字图书馆中的应用[A];网络信息资源的搜集与应用——全国高校社科信息资料研究会第十次年会论文集[C];2004年
4 肖健;沈彩霞;;浅谈数据挖掘技术现状[A];广西计算机学会2008年年会论文集[C];2008年
5 巩耀亮;邱晓东;孙丽君;李树强;;数据挖掘技术在企业竞争情报系统中的应用研究[A];信息时代——科技情报研究学术论文集(第三辑)[C];2008年
6 王洪锋;;数据挖掘在客户关系管理中的应用研究[A];河南省通信学会2005年学术年会论文集[C];2005年
7 白亚男;任广伟;;一种基于孤立点挖掘的网络入侵系统[A];2009全国计算机网络与通信学术会议论文集[C];2009年
8 姚小磊;彭清华;;数据挖掘技术在中医眼科应用的设想[A];中华中医药学会第七次眼科学术交流会论文汇编[C];2008年
9 张婧;;数据挖掘技术在进销存系统中的应用[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
10 杨利军;勾学荣;;数据挖掘在移动客户流失预测中的研究和应用[A];2008年中国高校通信类院系学术研讨会论文集(上册)[C];2009年
中国重要报纸全文数据库 前10条
1 陈晓 山西财经大学教师;数据挖掘技术在高校教学管理中的应用[N];山西经济日报;2010年
2 记者 吕贤如;大力加强数据挖掘技术研究应用[N];光明日报;2006年
3 主持人 李禾;数据挖掘技术如何驱动经济车轮[N];科技日报;2007年
4 首之;数据挖掘并不神秘[N];金融时报;2006年
5 ;IBM公司推出新型数据挖掘技术[N];中国高新技术产业导报;2001年
6 刘红岩、何军;利用数据挖掘技术获得商业智能[N];中国计算机报;2003年
7 山西银行学校 王林芳;数据挖掘在银行业务中的应用[N];山西科技报;2005年
8 任中华;财务数据挖掘六步走[N];中国计算机报;2007年
9 诺达咨询高级咨询顾问 周连升;数据挖掘拓展3G增值空间[N];通信产业报;2007年
10 徐扬;如何从数据中“挤出”效益[N];中国计算机报;2002年
中国博士学位论文全文数据库 前10条
1 赵恒;数据挖掘中聚类若干问题研究[D];西安电子科技大学;2005年
2 范九伦;模糊聚类新算法与聚类有效性问题研究[D];西安电子科技大学;1998年
3 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年
4 庞淑英;三江并流带旅游地质景观数据挖掘及旅游价值评价研究[D];昆明理工大学;2008年
5 赵晨;过程控制中的数据挖掘技术研究及其智能控制策略探讨[D];浙江大学;2005年
6 高清东;复杂供矿条件矿山技术指标整体动态优化系统及应用[D];北京科技大学;2005年
7 李兴;高光谱数据库及数据挖掘研究[D];中国科学院研究生院(遥感应用研究所);2006年
8 王玉峰;变电站瞬态电磁环境及微机保护系统EMC研究[D];大连理工大学;2007年
9 潘海天;数据挖掘技术在聚合过程建模与控制的应用研究[D];浙江大学;2003年
10 程其云;基于数据挖掘的电力短期负荷预测模型及方法的研究[D];重庆大学;2004年
中国硕士学位论文全文数据库 前10条
1 沈世铭;数据挖掘技术在入侵检测中的研究[D];天津工业大学;2007年
2 徐建军;医院信息系统中的数据挖掘技术研究[D];浙江大学;2006年
3 王羽婷;聚类挖掘研究及其在隧道病害评价中的应用[D];北京交通大学;2007年
4 曾庆花;模糊关联的数据挖掘技术在IDS中的应用[D];曲阜师范大学;2007年
5 方元康;基于模糊聚类的Web日志挖掘研究[D];合肥工业大学;2008年
6 鲍正益;模糊聚类算法及其有效性研究[D];厦门大学;2006年
7 高晓琴;基于粗糙集和模糊聚类的WEB使用挖掘的研究[D];西南交通大学;2006年
8 陈静;基于商业智能的数据挖掘的研究[D];贵州大学;2008年
9 闫飞;聚类算法研究及其在移动客户流失管理中的应用[D];长春理工大学;2010年
10 刘园园;构建基于数据挖掘技术的水平井产能预测模型[D];中国石油大学;2007年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978