收藏本站
收藏 | 论文排版

聚类分析中若干关键技术的研究

杨小兵  
【摘要】:基于数据库的知识发现(Knowledge Discovery in Database,简称KDD)是指从大量数据中提取有效的、新颖的、潜在有用的和最终可被理解的模式的非平凡过程。它是一个反复迭代的人机交互处理过程,该过程需要经历多个步骤,主要包括数据整理、数据挖掘(Data Mining)和结果的解释评估。其中数据挖掘是整个KDD过程中最核心的步骤,数据挖掘的目的就是运用特定的数据挖掘算法,从数据库中提取用户感兴趣的知识,并以一定的方式表示出来,如树、表、规则、图等。 聚类分析是数据挖掘的最主要的功能之一,聚类就是将数据对象分组为多个类或簇,在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大。本文将重点研究聚类分析中的若干关键技术和算法。 在第一章中,首先就数据挖掘进行概述,主要讨论数据挖掘的产生、发展以及数据挖掘算法可以实现的功能,主要包括:类/概念描述、关联规则、分类与回归、聚类分析、序列与时序分析以及孤立点分析等。最后给出了本文研究的主要内容和组织结构。 在第二章中,首先介绍了聚类分析的定义,聚类算法的基本要求,以及聚类中用到的主要数据类型;然后讨论了聚类分析的各种算法:划分方法、层次方法、基于密度的方法、基于网格的方法以及基于模型的方法;最后对聚类算法的应用领域进行了探讨。 第三章介绍了模糊集合的基本概念,模糊集合的运算,模糊截集及分解定理,在此基础上,研究了基于模糊关系的模糊聚类及其算法,通过应用FCM算法的实例解释了模糊聚类的应用。 第四章重点研究了高斯混合模型的聚类算法,除了介绍经典的EM算法以外,还讨论了GMDD算法。由于在某些领域,为了更准确地识别出不同性质的数据,人们会根据经验利用加权函数以获得更好的聚类效果,本文以加权似然方程为


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 丁小兵;;改进的聚类分析算法及其在我国高速公路事故预防中的应用[J];沿海企业与科技;2010年06期
2 朱强;;模糊聚类分析及其在数据挖掘中的应用[J];现代计算机;2007年04期
3 余琳;;电信用户呼叫行为的模糊聚类研究[J];电脑知识与技术;2008年14期
4 白瑞祥;李若岩;宋辉;;模糊C-均值聚类分析系统设计与实现[J];天津科技大学学报;2005年04期
5 李良,陈钢;数据挖掘技术——模糊聚类分析在客户关系管理中的应用研究[J];工业控制计算机;2003年08期
6 汤效琴,戴汝源;数据挖掘中聚类分析的技术方法[J];微计算机信息;2003年01期
7 尹鹏飞;张晓丹;;一种基于简单遗传算法的K-Means改进算法[J];吉首大学学报(自然科学版);2009年06期
8 柴旭光;;基于层次迭代思想的聚类算法的研究[J];邢台职业技术学院学报;2011年01期
9 周晓刚;洪春勇;;蚁群聚类算法在客户分类中的应用[J];计算机与现代化;2007年05期
10 邢婷;邢治国;王凤领;;基于信息熵的FCM聚类算法[J];计算机工程与设计;2010年23期
11 周朕;王加阳;;基于用户浏览兴趣模糊聚类研究[J];湖南工业职业技术学院学报;2011年02期
12 张建萍;刘希玉;;聚类分析在儿童发育时期分析中的应用[J];信息技术与信息化;2005年06期
13 袁宝兰;张万军;张智丰;;随机分类算法的实现及与普通遗传算法的比较[J];杭州电子科技大学学报;2007年02期
14 张恒;刘波;陈颖红;于静;;基于SAS聚类分析的用户类型划分[J];科学咨询(决策管理);2010年04期
15 刘放;叶菲;;改进的聚类分析算法在高校人力资源管理中的应用[J];皖西学院学报;2011年02期
16 彭宏玉;柴旭光;陈晓纪;;基于层次迭代思想的聚类算法的研究[J];唐山学院学报;2011年03期
17 魏丽;;数据挖掘中聚类算法比较研究[J];电脑知识与技术(学术交流);2007年21期
18 罗建平;苏志同;;聚类分析在铝电解槽况判断中的应用[J];现代计算机(专业版);2008年01期
19 朱海平;王忠浩;张国军;邵新宇;;基于数据挖掘的通用物料清单重构方法研究[J];计算机集成制造系统;2008年02期
20 林治;;聚类分析在学生成绩管理中的应用探析[J];福建电脑;2009年12期
中国重要会议论文全文数据库 前10条
1 楚红涛;寒枫;张燕;王婷;;基于数据流的挖掘研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
2 于健;陈子军;李霞;李炜;;一种新的多密度聚类算法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
3 潘玉奇;石冰;周劲;袁宁;;基于多维数据模型的聚类分析的研究[A];山东省计算机学会2005年信息技术与信息化研讨会论文集(一)[C];2005年
4 田小丽;郑康锋;钮心忻;;一种基于改进K-Medoids算法的网络攻击检测技术[A];2009通信理论与技术新发展——第十四届全国青年通信学术会议论文集[C];2009年
5 王静;汪晓刚;;一种新的保护原始数据隐私性的聚类算法[A];第十届中国科协年会论文集(三)[C];2008年
6 张昕;彭宏;郑启伦;;基于微粒群算法的聚类分析[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年
7 薛鲁华;张楠;;聚类分析在Web数据挖掘中的应用[A];北京市第十三次统计科学讨论会论文选编[C];2006年
8 刘剑;;基于数据挖掘聚类的节理统计分析方法[A];中国水力发电工程学会第四届地质及勘探专业委员会第一次学术交流会论文集[C];2008年
9 郭学军;陈晓云;;粗集方法在数据挖掘中的应用[A];第十六届全国数据库学术会议论文集[C];1999年
10 岑琴;赵建民;朱信忠;;基于Multi-Agent与数据挖掘的电子商务系统[A];2006年全国理论计算机科学学术年会论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 杨小兵;聚类分析中若干关键技术的研究[D];浙江大学;2005年
2 张瑀;基于实验数据挖掘与细胞自动机的结构分析方法[D];哈尔滨工业大学;2010年
3 王川;基因芯片数据管理及数据挖掘[D];中国科学院研究生院(上海生命科学研究院);2004年
4 孙丽;工艺知识管理及其若干关键技术研究[D];大连交通大学;2005年
5 胡志坤;复杂有色金属熔炼过程操作模式智能优化方法研究[D];中南大学;2005年
6 刘革平;基于数据挖掘的远程学习评价研究[D];西南师范大学;2005年
7 刘寨华;基于临床数据分析的病毒性心肌炎证候演变规律研究[D];黑龙江中医药大学;2006年
8 王涛;挖掘序列模式和结构化模式的精简集[D];华中科技大学;2006年
9 郭斯羽;动态数据中的数据挖掘研究[D];浙江大学;2002年
10 李旭升;贝叶斯网络分类模型研究及其在信用评估中的应用[D];西南交通大学;2007年
中国硕士学位论文全文数据库 前10条
1 郭军华;数据挖掘中聚类分析的研究[D];武汉理工大学;2003年
2 姜伟;基于数据挖掘聚类算法的研究及其应用[D];辽宁工程技术大学;2004年
3 宁绍芬;基于FCM聚类的算法改进[D];中国海洋大学;2007年
4 程灿;基于粒子群算法的模糊聚类研究[D];广西师范大学;2008年
5 涂继亮;基于数据挖掘的智能客户关系管理系统研究[D];哈尔滨理工大学;2005年
6 隋星光;Web用户浏览模式模糊聚类算法的研究[D];哈尔滨工程大学;2005年
7 高晓琴;基于粗糙集和模糊聚类的WEB使用挖掘的研究[D];西南交通大学;2006年
8 胡明文;数据挖掘在建筑结构可靠性鉴定中的应用[D];西安建筑科技大学;2005年
9 王天真;基于神经网络的智能数据挖掘方法及应用研究[D];上海海事大学;2003年
10 于泓漪;道路交通事故原因的聚类分析[D];吉林大学;2005年
中国重要报纸全文数据库 前10条
1 李开宇 黄建军 田长春;把“数据挖掘”作用发挥出来[N];中国国防报;2009年
2 华莱士;“数据挖掘”让银行赢利更多[N];国际金融报;2003年
3 记者 晏燕;数据挖掘让决策者告别“拍脑袋”[N];科技日报;2006年
4 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
5 张立明;数据挖掘之道[N];网络世界;2003年
6 中圣信息技术有限公司 李辉;数据挖掘在CRM中的作用[N];中国计算机报;2001年
7 田红生;数据挖掘在CRM中的应用[N];中国经济时报;2002年
8 王广宇;数据挖掘 加速银行CRM一体化[N];中国计算机报;2004年
9 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
10 张舒博;数据挖掘 提升品牌的好帮手[N];首都建设报;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978