收藏本站
《西安电子科技大学》 2003年
收藏 | 手机打开
二维码
手机客户端打开本文

数据挖掘中分类属性数据聚类研究

赵恒  
【摘要】: 现代数据库和网络技术的发展,使得人们面对的数据量以惊人的速度增长,为了获取有价值的信息,提出了数据挖掘技术。发展自统计学的聚类分析已成为数据挖掘中的一个十分活跃的研究领域。本文详细介绍了数据挖掘技术,包括数据挖掘的研究内容,任务和功能,数据挖掘的一般过程,数据挖掘的常用工具,主要应用领域和发展趋势。在此基础上对数挖掘中的聚类分析作以详细地论述,总结了数挖掘中聚类分析的方法和特点,并对聚类结果的评价方法进行了讨论,重点讨论了分类属性数据聚类,具体研究了k-modes 算法及其变形,并指出了它们的优缺点。主要探讨了模糊k-modes聚类结果与原始数据的分类结构的对比方法,对现有的精确度定义和计算方法进行修正,在划分相似度的基础上,重新定义模糊k-modes聚类精确度。应用进化策略对属性进行加权,改进了fuzzy k-modes算法,以基于划分相似度的聚类精确度为聚类结果的评价准则,进行实验分析,获得了较好的聚类效果。
【学位授予单位】:西安电子科技大学
【学位级别】:硕士
【学位授予年份】:2003
【分类号】:TP311.13

【引证文献】
中国硕士学位论文全文数据库 前5条
1 孟美芝;面向源代码挖掘的聚类算法研究[D];西北农林科技大学;2010年
2 张艳丽;基于综合度量的划分聚类研究[D];安徽大学;2011年
3 齐战胜;数据挖掘技术在计算机犯罪取证中的应用[D];内蒙古科技大学;2011年
4 郑明超;数据挖掘技术中分类算法的比较分析[D];兰州商学院;2007年
5 齐战胜;数据挖掘技术在计算机犯罪取证中的应用[D];内蒙古科技大学;2011年
【参考文献】
中国期刊全文数据库 前1条
1 陈宁,陈安,周龙骧;数值型和分类型混合数据的模糊K-Prototypes聚类算法(英文)[J];软件学报;2001年08期
中国硕士学位论文全文数据库 前1条
1 吴强;基于数据挖掘的入侵检测系统[D];西安电子科技大学;2002年
【共引文献】
中国期刊全文数据库 前10条
1 吴大宏,赵人达;基于遗传算法与神经网络的桥梁结构健康监测系统研究初探[J];四川建筑科学研究;2002年03期
2 郑浩,王全凤;L-M算法在高层结构体系选型中的应用[J];四川建筑科学研究;2003年03期
3 张世海,刘晓燕,欧进萍;高层结构智能选型知识发现及方法比较[J];四川建筑科学研究;2005年05期
4 张安勤;数据挖掘与进化算法[J];安徽教育学院学报;2002年03期
5 潘洁珠;半结构化数据及其数据模型[J];安徽教育学院学报;2003年06期
6 徐文婷;李承鹏;;基于自适应遗传算法的离散化方法[J];合肥师范学院学报;2011年03期
7 程家兴,陈万里;列车控制问题的计算分析及自适应算法[J];安徽大学学报(自然科学版);2002年02期
8 赵鹏,倪志伟,贾瑞玉;基于数据挖掘技术的范例库维护[J];安徽大学学报(自然科学版);2003年02期
9 蔡莉;胡学钢;;一种基于粗集的决策表求核算法[J];安徽大学学报(自然科学版);2007年06期
10 周玉华;李景杰;;不完备决策表的一种属性约简方法[J];安徽大学学报(自然科学版);2009年04期
中国重要会议论文全文数据库 前10条
1 杨益;方潜生;汪力君;;基于Handel-C的数字芯片的设计方法研究与实现[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 章曙光;;基于CBR的电力负荷预测系统的研究与实现[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
3 胡杨林;蒋洁琼;王明煌;曾勤;邱岳峰;邹俊;陈红丽;FDS team;;聚变裂变混合堆长寿命锕系废料嬗变处理的中子学优化分析[A];安徽新能源技术创新与产业发展博士科技论坛论文集[C];2010年
4 危前进;董荣胜;孟瑜;崔更申;;基于粗糙集的机械装配知识发现方法[A];广西计算机学会25周年纪念会暨2011年学术年会论文集[C];2011年
5 ;Fuzziness in Covering Generalized Rough Sets[A];第二十六届中国控制会议论文集[C];2007年
6 李雄;党生;;基于Rough集理论的战场侦察情报处理[A];第二十六届中国控制会议论文集[C];2007年
7 孙燕;孙峥;黄鹍;;基于模拟退火机制的隔离小生境混合遗传算法[A];第二十六届中国控制会议论文集[C];2007年
8 孙燕;孙峥;;利用正交遗传算法优化交通检测点分布[A];第二十六届中国控制会议论文集[C];2007年
9 郭玉堂;刘路路;;基于佳点集遗传算法的边缘检测[A];第二十七届中国控制会议论文集[C];2008年
10 刘向;邹逢兴;张湘平;高政;;面向节能的混合流水车间调度方法的研究[A];第二十七届中国控制会议论文集[C];2008年
中国博士学位论文全文数据库 前10条
1 王杰;基于人工智能的乒乓球比赛技战术诊断与评估研究[D];上海体育学院;2010年
2 张泽宝;空间数据库的索引技术研究[D];哈尔滨工程大学;2009年
3 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
4 姜延吉;多传感器数据融合关键技术研究[D];哈尔滨工程大学;2010年
5 牟向伟;模糊语义个性化推荐系统在电子政务中的应用研究[D];大连海事大学;2010年
6 时长江;豆科类杂草种子图像识别系统研究[D];中国海洋大学;2009年
7 全惠敏;电能质量相关信号的S变换检测算法及应用研究[D];湖南大学;2010年
8 韩艳玲;可能性构造空间理论与计算机作曲思维模型研究[D];华中科技大学;2010年
9 朱松;随机回归神经网络的动力学行为研究[D];华中科技大学;2010年
10 彭北青;第三方物流配送车辆路径问题模型及算法研究[D];华中科技大学;2009年
中国硕士学位论文全文数据库 前10条
1 何慧娟;基于多传感器的移动机器人障碍物检测与定位研究[D];安徽工程大学;2010年
2 赫英毅;毫米波段基于TE_(21)模差网络设计[D];中国工程物理研究院;2009年
3 万成;动态环境下的元胞遗传算法研究[D];南昌航空大学;2010年
4 李坤;参数参与进化的自适应遗传算法研究[D];南昌航空大学;2010年
5 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
6 吴香庭;基于遗传算法的K-means聚类方法的研究[D];山东科技大学;2010年
7 王辉;基于改进遗传算法的物流配送路径优化研究[D];山东科技大学;2010年
8 纪二云;基于改进遗传算法的电力系统无功优化的研究[D];山东科技大学;2010年
9 施晓坤;煤炭企业人才结构优化[D];山东科技大学;2010年
10 滕景忠;智能瓦斯传感器的研制[D];山东科技大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 赵姝,张燕平,张铃,张媛,陈传明;覆盖聚类算法[J];安徽大学学报(自然科学版);2005年02期
2 李翠霞,于剑;一种模糊聚类算法归类的研究[J];北京交通大学学报;2005年02期
3 徐晓霞;李金林;;基于决策树法的我国商业银行信用风险评估模型研究[J];北京理工大学学报(社会科学版);2006年03期
4 邵锐,巫兆聪,钟世明;基于粗糙集的K-均值聚类算法在图像分割中的应用[J];测绘信息与工程;2005年05期
5 康松林,费洪晓;数据挖掘的软分类方法[J];长沙铁道学院学报;2001年03期
6 查志琴;高波;;基于Web搜索的数据挖掘系统的研究与实现[J];常州工学院学报;2011年01期
7 王宇,杨莉;模糊k-prototypes聚类算法的一种改进算法[J];大连理工大学学报;2003年06期
8 王开;谭翼;周兰江;;JAVA中反射机制浅析及应用[J];电脑知识与技术(学术交流);2007年01期
9 魏丽;;数据挖掘中聚类算法比较研究[J];电脑知识与技术(学术交流);2007年21期
10 李树林;唐俊;;计算机犯罪与计算机犯罪取证技术发展的研究[J];电脑知识与技术;2008年34期
中国重要会议论文全文数据库 前1条
1 徐伟;张军;;关联规则在犯罪行为分析中的应用研究[A];第十届中国科协年会论文集(三)[C];2008年
中国博士学位论文全文数据库 前3条
1 李仁璞;分类数据挖掘中若干基本问题的研究[D];天津大学;2003年
2 王莉;数据挖掘中聚类方法的研究[D];天津大学;2004年
3 杨小兵;聚类分析中若干关键技术的研究[D];浙江大学;2005年
中国硕士学位论文全文数据库 前10条
1 刘振岩;数据挖掘分类算法的研究与应用[D];首都师范大学;2003年
2 焦瑾;基于数据挖掘的商业银行个人客户细分系统分析与设计[D];西南财经大学;2003年
3 袁奎军;决策树中基于贝叶斯定理提取异常规则[D];中国海洋大学;2003年
4 张静;决策树分类方法及其在铁路客票营销分析中的应用[D];郑州大学;2003年
5 黄小兰;基于决策树的分类算法及实现[D];西南石油学院;2003年
6 郭军华;数据挖掘中聚类分析的研究[D];武汉理工大学;2003年
7 金可仲;数据挖掘在计算机取证分析中的应用研究及系统设计[D];浙江工业大学;2004年
8 文专;基于神经网络的分类数据挖掘属性选择和规则抽取研究[D];天津大学;2004年
9 姜卯生;数据挖掘中基于贝叶斯技术的分类问题的研究[D];合肥工业大学;2004年
10 钟秀玉;计算机取证技术研究[D];广东工业大学;2004年
【二级引证文献】
中国期刊全文数据库 前1条
1 史众;陈立平;陈天恩;;决策树在精准农业中的应用现状与发展趋势[J];北方园艺;2011年16期
中国硕士学位论文全文数据库 前9条
1 陈起;电信行业针对性营销系统研究与开发[D];湖南大学;2009年
2 张煜辉;数据挖掘和SPC在生产过程质量控制中应用研究[D];上海交通大学;2009年
3 刘慧;AFS模糊逻辑在分类器设计中的应用[D];大连理工大学;2008年
4 高珊;金融中心竞争力评价及实证研究[D];天津科技大学;2009年
5 马江;数据挖掘技术在保险公司客户流失预测中的应用研究[D];西安理工大学;2010年
6 王娟;联通某地市分公司用户流失分析及对策研究[D];北京邮电大学;2010年
7 王丹丹;多层次序列模式挖掘及在抽油机井状态诊断中的应用研究[D];东北石油大学;2012年
8 刘诚;蛋白质相互作用界面中热点残基预测方法的研究[D];武汉科技大学;2012年
9 李鑫鑫;聚类算法在电子商务客户细分中的应用研究[D];中国海洋大学;2012年
【二级参考文献】
中国期刊全文数据库 前1条
1 李之棠,杨红云;模糊入侵检测模型[J];计算机工程与科学;2000年02期
【相似文献】
中国期刊全文数据库 前10条
1 胡学钢;周循;张晶;张润梅;;基于多重多层次关系的分类属性泛化研究[J];合肥工业大学学报(自然科学版);2008年09期
2 赵恒,杨万海;基于属性加权的模糊K-Modes聚类算法[J];系统工程与电子技术;2003年10期
3 陈涛;陈启买;张玮;郭小林;;聚类算法在学分制下高校专业自动分类中的应用[J];计算机应用与软件;2007年05期
4 万晓燕;徐国庆;;分类算法在酒店CRM中的应用[J];中国水运(学术版);2007年01期
5 郭帆;叶继华;余敏;;基于IDMEF和分类的报警聚合[J];计算机应用;2008年01期
6 蒋盛益;李庆华;;一种增强的k-means聚类算法[J];计算机工程与科学;2006年11期
7 王敏;林庆;;聚类在合作学习分组中的应用[J];计算机与现代化;2008年10期
8 王苗;柴瑞敏;;一种改进的决策树分类属性选择方法[J];计算机工程与应用;2010年08期
9 甘丽;王欣唐;;数据挖掘中的聚类分析研究[J];沿海企业与科技;2008年03期
10 张伟;周霆;陈芸;邹汉斌;;动态的模糊K-Modes初始化算法[J];计算机工程与设计;2006年04期
中国重要会议论文全文数据库 前10条
1 郭学军;陈晓云;;粗集方法在数据挖掘中的应用[A];第十六届全国数据库学术会议论文集[C];1999年
2 徐慧;;基于Web的文献数据挖掘[A];第十七届全国数据库学术会议论文集(技术报告篇)[C];2000年
3 孙迎;;医院信息的数据挖掘与方法研究[A];中华医学会第十次全国医学信息学术会议论文汇编[C];2004年
4 薛晓东;李海玲;;数据挖掘的客户关系管理应用[A];科技、工程与经济社会协调发展——河南省第四届青年学术年会论文集(下册)[C];2004年
5 郭建文;黄燕;印鉴;杨小波;梁兆辉;;建立中风病“阴阳类证”辨证规范的数据挖掘研究[A];中华医学会第十三次全国神经病学学术会议论文汇编[C];2010年
6 薛鲁华;张楠;;聚类分析在Web数据挖掘中的应用[A];北京市第十三次统计科学讨论会论文选编[C];2006年
7 朱扬勇;黄超;;基于多维模型的交互式数据挖掘框架[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
8 陈涛;胡学钢;陈秀美;;基于数据挖掘的教学质量评价体系分析[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
9 王星;谢邦昌;戴稳胜;;数据挖掘在保险业中的应用[A];北京市第十二次统计科学讨论会论文选编[C];2003年
10 郭建文;黄燕;印鉴;杨小波;梁兆辉;;建立中风病阴阳类证辨证规范的数据挖掘研究[A];2010中国医师协会中西医结合医师大会摘要集[C];2010年
中国重要报纸全文数据库 前10条
1 李开宇 黄建军 田长春;把“数据挖掘”作用发挥出来[N];中国国防报;2009年
2 华莱士;“数据挖掘”让银行赢利更多[N];国际金融报;2003年
3 记者 晏燕;数据挖掘让决策者告别“拍脑袋”[N];科技日报;2006年
4 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
5 张立明;数据挖掘之道[N];网络世界;2003年
6 中圣信息技术有限公司 李辉;数据挖掘在CRM中的作用[N];中国计算机报;2001年
7 田红生;数据挖掘在CRM中的应用[N];中国经济时报;2002年
8 王广宇;数据挖掘 加速银行CRM一体化[N];中国计算机报;2004年
9 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
10 张舒博;数据挖掘 提升品牌的好帮手[N];首都建设报;2009年
中国博士学位论文全文数据库 前10条
1 孙丽;工艺知识管理及其若干关键技术研究[D];大连交通大学;2005年
2 胡志坤;复杂有色金属熔炼过程操作模式智能优化方法研究[D];中南大学;2005年
3 刘革平;基于数据挖掘的远程学习评价研究[D];西南师范大学;2005年
4 刘寨华;基于临床数据分析的病毒性心肌炎证候演变规律研究[D];黑龙江中医药大学;2006年
5 王川;基因芯片数据管理及数据挖掘[D];中国科学院研究生院(上海生命科学研究院);2004年
6 王涛;挖掘序列模式和结构化模式的精简集[D];华中科技大学;2006年
7 郭斯羽;动态数据中的数据挖掘研究[D];浙江大学;2002年
8 李旭升;贝叶斯网络分类模型研究及其在信用评估中的应用[D];西南交通大学;2007年
9 刘东升;面向连锁零售企业的客户关系管理模型(R-CRM)研究[D];浙江工商大学;2008年
10 余红;网络时政论坛舆论领袖研究[D];华中科技大学;2007年
中国硕士学位论文全文数据库 前10条
1 赵恒;数据挖掘中分类属性数据聚类研究[D];西安电子科技大学;2003年
2 周循;基于领域知识的面向分类的属性泛化研究[D];合肥工业大学;2008年
3 郑锦良;基于粗糙集合理论的决策树优化方法研究[D];合肥工业大学;2009年
4 廖赛恩;养生方数据挖掘分析系统的研制[D];湖南中医药大学;2010年
5 李坤然;数据挖掘在股市趋势预测的应用研究[D];中南林业科技大学;2008年
6 郑宏;数据挖掘可视化技术的研究与实现[D];西安电子科技大学;2010年
7 杜金刚;数据挖掘在电信客户关系管理及数据业务营销中的应用[D];北京邮电大学;2010年
8 徐路;基于决策树的数据挖掘算法的研究及其在实际中的应用[D];电子科技大学;2009年
9 王鹏;数据挖掘在高校困难生认定中的应用研究[D];东北师范大学;2011年
10 梁小鸥;数据挖掘在高职教学管理中的应用[D];华南理工大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026