收藏本站
《长沙理工大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

基于遗传算法和粗糙集的聚类算法研究

洪亮亮  
【摘要】:随着计算机技术和数据库技术的快速发展,在各个领域里都产生了大量的数据,海量的数据背后隐藏着许多重要信息,人们希望能够分析数据,提取出对人们有用的知识。数据挖掘应运而生,它是目前数据库和信息决策领域最前沿的研究方向之一。聚类分析作为数据挖掘的一个重要分支,其基本目的是通过分析数据间的相似性来发现目标的自然分组特性。 本文探讨了基于遗传算法和粗糙集的聚类算法及其增量算法,探讨了针对分类型数据的聚类算法。本文主要研究工作如下: 1.分析了现有粗糙K-means聚类算法的优缺点,根据遗传算法的遗传进化以及最大最小距离算法思想,提出了一种优化粗糙K-means的方法,该算法能动态且非随机的确定初始中心点,同时能很好地处理边界对象。实验结果表明了该算法的有效性和正确性。 2.分析了现有非增量式粗糙聚类算法的优缺点,根据增量式思想及近邻思想,提出了一种增量式聚类方法。实验表明,该算法能充分利用前次挖掘结果,提高原有聚类信息的利用率及聚类效率,同时也能处理动态环境下和大的数据集。 3.提出了一种有效的处理分类型数据的聚类方法,该方法将K-means算法扩展到分类型数据域,克服了传统K-means算法只限于处理数值型数据的缺点。该方法根据与每个分类属性的每个值相关的数据分布信息,同时结合数据的纵向与横向分布来评价数据对象与类之间的差异性,提出了一种新的度量。实验表明,该算法能发现同一属性的不同值间的内在关系,并能有效地度量对象间的差异性。
【学位授予单位】:长沙理工大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP18;TP311.13

手机知网App
【引证文献】
中国硕士学位论文全文数据库 前2条
1 孟颖;基于蚁群优化的聚类算法分析与研究[D];长沙理工大学;2012年
2 黄细妹;基于决策树算法的文本图像分类方法研究[D];江西理工大学;2012年
【参考文献】
中国期刊全文数据库 前10条
1 罗敏,王丽娜,张焕国;基于无监督聚类的入侵检测方法[J];电子学报;2003年11期
2 付宁;乔立岩;彭喜元;;基于改进K-means聚类和霍夫变换的稀疏源混合矩阵盲估计算法[J];电子学报;2009年S1期
3 冯征;;一种基于粗糙集的K-Means聚类算法[J];计算机工程与应用;2006年20期
4 周涛;;具有自适应参数的粗糙k-means聚类算法[J];计算机工程与应用;2010年26期
5 岳嵚;冯珊;;遗传算法的计算性能的统计分析[J];计算机学报;2009年12期
6 王康;颜雪松;金建;占志刚;;一种改进的遗传K-均值聚类算法[J];计算机与数字工程;2010年01期
7 陈寿文;李明东;;遗传聚类算法改进及其仿真[J];计算机应用与软件;2010年09期
8 李军华;黎明;袁丽华;;基于聚类的伪并行遗传算法[J];模式识别与人工智能;2009年02期
9 庄健;杨清宇;杜海峰;于德弘;;一种高效的复杂系统遗传算法[J];软件学报;2010年11期
10 宋砚;刘安安;张勇东;林守勋;;基于聚类的视频字幕提取方法[J];通信学报;2009年02期
中国博士学位论文全文数据库 前1条
1 马昕;粗糙集理论在数据挖掘领域中的应用[D];浙江大学;2003年
中国硕士学位论文全文数据库 前2条
1 吴东芳;基于粗糙集的增量式数据挖掘技术的研究[D];大连交通大学;2005年
2 陆英贤;移动通信企业客户细分方法研究[D];大连理工大学;2007年
【共引文献】
中国期刊全文数据库 前10条
1 徐文婷;李承鹏;;基于自适应遗传算法的离散化方法[J];合肥师范学院学报;2011年03期
2 蔡莉;胡学钢;;一种基于粗集的决策表求核算法[J];安徽大学学报(自然科学版);2007年06期
3 周玉华;李景杰;;不完备决策表的一种属性约简方法[J];安徽大学学报(自然科学版);2009年04期
4 杨萍,万上海,陈耿;一种基于可变支持度的缺省规则挖掘算法[J];安徽工程科技学院学报(自然科学版);2004年02期
5 孙全玲;基于粗集和神经网络的建模方法研究[J];安徽建筑工业学院学报(自然科学版);2005年02期
6 孙虹;方敏;;基于Rough集和RBF网络的车牌字符识别方法[J];安徽建筑工业学院学报(自然科学版);2006年04期
7 孙虹;;粗糙集神经网络系统在车牌字符识别中的研究[J];安徽建筑工业学院学报(自然科学版);2007年04期
8 邓胜;戴小鹏;陈垦;黄璜;;粗糙集理论在农业生物灾害预测中的应用[J];安徽农业科学;2010年06期
9 刁占峰;张丹;张同军;;基于粗集-模糊综合评价法的水质指标约简研究[J];安徽农业科学;2010年26期
10 夏春艳;宋志超;张伟;;数据挖掘技术在农作物灾害预测中的应用[J];安徽农业科学;2011年08期
中国重要会议论文全文数据库 前10条
1 危前进;董荣胜;孟瑜;崔更申;;基于粗糙集的机械装配知识发现方法[A];广西计算机学会25周年纪念会暨2011年学术年会论文集[C];2011年
2 ;Fuzziness in Covering Generalized Rough Sets[A];第二十六届中国控制会议论文集[C];2007年
3 李雄;党生;;基于Rough集理论的战场侦察情报处理[A];第二十六届中国控制会议论文集[C];2007年
4 陈楚湘;沈建京;陈冰;尚长兴;王运成;;运用粗糙集理论建立中老年肺炎中医症候诊断标准[A];第二十九届中国控制会议论文集[C];2010年
5 龚锦红;杨辉;衷路生;;稀土萃取分离过程的Rough集案例推理方法[A];第二十九届中国控制会议论文集[C];2010年
6 ;Influence Diagram Based on Rough Set Theory[A];第二十九届中国控制会议论文集[C];2010年
7 ;The Prediction of Soil Moisture Based on Rough Set-Neural Network Model[A];第二十九届中国控制会议论文集[C];2010年
8 杨青;刘晔;张东旭;刘畅;;快速查找最优初始聚类数K的改进K-means算法[A];中国自动化学会控制理论专业委员会A卷[C];2011年
9 陈楚湘;沈建京;陈冰;尚长兴;王运成;;运用粗糙集理论和Apriori算法建立中医症候诊断标准[A];中国自动化学会控制理论专业委员会D卷[C];2011年
10 李友元;寇纲;施宇;陆晨;石勇;;基于组合熵权TOPSIS方法的山东省外商直接投资区位选择分析[A];经济全球化与系统工程——中国系统工程学会第16届学术年会论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
2 姜延吉;多传感器数据融合关键技术研究[D];哈尔滨工程大学;2010年
3 李桃迎;交通领域中的聚类分析方法研究[D];大连海事大学;2010年
4 张目;高技术企业信用风险影响因素及评价方法研究[D];电子科技大学;2010年
5 苏煜;基于SCF范式的在线P300脑机接口研究[D];浙江大学;2010年
6 郭戈;数字视频语义信息提取与分析[D];解放军信息工程大学;2010年
7 温世亿;膨胀土渠坡若干关键技术问题研究[D];武汉大学;2010年
8 黄正行;临床过程分析与优化技术研究[D];浙江大学;2010年
9 戴小鹏;知识网格及其在农业生物灾害预警中关键技术研究[D];湖南农业大学;2010年
10 朱佳俊;不确定可拓群决策优化方法及应用[D];东华大学;2010年
中国硕士学位论文全文数据库 前10条
1 岳海亮;信息论在粗糙集连续属性离散化中的应用[D];辽宁师范大学;2010年
2 张晓冬;基于全矢谱的智能诊断技术研究[D];郑州大学;2010年
3 李昕哲;关系邻域系统的属性约简[D];郑州大学;2010年
4 刘琪;正态云模型模糊推理系统及其应用研究[D];郑州大学;2010年
5 尹丽玲;基于人工免疫算法的Web文本挖掘研究[D];哈尔滨工程大学;2010年
6 方超;木材缺陷的图像检测技术[D];哈尔滨工程大学;2010年
7 冯为军;基于粗糙集理论的数据挖掘算法的研究[D];哈尔滨工程大学;2010年
8 徐艳红;基于倾斜时间窗口的频繁项集挖掘算法研究[D];哈尔滨工程大学;2010年
9 骆永健;基于聚类的数据流异常检测算法的研究[D];哈尔滨工程大学;2010年
10 王秀锋;网络环境下异构日志信息获取和预处理研究[D];哈尔滨工程大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 王永梅;胡学钢;;决策树中ID3算法的研究[J];安徽大学学报(自然科学版);2011年03期
2 童立靖;张艳;舒巍;占国亮;钱垚;;几种文本图像二值化方法的对比分析[J];北方工业大学学报;2011年01期
3 陶新民;徐晶;杨立标;刘玉;;一种改进的粒子群和K均值混合聚类算法[J];电子与信息学报;2010年01期
4 杨炳儒,唐菁;基于复杂类型数据的发现特征子空间模型(DFSSM)的研究[J];中国工程科学;2003年01期
5 尤淑撑,张玮,严泰来;模糊分类技术在作物类型识别中的应用[J];国土资源遥感;2000年01期
6 武俊峰;艾岭;;一种基于改进聚类算法的模糊模型辨识[J];哈尔滨理工大学学报;2010年03期
7 秦磊;高文;;基于内容相关性的场景图像分类方法[J];计算机研究与发展;2009年07期
8 邢冀鹏;邹雪城;刘政林;陈毅成;;K均值聚类和模拟退火融合的软硬件划分[J];计算机工程与应用;2006年16期
9 孙秀娟;刘希玉;;基于初始中心优化的遗传K-means聚类新算法[J];计算机工程与应用;2008年23期
10 张勇;吴文健;刘志明;;基于改进K均值聚类分析的迷彩伪装色选取[J];计算机工程与应用;2009年06期
中国博士学位论文全文数据库 前4条
1 马昕;粗糙集理论在数据挖掘领域中的应用[D];浙江大学;2003年
2 秦昆;基于形式概念分析的图像数据挖掘研究[D];武汉大学;2004年
3 陈久军;基于统计学习的图像语义挖掘研究[D];浙江大学;2006年
4 刘茂福;图像挖掘中的图像预处理技术研究[D];武汉大学;2005年
中国硕士学位论文全文数据库 前9条
1 鲜艳明;多特征结合与支持向量机集成在图像分类中的应用[D];西安科技大学;2011年
2 王斌;决策树算法的研究及应用[D];东华大学;2008年
3 刘祺;决策树ID3算法的改进研究[D];哈尔滨工程大学;2009年
4 宋潇毅;基于纹理和颜色特征的图像检索[D];电子科技大学;2009年
5 王顺富;基于语义的图像分类研究[D];西南交通大学;2009年
6 杜敏;文本图像认证技术研究[D];西北大学;2010年
7 余昌瑾;图像挖掘技术研究与应用[D];武汉理工大学;2010年
8 张悦;前向决策树算法的研究与改进[D];河北大学;2010年
9 陈杰;基于遗传算法的决策树剪枝方法[D];河北大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 张素妍,聂伟;基于粗糙集理论的分布式检测系统数据融合[J];北京化工大学学报(自然科学版);2004年01期
2 梁波,吴俊峰,舒华英;移动通信客户保持及其决定因素实证研究[J];北京邮电大学学报(社会科学版);2005年04期
3 胡丹,孙魁明,李洪兴;粗集中的隶属函数及其与模糊集的联系[J];北京师范大学学报(自然科学版);2003年02期
4 王国胤,刘锋,吴渝,聂能;Rough集规则知识获取研究中的不一致性问题[J];重庆邮电学院学报(自然科学版);2000年03期
5 钱进,孟祥萍,徐冬寅;一种有效的关联规则增量式更新算法[J];长春工程学院学报(自然科学版);2003年03期
6 黎明,张化光,何希勤;基于粗糙集的模糊模型辨识方法[J];东北大学学报;2000年05期
7 郝先臣,张德干,高光来,赵海;数据挖掘工具和应用中的问题[J];东北大学学报;2001年02期
8 张宇,张建州,游志胜;基于有效预测区域的模糊数据关联[J];电子科技大学学报;2001年06期
9 张琦,韩祯祥,曹绍杰,顾雪平;用于暂态稳定评估的人工神经网络输入空间压缩方法[J];电力系统自动化;2001年02期
10 刘宗田;属性最小约简的增量式算法[J];电子学报;1999年11期
中国硕士学位论文全文数据库 前1条
1 申爱华;粗糙集在不完备信息系统数据挖掘中的应用研究[D];大连海事大学;2004年
【相似文献】
中国期刊全文数据库 前10条
1 廖俊,朱世强,林建亚,任德祥;遗传算法在T-S模糊模型辨识中的应用[J];信息与控制;1997年02期
2 刘健庄,谢维信,高新波;一种图象中基元检测的新方法[J];电子与信息学报;1997年02期
3 金耀初;蒋静坪;;基于遗传算法的模糊控制器分析[J];模式识别与人工智能;1997年01期
4 曹先彬;庄镇泉;;一种基于遗传算法的模糊规则生成方法[J];模式识别与人工智能;1997年02期
5 夏文,王华芝;遗传算法在多波束赋形天线优化中的研究[J];北京邮电大学学报;1998年04期
6 龙甫荟,郑南宁,张晓缋;基于多层感知遗传算法的图象分割新方法[J];控制理论与应用;1998年02期
7 刘莹,王宝树,马建峰,杨耆董;模糊聚合及遗传算法在多传感器数据融合中的应用[J];电子科技;1998年01期
8 黄海贇,戚飞虎;一种精确标定摄像机的遗传算法方案(英文)[J];红外与毫米波学报;2000年01期
9 徐小力,许宝杰,殷健;采用遗传算法的旋转机组状态趋势预测之探讨[J];机械科学与技术;2000年05期
10 陈勇,邓先灿;基于遗传算法的微波电路优化方法[J];微波学报;2000年S1期
中国重要会议论文全文数据库 前10条
1 周海清;王恭先;陈正汉;;基于面向对象遗传算法的抗滑桩优化设计程序的研制[A];中国土木工程学会第九届土力学及岩土工程学术会议论文集(下册)[C];2003年
2 吴建生;金龙;;基于实数编码的遗传算法神经网络预报建模研究[A];推进气象科技创新加快气象事业发展——中国气象学会2004年年会论文集(下册)[C];2004年
3 申元霞;张翠芳;;GA-BP算法在系统辨识中的应用[A];中国自动化学会、中国仪器仪表学会2004年西南三省一市自动化与仪器仪表学术年会论文集[C];2004年
4 刘辙;彭亮;崔广才;吴学礼;;混合遗传算法在车间调度中的应用[A];中国自动化学会全国第九届自动化新技术学术交流会论文集[C];2004年
5 曹春红;李文辉;张永坚;;遗传蚂蚁算法在几何约束求解中的应用[A];中国仪器仪表学会第六届青年学术会议论文集[C];2004年
6 姜楠;张春森;;遗传算法在图像模板匹配中的应用[A];高精度几何量光电测量与校准技术研讨会论文集[C];2008年
7 朱秀娥;周宝焜;;振动筛设计的遗传算法[A];福建省科协第三届学术年会装备制造业专题学术年会论文集[C];2003年
8 何奉道;梁向阳;;基于遗传算法的机车周转图优化编制方法[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
9 刘忠凯;薛正辉;任武;李伟明;高本庆;;用遗传算法优化八木天线[A];2005'全国微波毫米波会议论文集(第二册)[C];2006年
10 汝勇;杨树强;;遗传算法在历史性约束组合优化问题中的应用[A];2010通信理论与技术新发展——第十五届全国青年通信学术会议论文集(上册)[C];2010年
中国重要报纸全文数据库 前10条
1 林京;《神经网络和遗传算法在水科学领域的应用》将面市[N];中国水利报;2002年
2 程爱娟;旅行推销员问题(TSP)的人工智能解法及其应用[N];新疆科技报(汉);2001年
3 中国科技大学计算机系 邢方亮;计算智能百花齐放[N];计算机世界;2003年
4 包家庆;IDS五大发展趋势[N];网络世界;2002年
5 郭明波;来自蝙蝠的启发[N];北京科技报;2001年
6 易水;IT新词集锦[N];计算机世界;2003年
7 高澜庆;矿山企盼智能化[N];中国矿业报;2000年
8 李磊;让电子政务更聪明[N];计算机世界;2001年
9 顾正华 唐洪武 肖洋 河海大学水利水电工程学院 李云 南京水利科学研究院水工研究所;水流智能模拟大步走来[N];中国水利报;2005年
10 记者 吴苡婷;用技术挖出网络信息中“金子”[N];上海科技报;2009年
中国博士学位论文全文数据库 前10条
1 袁丽华;基于物种进化的遗传算法研究[D];南京航空航天大学;2009年
2 张旭;具有拓扑结构布局优化的理论及算法[D];大连理工大学;2004年
3 廖平;基于遗传算法的形状误差计算研究[D];中南大学;2002年
4 周明;高新技术产业投资环境系统研究[D];西北工业大学;2006年
5 陈霄;DNA遗传算法及应用研究[D];浙江大学;2010年
6 曹宇;利用遗传算法对声障板优化设计的研究[D];哈尔滨工程大学;2010年
7 张需溥;小型化微带天线的设计与数值分析[D];上海大学;2004年
8 杨春成;空间数据挖掘中聚类分析算法的研究[D];解放军信息工程大学;2004年
9 方娟;基于移动代理的网格资源监控技术的研究[D];北京工业大学;2005年
10 崔晓芳;箱型结构焊接变形预测、控制及应用[D];大连交通大学;2005年
中国硕士学位论文全文数据库 前10条
1 朱奉梅;遗传算法在高校排课系统中的研究与应用[D];东北大学;2009年
2 孙晓丽;基于遗传算法的既有线平面及纵断面整正优化设计[D];中南大学;2010年
3 冯秋霞;解最小生成树问题的新的遗传算法[D];西安电子科技大学;2010年
4 郭佳;基于遗传算法的认知无线网络资源分配技术研究[D];西安电子科技大学;2010年
5 宋品;基于改进遗传算法的波束形成技术研究及其应用[D];西安电子科技大学;2010年
6 梁云静;基于遗传算法的主题爬虫搜索策略研究[D];湖北工业大学;2010年
7 高建兵;基于遗传算法的模糊推理控制系统的参数优化研究[D];辽宁工程技术大学;2011年
8 李振业;多向变异遗传算法及其优化神经网络的研究[D];华南理工大学;2011年
9 栾丽霞;遗传算法在潍坊商校排课系统的研究与应用[D];电子科技大学;2011年
10 王辉;基于改进遗传算法的物流配送路径优化研究[D];山东科技大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026