收藏本站
《山东科技大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于遗传算法的K-means聚类方法的研究

吴香庭  
【摘要】:数据挖掘是随着信息技术不断发展而形成的一门新兴的交叉学科,是信息处理和数据库技术领域的前沿研究课题。 聚类分析是数据挖掘的一个非常重要的研究分支。聚类是一种无监督的分类方法,目标是在没有任何先验知识的情况下,将数据集划分成不同的类,使得不同类中的对象尽可能相异,相同类中的对象尽可能相似。K-means算法作为聚类分析中的经典算法现已被广泛应用在商务、市场分析、生物学、文本分类等领域。K-means聚类算法具有较强的局部搜索能力,但是对初始聚类中心敏感,容易陷入局部最优,影响了聚类结果。而遗传算法是一种高效的全局搜索方法,它的局部搜索能力较差。本文将K-means聚类算法与遗传算法相结合,互相取长补短,提出了一种基于遗传算法的K-means聚类算法(KBGA),并通过实验验证了算法的有效性。 本文工作主要体现在以下几个方面: 首先,详细介绍了K-means聚类算法,分析了K-means聚类算法的优缺点,并在此基础上,提出了解决缺点的方法。 其次,介绍了数据挖掘中的一个重要算法——遗传算法。对遗传算法的概念、组成、应用流程、应用中的问题等进行了详细描述。 再次,提出了一种改进的遗传K-means聚类算法(KBGA)。由于传统的K-means算法对初始聚类中心非常敏感,本文提出了一种基于相似度的最小最大原则的方法来选取初始聚类中心,并提出了一种相应的改进的K-means聚类算法(IKA)。另外由于K-means聚类的初始聚类数K的选择也是是影响聚类的一个重要参数。为了获得高精度的聚类结果,基于遗传算法和K-means算法的特点,本文提出了一种基于遗传算法的求K值方法,从编码方法、适应度函数的构造、选择算子、交叉算子和变异算子的设计等方面进行了改进。 最后,为了测试本文提出的聚类算法的性能,本文通过实验对两种算法的聚类结果进行比较,实验结果表明本文算法能够有效地解决聚类问题。
【学位授予单位】:山东科技大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP311.13

【参考文献】
中国期刊全文数据库 前10条
1 赵锋;薛惠锋;王伟;;基于复合形遗传算法的K-means优化聚类方法[J];航空计算技术;2006年05期
2 高坚;用基于免疫机制的单亲遗传算法求解数据聚类优化问题[J];计算机工程与应用;2003年12期
3 张伟;廖晓峰;吴中福;;一种基于遗传算法的聚类新方法[J];计算机科学;2002年06期
4 武兆慧,张桂娟,刘希玉;基于模拟退火遗传算法的聚类分析[J];计算机应用研究;2005年12期
5 贾兆红;唐俊;;一种基于混合遗传算法的聚类方法[J];计算机应用与软件;2008年04期
6 张晓缋,戴冠中,徐乃平;一种新的优化搜索算法──遗传算法[J];控制理论与应用;1995年03期
7 席裕庚,柴天佑,恽为民;遗传算法综述[J];控制理论与应用;1996年06期
8 何琳,王科俊,李国斌,金鸿章;最优保留遗传算法及其收敛性分析[J];控制与决策;2000年01期
9 谢维信,刘健庄;硬聚类和模糊聚类的结合——双层FCM快速算法[J];模糊系统与数学;1992年02期
10 孙才志,王敬东,潘俊;模糊聚类分析最佳聚类数的确定方法研究[J];模糊系统与数学;2001年01期
【共引文献】
中国期刊全文数据库 前10条
1 吴大宏,赵人达;基于遗传算法与神经网络的桥梁结构健康监测系统研究初探[J];四川建筑科学研究;2002年03期
2 张晓杰,王巍巍;基于C—均值模糊聚类的工程结构构件自动归并方法研究[J];四川建筑科学研究;2005年04期
3 张世海,刘晓燕,欧进萍;高层结构智能选型知识发现及方法比较[J];四川建筑科学研究;2005年05期
4 廖瑛;;基坑支护结构稳定性问题的模糊随机方法研究[J];四川建筑科学研究;2010年01期
5 邓建斌;叶洪江;;基于混沌遗传算法的配电网无功补偿优化[J];安徽电气工程职业技术学院学报;2006年03期
6 乔志杰;程翠翠;;基于遗传算法优化的模糊PID控制研究及其仿真[J];安徽电气工程职业技术学院学报;2009年03期
7 张安勤;数据挖掘与进化算法[J];安徽教育学院学报;2002年03期
8 潘洁珠;半结构化数据及其数据模型[J];安徽教育学院学报;2003年06期
9 徐文婷;李承鹏;;基于自适应遗传算法的离散化方法[J];合肥师范学院学报;2011年03期
10 安振刚,李谋渭,尹显东,于宁,唐伟;遗传神经网络在平整轧制力预报中的应用[J];鞍钢技术;2001年06期
中国重要会议论文全文数据库 前10条
1 齐继阳;竺长安;曾议;;基于遗传禁忌混合搜索算法的设备布局研究[A];2004“安徽制造业发展”博士科技论坛论文集[C];2004年
2 杨益;方潜生;汪力君;;基于Handel-C的数字芯片的设计方法研究与实现[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
3 章曙光;;基于CBR的电力负荷预测系统的研究与实现[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
4 胡杨林;蒋洁琼;王明煌;曾勤;邱岳峰;邹俊;陈红丽;FDS team;;聚变裂变混合堆长寿命锕系废料嬗变处理的中子学优化分析[A];安徽新能源技术创新与产业发展博士科技论坛论文集[C];2010年
5 丁婷;崔红涛;;遗传算法在智能天线扇区波束赋形及阵元失效补偿中的应用[A];经济策论(上)[C];2011年
6 程远林;李茂军;;基于小生境遗传算法的配电网电容器优化配置[A];第二十六届中国控制会议论文集[C];2007年
7 姜明辉;袁绪川;;基于GA优化的个人信用评估SVM模型[A];第二十六届中国控制会议论文集[C];2007年
8 孙燕;孙峥;黄鹍;;基于模拟退火机制的隔离小生境混合遗传算法[A];第二十六届中国控制会议论文集[C];2007年
9 李枚毅;游维;蔡自兴;;多样度和适应度引导的遗传算法操作概率计算研究[A];第二十六届中国控制会议论文集[C];2007年
10 孙燕;孙峥;;利用正交遗传算法优化交通检测点分布[A];第二十六届中国控制会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 张杏莉;几何约束求解关键问题研究[D];山东科技大学;2010年
2 樊建聪;分布估计学习算法研究[D];山东科技大学;2010年
3 王杰;基于人工智能的乒乓球比赛技战术诊断与评估研究[D];上海体育学院;2010年
4 李佳;载人潜器阻力性能的数值和试验预报及外形优化研究[D];哈尔滨工程大学;2010年
5 张亚娟;适应性企业战略协同机制研究[D];哈尔滨工程大学;2010年
6 谭枫;介入式文化算法及其应用研究[D];哈尔滨工程大学;2010年
7 陆满君;通信辐射源个体识别与参数估计[D];哈尔滨工程大学;2010年
8 戴运桃;粒子群优化算法研究及其在船舶运动参数辨识中的应用[D];哈尔滨工程大学;2010年
9 曹宇;利用遗传算法对声障板优化设计的研究[D];哈尔滨工程大学;2010年
10 李晚龙;六自由度Stewart平台分散智能控制研究[D];哈尔滨工程大学;2010年
中国硕士学位论文全文数据库 前10条
1 赫英毅;毫米波段基于TE_(21)模差网络设计[D];中国工程物理研究院;2009年
2 万成;动态环境下的元胞遗传算法研究[D];南昌航空大学;2010年
3 李坤;参数参与进化的自适应遗传算法研究[D];南昌航空大学;2010年
4 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
5 赵映超;基于三维结构的项目风险动态管理研究及应用[D];山东科技大学;2010年
6 马水松;多目标遗传算法与非支配集的构造研究[D];山东科技大学;2010年
7 高兆梓;基于专利分析的竞争对手分类系统研究[D];山东科技大学;2010年
8 李臻;城市公交车辆智能调度优化研究[D];山东科技大学;2010年
9 朱国凯;泰安市农村公路典型路面结构研究[D];山东科技大学;2010年
10 王辉;基于改进遗传算法的物流配送路径优化研究[D];山东科技大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 郑岩,黄荣怀,战晓苏,周春光;基于遗传算法的动态模糊聚类[J];北京邮电大学学报;2005年01期
2 朱朝艳,刘斌,郭鹏飞;离散变量结构优化设计的复合形遗传算法[J];东北大学学报;2004年07期
3 王磊,潘进,焦李成;免疫算法[J];电子学报;2000年07期
4 刘少辉,胡斐,贾自艳,史忠植;一种基于Rough集的层次聚类算法[J];计算机研究与发展;2004年04期
5 张蓉,彭宏;一种快速的模拟退火算法及其在数据聚类中的应用[J];计算机工程与应用;2001年15期
6 李飞;薛彬;黄亚楼;;初始中心优化的K-Means聚类算法[J];计算机科学;2002年07期
7 王敞;陈增强;袁著祉;;基于遗传算法的K均值聚类分析[J];计算机科学;2003年02期
8 高坚;基于C-均值和免疫遗传算法的聚类分析[J];计算机工程;2003年12期
9 贾兆红,倪志伟,赵鹏;用遗传算法挖掘范例库中的特征项权重的方法[J];计算机工程;2003年14期
10 傅景广,许刚,王裕国;基于遗传算法的聚类分析[J];计算机工程;2004年04期
【相似文献】
中国期刊全文数据库 前10条
1 王颖;刘建平;;基于改进遗传算法的K-means聚类分析[J];工业控制计算机;2011年08期
2 王颋;姜鹏飞;;一种基于遗传算法的聚类算法[J];软件导刊;2008年01期
3 山拜·达拉拜;曹红丽;尤努斯·艾沙;;基于遗传算法的K-means初始化EM算法及聚类应用[J];现代电子技术;2010年15期
4 吕强,俞金寿;基于混合遗传算法的K-Means最优聚类算法[J];华东理工大学学报;2005年02期
5 崔志刚;;一种改进的混合遗传聚类算法的数据挖掘技术[J];网络安全技术与应用;2010年03期
6 张增林 ,施霞萍;基于遗传算法的聚类分析在体型分析中的应用[J];微计算机信息;2005年22期
7 王娟;;一种基于遗传算法的K-means聚类算法[J];微型机与应用;2011年20期
8 赵立江;;基于遗传算法的混合属性聚类初始点选择研究[J];广西师范大学学报(自然科学版);2008年03期
9 吴东洋;业宁;沈丽容;张倩倩;赖正文;;基于颜色矩的木材缺陷聚类识别[J];江南大学学报(自然科学版);2009年05期
10 杨昕;彭玉青;;结合蚂蚁算法的K-Means聚类分析[J];河北工业大学学报;2007年03期
中国重要会议论文全文数据库 前10条
1 陈岑;王贵成;逄玉俊;;一种基于遗传算法的故障聚类新方法[A];2009全国虚拟仪器大会论文集(二)[C];2009年
2 王家耀;张雪萍;;基于遗传算法和K-均值算法相结合的空间聚类分析[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
3 洪沛霖;张佑生;;基于遗传算法和模糊模式的手写体数字识别[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
4 周海清;王恭先;陈正汉;;基于面向对象遗传算法的抗滑桩优化设计程序的研制[A];中国土木工程学会第九届土力学及岩土工程学术会议论文集(下册)[C];2003年
5 吴建生;金龙;;基于实数编码的遗传算法神经网络预报建模研究[A];推进气象科技创新加快气象事业发展——中国气象学会2004年年会论文集(下册)[C];2004年
6 申元霞;张翠芳;;GA-BP算法在系统辨识中的应用[A];中国自动化学会、中国仪器仪表学会2004年西南三省一市自动化与仪器仪表学术年会论文集[C];2004年
7 刘辙;彭亮;崔广才;吴学礼;;混合遗传算法在车间调度中的应用[A];中国自动化学会全国第九届自动化新技术学术交流会论文集[C];2004年
8 曹春红;李文辉;张永坚;;遗传蚂蚁算法在几何约束求解中的应用[A];中国仪器仪表学会第六届青年学术会议论文集[C];2004年
9 姜楠;张春森;;遗传算法在图像模板匹配中的应用[A];高精度几何量光电测量与校准技术研讨会论文集[C];2008年
10 朱秀娥;周宝焜;;振动筛设计的遗传算法[A];福建省科协第三届学术年会装备制造业专题学术年会论文集[C];2003年
中国重要报纸全文数据库 前10条
1 林京;《神经网络和遗传算法在水科学领域的应用》将面市[N];中国水利报;2002年
2 程爱娟;旅行推销员问题(TSP)的人工智能解法及其应用[N];新疆科技报(汉);2001年
3 中国科技大学计算机系 邢方亮;计算智能百花齐放[N];计算机世界;2003年
4 包家庆;IDS五大发展趋势[N];网络世界;2002年
5 郭明波;来自蝙蝠的启发[N];北京科技报;2001年
6 易水;IT新词集锦[N];计算机世界;2003年
7 高澜庆;矿山企盼智能化[N];中国矿业报;2000年
8 李磊;让电子政务更聪明[N];计算机世界;2001年
9 记者 吴苡婷;用技术挖出网络信息中“金子”[N];上海科技报;2009年
10 顾正华 唐洪武 肖洋 河海大学水利水电工程学院 李云 南京水利科学研究院水工研究所;水流智能模拟大步走来[N];中国水利报;2005年
中国博士学位论文全文数据库 前10条
1 赵胜利;基于计算智能方法的岩土工程与工程网络计划的应用研究[D];天津大学;2004年
2 张旭;具有拓扑结构布局优化的理论及算法[D];大连理工大学;2004年
3 廖平;基于遗传算法的形状误差计算研究[D];中南大学;2002年
4 周明;高新技术产业投资环境系统研究[D];西北工业大学;2006年
5 张需溥;小型化微带天线的设计与数值分析[D];上海大学;2004年
6 杨春成;空间数据挖掘中聚类分析算法的研究[D];解放军信息工程大学;2004年
7 方娟;基于移动代理的网格资源监控技术的研究[D];北京工业大学;2005年
8 崔晓芳;箱型结构焊接变形预测、控制及应用[D];大连交通大学;2005年
9 张材;薄带坯铸轧板形智能识别与控制系统研究[D];中南大学;2004年
10 田方;遗传算法的改进研究及其在压缩机性能分析与优化中的应用[D];东北大学;2006年
中国硕士学位论文全文数据库 前10条
1 吴香庭;基于遗传算法的K-means聚类方法的研究[D];山东科技大学;2010年
2 朱奉梅;遗传算法在高校排课系统中的研究与应用[D];东北大学;2009年
3 杨丽;基于遗传算法的文本聚类研究[D];南京航空航天大学;2009年
4 孙晓丽;基于遗传算法的既有线平面及纵断面整正优化设计[D];中南大学;2010年
5 冯秋霞;解最小生成树问题的新的遗传算法[D];西安电子科技大学;2010年
6 郭佳;基于遗传算法的认知无线网络资源分配技术研究[D];西安电子科技大学;2010年
7 宋品;基于改进遗传算法的波束形成技术研究及其应用[D];西安电子科技大学;2010年
8 梁云静;基于遗传算法的主题爬虫搜索策略研究[D];湖北工业大学;2010年
9 高建兵;基于遗传算法的模糊推理控制系统的参数优化研究[D];辽宁工程技术大学;2011年
10 李振业;多向变异遗传算法及其优化神经网络的研究[D];华南理工大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026