收藏本站
《西安建筑科技大学》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

基于遗传算法的数据挖掘技术研究

杨丽娜  
【摘要】: 数据挖掘技术的应用已经相当广泛,但关于数据挖掘方法的研究仍然方兴未艾。在众多的数据挖掘方法中,关于预测的方法和关于聚类的方法是相当常用的,目前也有很多学者在进行与这些算法相关的研究。但很多研究都是在某一方面对现有算法进行了改进,在关于预测和聚类算法及其它算法的研究中,没有一种方法是十全十美、可以解决现有算法存在的所有问题的。就预测和聚类算法而言,本文给出了作者对目前已有算法的一些改进方案。 在数据挖掘技术的预测方法中,回归分析是最常用也是最简单易行的预测分析技术,但这种分析存在很多不足,通常得到的结果不够精确,有时候误差会比较大。鉴于遗传算法的全局寻优特性,为了解决传统回归方程的参数精度问题,本文引入遗传算法来对回归方程中的参数进行寻优,以便优化回归方程。 在数据挖掘中,聚类分析也是一种很长用的技术。而聚类技术中K-means聚类分析技术又是最常用的方法。但K-means算法在实际应用中需要用户给出要聚类的数目即k的值,另外,K-means算法在运行时要首先随机产生一个初始聚类中心,然后再对使用这个初始聚类中心得到的聚类结果进行不断调整,而这个聚类结果在很大程度上受初始聚类中心选取的影响。为了消除K-means聚类算法对于用户输入k值的依赖,也为了减小K-means聚类算法受初始聚类中心的影响,本文引入了遗传算法。在具体实现中,首先在原始样本集的一个子集上运行遗传算法进行参数k的寻优以及在该最优值k的基础上对初始聚类中心的寻优,然后再在原始样本集上运行K-means聚类算法,最终得到聚类结果。 在最后,本文分别给出了对应于预测算法和聚类算法的应用实例,经过在实例数据集上的运行结果和先前方法的比较中得出,在这两种方法中引入遗传算法提高了预测和聚类的精度和准确性,试验证明,本文提出的方法具有良好的使用价值。
【学位授予单位】:西安建筑科技大学
【学位级别】:硕士
【学位授予年份】:2007
【分类号】:TP311.13

手机知网App
【引证文献】
中国期刊全文数据库 前3条
1 徐波;;遗传算法及其在数据挖掘中的应用[J];电脑编程技巧与维护;2010年04期
2 范文广;;数据挖掘技术的研究[J];佛山科学技术学院学报(自然科学版);2011年06期
3 张卫;彭月英;魏勇;冯振;;多属性修正遗传算法适应度在专家系统中的应用[J];现代计算机(专业版);2011年11期
中国硕士学位论文全文数据库 前3条
1 范文广;高校教务管理信息系统设计与开发研究[D];安徽大学;2011年
2 颜伟;集装箱航线系统优化设计模型研究[D];大连海事大学;2012年
3 安鹏程;街下2号偏压连拱隧道围岩压力分析与现场监控量测[D];吉林大学;2008年
【参考文献】
中国期刊全文数据库 前10条
1 李碧,雍正正;一种改进的基于遗传算法的聚类分析方法[J];电路与系统学报;2002年03期
2 黄晓霞,萧蕴诗;数据挖掘应用研究及展望[J];计算机辅助工程;2001年04期
3 朱金钧,高凯,周万珍;遗传算法在数据挖掘中的应用[J];计算机工程与应用;2003年17期
4 刘立平,孟志青;一种选取初始聚类中心的方法[J];计算机工程与应用;2004年08期
5 张伟;廖晓峰;吴中福;;一种基于遗传算法的聚类新方法[J];计算机科学;2002年06期
6 万小军,杨建武,陈晓鸥;文档聚类中k-means算法的一种改进算法[J];计算机工程;2003年02期
7 贾兆红,倪志伟,赵鹏;改进型遗传算法及其在数据挖掘中的应用[J];计算机应用;2002年09期
8 张玉芳,毛嘉莉,熊忠阳;一种改进的K-means算法[J];计算机应用;2003年08期
9 卢启程,邹平;数据挖掘的研究与应用进展[J];昆明理工大学学报(理工版);2002年05期
10 席裕庚,柴天佑,恽为民;遗传算法综述[J];控制理论与应用;1996年06期
【共引文献】
中国期刊全文数据库 前10条
1 吴大宏,赵人达;基于遗传算法与神经网络的桥梁结构健康监测系统研究初探[J];四川建筑科学研究;2002年03期
2 钟晓旭;胡学钢;;基于数据挖掘的Web招聘信息相关性分析[J];安徽建筑工业学院学报(自然科学版);2010年04期
3 毛德华;邹君;李杰;李景保;金菊良;;基于遗传算法的投影寻踪方法在洞庭湖区洪灾易损性评价中的应用[J];冰川冻土;2010年02期
4 杨德利,刘百勇,龚雪皓,郑学仁,吴朝晖;半导体器件的遗传算法优化设计[J];半导体技术;2001年02期
5 曾凡锋,马润津,蔡自兴;基于改进遗传算法的系统参数辨识方法[J];北方工业大学学报;1998年01期
6 张安民,杨世兴,李志舜,韩崇昭;利用遗传算法的垂直命中导引律研究[J];兵工学报;2004年03期
7 杨尔辅,张振鹏,刘国球;一种推进系统故障诊断反问题模型与算法[J];北京航空航天大学学报;1999年06期
8 张飞舟,晏磊,范跃祖,孙先仿;智能交通系统中的运营车辆优化调度研究[J];北京航空航天大学学报;2002年06期
9 涂承媛,涂承宇,冯占英;基于仿生进化的自动控制系统[J];北京联合大学学报;2000年03期
10 张玉英;孟海东;;数据挖掘技术中聚类算法的改进研究[J];包头钢铁学院学报;2005年04期
中国重要会议论文全文数据库 前10条
1 杨阳;陈宗海;张海涛;;复杂系统仿真的前端智能化综述[A];'2003系统仿真技术及其应用学术交流会论文集[C];2003年
2 彭锦;;进化算法综述[A];中国运筹学会第六届学术交流会论文集(上卷)[C];2000年
3 刘德朋;孙启美;;一种变异概率的遗传算法[A];第六届中国青年运筹与管理学者大会论文集[C];2004年
4 黄红兵;蒋望东;;数据挖掘技术在地理信息系统中的应用[A];广西计算机学会2004年学术年会论文集[C];2004年
5 胡硕;朱明;宋华军;;基于遗传算法的快速图像的相关匹配[A];2004全国光学与光电子学学术研讨会、2005全国光学与光电子学学术研讨会、广西光学学会成立20周年年会论文集[C];2005年
6 王向;;遗传算法综述[A];2007年河北省电子学会、河北省计算机学会、河北省自动化学会、河北省人工智能学会、河北省计算机辅助设计研究会、河北省软件行业协会联合学术年会论文集[C];2007年
7 刘吉峰;汪希时;;一种利用遗传算法改进的模拟退火算法及其应用[A];1995中国控制与决策学术年会论文集[C];1995年
8 李旭;徐心和;;一种基于信息论的故障诊断专家系统[A];1997中国控制与决策学术年会论文集[C];1997年
9 潘永湘;高红梅;徐前锋;;实数遗传算法在特征关系图匹配中的应用[A];2000中国控制与决策学术年会论文集[C];2000年
10 马淑华;赵一丁;;基于遗传算法的热电偶温度传感器非线性模型辨识[A];2004中国控制与决策学术年会论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 尹可挺;Internet环境中基于QoS的Web服务组合研究[D];浙江大学;2010年
2 李熹平;快速热循环注塑模具及工艺关键技术研究[D];山东大学;2010年
3 徐河杭;面向PLM的数据挖掘技术和应用研究[D];浙江大学;2010年
4 程文涛;关节式坐标测量机标定技术研究[D];合肥工业大学;2011年
5 尤海峰;求解隐式目标优化问题的交互式进化算法研究[D];中国科学技术大学;2011年
6 孙兵;物流领域若干关键问题研究[D];天津大学;2010年
7 徐健腾;复杂供应链协调优化模型及算法研究[D];哈尔滨工业大学;2010年
8 李军华;基于知识和多种群进化的遗传算法研究[D];南京航空航天大学;2009年
9 孙佳龙;近海雷达卫星测高数据质量改善及在南海海潮模型中的应用研究[D];山东科技大学;2011年
10 刘辉;电缆故障诊断理论与关键技术研究[D];华中科技大学;2012年
中国硕士学位论文全文数据库 前10条
1 吴香庭;基于遗传算法的K-means聚类方法的研究[D];山东科技大学;2010年
2 尹丽玲;基于人工免疫算法的Web文本挖掘研究[D];哈尔滨工程大学;2010年
3 石丽丽;智能优化算法对比研究及其在船体双底结构优化中的应用[D];哈尔滨工程大学;2010年
4 颜语;无线传感网络在环境监测中的应用[D];辽宁工程技术大学;2009年
5 袁军;煤基混合燃料的燃烧特性及优化配比研究[D];长沙理工大学;2010年
6 袁伟杰;自治水下机器人动力学建模及参数辨识研究[D];中国海洋大学;2010年
7 张峰;基于数据挖掘技术的教学管理应用研究[D];合肥工业大学;2010年
8 李玲玲;基于层次聚类的模糊聚类算法的研究[D];合肥工业大学;2010年
9 冯兴祥;关联规则挖掘在高校招生录取中的应用[D];合肥工业大学;2010年
10 年爱华;数据挖掘在职校普通话等级考试成绩分析中的应用[D];兰州大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 姜勇,朱合华;岩石偏压隧道动态分析及相关研究[J];地下空间;2004年03期
2 曲海锋;杨重存;朱合华;王华牢;杨彦民;;公路隧道围岩压力研究与发展[J];地下空间与工程学报;2007年03期
3 唐亮;双连拱隧道施工方法[J];重庆交通学院学报;2004年02期
4 孙敏;;集装箱班轮航线靠港选择的影响因素分析[J];中国储运;2010年02期
5 宋颖华;高速公路隧道监控系统的方案设计[J];东北公路;2000年03期
6 刘立平,牛熠;遗传算法综述[J];东莞理工学院学报;2005年03期
7 杨华龙,陈晓东,朱晓宁;班轮航线集装箱合理配备与使用问题的研究[J];大连海事大学学报;2000年01期
8 陈超,孙玉杰;航线集装箱需备量构成的方法[J];大连海事大学学报;2005年02期
9 陈超;苏雅;;集装箱航线结构模式的选择[J];大连海事大学学报;2010年04期
10 郭子坚,王诺,霍红;多种运输模式下国内沿海集装箱港口布局模型研究[J];大连理工大学学报;2001年05期
中国博士学位论文全文数据库 前1条
1 孙香红;基于结构可靠性的被动控制系统优化理论和应用方法研究[D];西安建筑科技大学;2010年
中国硕士学位论文全文数据库 前10条
1 武军;遗传算法在PCA人脸识别算法中的应用研究[D];电子科技大学;2011年
2 梁建辉;基于遗传算法的神经网络预测控制及应用[D];西北工业大学;2003年
3 王文正;公路双连拱隧道开挖方法及施工过程数值模拟研究[D];长安大学;2003年
4 王如义;多元线性回归中复共线问题及偏最小二乘回归分析[D];西南交通大学;2004年
5 王世春;BP网络在多元回归分析中的应用[D];合肥工业大学;2003年
6 张磊;基于混合遗传算法的分类规则挖掘方法及其并行实现[D];重庆大学;2004年
7 何君莲;基于遗传算法滑坡防治方案优化的研究[D];武汉理工大学;2005年
8 刘德平;双连拱隧道围岩稳定性分析及施工有限元模拟[D];西安科技大学;2005年
9 阮诗新;一些回归分析方法的实现、改进与应用[D];吉林大学;2005年
10 张晓哲;基于改进遗传算法的反分析理论及其在电厂沉降观测中的应用[D];宁夏大学;2005年
【二级引证文献】
中国期刊全文数据库 前3条
1 王晓笛;肖伟;;解决多目标优化问题的几种进化算法的比较研究[J];电脑知识与技术;2011年07期
2 常丽;;基于遗传算法的数据挖掘技术及应用[J];沙洋师范高等专科学校学报;2012年02期
3 蔡俊宁;;Matlab在股指期货中的应用[J];信息系统工程;2012年04期
中国硕士学位论文全文数据库 前2条
1 王晓笛;基于改进蛙跳算法的多目标优化问题研究[D];湖南师范大学;2011年
2 王玥;基于Web使用挖掘的在线报名推荐系统的研究与实现[D];电子科技大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 马刚,王延章;数据仓库及其设计规范化[J];大连理工大学学报;2001年05期
2 韩家炜,孟小峰,王静,李盛恩;Web挖掘研究[J];计算机研究与发展;2001年04期
3 陈秋双,刘东红,李红星;基于数据仓库的客户分析系统的分析与设计[J];计算机工程与应用;2001年14期
4 王清毅;陈恩红;蔡庆生;;知识发现的若干问题及应用研究[J];计算机科学;1997年05期
5 朱廷劭;高文;Charlex X.Ling;;数据库中知识发现的处理过程模型的研究[J];计算机科学;1999年02期
6 陈宁;周龙骧;;数据采掘在Internet中的应用[J];计算机科学;1999年07期
7 余建桥;梁颖;;农业数据库中知识发现的研究[J];计算机科学;1999年12期
8 刘明吉;王秀峰;黄亚楼;;数据挖掘中的数据预处理[J];计算机科学;2000年04期
9 欧阳为民;郑诚;张燕;;国际知识发现与数据发掘工具评述[J];计算机科学;2001年03期
10 张志强;周立柱;冯建华;;Web数据库技术简述[J];计算机科学;2001年10期
【相似文献】
中国期刊全文数据库 前10条
1 邹文东;张立厚;;数据挖掘在水环境分析信息化中的应用[J];图书馆论坛;2006年05期
2 杨凯;;数据挖掘技术在中石油ERP中的应用研究[J];中国管理信息化;2010年17期
3 郑明秀;杨明根;;一阶马尔可夫链在点击流分析中的应用[J];西南民族大学学报(自然科学版);2007年01期
4 朱启家;;神经网络方法在工程预测中的应用[J];福建电脑;2009年10期
5 陈振海;孙世温;;数据挖掘在军交后付运费数据分析中的应用[J];四川兵工学报;2008年02期
6 谷琼;朱莉;蔡之华;袁红星;;基于决策树技术的高校研究生信息库数据挖掘研究[J];电子技术应用;2006年01期
7 向保林;;数据挖掘技术在电力市场中的运用[J];武汉电力职业技术学院学报;2005年01期
8 毛澄映;卢炎生;胡小华;;数据挖掘技术在软件工程中的应用综述[J];计算机科学;2009年05期
9 张德武,江国星;数据挖掘技术[J];现代计算机;2002年12期
10 刘志荣;;电子政务的数据挖掘研究[J];广东技术师范学院学报;2008年03期
中国重要会议论文全文数据库 前10条
1 马卫民;许卫华;;数据挖掘在预测金融机构发行个人理财产品中的应用[A];第三届中国智能计算大会论文集[C];2009年
2 马洪杰;曲晓飞;;数据挖掘技术和过程的特点[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
3 戈欣;吴晓芬;许建荣;;数据挖掘技术在放射科医疗管理中的潜在作用[A];2009中华医学会影像技术分会第十七次全国学术大会论文集[C];2009年
4 魏元珍;杨沂凤;;数据挖掘技术及其在数字图书馆中的应用[A];网络信息资源的搜集与应用——全国高校社科信息资料研究会第十次年会论文集[C];2004年
5 肖健;沈彩霞;;浅谈数据挖掘技术现状[A];广西计算机学会2008年年会论文集[C];2008年
6 巩耀亮;邱晓东;孙丽君;李树强;;数据挖掘技术在企业竞争情报系统中的应用研究[A];信息时代——科技情报研究学术论文集(第三辑)[C];2008年
7 王洪锋;;数据挖掘在客户关系管理中的应用研究[A];河南省通信学会2005年学术年会论文集[C];2005年
8 姚小磊;彭清华;;数据挖掘技术在中医眼科应用的设想[A];中华中医药学会第七次眼科学术交流会论文汇编[C];2008年
9 张婧;;数据挖掘技术在进销存系统中的应用[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
10 杨利军;勾学荣;;数据挖掘在移动客户流失预测中的研究和应用[A];2008年中国高校通信类院系学术研讨会论文集(上册)[C];2009年
中国重要报纸全文数据库 前10条
1 陈晓 山西财经大学教师;数据挖掘技术在高校教学管理中的应用[N];山西经济日报;2010年
2 记者 吕贤如;大力加强数据挖掘技术研究应用[N];光明日报;2006年
3 主持人 李禾;数据挖掘技术如何驱动经济车轮[N];科技日报;2007年
4 首之;数据挖掘并不神秘[N];金融时报;2006年
5 ;IBM公司推出新型数据挖掘技术[N];中国高新技术产业导报;2001年
6 刘红岩、何军;利用数据挖掘技术获得商业智能[N];中国计算机报;2003年
7 山西银行学校 王林芳;数据挖掘在银行业务中的应用[N];山西科技报;2005年
8 任中华;财务数据挖掘六步走[N];中国计算机报;2007年
9 诺达咨询高级咨询顾问 周连升;数据挖掘拓展3G增值空间[N];通信产业报;2007年
10 徐扬;如何从数据中“挤出”效益[N];中国计算机报;2002年
中国博士学位论文全文数据库 前10条
1 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年
2 庞淑英;三江并流带旅游地质景观数据挖掘及旅游价值评价研究[D];昆明理工大学;2008年
3 赵晨;过程控制中的数据挖掘技术研究及其智能控制策略探讨[D];浙江大学;2005年
4 高清东;复杂供矿条件矿山技术指标整体动态优化系统及应用[D];北京科技大学;2005年
5 李兴;高光谱数据库及数据挖掘研究[D];中国科学院研究生院(遥感应用研究所);2006年
6 王玉峰;变电站瞬态电磁环境及微机保护系统EMC研究[D];大连理工大学;2007年
7 潘海天;数据挖掘技术在聚合过程建模与控制的应用研究[D];浙江大学;2003年
8 程其云;基于数据挖掘的电力短期负荷预测模型及方法的研究[D];重庆大学;2004年
9 束志恒;化学化工数据挖掘技术的研究[D];浙江大学;2005年
10 孙蕾;医学图像智能挖掘关键技术研究[D];西北大学;2005年
中国硕士学位论文全文数据库 前10条
1 杨丽娜;基于遗传算法的数据挖掘技术研究[D];西安建筑科技大学;2007年
2 韩伟;基于粗糙集的数据挖掘技术在质量监督管理系统中的应用[D];浙江工业大学;2005年
3 吴程赟;纺织企业纱线质量的数据挖掘研究[D];东南大学;2006年
4 孙秀娟;基于遗传算法的K-means聚类算法分析研究[D];山东师范大学;2009年
5 张永军;基于智能计算技术的Web日志挖掘[D];吉林大学;2007年
6 赵林明;基于数据仓库的信用卡数据挖掘研究[D];山东科技大学;2005年
7 陈骏武;基于数据挖掘技术的电信客户关系管理研究[D];湖南大学;2005年
8 房静;面向CRM的数据挖掘在电力市场营销中的应用[D];天津大学;2004年
9 罗国甫;数据挖掘在银行客户经理考核系统中的应用[D];同济大学;2006年
10 王鑫;数据挖掘中聚类分析算法的研究[D];山东师范大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026