收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于遗传算法的数据挖掘技术研究

杨丽娜  
【摘要】: 数据挖掘技术的应用已经相当广泛,但关于数据挖掘方法的研究仍然方兴未艾。在众多的数据挖掘方法中,关于预测的方法和关于聚类的方法是相当常用的,目前也有很多学者在进行与这些算法相关的研究。但很多研究都是在某一方面对现有算法进行了改进,在关于预测和聚类算法及其它算法的研究中,没有一种方法是十全十美、可以解决现有算法存在的所有问题的。就预测和聚类算法而言,本文给出了作者对目前已有算法的一些改进方案。 在数据挖掘技术的预测方法中,回归分析是最常用也是最简单易行的预测分析技术,但这种分析存在很多不足,通常得到的结果不够精确,有时候误差会比较大。鉴于遗传算法的全局寻优特性,为了解决传统回归方程的参数精度问题,本文引入遗传算法来对回归方程中的参数进行寻优,以便优化回归方程。 在数据挖掘中,聚类分析也是一种很长用的技术。而聚类技术中K-means聚类分析技术又是最常用的方法。但K-means算法在实际应用中需要用户给出要聚类的数目即k的值,另外,K-means算法在运行时要首先随机产生一个初始聚类中心,然后再对使用这个初始聚类中心得到的聚类结果进行不断调整,而这个聚类结果在很大程度上受初始聚类中心选取的影响。为了消除K-means聚类算法对于用户输入k值的依赖,也为了减小K-means聚类算法受初始聚类中心的影响,本文引入了遗传算法。在具体实现中,首先在原始样本集的一个子集上运行遗传算法进行参数k的寻优以及在该最优值k的基础上对初始聚类中心的寻优,然后再在原始样本集上运行K-means聚类算法,最终得到聚类结果。 在最后,本文分别给出了对应于预测算法和聚类算法的应用实例,经过在实例数据集上的运行结果和先前方法的比较中得出,在这两种方法中引入遗传算法提高了预测和聚类的精度和准确性,试验证明,本文提出的方法具有良好的使用价值。


知网文化
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978