收藏本站
《东北师范大学》 2015年
加入收藏

进化算法研究及其在化学信息学中的应用

李向涛  
【摘要】:随着高强度的筛选技术、化学技术以及测序技术的出现,基于实验研究而形成的数据信息已经越来越多,尤其是在基因表达数据和原子团簇问题中。基因表达数据的特征选择问题和原子团簇问题都是化学信息学中的两个基本问题。原因在于:一是基因表达数据的分析可以给疾病的诊断带来方便。二是,可以通过分析团簇的结构来分析原子的结构。由于这两个问题都已经被证明是NP-难问题,以往的研究表明,对于NP-难问题来说,不太可能采用多项式内的复杂度的算法来求解这些问题。因此,在本文中主要采用两种进化算法,分别是生物地理学算法和微分进化算法解决基因表达数据的特征选择问题和原子团簇问题,具体内容如下:(1)提出了一种基于生物地理学算法的多目标离散算法,首先采用Fisher Markov selector来选择六十个最高分数的特征。接下来将选择出来的六十个特征将会作为多目标离散生物地理学算法的初始特征。再者,受到遗传算法的启发,提出了离散的迁移模型和变异模型。结合提出的离散生物地理学算法,研究了如何使用非支配排序的方法和拥挤距离方法来选择特征选择的两种目标:最小子集和最大精度,最终提出多目标离散生物地理学算法。为了说明算法的优越性和高效性,十个基因表达数据被使用,从实验结果来看,提出的算法不管是从精度角度,还是从特征子集的角度都是比粒子群算法,遗传算法以及一些改进的支持向量机要有竞争力。(2)提出了一种基于微分进化算法的多目标离散算法,该算法主要也是在研究如何选择合适的特征来分类基因表达数据问题。首先使用Fisher Markov selector来选择固定最高分数的特征。选择出来的特征将会作为多目标离散微分进化算法的初始特征。其次,知道标准的微分进化算法是一个用来求解连续优化问题的算法,它的编码是不适合求解离散问题的。在本文中,提出了离散的变异模型。该模型主要的目的是平衡算法的开采性和挖掘性。其次,结合提出的离散微分进化算法,研究了如何使用归一化目标值总和和多样性选择的方法来选择个体,最终提出多目标离散微分进化算法。值得说明的是,提出的算法同时也对支持向量机的两个参数进行优化。为了说明算法的优越性和高效性,十个基因表达数据被使用,从实验结果来看,提出的算法不管是从精度角度,还是从特征子集的角度都是比其它的离散微分进化算法和其它的进化算法要有竞争力。(3)提出一种新的微分进化算法用来求解原子团簇问题和函数优化问题。改进的微分进化算法主要从变异规则和参数设置两个部分来考虑。对于变异规则,使用了两种常用的变异规则分别是:DE/rand/2/bin和DE/rand to pbest/1/bin。为了平衡这两个变异规则的性能,使用概率选择的方法来选择这两个变异规则,值得注意的是对于一个个体在一次迭代中只选择一个变异规则。对于参数设置,知道标准的微分进化算法对于F和CR值都是常数。然而,这样的参数设置特别容易使得算法出现收敛过慢或者陷入局部最优解这些常见的问题。并且对于不同的问题事实上所需要的参数设置也是各不相同的。针对这一问题,提出了自适应的参数设置方法,该方法是记录算法上一次迭代的结果来判断参数设置是否成功,然后根据成功率来重新生成下一次迭代中种群中个体的参数。总之上述的改进策略都是为了平衡算法的开采性和挖掘性。从实验结构来看,提出的算法还是非常有竞争力的。
【关键词】:遗传算法 粒子群算法 生物地理学算法 微分进化算法 基因表达数据 特征选择问题 原子团簇问题
【学位授予单位】:东北师范大学
【学位级别】:博士
【学位授予年份】:2015
【分类号】:O69;TP18
【目录】:
  • 摘要4-6
  • Abstract6-11
  • 第一章 绪论11-17
  • 1.1 研究背景11-14
  • 1.1.1 化学信息学简介11-12
  • 1.1.2 进化算法在化学信息学中的应用12-13
  • 1.1.3 基因表达数据13
  • 1.1.4 原子团簇13-14
  • 1.2 本文工作14-17
  • 1.2.1 本文的研究内容14-15
  • 1.2.2 本文的组织结构15-17
  • 第二章 进化算法17-29
  • 2.1 人工蜂群算法17-19
  • 2.1.1 人工蜂群算法的基本框架17-18
  • 2.1.2 人工蜂群算法的国内外现状18-19
  • 2.2 粒子群算法19-20
  • 2.2.1 粒子群算法的基本框架19-20
  • 2.2.2 粒子群算法的国内外现状20
  • 2.3 生物地理学算法20-25
  • 2.3.1 生物地理学算法的基本框架20-24
  • 2.3.2 生物地理学算法的国内外现状24-25
  • 2.4 微分进化算法25-28
  • 2.4.1 微分进化算法的基本框架25-28
  • 2.4.2 微分进化算法的国内外现状28
  • 2.5 本章小结28-29
  • 第三章 基于多目标算法的基因表达数据特征选择问题的研究29-47
  • 3.1 引言29-30
  • 3.2 多目标离散生物地理学算法30-36
  • 3.2.1 离散生物地理学算法30-31
  • 3.2.2 多目标离散生物地理学算法31-33
  • 3.2.3 混合多目标离散生物地理学算法33-36
  • 3.2.4 算法的复杂度36
  • 3.3 实验结果及分析36-46
  • 3.4 本章小结46-47
  • 第四章 基于多目标离散微分进化算法的基因表达数据分析47-67
  • 4.1 引言47-48
  • 4.2 多目标离散微分进化算法48-55
  • 4.2.1 Fisher-Markov selector49
  • 4.2.2 多目标离散微分进化算法49-54
  • 4.2.3 支持向量机54
  • 4.2.4 算法的复杂度54-55
  • 4.3 实验设置55
  • 4.4 实验讨论与分析55-66
  • 4.4.1 与单目标优化算法进行比较63-64
  • 4.4.2 与多目标优化算法NSGAII进行比较64-65
  • 4.4.3 Wilcoxon秩和检验65-66
  • 4.5 本章小结66-67
  • 第五章 基于改进微分进化算法的原子团簇问题研究67-93
  • 5.1 引言67-69
  • 5.2 LJ团簇的势能模型69
  • 5.3 改进的微分进化算法69-75
  • 5.3.1 改进的变异机制69-71
  • 5.3.2 随机放缩因子71-72
  • 5.3.3 自适应的交叉因子72-73
  • 5.3.4 边界约束73-74
  • 5.3.5 自适应的改进差分进化算法74-75
  • 5.4 实验结果及分析75-92
  • 5.4.1 实验设置77-78
  • 5.4.2 不同的 ω 值的效果78-79
  • 5.4.3 在原子团簇问题上的比较试验79
  • 5.4.4 与不同参数的微分进化算法进行比较79-82
  • 5.4.5 比较MDE与其它微分进化算法82-85
  • 5.4.6 与其它进化算法进行比较85-87
  • 5.4.7 与EP算法进行比较87-89
  • 5.4.8 改进微分进化算法的参数验证89-92
  • 5.5 本章小结92-93
  • 第六章 总结与展望93-95
  • 6.1 总结93
  • 6.2 展望93-95
  • 参考文献95-106
  • 致谢106-107
  • 在学期间公开发表论文及著作情况107-10

【相似文献】
中国重要会议论文全文数据库 前9条
1 刘明兰;王玲琍;曾春年;钟绍华;张俊;;双模自组织Fuzzy-Dahlin算法研究[A];1997中国控制与决策学术年会论文集[C];1997年
2 胡海清;;序列最小优化及其改进算法[A];第十届中国科协年会信息化与社会发展学术讨论会分会场论文集[C];2008年
3 王春厚;许都;孙健;;一种降低误判率的BF快速匹配算法结构[A];2010年全国通信安全学术会议论文集[C];2010年
4 桑红燕;潘全科;任立群;;解决单机准时排序问题的差异进化算法[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
5 周川;张璐;陈庆伟;;基于神经网络PID的智能AQM新算法[A];第二十七届中国控制会议论文集[C];2008年
6 陈小林;赵建;王延杰;;多模实时跟踪算法研究[A];第七届全国信息获取与处理学术会议论文集[C];2009年
7 傅荟璇;王宇超;孙枫;;融合Kalman滤波的自适应带宽Mean Shift算法[A];2011年中国智能自动化学术会议论文集(第一分册)[C];2011年
8 羌磊;肖田元;宋士吉;;多种群模式协同搜索贝叶斯优化算法[A];第25届中国控制会议论文集(中册)[C];2006年
9 阮秀凯;张志涌;;一种基于支持向量回归的盲恢复新算法[A];2009年中国智能自动化会议论文集(第七分册)[南京理工大学学报(增刊)][C];2009年
中国博士学位论文全文数据库 前7条
1 李向涛;进化算法研究及其在化学信息学中的应用[D];东北师范大学;2015年
2 许伟;基于进化算法的复杂化工过程智能建模方法及其应用[D];华东理工大学;2011年
3 郑友莲;面向模糊车间调度问题的智能算法研究[D];武汉大学;2011年
4 高健;分布式环境的同顺序流水作业问题求解算法研究[D];大连海事大学;2013年
5 毕云龙;自适应声学回声抑制算法研究及其VLSI芯片设计[D];哈尔滨工业大学;2010年
6 赵立权;ICA算法及其在阵列信号处理中的应用研究[D];哈尔滨工程大学;2009年
7 邹德旋;启发式算法及其在工程优化中的应用[D];东北大学;2011年
中国硕士学位论文全文数据库 前10条
1 焦健;基于知网和话题更新的话题跟踪算法研究[D];北京交通大学;2009年
2 岳凤;多态蚁群算法研究及其应用[D];山东师范大学;2009年
3 涂小坡;图像显著性算法和评价研究[D];南京航空航天大学;2011年
4 张俊杰;改进的社会力模型优化算法的研究与应用[D];太原理工大学;2014年
5 易卜拉欣;基于文化框架的群搜索和粒子群的混合算法及其应用[D];华东理工大学;2014年
6 刘梦楠;类电磁机制算法的研究与改进[D];西安电子科技大学;2014年
7 张可;蚁群算法的参数调整研究[D];合肥工业大学;2012年
8 房艳红;基于蚁群算法的订单接受与加工调度优化决策问题研究[D];南京理工大学;2013年
9 张冰冰;蚁群算法在控制系统中的应用研究[D];新疆大学;2013年
10 汪博峰;三维编织复合材料几何成型仿真及算法研究[D];华中科技大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026