蛋白质结构预测的粒子群优化算法研究
【摘要】:蛋白质工程是现代生物技术发展的前沿领域,求解蛋白质结构预测问题是后基因组时代蛋白质工程中最重要的课题之一,同时也是生物信息学领域中极具挑战性的问题之一。蛋白质结构预测中的从头预测方法以热力学假说“蛋白质的天然构象是自由能最低的构象”为理论基础,通过计算蛋白质最低的能量值可以预测出蛋白质的结构。因此,使用从头预测方法来进行蛋白质结构预测可以归结为一个全局优化的问题。
AB(Toy)模型是蛋白质结构预测的经典模型之一。它是一种连续聚合体模型,比其他模型更接近真实的蛋白质结构,研究的现实意义也更大。基于AB(Toy)模型的蛋白质结构预测问题是一个典型的NP问题,寻找一种有效的全局优化算法是求解该问题的关键。目前,已经有许多启发式算法应用到蛋白质的二维AB模型中进行结构预测,但是这些方法预测的精度不够高,计算的速度也不够快。将粒子群优化(Particle Swarm Optimization,PSO)算法应用于蛋白质结构预测中是近几年来PSO算法的一个新的应用。
基于二维AB模型,本文研究了蛋白质结构预测的全局版本和局部版本的PSO算法。对局部版本的PSO算法,分别研究了环形五邻域结构、环形九邻域结构、冯?诺依曼五邻域结构和冯·诺依曼九邻域结构,在四条Fibonacci蛋白质测试序列上进行了仿真。
针对PSO算法在求解多变量优化问题中存在的不足,提出了一种带迭代改进策略的PSO算法框架,能有效地减少多变量之间的相互影响,使PSO算法有更好的局部求精能力。在典型测试函数上的仿真表明,带迭代改进策略的PSO算法明显优于传统PSO算法。将该算法框架应用到蛋白质结构预测的二维AB模型上,分别在四条Fibonacci蛋白质测试序列和真实的蛋白质序列上进行测试,结果表明,与传统PSO算法相比,迭代改进策略能提高粒子群优化算法的性能,能更有效地进行蛋白质的结构预测。