收藏本站
《广西师范大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

基于粒子对和极值优化的基因聚类混合算法研究

禤浚波  
【摘要】:随着人类基因组计划的完成,生命科学的研究进入到后基因组时代,研究的重点已变为确定每条基因在生物体中的功能以及基因之间相互作用和调控的关系。作为后基因组时代功能基因组研究最基本的实验手段,基因芯片一次实验可以同时观测成千上万条基因在不同实验条件下的表达情况,从而产生了大量蕴含着基因活动信息的基因表达数据。如何分析和处理这些基因表达数据,以提取出对人类有意义的生物、医学信息,已成为后基因组时代人们关注和研究的热点。目前,聚类方法是对基因表达数据进行分析和处理的主要计算技术之一。通过对基因表达数据进行聚类,能够将表达模式相似或相同的基因归纳成类,有助于对基因功能、基因调控、细胞过程、细胞亚型等进行综合的研究,在补充未知基因的生物学功能注释、临床诊断治疗等方面具有重要的现实意义。因此,已有大量国内外学者提出了应用到基因表达数据聚类分析中的各种聚类算法。作为一种较新颖的基因聚类算法,粒子对算法(PPO)在一些基因表达数据集中获得了较好的聚类效果,但也存在着一些有待解决的问题。本文就是围绕着如何进一步提高PPO算法的聚类效果开展研究,主要做的相关研究工作如下: (1)对生物信息学的相关基础知识进行了简单介绍,接着对基因表达数据的获得、表示、预处理、聚类分析原理和聚类结果评价进行了较为详细的分析,最后获取了本文进行聚类分析实验所用到的两组基因表达数据集。 (2)对K-means、层次聚类这两种传统的基因聚类算法的原理进行了简单分析,接着介绍了标准粒子群优化算法(PSO)的原理,并分析了粒子群聚类算法的原理和优缺点,最后对基本PPO算法的原理、聚类流程和特点进行了较为详细的阐述。 (3)对基本PPO算法进行了较为深入的研究,分析了PPO算法存在着有待解决的3个问题,并相应提出了3种改进思路:用K-means快速聚类结果初始化一个粒子、为初始粒子对之间引入一种最优信息共享策略、根据粒子对的统计信息对属于不同类别的粒子采用不同的速度进化公式,由此得到了一种新的改进粒子对算法ImPPO。为验证改进思路和改进算法ImPPO的有效性,采用了三个基因表达数据集进行聚类分析实验。实验结果表明,与K-means、基本PPO算法相比,提出的改进思路和改进算法ImPPO在一些基因表达数据集中获得了较好的聚类效果,并且再一次说明了对于不同的聚类算法,甚至同一聚类算法使用不同的参数,应用到同一基因表达数据集中可能会得到不同的聚类结果。 (4)在对基本极值优化算法(EO)的原理、特点进行分析的基础上,结合PPO和EO算法的优点,提出了一种新的基因聚类混合算法PPO-EO。混合算法PPO-EO在精英粒子对的迭代过程中根据一定的迭代次数将EO算法引入到PPO算法中,一方面利用EO算法强大的局部搜索能力的优点克服PPO算法后期可能过早陷入局部最优的缺点,另一方面利用PPO算法能够保证全局收敛的优点克服EO算法不能保证收敛的缺点,发挥二者的优势完成基因聚类,以提高基因聚类结果的精度。为评价混合算法的聚类效果,通过采用另外三个基因表达数据集进行了聚类分析实验。实验结果表明,混合算法PPO-EO在三个聚类评价指标均方差函数、类内紧致性和类间分离度方面获得了比K-means、PPO算法更好的聚类结果精度。
【学位授予单位】:广西师范大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP301.6

【引证文献】
中国硕士学位论文全文数据库 前1条
1 禤世丽;基于粒子对和差分进化的基因聚类混合算法研究[D];广西师范大学;2012年
【参考文献】
中国期刊全文数据库 前10条
1 阮晓钢;李晓明;王金莲;;边介数聚类算法在肿瘤基因表达谱中的应用[J];北京工业大学学报;2008年07期
2 纪震;廖惠连;许文焕;姜来;;粒子对算法在图像矢量量化中的应用[J];电子学报;2007年10期
3 毕晓君;刘国安;;种群分类粒子群改进算法研究[J];哈尔滨工程大学学报;2008年09期
4 陆媛;杨慧中;;基于代表熵的基因表达数据聚类分析方法[J];计算机工程与应用;2008年27期
5 张国印;程慧杰;刘咏梅;姚爱红;;一种新算法在基因表达谱聚类中的应用[J];计算机工程与应用;2009年36期
6 高倩倩;须文波;孙俊;;量子行为粒子群算法在基因聚类中的应用[J];计算机工程与应用;2010年21期
7 欧阳金华;孙季丰;;基于改进粒子群算法的矢量量化码书设计研究[J];科学技术与工程;2010年28期
8 齐洁;汪定伟;;极值优化算法综述[J];控制与决策;2007年10期
9 岳峰;孙亮;王宽全;王永吉;左旺孟;;基因表达数据的聚类分析研究进展[J];自动化学报;2008年02期
10 张亮,张岩,周一鸣,安爽,果德安,周玉祥,曾令文,程京;用聚类法分析受抗真菌物质处理后的酵母细胞全基因表达谱[J];生物化学与生物物理进展;2002年04期
中国博士学位论文全文数据库 前1条
1 杨春梅;基因表达数据聚类分析算法研究和应用[D];天津大学;2006年
中国硕士学位论文全文数据库 前2条
1 梅丽;人类启动子识别算法研究[D];辽宁师范大学;2010年
2 高倩倩;基因表达数据的聚类算法研究及其实现[D];江南大学;2009年
【共引文献】
中国期刊全文数据库 前10条
1 汪雪红;焦清局;常盼盼;黄继风;;基于最小编码长度的基因数据聚类[J];安徽农业科学;2012年19期
2 刘开云;刘保国;徐冲;;基于PSO-BP算法的隧道非线性位移分析模型[J];地下空间与工程学报;2009年02期
3 谭乐祖;任东彦;温巧林;;基于杂交粒子群算法的弹炮混编防空群火力优化模型[J];兵工自动化;2010年02期
4 丁铸;马大为;于存贵;张学锋;;基于禁忌搜索与微粒群优化算法的混合优化策略算法在目标分配问题上的应用[J];兵工学报;2007年09期
5 董跃;田雨波;;基于PSO-BP算法的微带天线谐振频率神经网络建模[J];中国传媒大学学报(自然科学版);2009年02期
6 高超;刘际明;钟宁;黄佳进;邱洪君;;邮件网络免疫策略仿真[J];北京工业大学学报;2010年06期
7 陈昊;厉虹;;基于粒子群算法的无刷直流电机调速系统应用研究[J];北京机械工业学院学报;2008年04期
8 杨思亮;徐世杰;;基于粒子群算法的航天器姿态机动路径规划[J];北京航空航天大学学报;2010年01期
9 张华;张葛祥;程吉祥;;基于混合搜索算法的图像稀疏分解[J];重庆邮电大学学报(自然科学版);2011年03期
10 祁辉;周树民;熊鹰;;含步长加速变异算子的微粒群算法[J];成都大学学报(自然科学版);2006年04期
中国重要会议论文全文数据库 前10条
1 崔志华;蔡星娟;曾建潮;孙国基;;基于预测速度的改进微粒群算法[A];第二十六届中国控制会议论文集[C];2007年
2 袁少强;徐发洋;;基于CPSO的有限反馈增益系统设计[A];中国自动化学会控制理论专业委员会B卷[C];2011年
3 曾祥远;李俊峰;宝音贺西;;应用太阳帆的金星往返任务轨迹优化[A];北京力学会第十六届学术年会论文集[C];2010年
4 陈军;潘艳;唐世星;张吉强;易东;;小脑基因表达数据的模糊多尺度聚类分析[A];重庆市预防医学会2010年论文集[C];2011年
5 王云;董增寿;卓东风;;基于图像纹理和结构特征的燃烧指数的高温低氧火焰燃烧稳定性识别[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
6 张桐;王亚慧;叶安丽;王健;;基于微粒群算法与最小二乘法的在线辨识策略研究[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(下册)[C];2008年
7 胡松峰;彭显刚;;电网短期负荷预测方法综述[A];武汉(南方九省)电工理论学会第22届学术年会、河南省电工技术学会年会论文集[C];2010年
8 曾建潮;薛颂东;;群机器人系统的建模与仿真[A];'2008系统仿真技术及其应用学术会议论文集[C];2008年
9 李丽娟;黄志斌;刘锋;;启发式粒子群算法及其应用研究[A];第16届全国结构工程学术会议论文集(第Ⅰ册)[C];2007年
10 王元元;曾建潮;谭瑛;;基于环形结构带缓存器模型的并行微粒群算法[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年
中国博士学位论文全文数据库 前10条
1 谭佳琳;粒子群优化算法研究及其在海底地形辅助导航中的应用[D];哈尔滨工程大学;2010年
2 张进;地震叠前数据的弹性阻抗非线性反演方法研究[D];中国海洋大学;2009年
3 曲建华;基于群体智能的聚类分析[D];山东师范大学;2010年
4 周晖;自由搜索算法及其在传感器网络中的应用[D];东华大学;2010年
5 董浩;RNA二级结构预测方法研究[D];吉林大学;2011年
6 孙亦鹏;基于多光谱分析的火焰温度及烟黑浓度分布检测[D];华中科技大学;2011年
7 谢丽萍;基于拟态物理学的全局优化算法设计及性能分析[D];兰州理工大学;2010年
8 赵静;无线多媒体传感器网络的覆盖控制与目标跟踪问题研究[D];兰州理工大学;2010年
9 王艳;多目标拟态物理学优化算法及其应用研究[D];兰州理工大学;2011年
10 王丽芳;基于copula理论的分布估计算法研究[D];兰州理工大学;2011年
中国硕士学位论文全文数据库 前10条
1 柳枝华;微粒群优化算法的改进及应用[D];南昌航空大学;2010年
2 赵乐乐;在役桥梁结构健康诊断与寿命预测技术研究[D];郑州大学;2010年
3 杨书显;基于PSO算法的氧乐果合成过程建模与控制研究[D];郑州大学;2010年
4 边峦剑;基于改进粒子群的盲源分离算法及其应用研究[D];哈尔滨工程大学;2010年
5 曹巍巍;基于智能优化算法的OFDMA系统自适应资源分配问题研究[D];哈尔滨工程大学;2010年
6 郭建霞;基于现金流的工程进度协调优化研究[D];大连理工大学;2010年
7 李鹤鹏;基于搜索算法的煤矿生产系统可靠性优化研究[D];辽宁工程技术大学;2009年
8 黄文娟;基于人工鱼群算法的动态目标跟踪技术研究[D];天津理工大学;2010年
9 燕居伟;工程建设项目控制目标优化研究[D];河北工程大学;2010年
10 姜晓伟;粒子群算法在查询优化中的应用[D];哈尔滨理工大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 纪震;廖惠连;许文焕;姜来;;粒子对算法在图像矢量量化中的应用[J];电子学报;2007年10期
2 王正华,王勇献;后基因组时代生物信息学的新进展[J];国防科技大学学报;2003年01期
3 张国印;程慧杰;刘咏梅;姚爱红;;一种新算法在基因表达谱聚类中的应用[J];计算机工程与应用;2009年36期
4 高倩倩;须文波;孙俊;;量子行为粒子群算法在基因聚类中的应用[J];计算机工程与应用;2010年21期
5 吴旻;生物信息学的发展[J];中国科学院院刊;1998年03期
6 刘波;王凌;金以慧;;差分进化算法研究进展[J];控制与决策;2007年07期
7 唐焕文,靳利霞;生物信息学的产生、发展及应用前景[J];洛阳师范学院学报;2001年02期
8 岳峰;孙亮;王宽全;王永吉;左旺孟;;基因表达数据的聚类分析研究进展[J];自动化学报;2008年02期
9 李松;王英;;生物信息学在生命科学研究中的应用[J];热带医学杂志;2009年10期
10 李维忠,王任小,林大威,毛凤楼,韩玉真,来鲁华;国内外生物信息学数据库服务新进展[J];生物化学与生物物理进展;1999年01期
中国硕士学位论文全文数据库 前1条
1 高倩倩;基因表达数据的聚类算法研究及其实现[D];江南大学;2009年
【二级参考文献】
中国期刊全文数据库 前10条
1 田盛丰;基于核函数的学习算法[J];北方交通大学学报;2003年02期
2 王修竹;刘自伟;齐阳;鲍竞;;基因表达数据的预处理方法[J];兵工自动化;2006年07期
3 裘敏燕,李瑶,谢毅,毛裕民;基因芯片技术及其应用[J];第二军医大学学报;2001年06期
4 李霞,罗雪晖,张基宏;基于人工蚁群优化的矢量量化码书设计算法[J];电子学报;2004年07期
5 原峰山,朱思铭;基于傅立叶变换的变元可分离核函数的确定方法[J];广州航海高等专科学校学报;2003年02期
6 ;Genetic Algorithms Applied to Multi-Class Clustering for Gene Ex-pression Data[J];Genomics Proteomics & Bioinformatics;2003年04期
7 王长本,刘兴晖,王伟灵,周新;基因表达数据的聚类分析[J];国外医学(临床生物化学与检验学分册);2004年04期
8 顾坚磊;周雁;;中国基因组生物信息学回顾与展望[J];中国科学(C辑:生命科学);2008年10期
9 王士同;修宇;;基于模型的基因表达聚类分析技术研究进展[J];江南大学学报;2006年03期
10 杨占华;杨燕;;SOM神经网络算法的研究与进展[J];计算机工程;2006年16期
中国博士学位论文全文数据库 前2条
1 刘志刚;支撑向量机在光谱遥感影像分类中的若干问题研究[D];武汉大学;2004年
2 杜耀华;基因组转录调控元件的特征分析与识别算法研究[D];国防科学技术大学;2006年
中国硕士学位论文全文数据库 前3条
1 万江;基于SOM基因聚类的基因数据组织样本聚类[D];西安电子科技大学;2005年
2 智慧;人类RNA聚合酶Ⅱ启动子识别研究[D];同济大学;2008年
3 董宜堃;基因序列数据的启动子识别系统研究[D];哈尔滨工程大学;2009年
【相似文献】
中国期刊全文数据库 前10条
1 蔡莉;郭红;;一种改进的基因表达数据双聚类算法[J];福州大学学报(自然科学版);2010年01期
2 李刚;苗夺谦;王睿智;;一种基于粗糙遗传算法的缩放模式双聚类分析方法[J];计算机科学;2010年01期
3 唐世星;陈军;柯凤琴;;基于FCM算法的小脑基因模糊聚类分析[J];数学的实践与认识;2010年12期
4 赵欣;叶庆卫;周宇;;一种保持PSO与GA独立性的混合优化算法[J];计算机工程与应用;2009年26期
5 闵克学;葛宏伟;张毅;梁艳春;;基于蚁群和粒子群优化的混合算法求解TSP问题[J];吉林大学学报(信息科学版);2006年04期
6 芦玉梅;姜伟;;变长度可重复自然数编码的混合算法在模具异地制造调度中的应用[J];机械设计与制造;2006年11期
7 宋晓宇;朱云龙;尹朝万;李富明;;应用混合蚁群算法求解模糊作业车间调度问题[J];计算机集成制造系统;2007年01期
8 宁黎华;古天龙;;装配序列规划问题求解的一种混合算法[J];计算机集成制造系统;2007年04期
9 陆克中;王汝传;章家顺;;最优化问题全局寻优的PSO-BFGS混合算法[J];计算机应用研究;2007年05期
10 王伟;;混合粒子群算法及其优化效率评价[J];中国水运(学术版);2007年06期
中国重要会议论文全文数据库 前10条
1 赵宇海;印莹;王国仁;许光宇;王之琼;;最大子空间共调控基因聚类[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
2 赵宇海;印莹;王国仁;许光宇;;挖掘微阵列数据集中的最大局部保守基因聚类[A];第二十三届中国数据库学术会议论文集(研究报告篇)[C];2006年
3 游波;张明敏;;基于MFP/LTI积分混合算法的贝叶斯检测阈问题研究[A];中国声学学会2002年全国声学学术会议论文集[C];2002年
4 史琰;梁昌洪;;应用傅立叶伪谱时域算法与高阶时域有限差分方法的混合算法到2.5维问题中[A];2005'全国微波毫米波会议论文集(第二册)[C];2006年
5 王乐;田李;贾焰;韩伟红;;一个并行的文本聚类混合算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
6 杨昆;李建中;王朝坤;徐继伟;;基因表达数据的基于类别树和SVMs的多类癌症分类算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
7 陈军;潘艳;唐世星;张吉强;易东;;小脑基因表达数据的模糊多尺度聚类分析[A];重庆市预防医学会2010年论文集[C];2011年
8 贾宁;陈庚;郭中源;陈岩;;混合算法在分数判决反馈均衡器中的应用[A];2008年全国声学学术会议论文集[C];2008年
9 余建军;孙树栋;;模拟退火免疫混合算法[A];全国第16届计算机科学与技术应用(CACIS)学术会议论文集[C];2004年
10 李嘉;王梦光;唐立新;宋建海;;求解异种车队车辆路径问题的混合遗传算法[A];2001中国控制与决策学术年会论文集[C];2001年
中国重要报纸全文数据库 前3条
1 唐慧;让电子邮件更安全[N];网络世界;2002年
2 曹秀敏;物料平衡的控制核算系统[N];中国石化报;2002年
3 记者 宋广平;多方联手进军IPTV市场[N];计算机世界;2005年
中国博士学位论文全文数据库 前10条
1 程慧杰;基于模式识别方法的基因表达数据分析研究[D];哈尔滨工程大学;2012年
2 马骥;高低频混合算法的研究与应用[D];西安电子科技大学;2013年
3 王强;局部叠加基因表达模式聚类分析方法研究[D];哈尔滨工业大学;2012年
4 张焕萍;面向基因表达数据的致病基因挖掘方法研究[D];南京航空航天大学;2009年
5 陆慧娟;基于基因表达数据的肿瘤分类算法研究[D];中国矿业大学;2012年
6 蔡瑞初;基因表达数据挖掘若干关键技术研究[D];华南理工大学;2010年
7 汤炜;ADI-FDTD及其混合算法在电磁散射中的应用[D];西安电子科技大学;2005年
8 陈伟;群体智能算法及其在基因表达数据聚类中的应用[D];江南大学;2011年
9 刘克钦;基于生物信号通路的复杂疾病标志物识别与研究[D];上海大学;2013年
10 朱剑;复杂电磁问题的有限元、边界积分及混合算法的快速分析技术[D];南京理工大学;2011年
中国硕士学位论文全文数据库 前10条
1 禤浚波;基于粒子对和极值优化的基因聚类混合算法研究[D];广西师范大学;2011年
2 禤世丽;基于粒子对和差分进化的基因聚类混合算法研究[D];广西师范大学;2012年
3 邓庆山;聚类分析及其在基因表达数据中的应用研究[D];华中科技大学;2004年
4 刘月明;基因表达聚类分析方法研究[D];第三军医大学;2001年
5 陈佳妮;基因表达数据分析中IGA-FCM聚类算法研究与实现[D];东北林业大学;2010年
6 周鹏;神经网络集成算法研究及在基因表达数据分析中的应用[D];华中科技大学;2004年
7 张礼;寻找差异基因的概率方法研究[D];南京航空航天大学;2010年
8 李嘉;电力系统暂态稳定分析的混合算法[D];广西大学;2005年
9 许宁;对粒子群算法的改进及应用[D];浙江大学;2006年
10 马江涛;基于遗传与蚁群的混合算法路径优化研究[D];湖北工业大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026