收藏本站
《大连理工大学》 2004年
收藏 | 手机打开
二维码
手机客户端打开本文

蛋白质二级结构预测方法研究

张海霞  
【摘要】:随着人类基因组计划的完成,人们已经获得了大量生物的遗传信息,数以万计的蛋白质序列也已经被测出,到2004年4月13日为止SWISS-PROT数据库中总共收集了148516条已被测序的蛋白质序列。然而一条蛋白质序列必须折叠成一定的空间结构时才能发挥它特定的生物功能,人们在对蛋白质序列测序完成之后更希望的是得到这些蛋白质的空间结构,以便发现结构与功能之间的联系。因此,蛋白质结构和功能的研究就成为了后基因组时代生命科学领域人们研究的主要任务和目的。 目前,通过实验的方法获得的蛋白质结构序列只有两万多条(2004年4月20日,PDB数据库中共收集了25176条),远远落后于蛋白质序列的测序速度,因此理论预测蛋白质结构势在必行。然而,直接从蛋白质一级序列预测其三维空间结构时人们又遇到了诸多困难。在对蛋白质分子的仔细研究和分析后发现由二级结构组装而成的空间结构是有限的。因此,如果能从蛋白质一级序列先预测出二级结构,再由二级结构预测三级结构便成为一条有效的途径。这里,蛋白质二级结构预测不仅成为联系蛋白质一级序列和三级结构的纽带,而且也是从一级序列预测其三维空间结构的关键步骤。 本文的主要工作是蛋白质二级结构预测方法的研究,具体工作概括如下: 1.从上世纪60年代中期至今,蛋白质二级结构预测已经发展了40年的时间,期间涌现出了许多好的预测方法。然而,由于每种方法选用的数据集不同、对二级结构的定义不同、选用的评价指标不同,因此方法间无法进行客观、全面的比较。而且研究证明,上述几个方面的因素对方法的预测结果影响较大,因此就迫切需要在一个统一的标准下将多种方法进行评价,从而找出目前最好的方法,也能从中发现需要继承和改进的方向。本文针对上述几个因素选择了统一的标准,对目前主要的十种方法进行了评价,这十种方法分别是:GORⅠ、PROF、GORⅣ、NNPREDICT、PHDsec、SSpro v 2.0、PSIPRED、PREDATOR、SOPMA和APSSP2。这一工作的过程是繁杂而费时的,工作量较大,至今没有其他人做出。 2.FDOD方法是一种比较多序列间差异程度的有效方法,作者将这一方法首次用于蛋白质二级结构预测中,得到了令人鼓舞的结果,准确率达到了78.8%,是目前二级结构预测中最好的结果之一。鉴于这一令作者也颇感意外的结果,文中对FDOD方法做了详细地分析,它的优势在于:一,它使用子序列分布作为序列特征的描述,无需引入其它物化参数且又挖掘出了序列本身尽可能多的特征信息,从而很好地给出了序列与结构之间的关系。二,FDOD函数的使用。FDOD函数是基于信息论中熵的概念,输入向量是一个概率分布,计算中只涉及到简单运算,因此对输入向量的规模没有大的限制。与其 它方法相比,FDOD方法具有明显的运算速度优势而且预测准确率高。 神经网络方法是蛋白质二级结构预测发展过程中的一类重要方法。从1988 年Qian和Sejnowski首次将其应用到二级结构预测至今又有了很大的改进和 提高。作者对这一方法进行了认真的学习,用一种改进的BP网络进行了实 际预测。由于受到时间和经验等多方面的影响,目前这一尝试只得到了一个 初步的结果,还需要在今后的工作中继续进行研究。 支持向量机方法是一类较好的机器学习算法,我国学者孙之荣等人将这种方 法首先用于了蛋白质二级结构的预测。然而由于支持向量机方法在处理大规 模数据时需要的时间和空间的代价很高,为了解决这一问题我们将支持向量 机与增量学习技术结合起来,提出了一种改进的支持向量机增量学习方法, 并将其应用于蛋白质二级结构预测中。预测结果显示,此算法可在牺牲很小 的测试精度(不足1%)的前提下节省一半左右的训练时间,从而提高了二 级结构预测的效率。
【学位授予单位】:大连理工大学
【学位级别】:硕士
【学位授予年份】:2004
【分类号】:Q51

【引证文献】
中国期刊全文数据库 前2条
1 冉丽;邹先霞;许龙飞;;基于数据挖掘技术的蛋白质结构分类的研究[J];计算机工程与应用;2006年18期
2 武江勇;李立;;基于机器人机构学的蛋白质多肽链的运动学研究[J];机械设计与制造;2012年03期
中国博士学位论文全文数据库 前1条
1 刘桂霞;蛋白质关联图预测研究[D];吉林大学;2007年
中国硕士学位论文全文数据库 前6条
1 武江勇;基于机器人机构学的F_0F_1ATP合成酶马达能量储存研究[D];西南交通大学;2011年
2 雷国庆;面向生物信息学结构预测领域的算法加速器设计[D];国防科学技术大学;2010年
3 王荣兴;基于克隆选择算法蛋白质联系图预测的研究[D];吉林大学;2006年
4 孙波;产甲烷杆菌耐热性与序列结构关系的生物信息学研究[D];江南大学;2006年
5 俞文洋;支持向量机在蛋白质结构预测中的应用研究[D];河南大学;2008年
6 林锦华;基于隐马尔可夫模型的蛋白质二级结构预测[D];福建农林大学;2012年
【参考文献】
中国期刊全文数据库 前6条
1 张立震,唐焕文;一种基于子序列分布的蛋白质结构类预测方法[J];计算机与应用化学;2003年03期
2 张文,唐焕文,方伟武,修志龙;信息离散性度量方法在SARS病毒研究中的应用[J];计算机与应用化学;2003年06期
3 牛卫东,潘宪明;蛋白质结构预测[J];世界科技研究与发展;1998年01期
4 王志新;蛋白质结构预测的现状与展望[J];生命的化学;1998年06期
5 靳利霞,唐焕文;蛋白质结构预测方法简述[J];自然杂志;2001年04期
6 朱伟,史定华,王翼飞;神经网络在蛋白质二级结构预测中的应用[J];自然杂志;2003年03期
【共引文献】
中国期刊全文数据库 前10条
1 郭苗莉,朱江波,陈蓉芳,张天宝;应用基因表达谱芯片研究MNNG诱致小鼠胚胎畸形肢体基因表达的变化[J];癌变.畸变.突变;2005年02期
2 张世海,刘晓燕,欧进萍;高层结构智能选型知识发现及方法比较[J];四川建筑科学研究;2005年05期
3 崔旖娜;王苏岩;李宏男;;基于BP神经网络时间序列方法的辽宁省建筑业经济技术指标预测[J];四川建筑科学研究;2008年02期
4 王朝霞;生物信息学:一门前沿交叉学科[J];安徽教育学院学报;2002年06期
5 潘洁珠;半结构化数据及其数据模型[J];安徽教育学院学报;2003年06期
6 陈征;;一类系统的二次李雅普诺夫函数存在性的判断[J];安徽电子信息职业技术学院学报;2006年04期
7 赵鹏,倪志伟,贾瑞玉;基于数据挖掘技术的范例库维护[J];安徽大学学报(自然科学版);2003年02期
8 孙小军;焦建民;何俊红;;解优化问题的遗传加速信赖域搜索算法[J];安徽大学学报(自然科学版);2008年03期
9 史冬燕;程在全;;云南疣粒野生稻部分cDNA片段的分离和注释[J];安徽大学学报(自然科学版);2008年03期
10 张家昕;段复建;;一种结合NCP函数的SQP滤子新算法[J];安徽大学学报(自然科学版);2010年05期
中国重要会议论文全文数据库 前10条
1 章曙光;;基于CBR的电力负荷预测系统的研究与实现[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 ;An effective procedure exploiting unlabeled data to build monitoring system[A];中国科学院地质与地球物理研究所第11届(2011年度)学术年会论文集(下)[C];2012年
3 刘钰;韩峰;董楠;陆希成;雷鸣;;爆炸容器安全概率的统计分析方法[A];全国危险物质与安全应急技术研讨会论文集(下)[C];2011年
4 吴敏;徐辰华;;铅锌烧结过程产量质量的神经网络预测方法[A];第二十六届中国控制会议论文集[C];2007年
5 ;A Novel Kernel PCA Support Vector Machine Algorithm with Feature Transition Function[A];第二十六届中国控制会议论文集[C];2007年
6 吕蓬;柳亦兵;马强;魏于凡;;支持向量机在齿轮智能故障诊断中的应用研究[A];第二十六届中国控制会议论文集[C];2007年
7 张佑春;王平;张公永;;基于D-S证据理论和神经网络的信息融合方法及应用[A];第二十七届中国控制会议论文集[C];2008年
8 ;Fault Pattern Recognition of Rolling Bearings Based on Wavelet Packet and Support Vector Machine[A];第二十七届中国控制会议论文集[C];2008年
9 蒋少华;桂卫华;阳春华;唐朝晖;蒋朝辉;;基于主元分析与支持向量机的方法及其在密闭鼓风炉过程监控诊断中的应用[A];第二十七届中国控制会议论文集[C];2008年
10 姚智颖;刘冬;;基于Kazakov线性化的迭代滤波[A];第二十九届中国控制会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 王杰;基于人工智能的乒乓球比赛技战术诊断与评估研究[D];上海体育学院;2010年
2 王冰;降解丝素放线菌的分离鉴定、发酵条件优化及其降解机制研究[D];山东农业大学;2009年
3 赵莹;半监督支持向量机学习算法研究[D];哈尔滨工程大学;2010年
4 谭佳琳;粒子群优化算法研究及其在海底地形辅助导航中的应用[D];哈尔滨工程大学;2010年
5 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
6 孙鹏飞;基于计算智能技术的蛋白质结构预测方法研究[D];哈尔滨工程大学;2010年
7 陈得宇;基于MAS的智能电压控制系统研究[D];哈尔滨工程大学;2010年
8 牟向伟;模糊语义个性化推荐系统在电子政务中的应用研究[D];大连海事大学;2010年
9 苏晓宏;海杂波的特性分析与目标检测处理[D];大连海事大学;2010年
10 刘冬雁;川西高原甘孜黄土记录的早更新世晚期以来的古气候变化[D];中国海洋大学;2009年
中国硕士学位论文全文数据库 前10条
1 张志慧;米糠的微波稳定化及其油脂和蛋白质的提取研究[D];华中农业大学;2010年
2 陈卫卫;耐高温水稻资源高温诱导表达蛋白鉴定与分析[D];华中农业大学;2010年
3 朱杰;一种基于聚类的支持向量机反问题求解算法[D];河北大学;2007年
4 张小亮;非线性规划的信赖域算法[D];河南理工大学;2010年
5 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
6 吴香庭;基于遗传算法的K-means聚类方法的研究[D];山东科技大学;2010年
7 王永;消防单兵综合信息采集系统研究[D];山东科技大学;2010年
8 徐芳芳;优化问题的PVD算法研究[D];山东科技大学;2010年
9 王春华;基于盲源分离的肺音信号提取研究[D];山东科技大学;2010年
10 滕景忠;智能瓦斯传感器的研制[D];山东科技大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 郑德玲,梁瑞鑫,付冬梅,李晓刚,方彤;人工免疫系统及人工免疫遗传算法在优化中的应用[J];北京科技大学学报;2003年03期
2 李丽娜,侯朝桢;基于支持向量机(SVM)的工业过程辨识[J];北京理工大学学报;2003年05期
3 郭大忠;柳洪义;张威;李丽娜;;冗余度机器人运动学和动力学同时优化[J];东北大学学报(自然科学版);2008年07期
4 李刚俊;;冗余度机器人的运动规划碰撞算法[J];电子科技大学学报;2005年06期
5 唐巍,李殿璞,陈学允;混沌理论及其应用研究[J];电力系统自动化;2000年07期
6 梁刚锋,谢涛;使用HSMMs模型的蛋白质二级结构预测[J];电脑知识与技术;2005年03期
7 魏冰川;刘振飞;卞江;;氢键能量分划方法[J];大学化学;2007年01期
8 吴佑寿;世界计算智能大会(WCCI'98)简介[J];电子科技导报;1998年10期
9 邹权;郭茂祖;张涛涛;;RNA二级结构预测方法综述[J];电子学报;2008年02期
10 燕忠,袁春伟;基于蚁群智能和支持向量机的人脸性别分类方法[J];电子与信息学报;2004年08期
中国博士学位论文全文数据库 前10条
1 王磊;免疫进化计算理论及应用[D];西安电子科技大学;2001年
2 徐雪松;基于人工免疫系统的函数优化及其在复杂系统中的应用研究[D];浙江大学;2004年
3 舒咬根;生物分子马达的定向输运机制及其ATP水解动力学[D];厦门大学;2004年
4 孙勇智;人工免疫系统模型、算法及其应用研究[D];浙江大学;2005年
5 丁彦蕊;嗜热菌耐热性与蛋白质序列、结构和功能关系的生物信息学研究[D];江南大学;2005年
6 李忠伟;支持向量机学习算法研究[D];哈尔滨工程大学;2006年
7 孙康;可重构计算相关技术研究[D];浙江大学;2007年
8 谷俊峰;蛋白质结构预测中几个关键问题的研究[D];大连理工大学;2009年
9 张艳;取代法计算多肽中N-H...O=C分子内氢键键能[D];辽宁师范大学;2008年
10 罗亮;蛋白质结构预测模型研究[D];华中科技大学;2010年
中国硕士学位论文全文数据库 前6条
1 孙海军;基于神经网络的蛋白质二级结构预测问题的研究[D];北京工业大学;2004年
2 梁刚锋;蛋白质二级结构的建模与预测[D];国防科学技术大学;2005年
3 袁前飞;基于支持向量机的癌症诊断研究[D];重庆大学;2007年
4 孙文恒;基于遗传算法和BP神经网络的蛋白质二级结构预测研究[D];兰州大学;2008年
5 张红亮;基于蛋白质和核酸的超冗余生物纳米机器人研究[D];西南交通大学;2009年
6 朱嘉瑜;基于粒子群优化算法的隐马尔可夫模型优化及其应用研究[D];广州大学;2009年
【二级引证文献】
中国期刊全文数据库 前4条
1 于晓丽;;蛋白质结构分类数据库[J];重庆理工大学学报(自然科学版);2010年11期
2 张军;陈柏松;李良峰;杨哲;;基于单因素SVM的航空兵空运转场飞行架次需求预测研究[J];飞机设计;2010年06期
3 刘君;熊忠阳;王银辉;;蛋白质二级结构的协同训练预测方法[J];计算机应用研究;2011年05期
4 刘英;李立;;机构学模型在多肽链构象势能计算中的应用[J];机械设计与制造;2014年02期
中国博士学位论文全文数据库 前2条
1 刘君;融合计算智能的蛋白质结构预测研究[D];重庆大学;2011年
2 王臣业;我国高校科技成果运营的模式及绩效评价研究[D];哈尔滨工程大学;2012年
中国硕士学位论文全文数据库 前6条
1 李倩;大肠杆菌苹果酸脱氢酶基因mdh克隆、高效表达及酶学性质研究[D];江南大学;2010年
2 于晓丽;蛋白质结构分类研究[D];华北电力大学(北京);2011年
3 许良;后驱轻型客车ESP免疫PI控制及车速估算方法研究[D];吉林大学;2007年
4 苏启龙;基于FPGA的并行RNA二级结构预测加速算法研究[D];上海交通大学;2013年
5 刘英;ATP合成酶分子马达的储能模型研究[D];西南交通大学;2013年
6 金李灿;智能计算在蛋白质结构预测中应用研究[D];哈尔滨工程大学;2013年
【二级参考文献】
中国期刊全文数据库 前1条
1 张春霆;蛋白质结构分类与结构类预测研究[J];中国科学基金;2000年05期
【相似文献】
中国期刊全文数据库 前10条
1 张海霞,唐焕文,张立震,靳利霞,唐一源;蛋白质二级结构预测方法的评价[J];计算机与应用化学;2003年06期
2 李晓琴,罗辽复,刘次全;翻译速率与蛋白质二级结构的关系[J];生物化学与生物物理学报;2003年02期
3 朱伟,史定华,王翼飞;神经网络在蛋白质二级结构预测中的应用[J];自然杂志;2003年03期
4 闫化军;傅彦;章毅;李毅超;;神经网络方法预测蛋白质二级结构[J];计算机科学;2003年11期
5 孙向东,韦柳静,黄日波;蛋白质二级结构预测的支持向量机模型研究[J];广西农业生物科学;2004年01期
6 李小妹,王能超;神经网络预测蛋白质二级结构的编码技术[J];华中科技大学学报(自然科学版);2004年05期
7 梅启鹏,王能超,李小妹;蛋白质二级结构预测中的简化编码技术[J];科技情报开发与经济;2004年05期
8 闫化军,章毅;基于蛋白质二级结构内容的域结构类预测(英文)[J];生物信息学;2004年04期
9 董启文,王晓龙,林磊,关毅,赵健;蛋白质二级结构预测:基于词条的最大熵马尔科夫方法[J];中国科学C辑:生命科学;2005年01期
10 景楠,周春光,夏斌;基于径向基函数蛋白质二级结构预测方法[J];计算机工程与应用;2005年29期
中国重要会议论文全文数据库 前10条
1 王守源;李晓琴;罗辽复;;氨基酸分类与蛋白质二级结构相关性[A];第九次全国生物物理大会学术会议论文摘要集[C];2002年
2 孙海军;阮晓钢;;氨基酸序列编码对蛋白质二级结构预测的影响[A];第二十二届中国控制会议论文集(下)[C];2003年
3 陈明杰;王焕峰;刘伟;;基于基团编码的蛋白质二级结构预测[A];中国化学会第26届学术年会化学信息学与化学计量学分会场论文集[C];2008年
4 宋亮;张剑;王先明;温继敏;陈海波;姚端正;蒋昌忠;;人工神经网络预测蛋白质结构的探讨[A];湖北省物理学会、武汉物理学会成立70周年庆典暨2002年学术年会论文集[C];2002年
5 杨惠云;田心;;神经网络预测蛋白质二级结构的研究[A];天津市生物医学工程学会2007年学术年会论文摘要集[C];2007年
6 罗三华;黄建华;邱建丁;;小波支持向量机在蛋白质二级结构分类预测中应用[A];中国化学会第26届学术年会化学信息学与化学计量学分会场论文集[C];2008年
7 丛培盛;王志恒;王思聪;李通化;;基于SPSSM的蛋白质二级结构预测进展[A];中国化学会第29届学术年会摘要集——第19分会:化学信息学与化学计量学[C];2014年
8 孙向东;黄日波;;运用SVMs原理预测蛋白质二级结构研究[A];广西微生物学会2003年学术年会论文集[C];2003年
9 王靖;郭晨;梁向峰;郑丽丽;陈澍;马俊鹤;刘会洲;;阳离子表面活性剂CTAB对蛋白质二级结构的影响[A];第十四届全国分子光谱学术会议论文集[C];2006年
10 孙衍华;刘继凤;迟学斌;;GridMol:基于网格的分子可视化建模软件[A];第九届全国计算(机)化学学术会议论文摘要集[C];2007年
中国博士学位论文全文数据库 前9条
1 王勇献;蛋白质二级结构预测的模型与方法研究[D];国防科学技术大学;2004年
2 石鸥燕;蛋白质结构预测模型的研究[D];天津医科大学;2008年
3 张胜利;蛋白质与RNA中的若干问题研究[D];大连理工大学;2011年
4 刘君;融合计算智能的蛋白质结构预测研究[D];重庆大学;2011年
5 贾孟文;mRNA序列、结构、能量和蛋白质二级结构的相关性[D];内蒙古大学;2004年
6 赵裕众;生物序列分析算法的研究及其应用[D];中国科学技术大学;2010年
7 李明辉;基于机器学习的蛋白质二级结构和相互作用预测[D];哈尔滨工业大学;2007年
8 王艳春;基于GEP和ANN的蛋白质二级结构预测方法研究[D];西北农林科技大学;2009年
9 严文颖;氨基酸相互作用网络的构建、分析及应用[D];苏州大学;2013年
中国硕士学位论文全文数据库 前10条
1 王洪亮;基于遗传算法的蛋白质二级结构预测研究[D];哈尔滨工程大学;2008年
2 梅启鹏;蛋白质二级结构中的简化编码技术[D];华中科技大学;2004年
3 梁刚锋;蛋白质二级结构的建模与预测[D];国防科学技术大学;2005年
4 于淑惠;基于神经网络的蛋白质二级结构预测建模研究[D];西南大学;2006年
5 孙海军;基于神经网络的蛋白质二级结构预测问题的研究[D];北京工业大学;2004年
6 张海霞;蛋白质二级结构预测方法研究[D];大连理工大学;2004年
7 景楠;基于神经网络方法蛋白质二级结构预测的研究[D];吉林大学;2004年
8 闫蓬勃;蛋白质二级结构预测准确率影响因素探讨[D];河北大学;2009年
9 叶小娇;基于支持向量机的蛋白质二级结构预测编码方法研究[D];安徽师范大学;2011年
10 马寿勇;序列上下文与其蛋白质二级结构的关系[D];陕西科技大学;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026