收藏本站
《大连理工大学》 2004年
收藏 | 手机打开
二维码
手机客户端打开本文

蛋白质二级结构预测方法研究

张海霞  
【摘要】:随着人类基因组计划的完成,人们已经获得了大量生物的遗传信息,数以万计的蛋白质序列也已经被测出,到2004年4月13日为止SWISS-PROT数据库中总共收集了148516条已被测序的蛋白质序列。然而一条蛋白质序列必须折叠成一定的空间结构时才能发挥它特定的生物功能,人们在对蛋白质序列测序完成之后更希望的是得到这些蛋白质的空间结构,以便发现结构与功能之间的联系。因此,蛋白质结构和功能的研究就成为了后基因组时代生命科学领域人们研究的主要任务和目的。 目前,通过实验的方法获得的蛋白质结构序列只有两万多条(2004年4月20日,PDB数据库中共收集了25176条),远远落后于蛋白质序列的测序速度,因此理论预测蛋白质结构势在必行。然而,直接从蛋白质一级序列预测其三维空间结构时人们又遇到了诸多困难。在对蛋白质分子的仔细研究和分析后发现由二级结构组装而成的空间结构是有限的。因此,如果能从蛋白质一级序列先预测出二级结构,再由二级结构预测三级结构便成为一条有效的途径。这里,蛋白质二级结构预测不仅成为联系蛋白质一级序列和三级结构的纽带,而且也是从一级序列预测其三维空间结构的关键步骤。 本文的主要工作是蛋白质二级结构预测方法的研究,具体工作概括如下: 1.从上世纪60年代中期至今,蛋白质二级结构预测已经发展了40年的时间,期间涌现出了许多好的预测方法。然而,由于每种方法选用的数据集不同、对二级结构的定义不同、选用的评价指标不同,因此方法间无法进行客观、全面的比较。而且研究证明,上述几个方面的因素对方法的预测结果影响较大,因此就迫切需要在一个统一的标准下将多种方法进行评价,从而找出目前最好的方法,也能从中发现需要继承和改进的方向。本文针对上述几个因素选择了统一的标准,对目前主要的十种方法进行了评价,这十种方法分别是:GORⅠ、PROF、GORⅣ、NNPREDICT、PHDsec、SSpro v 2.0、PSIPRED、PREDATOR、SOPMA和APSSP2。这一工作的过程是繁杂而费时的,工作量较大,至今没有其他人做出。 2.FDOD方法是一种比较多序列间差异程度的有效方法,作者将这一方法首次用于蛋白质二级结构预测中,得到了令人鼓舞的结果,准确率达到了78.8%,是目前二级结构预测中最好的结果之一。鉴于这一令作者也颇感意外的结果,文中对FDOD方法做了详细地分析,它的优势在于:一,它使用子序列分布作为序列特征的描述,无需引入其它物化参数且又挖掘出了序列本身尽可能多的特征信息,从而很好地给出了序列与结构之间的关系。二,FDOD函数的使用。FDOD函数是基于信息论中熵的概念,输入向量是一个概率分布,计算中只涉及到简单运算,因此对输入向量的规模没有大的限制。与其 它方法相比,FDOD方法具有明显的运算速度优势而且预测准确率高。 神经网络方法是蛋白质二级结构预测发展过程中的一类重要方法。从1988 年Qian和Sejnowski首次将其应用到二级结构预测至今又有了很大的改进和 提高。作者对这一方法进行了认真的学习,用一种改进的BP网络进行了实 际预测。由于受到时间和经验等多方面的影响,目前这一尝试只得到了一个 初步的结果,还需要在今后的工作中继续进行研究。 支持向量机方法是一类较好的机器学习算法,我国学者孙之荣等人将这种方 法首先用于了蛋白质二级结构的预测。然而由于支持向量机方法在处理大规 模数据时需要的时间和空间的代价很高,为了解决这一问题我们将支持向量 机与增量学习技术结合起来,提出了一种改进的支持向量机增量学习方法, 并将其应用于蛋白质二级结构预测中。预测结果显示,此算法可在牺牲很小 的测试精度(不足1%)的前提下节省一半左右的训练时间,从而提高了二 级结构预测的效率。
【学位授予单位】:大连理工大学
【学位级别】:硕士
【学位授予年份】:2004
【分类号】:Q51

知网文化
【引证文献】
中国期刊全文数据库 前2条
1 冉丽;邹先霞;许龙飞;;基于数据挖掘技术的蛋白质结构分类的研究[J];计算机工程与应用;2006年18期
2 武江勇;李立;;基于机器人机构学的蛋白质多肽链的运动学研究[J];机械设计与制造;2012年03期
中国博士学位论文全文数据库 前1条
1 刘桂霞;蛋白质关联图预测研究[D];吉林大学;2007年
中国硕士学位论文全文数据库 前6条
1 武江勇;基于机器人机构学的F_0F_1ATP合成酶马达能量储存研究[D];西南交通大学;2011年
2 雷国庆;面向生物信息学结构预测领域的算法加速器设计[D];国防科学技术大学;2010年
3 王荣兴;基于克隆选择算法蛋白质联系图预测的研究[D];吉林大学;2006年
4 孙波;产甲烷杆菌耐热性与序列结构关系的生物信息学研究[D];江南大学;2006年
5 俞文洋;支持向量机在蛋白质结构预测中的应用研究[D];河南大学;2008年
6 林锦华;基于隐马尔可夫模型的蛋白质二级结构预测[D];福建农林大学;2012年
【参考文献】
中国期刊全文数据库 前6条
1 张立震,唐焕文;一种基于子序列分布的蛋白质结构类预测方法[J];计算机与应用化学;2003年03期
2 张文,唐焕文,方伟武,修志龙;信息离散性度量方法在SARS病毒研究中的应用[J];计算机与应用化学;2003年06期
3 牛卫东,潘宪明;蛋白质结构预测[J];世界科技研究与发展;1998年01期
4 王志新;蛋白质结构预测的现状与展望[J];生命的化学;1998年06期
5 靳利霞,唐焕文;蛋白质结构预测方法简述[J];自然杂志;2001年04期
6 朱伟,史定华,王翼飞;神经网络在蛋白质二级结构预测中的应用[J];自然杂志;2003年03期
【共引文献】
中国期刊全文数据库 前10条
1 郭苗莉,朱江波,陈蓉芳,张天宝;应用基因表达谱芯片研究MNNG诱致小鼠胚胎畸形肢体基因表达的变化[J];癌变.畸变.突变;2005年02期
2 张世海,刘晓燕,欧进萍;高层结构智能选型知识发现及方法比较[J];四川建筑科学研究;2005年05期
3 崔旖娜;王苏岩;李宏男;;基于BP神经网络时间序列方法的辽宁省建筑业经济技术指标预测[J];四川建筑科学研究;2008年02期
4 王朝霞;生物信息学:一门前沿交叉学科[J];安徽教育学院学报;2002年06期
5 潘洁珠;半结构化数据及其数据模型[J];安徽教育学院学报;2003年06期
6 陈征;;一类系统的二次李雅普诺夫函数存在性的判断[J];安徽电子信息职业技术学院学报;2006年04期
7 赵鹏,倪志伟,贾瑞玉;基于数据挖掘技术的范例库维护[J];安徽大学学报(自然科学版);2003年02期
8 孙小军;焦建民;何俊红;;解优化问题的遗传加速信赖域搜索算法[J];安徽大学学报(自然科学版);2008年03期
9 史冬燕;程在全;;云南疣粒野生稻部分cDNA片段的分离和注释[J];安徽大学学报(自然科学版);2008年03期
10 张家昕;段复建;;一种结合NCP函数的SQP滤子新算法[J];安徽大学学报(自然科学版);2010年05期
中国重要会议论文全文数据库 前10条
1 章曙光;;基于CBR的电力负荷预测系统的研究与实现[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 ;An effective procedure exploiting unlabeled data to build monitoring system[A];中国科学院地质与地球物理研究所第11届(2011年度)学术年会论文集(下)[C];2012年
3 刘钰;韩峰;董楠;陆希成;雷鸣;;爆炸容器安全概率的统计分析方法[A];全国危险物质与安全应急技术研讨会论文集(下)[C];2011年
4 吴敏;徐辰华;;铅锌烧结过程产量质量的神经网络预测方法[A];第二十六届中国控制会议论文集[C];2007年
5 ;A Novel Kernel PCA Support Vector Machine Algorithm with Feature Transition Function[A];第二十六届中国控制会议论文集[C];2007年
6 吕蓬;柳亦兵;马强;魏于凡;;支持向量机在齿轮智能故障诊断中的应用研究[A];第二十六届中国控制会议论文集[C];2007年
7 张佑春;王平;张公永;;基于D-S证据理论和神经网络的信息融合方法及应用[A];第二十七届中国控制会议论文集[C];2008年
8 ;Fault Pattern Recognition of Rolling Bearings Based on Wavelet Packet and Support Vector Machine[A];第二十七届中国控制会议论文集[C];2008年
9 蒋少华;桂卫华;阳春华;唐朝晖;蒋朝辉;;基于主元分析与支持向量机的方法及其在密闭鼓风炉过程监控诊断中的应用[A];第二十七届中国控制会议论文集[C];2008年
10 姚智颖;刘冬;;基于Kazakov线性化的迭代滤波[A];第二十九届中国控制会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 王杰;基于人工智能的乒乓球比赛技战术诊断与评估研究[D];上海体育学院;2010年
2 王冰;降解丝素放线菌的分离鉴定、发酵条件优化及其降解机制研究[D];山东农业大学;2009年
3 赵莹;半监督支持向量机学习算法研究[D];哈尔滨工程大学;2010年
4 谭佳琳;粒子群优化算法研究及其在海底地形辅助导航中的应用[D];哈尔滨工程大学;2010年
5 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
6 孙鹏飞;基于计算智能技术的蛋白质结构预测方法研究[D];哈尔滨工程大学;2010年
7 陈得宇;基于MAS的智能电压控制系统研究[D];哈尔滨工程大学;2010年
8 牟向伟;模糊语义个性化推荐系统在电子政务中的应用研究[D];大连海事大学;2010年
9 苏晓宏;海杂波的特性分析与目标检测处理[D];大连海事大学;2010年
10 刘冬雁;川西高原甘孜黄土记录的早更新世晚期以来的古气候变化[D];中国海洋大学;2009年
中国硕士学位论文全文数据库 前10条
1 张志慧;米糠的微波稳定化及其油脂和蛋白质的提取研究[D];华中农业大学;2010年
2 陈卫卫;耐高温水稻资源高温诱导表达蛋白鉴定与分析[D];华中农业大学;2010年
3 朱杰;一种基于聚类的支持向量机反问题求解算法[D];河北大学;2007年
4 张小亮;非线性规划的信赖域算法[D];河南理工大学;2010年
5 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
6 吴香庭;基于遗传算法的K-means聚类方法的研究[D];山东科技大学;2010年
7 王永;消防单兵综合信息采集系统研究[D];山东科技大学;2010年
8 徐芳芳;优化问题的PVD算法研究[D];山东科技大学;2010年
9 王春华;基于盲源分离的肺音信号提取研究[D];山东科技大学;2010年
10 滕景忠;智能瓦斯传感器的研制[D];山东科技大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 郑德玲,梁瑞鑫,付冬梅,李晓刚,方彤;人工免疫系统及人工免疫遗传算法在优化中的应用[J];北京科技大学学报;2003年03期
2 李丽娜,侯朝桢;基于支持向量机(SVM)的工业过程辨识[J];北京理工大学学报;2003年05期
3 郭大忠;柳洪义;张威;李丽娜;;冗余度机器人运动学和动力学同时优化[J];东北大学学报(自然科学版);2008年07期
4 李刚俊;;冗余度机器人的运动规划碰撞算法[J];电子科技大学学报;2005年06期
5 唐巍,李殿璞,陈学允;混沌理论及其应用研究[J];电力系统自动化;2000年07期
6 梁刚锋,谢涛;使用HSMMs模型的蛋白质二级结构预测[J];电脑知识与技术;2005年03期
7 魏冰川;刘振飞;卞江;;氢键能量分划方法[J];大学化学;2007年01期
8 吴佑寿;世界计算智能大会(WCCI'98)简介[J];电子科技导报;1998年10期
9 邹权;郭茂祖;张涛涛;;RNA二级结构预测方法综述[J];电子学报;2008年02期
10 燕忠,袁春伟;基于蚁群智能和支持向量机的人脸性别分类方法[J];电子与信息学报;2004年08期
中国博士学位论文全文数据库 前10条
1 王磊;免疫进化计算理论及应用[D];西安电子科技大学;2001年
2 徐雪松;基于人工免疫系统的函数优化及其在复杂系统中的应用研究[D];浙江大学;2004年
3 舒咬根;生物分子马达的定向输运机制及其ATP水解动力学[D];厦门大学;2004年
4 孙勇智;人工免疫系统模型、算法及其应用研究[D];浙江大学;2005年
5 丁彦蕊;嗜热菌耐热性与蛋白质序列、结构和功能关系的生物信息学研究[D];江南大学;2005年
6 李忠伟;支持向量机学习算法研究[D];哈尔滨工程大学;2006年
7 孙康;可重构计算相关技术研究[D];浙江大学;2007年
8 谷俊峰;蛋白质结构预测中几个关键问题的研究[D];大连理工大学;2009年
9 张艳;取代法计算多肽中N-H...O=C分子内氢键键能[D];辽宁师范大学;2008年
10 罗亮;蛋白质结构预测模型研究[D];华中科技大学;2010年
中国硕士学位论文全文数据库 前6条
1 孙海军;基于神经网络的蛋白质二级结构预测问题的研究[D];北京工业大学;2004年
2 梁刚锋;蛋白质二级结构的建模与预测[D];国防科学技术大学;2005年
3 袁前飞;基于支持向量机的癌症诊断研究[D];重庆大学;2007年
4 孙文恒;基于遗传算法和BP神经网络的蛋白质二级结构预测研究[D];兰州大学;2008年
5 张红亮;基于蛋白质和核酸的超冗余生物纳米机器人研究[D];西南交通大学;2009年
6 朱嘉瑜;基于粒子群优化算法的隐马尔可夫模型优化及其应用研究[D];广州大学;2009年
【二级引证文献】
中国期刊全文数据库 前4条
1 于晓丽;;蛋白质结构分类数据库[J];重庆理工大学学报(自然科学版);2010年11期
2 张军;陈柏松;李良峰;杨哲;;基于单因素SVM的航空兵空运转场飞行架次需求预测研究[J];飞机设计;2010年06期
3 刘君;熊忠阳;王银辉;;蛋白质二级结构的协同训练预测方法[J];计算机应用研究;2011年05期
4 刘英;李立;;机构学模型在多肽链构象势能计算中的应用[J];机械设计与制造;2014年02期
中国博士学位论文全文数据库 前2条
1 刘君;融合计算智能的蛋白质结构预测研究[D];重庆大学;2011年
2 王臣业;我国高校科技成果运营的模式及绩效评价研究[D];哈尔滨工程大学;2012年
中国硕士学位论文全文数据库 前6条
1 李倩;大肠杆菌苹果酸脱氢酶基因mdh克隆、高效表达及酶学性质研究[D];江南大学;2010年
2 于晓丽;蛋白质结构分类研究[D];华北电力大学(北京);2011年
3 许良;后驱轻型客车ESP免疫PI控制及车速估算方法研究[D];吉林大学;2007年
4 苏启龙;基于FPGA的并行RNA二级结构预测加速算法研究[D];上海交通大学;2013年
5 刘英;ATP合成酶分子马达的储能模型研究[D];西南交通大学;2013年
6 金李灿;智能计算在蛋白质结构预测中应用研究[D];哈尔滨工程大学;2013年
【二级参考文献】
中国期刊全文数据库 前1条
1 张春霆;蛋白质结构分类与结构类预测研究[J];中国科学基金;2000年05期
【相似文献】
中国期刊全文数据库 前10条
1 杨艳;;人工神经网络和支持向量机在剪接位点识别上的应用[J];科技资讯;2007年22期
2 张乐坚;程明虎;田付友;;人工神经网络及支持向量机在降雨量预报中的应用[J];高原气象;2010年04期
3 李素梅;张延炘;董磊;常胜江;申金媛;;基于支持向量机的肤色滤波器[J];光子学报;2006年02期
4 王炜;刘悦;李国正;吴耿锋;马钦忠;赵利飞;林命週;;我国大陆强震预测的支持向量机方法[J];地震学报;2006年01期
5 郑先越;刘志焘;;一种基于支持向量机的客户满意度评价方法[J];商场现代化;2007年02期
6 王李进;胡欣欣;;基于支持向量机的面向对象软件可维护性预测[J];北华大学学报(自然科学版);2010年03期
7 陈芝芬;张冬梅;姚振忠;;SVM在成矿预测中的研究[J];计算机工程与应用;2009年30期
8 朱敏;张永清;李梦龙;周大威;黄俊;;基于集成学习方法的蛋白质相互作用预测[J];四川大学学报(工程科学版);2011年03期
9 夏国恩;陈云;金炜东;;基于支持向量机的电信客户欠费评估[J];科技管理研究;2006年02期
10 甄彤;范艳峰;;基于支持向量机的企业信用风险评估研究[J];微电子学与计算机;2006年05期
中国重要会议论文全文数据库 前10条
1 张云佳;晏华;;支持向量机在肝病分类模型中的应用[A];第九届全国计算(机)化学学术会议论文摘要集[C];2007年
2 符敏;程德福;张广峰;;基于支持向量回归的声音转换[A];第八届全国人机语音通讯学术会议论文集[C];2005年
3 林关成;李亚安;;基于ANN与SVM的分类和回归比较研究[A];2008’促进中西部发展声学学术交流会论文集[C];2008年
4 杨凌;刘玉树;;基于支持向量机的坦克识别算法[A];第三届全国数字成像技术及相关材料发展与应用学术研讨会论文摘要集[C];2004年
5 林杰华;张斌;李冬森;宋华茂;余志强;王浩;;支持向量机在电力客户信用评级中的应用[A];全国第21届计算机技术与应用学术会议(CACIS·2010)暨全国第2届安全关键技术与应用学术会议论文集[C];2010年
6 蒋铁军;张怀强;李积源;;多变量系统预测的支持向量机方法研究[A];管理科学与系统科学研究新进展——第7届全国青年管理科学与系统科学学术会议论文集[C];2003年
7 黄淑云;孙兴玉;梁汝萍;邱建丁;;基于小波支持向量机预测蛋白质亚细胞定位研究[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年
8 谢湘;匡镜明;;支持向量机在语音识别中的应用研究[A];现代通信理论与信号处理进展——2003年通信理论与信号处理年会论文集[C];2003年
9 涂冬成;薛龙;刘木华;赵进辉;沈杰;吁芳;;基于支持向量机的鹅肉肉色客观评定研究[A];中国农业工程学会电气信息与自动化专业委员会、中国电机工程学会农村电气化分会科技与教育专委会2010年学术年会论文摘要[C];2010年
10 师旭超;巴松涛;;基于支持向量机方法的深基坑变形预测[A];科技、工程与经济社会协调发展——河南省第四届青年学术年会论文集(上册)[C];2004年
中国重要报纸全文数据库 前10条
1 记者 吴伟农 张小军;挑战蛋白质[N];新华每日电讯;2001年
2 吴伟农 张小军;后基因组时代序幕拉开[N];中国水利报;2001年
3 记者 刘向;人类已经步入“后基因组时代”[N];新华每日电讯;2004年
4 中国协和医科大学实验动物研究所所长方福德;后基因组时代的生物医学[N];科技日报;2002年
5 通讯员 赵如江;抢占后基因组时代的制高点[N];大众科技报;2000年
6 奇云;人类迈进后基因组时代[N];大众科技报;2003年
7 朱国旺;不应轻言进入后基因组时代[N];中国医药报;2005年
8 胡性慧 王唯赫 杨腾;人工神经网络拓宽版权贸易路径[N];中国知识产权报;2010年
9 余志平;组合信息学——大踏步进入后基因组时代[N];医药经济报;2002年
10 张东方;沙明;杨松松;人工神经网络在中药领域中的应用[N];中国医药报;2003年
中国博士学位论文全文数据库 前10条
1 燕忠;基于蚁群优化算法的若干问题的研究[D];东南大学;2005年
2 张超;基于支持向量机的汽轮机轴系振动故障智能诊断研究[D];华北电力大学(河北);2009年
3 武国正;支持向量机在湖泊富营养化评价及水质预测中的应用研究[D];内蒙古农业大学;2008年
4 吴斌;“证候-基因组”的方法学及家系虚寒证的代谢基因表达谱研究[D];成都中医药大学;2005年
5 杜小芳;基于CPFR的农产品采购模型研究[D];华中科技大学;2005年
6 刘育明;动态过程数据的多变量统计监控方法研究[D];浙江大学;2006年
7 栾锋;支持向量机(SVM)和径向基神经网络(RBFNN)方法在化学、环境化学和药物化学中的应用研究[D];兰州大学;2006年
8 孙薇;市场条件下抽水蓄能电站效益综合评价及运营模式研究[D];华北电力大学(河北);2007年
9 常群;支持向量机的核方法及其模型选择[D];哈尔滨工业大学;2007年
10 朱燕飞;锌钡白回转窑煅烧过程智能建模研究[D];华南理工大学;2005年
中国硕士学位论文全文数据库 前10条
1 张海霞;蛋白质二级结构预测方法研究[D];大连理工大学;2004年
2 张有才;岩体爆破块度分布的预报模型分析[D];武汉大学;2005年
3 王思俊;基于时频分析的扬声器故障在线检测方法研究[D];天津科技大学;2008年
4 昝玉顺;微RNA基因机器识别算法的开发与优化[D];南京农业大学;2007年
5 刘艳伟;支持向量机方法在感潮河段洪峰水位预报中的应用[D];浙江大学;2010年
6 杨镭;支持向量机算法设计及在高分辨雷达目标识别中的应用[D];国防科学技术大学;2010年
7 童振;基于支持向量机的电解液成分预测[D];东北大学;2008年
8 聂小芳;模糊粗糙集与支持向量机在煤与瓦斯突出预测中的应用研究[D];辽宁工程技术大学;2009年
9 鄢常亮;基于支持向量机的高炉向凉向热炉况预测研究[D];内蒙古科技大学;2010年
10 韩叙东;基于支持向量机的水电故障分类器的设计与实现[D];东北大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026