收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

蛋白质若干结构预测问题研究及其软件实现

顾斐  
【摘要】: 蛋白质结构预测一直是蛋白质结构研究的热点方向。由于蛋白质序列是蛋白质结构形成的基础和决定性条件,因而本论文主要通过蛋白质的序列来预测蛋白质的结构。本论文的主要工作和成果可以归纳为以下几点: (1)蛋白质序列特征信息的提取 为了能更好的进行蛋白质结构类和二级结构的预测,本文首先提出了一套较为全面、有代表性、能最大程度反映蛋白质序列特性的特征信息。这套特征信息包含了序列统计特征、序列物理化学特征、序列信号特征三方面的信息,并且能全面涵盖蛋白质序列中的短、中、长程之间的关系。 (2)蛋白质结构类预测 结构类预测算法一直是蛋白质结构预测的热点。针对传统结构类预测算法中较少考虑序列长程效应的缺点,本论文把(1)中新的特征信息引入到了训练和预测当中。 在蛋白质结构类研究当中,训练过程用到直接平均法、神经网络方法。分类过程中用到的算法为:神经网络法、最近邻居法、bayes法和本论文提出的最大信息量法。其中,最近邻居法是文献当中主要使用的方法,用该方法可以横向比较本论文与其他文献结构类的预测结果。采用神经网络和最大信息量法能够很好的提升结构类的预测正确率。 数据集和评价体系也是蛋白质结构类预测的一个重要因素。本论文通过构建一个包含所有已分结构类的蛋白质序列非冗余数据集,保证了数据集的全面性、有效性和可靠性。本论文还通过多种评判指标来分析结果的各种性能。 本论文提出的方法对蛋白质结构类预测的正确率可以达到74.3%(留一法),比主要文献提到的正确率要高2%-20%。 (3)蛋白质二级结构预测 在本论文中,蛋白质二级结构的预测并不考虑序列比对的信息,这是为了在预测中不引入与蛋白质自身序列无关的信息,这样可以对特征信息提取和预测算法做更好的评判。 蛋白质二级结构预测的关键问题是二级结构片段位置的确定以及二级结构片段类型的预测。本论文通过考察蛋白质疏水值的局部特性来定位二级结构片段,通过对二级结构片段特征信息的训练得出三种二级结构类型的代表性特征向量,并将其作为预测的依据。二级结构片段定位中用到的方法为小波变换法,片段类型的训练和预测过程中用到的算法为直接平均法。本论文提出的蛋白质二级结构预测方式较为新颖,并且具有生物学意义。 在蛋白质二级结构预测中用到的是CB396数据集,这个数据库具有低序列相似度和低序列冗余度的特性,并且已经有多种方法对该数据库做了测试,方便了本论文结果与其它方法结果的比较。从结果看,本论文的二级结构预测正确率(Q_3)达到70.21%,SOV的正确率为67.14%。这一结果与现有的方法相比相差无几。 最后,利用蛋白质结构类的信息,得到了蛋白质结构类倾向性因子这一特征信息,该特征信息比传统的倾向性因子更能反映氨基酸对二级结构的偏好性。 (4)蛋白质结构预测软件编写 根据本论文提到的与蛋白质结构类和二级结构有关的特征信息、预测方法和预测模型,编写了蛋白质结构预测软件。该软件具有多参数、多分类方法的特点,用户可以自己定义特征信息和机器学习方法,方便灵活。在默认状态下,程序会自动调用本论文的预测模型以及所使用的参数,使得用户可以直接使用本论文的研究成果。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 李前忠;李晓琴;罗辽复;;多肽链中氢键的统计分析[J];内蒙古大学学报(自然科学版);1991年03期
2 王鹤尧,卜凤荣,陈琳;聚合牛血红蛋白二级结构初步研究[J];生物技术通讯;1999年02期
3 唐四薪;向卓;刘艳波;;RNA二级结构预测的计算语言学方法[J];衡阳师范学院学报;2008年06期
4 吴玉章,朱锡华;Pre-S2蛋白抗原表位及二级结构的预测与比较[J];免疫学杂志;1993年01期
5 张静,刘次全;真核生物mRNA二级结构与内含子剪接[J];生物化学与生物物理进展;1999年04期
6 刘光清,倪征,云涛,梁华丽,华炯刚,李双茂,杜清云;猪圆环病毒II型结构蛋白的二级结构及其B细胞抗原表位预测[J];中国预防兽医学报;2005年06期
7 毛华伟;赵晓东;杨锡强;;人偏肺病毒黏附蛋白的二级结构及B细胞表位初步预测[J];中华微生物学和免疫学杂志;2005年12期
8 李建龙;王正志;;siRNA活性与mRNA二级结构关系的研究[J];生物医学工程研究;2006年01期
9 叶锋;安英格;秦德志;杨林;佘岚;邢瑞敏;;羟基磷灰石结晶对牛血清白蛋白二级结构影响的光谱研究[J];光谱学与光谱分析;2007年02期
10 卢雁;张玮玮;王公轲;;FTIR用于变性蛋白质二级结构的研究进展[J];光谱学与光谱分析;2008年01期
11 李晶;张冬娟;张园;黄蔚;唐建国;杨吉春;;Tyr61的芳香族侧链对稳定瘦素的结构至关重要(英文)[J];中国生物化学与分子生物学报;2009年03期
12 田素燕;李连之;高磊;穆建帅;刘晓燕;谭相石;;圆二色光谱法研究环境因素对细胞红蛋白二级结构的影响[J];分析化学;2009年08期
13 华庆新;蛋白质二级结构的实测与预测[J];生物化学与生物物理进展;1990年02期
14 孙之荣,赵卫东,赵南明,杨存荣;用模式识别方法预测膜蛋白RC、BR和RH的二级结构[J];生物物理学报;1993年01期
15 毛成建,洪国藩;豌豆根瘤菌结瘤基因启动子内二级结构区与转录活性有关[J];微生物学报;1994年06期
16 张平武,王易伦,陆德如;mRNA翻译起始区二级结构改变对干扰素基因在大肠杆菌中翻译的影响[J];生物技术通讯;1998年01期
17 燕翔;马文丽;宋艳斌;张宝;郑文岭;;目标序列二级结构对RNA干扰效果的影响[J];基础医学与临床;2006年06期
18 石鸥燕;杨晶;杨惠云;田心;;简单的一致性方法预测蛋白质二级结构[J];现代生物医学进展;2007年11期
19 李江涛;殷相平;柳纪省;胡永浩;;狂犬病病毒糖蛋白基因的克隆及其二级结构和B细胞抗原表位预测[J];动物医学进展;2008年03期
20 郑欣亚;马文丽;陈启龙;郑文岭;;复合编码支持向量机预测蛋白质二级结构[J];微计算机信息;2009年13期
中国重要会议论文全文数据库 前10条
1 刘卫东;庞玉玺;刘爱琢;裴奉奎;;眼镜王蛇神经毒素(CM-11)的一级序列、二级结构和三级结构的确定[A];第九届全国波谱学学术会议论文摘要集[C];1996年
2 田琨;陈新;;热诱导大豆蛋白膜构象转变动力学研究[A];2009年全国高分子学术论文报告会论文摘要集(下册)[C];2009年
3 袁青青;曹惠;邵正中;;电喷法制备丝素蛋白纳米微球[A];2009年全国高分子学术论文报告会论文摘要集(上册)[C];2009年
4 赵武;李斌;梁家幸;梁保忠;姚瑞英;黄安国;何颖;蒋玉雯;;猪细小病毒自然弱毒N株(PPV-N株)VP1蛋白二级结构及B细胞抗原表位预测[A];中国畜牧兽医学会家畜传染病学分会第七届全国会员代表大会暨第十三次学术研讨会论文集(上册)[C];2009年
5 田琨;陈新;邵正中;;大豆分离蛋白在溶液和膜中构象的初步研究[A];2007年全国高分子学术论文报告会论文摘要集(下册)[C];2007年
6 刘茹;熊善柏;谢笔钧;;不同pH值下鲢肌球蛋白的二级结构对胶凝特性的影响[A];2008年中国水产学会学术年会论文摘要集[C];2008年
7 何晓芳;温硕洋;庞雄飞;;拟澳洲赤眼蜂ITS2二级结构及其推导的地理种群进化[A];昆虫与环境——中国昆虫学会2001年学术年会论文集[C];2001年
8 付诚杰;邵正中;;非自然吐出柞蚕丝的力学性能研究[A];2009年全国高分子学术论文报告会论文摘要集(下册)[C];2009年
9 邱阳;林克椿;聂松青;;HIV-1gp41N端融合肽及其突变体与脂膜作用后二级结构的变化[A];第七届全国生物膜学术讨论会论文摘要汇编[C];1999年
10 黄金海;杨汉春;郭鑫;陈艳红;韩军;;PRRSV GP5蛋白的高效表达、纯化与结构分析[A];中国畜牧兽医学会畜牧兽医生物技术学分会暨中国免疫学会兽医免疫分会第六次研讨会论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 闫若潜;鸡BF2和β2m分子特征与二级结构及其复合体鉴定病毒表位的研究[D];中国农业大学;2005年
2 莫春丽;傅立叶变换红外光谱对再生丝蛋白二级结构的表征[D];复旦大学;2009年
3 宗小红;铜离子和pH对再生丝素蛋白二级结构的影响[D];复旦大学;2005年
4 吴峰;靶向HER-2的siRNA治疗乳腺癌的实验研究[D];中国人民解放军军事医学科学院;2005年
5 张华东;1.livin反义脱氧核苷酸抗癌作用相关研究 2.DCQA食蟹猴长期毒性试验及伴随毒代动力学研究[D];中国人民解放军军事医学科学院;2005年
6 宋海峰;基于系统发育比较分析的反义药物优化设计及相关药理学研究[D];中国人民解放军军事医学科学院;2004年
7 周春才;蜘蛛丝蛋白摸拟聚合物的合成及其结构、性能的研究[D];复旦大学;2004年
8 刘琦;RNA二级结构的若干计算生物学问题研究[D];浙江大学;2008年
9 金莉莉;东北林蛙皮抗菌肽及其生物学特性[D];中国医科大学;2009年
10 赵培英;基于智能计算的膜蛋白结构与相互作用预测研究[D];东华大学;2010年
中国硕士学位论文全文数据库 前10条
1 李志杰;E亚类I型内含子的结构预测与系统发生分析[D];武汉大学;2005年
2 姚占全;应用圆二色光谱研究电场对蛋白质(酶)构象的影响[D];内蒙古大学;2005年
3 燕翔;RAS基因在K562细胞凋亡中的作用研究[D];第一军医大学;2005年
4 昝玉顺;微RNA基因机器识别算法的开发与优化[D];南京农业大学;2007年
5 吴琼;小鼠生长抑素干扰RNA的设计与筛选[D];吉林大学;2007年
6 张永刚;磷脂酶D制备磷脂酰甘油的酶学特性研究[D];江南大学;2008年
7 李莎莎;蛋白质吸附的拉曼光谱研究[D];天津大学;2008年
8 郭晨;人类pre-mRNA二级结构的数据库建立及与蛋白质相关性的分析[D];云南大学;2010年
9 郭颖;RNA的二级结构[D];大连理工大学;2005年
10 杜兴兰;海栖热袍菌基因aguA在常温下形成的mRNA二级结构与基因表达水平关系的初步研究[D];江南大学;2004年
中国重要报纸全文数据库 前10条
1 电脑商报记者 彭敏;何东辉:平衡与成长的艺术[N];电脑商报;2008年
2 中国政法大学马列学院教授 常绍舜;马克思主义哲学发展的新趋势[N];浙江日报;2007年
3 银河证券研究中心 胡立峰;基金走进繁荣期[N];证券时报;2006年
4 孙丰雷 杨公涛 高 华;灵芝降糖作用的研究[N];中国中医药报;2006年
5 朱广平 刘远桥;青光眼基因芯片研究取得重大进展[N];科技日报;2005年
6 朱广平 刘远桥;三军医大大坪医院 青光眼基因芯片研究取得进展[N];中国医药报;2005年
7 大同报社 董秉梅;加强新时期工会组织建设[N];大同日报;2008年
8 记者 易运文;职业资格证在深圳越来越吃香[N];光明日报;2003年
9 ;瑞星RIDS-100:检测入侵 监控网络[N];计算机世界;2002年
10 郑青;揭开抗菌肽生物活性的面纱[N];医药经济报;2001年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978