收藏本站
《大连理工大学》 2012年
收藏 | 手机打开
二维码
手机客户端打开本文

进化分析与结构预测中的若干问题研究

丁淑妍  
【摘要】:随着生物测序技术的快速发展,生物科学的数据资源无论从数量上还是从质量上都得到了极大的丰富与提升。数据资源的急剧膨胀使得我们必须考虑寻求一种强有力的工具来更好地组织它们,以利于对已知生物学的知识进行储存和进一步加工利用。大量多样化的生物学数据资源中必然蕴含着大量重要的生物学规律,这些规律是我们解决诸多生命之谜的关键所在,继续沿用传统的方法和手段来分析如此庞杂的数据是十分困难的,运用新兴的计算机科学技术和网络技术来有效地管理和处理生物学数据势在必行,于是一门崭新的交叉学科-生物信息学应运而生。本文主要对生物信息学中的进化分析和结构预测两个方面作了研究,主要成果有: 在第二章中,我们提出了两种非比对方法,并根据真实数据构建了进化树。第一种方法是基于去除k-字频率中随机背景的特征向量的非比对方法,通过重构24种脊椎动物转铁蛋白和48种戊型肝炎病毒的进化树说明了这种方法可以有效地提取生物序列中的进化信息。另外,我们还提出了一个指标δk并用来指导k的选择。第二种方法是基于k-字平均间隔的特征向量的非比对方法,该方法可以有效地提取k-字在DNA序列中的结构分布信息。我们通过线粒体基因构建了30种哺乳动物的进化关系并用INDELible软件说明了我们所提出方法的可靠性和稳定性。另外,我们提出了一个指标将4k个k-字分成n类(n是数据集中序列的数目),并在k=5,6,7,8,9时讨论了每类k-字对进化分析的影响。 在第三章中,我们研究了蛋白质二级结构的预测,提出了一种新的基于支持向量机的结构预测方法,该方法从蛋白质二级结构序列和其相应的E-H序列中提取了11个特征并检验了每个特征对预测的重要性。这11个特征中有7个特征是以前研究者提出的,另外4个特征是我们新提出来的,主要用于提高α/β类蛋白质和α+β类蛋白质的预测精确度。本章共用到了5组低相似性数据集来训练和测试我们的方法,并与最近提出的三种蛋白质二级结构预测方法(SCPRED, MODAS, RKS-PPSC)的精确度和MCC值作了全面的比较,比较的结果说明我们提出的方法是有效的。
【学位授予单位】:大连理工大学
【学位级别】:博士
【学位授予年份】:2012
【分类号】:Q71;O221.3

手机知网App
【参考文献】
中国期刊全文数据库 前4条
1 程妍;刘仲林;;计算生物学——一门充满活力的新兴交叉学科[J];科学学与科学技术管理;2006年03期
2 张春霆;生物信息学的现状与展望[J];世界科技研究与发展;2000年06期
3 张春霆;人与其他生物基因组若干重要问题的生物信息学研究[J];自然科学进展;2004年12期
4 黎炽森;戊型肝炎流行病学研究的进展[J];职业与健康;2000年08期
中国博士学位论文全文数据库 前2条
1 王燕;机器学习在蛋白质结构和功能预测中的应用研究[D];华中科技大学;2006年
2 王艳春;基于GEP和ANN的蛋白质二级结构预测方法研究[D];西北农林科技大学;2009年
【共引文献】
中国期刊全文数据库 前10条
1 郭苗莉,朱江波,陈蓉芳,张天宝;应用基因表达谱芯片研究MNNG诱致小鼠胚胎畸形肢体基因表达的变化[J];癌变.畸变.突变;2005年02期
2 王朝霞;生物信息学:一门前沿交叉学科[J];安徽教育学院学报;2002年06期
3 程钢;;生物信息学课程教学改革和实践[J];安徽农学通报(上半月刊);2011年13期
4 黄啸;;生物信息学在蛋白质组学上的应用[J];安徽农业科学;2006年23期
5 王建平;柴立和;;蛋白质分子网络的分形结构[J];安徽农业科学;2007年06期
6 张树林;何德;朱高浦;刘杰;莫鹏巧;;生物信息学在农业上的应用[J];安徽农业科学;2007年22期
7 王勇;陈克平;姚勤;;系统发生分析软件PAUP和TreePuzzle使用方法介绍[J];安徽农业科学;2008年02期
8 吉冬梅;;酵母基因表达调控关系的构建及其统计特性分析[J];安徽农业科学;2009年10期
9 王勇;陈克平;姚勤;;系统发生分析程序MrBayes 3.1使用方法介绍[J];安徽农业科学;2009年33期
10 任先耀;凌文州;石家胜;刘宁;;基于自然选择理论的动物利他行为研究[J];安徽农业科学;2010年04期
中国重要会议论文全文数据库 前10条
1 胡扬;桂卫华;;人工代谢技术在医药领域中的应用研究[A];第二十九届中国控制会议论文集[C];2010年
2 庄绪静;曹雅忠;李克斌;尹姣;;同源建模和分子对接方法的应用与发展[A];植保科技创新与病虫防控专业化——中国植物保护学会2011年学术年会论文集[C];2011年
3 栾德琴;常国斌;陈国宏;;隐性白鸡不同时期肌肉组织生长相关基因的表达谱分析[A];安全优质的家禽生产——第十五次全国家禽学术讨论会论文集[C];2011年
4 崔光照;曹祥红;张华;;基于小波变换的基因表达数据去噪聚类分析[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
5 姜春林;杜维滨;李江波;;药物分子设计技术领域的文献计量可视化分析[A];科学学理论与科学计量学探索——全国科学技术学暨科学学理论与学科建设2008年联合年会论文集[C];2008年
6 齐江蕾;;物种灾难与发展风险[A];第二届中国科技哲学及交叉学科研究生论坛论文集(硕士卷)[C];2008年
7 李天瑞;;DNA序列分析的理论基础及挖掘算法研究[A];科技、工程与经济社会协调发展——中国科协第五届青年学术年会论文集[C];2004年
8 郑海航;李东升;;第二十三章 国际金融危机下企业管理的应变转型[A];国际金融危机与中国企业发展:中国企业管理研究会年度报告(2009~2010)[C];2009年
9 张国文;陈秀霞;;牛蒡苷与人血清白蛋白的相互作用[A];2009年中国农业工程学会农产品加工及贮藏工程分会学术年会论文集[C];2009年
10 杨长平;;生物信息学在畜禽基因组研究中的应用[A];中国农业信息科技创新与学科发展大会论文汇编[C];2007年
中国博士学位论文全文数据库 前10条
1 王冰;降解丝素放线菌的分离鉴定、发酵条件优化及其降解机制研究[D];山东农业大学;2009年
2 贺厚光;双调控溶瘤腺病毒携带超抗原SEA基因治疗前列腺癌基础研究[D];苏州大学;2010年
3 郭新军;拟黑多刺蚁肌细胞增强因子2与肌钙蛋白Ⅰ亚基基因的克隆及其在发育中的表达研究[D];陕西师范大学;2010年
4 周茜;混沌理论及应用若干问题的研究[D];南开大学;2010年
5 傅晓萍;美洲商陆镉吸收和耐性机理研究[D];浙江大学;2011年
6 徐兆华;基因芯片数据统合分析方法的若干拓展[D];浙江大学;2010年
7 程敬丽;源自内生真菌的倍半萜类新颖高效抑菌化合物的衍生合成与生物活性研究[D];浙江大学;2010年
8 包梅荣;油茶种子成熟调控蛋白基因的分离克隆及功能研究[D];中南林业科技大学;2010年
9 陈欣;蛋白质在不同界面的识别、吸附及稳定性研究[D];浙江大学;2009年
10 顾全;基于集成智能的膜蛋白受体结构与功能研究[D];东华大学;2010年
中国硕士学位论文全文数据库 前10条
1 陈卫卫;耐高温水稻资源高温诱导表达蛋白鉴定与分析[D];华中农业大学;2010年
2 张艳萍;蛋白质序列的数学描述及其应用[D];浙江理工大学;2010年
3 徐杰;生物信息学在家蚕中用应用及Ras相关CTP结合蛋白C(BmRGPC的表达研究)[D];浙江理工大学;2010年
4 郑碧;家蚕小热休克蛋白22.6的克隆表达与功能初步分析[D];浙江理工大学;2010年
5 庄文华;家蚕ras oncogene (Bras2)的表达、纯化以及特性分析[D];浙江理工大学;2010年
6 马良;家蚕BmIBP基因的原核表达及其亚细胞定位研究[D];浙江理工大学;2010年
7 李婷婷;家蚕BmNADHb5的表达分析及其亚细胞定位[D];浙江理工大学;2010年
8 刘靓珏;家蚕RPA43相关基因(BmRPA43 N)的克隆表达及定位分析[D];浙江理工大学;2010年
9 张杰;基于支持向量机和蛋白质全序列的蛋白质—蛋白质相互作用预测[D];郑州大学;2010年
10 仝磊;西双版纳地区鼠类食物贮藏行为研究[D];郑州大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 蒋思伟,蔡之华,曾丹,李曲,程远方;基于模拟退火的并行基因表达式编程算法研究[J];电子学报;2005年11期
2 张云兰,毕宜珺;戊型肝炎流行病学研究的再认识[J];国外医学.流行病学传染病学分册;1994年04期
3 魏志成,杨联祥,周激流;遗传算法优化神经网络拓扑结构和权值[J];广西师范大学学报(自然科学版);2003年01期
4 何友雄,杨进业,李均伦,李艳萍,杨勤保,谭乃功,杨秀卿;广西凌云县戊型肝炎病毒感染的血清流行病学调查[J];广西预防医学;1996年02期
5 李艳萍,李荣成,黄全诚,杨进业,江世平,农艺,黄月葵;广西急性散发性病毒性肝炎的血清流行病学研究[J];广西预防医学;1997年06期
6 李小妹,王能超;神经网络预测蛋白质二级结构的编码技术[J];华中科技大学学报(自然科学版);2004年05期
7 段磊,唐常杰,左劼,陈宇,钟义啸,元昌安;基于基因表达式编程的抗噪声数据的函数挖掘方法[J];计算机研究与发展;2004年10期
8 罗莉,罗强,胡守仁;前馈多层神经网络的一种优质高效学习算法[J];计算机研究与发展;1997年02期
9 向国全,董道珍;BP模型中的激励函数和改进的网络训练法[J];计算机研究与发展;1997年02期
10 曾水玲,宋鸾娇,徐蔚鸿;基于遗传算法的神经网络结构优化[J];吉首大学学报(自然科学版);2005年03期
【相似文献】
中国期刊全文数据库 前10条
1 陈兵;文建凡;;内含子在生物信息学研究和基因工程中的应用[J];生命的化学;2010年01期
2 胡勇,王东,孔冬冬,鞠传丽,何奕昆;衣藻质体分裂相关基因CrFtsZ2的克隆及其进化分析[J];中国生物化学与分子生物学报;2003年01期
3 周世力;艾晓武;董长垣;;肠道病毒71型SHZH03结构蛋白基因的遗传进化分析[J];公共卫生与预防医学;2007年01期
4 许春鹃;韩燕;范丽菲;黄功华;;文昌鱼AmphiDC-like的全长cDNA克隆及其表达模式分析[J];中国生物化学与分子生物学报;2008年05期
5 张亮生;马成荣;戢茜;王翼飞;;拟南芥和水稻SET结构域基因家族全基因组鉴定、分类和表达[J];遗传;2009年02期
6 郝妍;宋晓峰;;人轮状病毒VP7、NSP4基因的适应性进化分析[J];计算机与应用化学;2009年03期
7 苏彤;李淑华;常文军;刘世建;鹿文英;韩一芳;曹广文;;2009年新型甲型H1N1流感病毒神经氨酸酶基因进化分析[J];第二军医大学学报;2009年06期
8 梁望旺;杨克礼;伍锐;熊忠良;刘泽文;段正赢;徐涤平;;猪繁殖与呼吸综合征病毒分离株GP5基因的遗传变异与系统进化分析[J];华中农业大学学报;2009年05期
9 李长龙;卢领群;郭红刚;柯贤福;戴方伟;萨晓婴;;长爪沙鼠线粒体DNA控制区全序列测定及分析[J];中国比较医学杂志;2010年04期
10 周开姣;吴慧;陈敏玫;莫兆军;闭福银;莫毅;谭毅;韦增良;李浩;杨进业;唐青;;广西狂犬病病毒M基因序列分析[J];应用预防医学;2011年03期
中国重要会议论文全文数据库 前10条
1 张琦;乔卫勇;;RACF介绍[A];第二次计算机安全技术交流会论文集[C];1987年
2 梁一平;邓左祥;周小平;;一种多关系数据挖掘中元组ID传播的设计与实现[A];2009年中国高校通信类院系学术研讨会论文集[C];2009年
3 王忠卫;周莉;桂建芳;;银鲫线粒体全基因组研究和进化分析[A];中国海洋湖沼学会第九次全国会员代表大会暨学术研讨会论文摘要汇编[C];2007年
4 邹小勇;李占潮;周漩;戴宗;;基于生物序列信息的功能预测研究[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年
5 程影;黄锐芝;钟新民;吴学龙;王五宏;刘智宏;李必元;;十字花科植物HSP22基因同源序列的克隆与进化分析[A];中国园艺学会2011年学术年会论文摘要集[C];2011年
6 宋陈玲;李亮;王继文;;水禽乙酰辅酶A羧化酶α基因部分序列克隆及进化分析[A];安全优质的家禽生产——第十五次全国家禽学术讨论会论文集[C];2011年
7 周晓云;孙志挥;张柏礼;胡文瑜;;一种基于单调递减阈值函数的高维数据集聚类算法[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
8 何增有;徐晓飞;邓胜春;宋玉福;;dNumber:超大范畴数据集的一个快速聚结算法(英文)[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
9 李永光;王镝;王国仁;马宜菲;;基于块排序索引的生物序列局部比对查询技术(英文)[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
10 韩威;李慧芳;朱云芬;束婧婷;陈宽维;;禽类Mx基因GTP酶效应区(GED)序列进化分析[A];中国动物遗传育种研究进展——第十五次全国动物遗传育种学术讨论会论文集[C];2009年
中国重要报纸全文数据库 前10条
1 山水;艾斯本与NIST集合数据集[N];中国石化报;2007年
2 李宇;上市预披露将成市场常规[N];中国证券报;2008年
3 郭立;荣昌猪实现数字化[N];中国畜牧兽医报;2005年
4 记者 刘浪 通讯员 廖雅琴;中国首套数字化“可视人”数据集在渝通过成果鉴定[N];重庆日报;2003年
5 秦笃烈;解读 中国造女性数字人[N];健康报;2006年
6 李宇;港交所明年试验上市预披露计划[N];中国证券报;2007年
7 上海 陈纯;初识T-SQL,恋情的开始[N];电脑报;2004年
8 周青 编译;CDP:与快照相得益彰[N];计算机世界;2006年
9 本报记者 周仲全 实习生 蔡为伟;数字虚拟人:为承受人类苦痛而来[N];辽宁日报;2005年
10 本报记者  郝宗强;为社会和谐作贡献[N];人民日报;2006年
中国博士学位论文全文数据库 前10条
1 丁淑妍;进化分析与结构预测中的若干问题研究[D];大连理工大学;2012年
2 黄玉娟;基于k词的DNA序列分析的模型研究及应用[D];大连理工大学;2012年
3 曹锋;数据流聚类分析算法[D];复旦大学;2006年
4 杨连平;生物序列的相对特征分析及Burrows-Wheeler方法[D];大连理工大学;2011年
5 薛良义;脊椎动物Hoxall基因进化分析与研究[D];浙江大学;2006年
6 吴毅;数字人全身分割数据集的建立及人体胸腔与盆腔的数字化研究[D];第三军医大学;2012年
7 刘迎照;生物序列分析中的非比对方法及其应用[D];大连理工大学;2008年
8 刘立伟;蛋白质及RNA结构比较与进化分析[D];大连理工大学;2008年
9 李呈军;中国H9N2亚型禽流感病毒进化分析与H5N1亚型禽流感病毒标记疫苗的研究[D];中国农业科学院;2005年
10 时硕永;水平基因转移与基因组进化[D];中国科学院研究生院(上海生命科学研究院);2006年
中国硕士学位论文全文数据库 前10条
1 王春玉;非平衡数据集分类方法研究及其在电信行业中的应用[D];浙江大学;2011年
2 翟洪亮;基于二级结构甲型H1N1流感病毒的进化分析[D];吉林大学;2011年
3 黄伟;基于面积不变量的生物序列相似性分析[D];大连理工大学;2008年
4 张杰;基于支持向量机和蛋白质全序列的蛋白质—蛋白质相互作用预测[D];郑州大学;2010年
5 侯凤成;基于Q学习的生物序列比对方法[D];山东师范大学;2007年
6 茹炳华;哺乳动物GJB6的分子克隆和进化分析[D];华东师范大学;2011年
7 范先念;数据不平衡分类问题研究[D];中国科学技术大学;2011年
8 孟中楼;入侵检测中的数据集生成和使用技术研究[D];华中科技大学;2004年
9 王霞;家蚕核型多角体病毒(BmNPV)bro基因的遗传多样性和进化分析[D];西南农业大学;2005年
10 杨春;条斑紫菜多聚泛素基因的克隆与系统进化分析[D];中国海洋大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026