收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

化学信息学新算法及在化学、生物与食品科学中的应用研究

杜红英  
【摘要】: 近年来,随着信息科学、计算机科学与互联网的高速发展,一种新的交叉学科-化学信息学(Chemoinformatics)也迅速成长起来了。化学信息学是一门利用信息学的方法来解决化学的问题,同时得到有关化学本质规律的的学科。化学信息学的研究范围十分广泛,内容丰富,例如化学试验设计与优化、定量校正理论、分析信号处理、化学模式识别、模型与参数估计、人工智能等。化学信息学产生于科学家们对化学知识规律的不断需要的过程中。 化合物结构与性质/活性定量关系(quantitative structure-property /activityrelationship,QSPR/QSAR)是化学信息学研究中的一个重要应用分支。该方法是指将化合物的结构参数同其生物活性数据以一定的数学模型相联系起来的定量关系。QSPR/QSAR的研究最初应用于生物领域是为了适应合理设计生物活性分子的需要而发展起来的。由于计算机技术的发展和应用,QSPR/QSAR的研究提高到了一个新的水平,且日趋成熟,其应用范围也迅速扩大,研究涉及生物,化学,药物科学,以及食品科学等诸多学科。人们期望用一个成功的数学模型,能从分子水平上理解其微观结构同其宏观性质/活性之间的关系,根据已有的知识,探求化合物性质/活性与结构的相互作用规律,从而推论呈现化合物某些性质的影响因素,然后为设计,筛选或预测具有人们期望性质的化合物提供信息。 化学信息学的发展为化学各分支学科的发展提供了多种解决问题的新思路,新方法。本学位论文主要对化学信息学研究中的一些新算法进行了探讨,并把这些新算法成功应用于QSAR/QSPR研究领域中。该论文共包括五章节内容,每一个章节的具体内容如下所示: 第一章:简述了化学信息学的基本概念和研究现状,以及多种化学信息学算法,也详细讲述了化学信息学研究的分支之一——QSAR,包括QSAR演变历史,基本原理以及实现的步骤等等。 第二章:主要讨论了Quantitative structure-retention relationship (QSRR)方法在多肽色谱保留行为预测的应用研究。具体内容如下:(1)基于线性和非线性建模方法对反相液相色谱(RPLC)的101种多肽保留时间进行了定量结构保留关系建模研究。最佳多元线性回归(BMLR)方法用来选择与保留行为最为密切的分子描述符,并建立线性模型。另外两种非线性回归方法(径向基函数神经网络(RBFNN)和投影寻踪回归(PPR))用来构建非线性模型。RBFNN和PPR模型的训练集的相关系数(R~2)分别为0.9787和0.9881;均方根误差(RMSE)为0.5666和0.4207。结果表明,RBF神经网络和投影寻踪回归将是蛋白质组研究中一种简单且有效的工具,并有望应用于其他类似的研究领域。(2)新颖的化学信息学方法—局部懒惰回归(LLR)首次应用于预测278个多肽在固定金属亲和色谱(镍柱)的保留行为研究。该工作分别用BMLR,PPR和LLR三种方法建立线性和非线性QSRR模型。最佳的LLR模型的训练集和测试集的R~2分别为0.9446和0.9252。该工作证明新颖机器学习算法LLR是一个非常有前途的研究工具,它可用于色谱保留行为研究领域,为协助设计和分离纯化蛋白质和多肽发挥一定的作用。 第三章主要描述了QSAR方法在农业和食品科学领域的应用研究,具体内容如下:(1)三种机器学习方法:遗传算法-多元线性回归(GA-MLR),最小二乘支持向量机(LS- SVM),PPR用于100个稻瘟病抑制剂噻唑啉衍生物的杀菌活性研究。线性模型GA-MLR和非线性模型LS-SVM和PPR都得到了良好的预测结果,但非线性模型提供了更加精确的预测能力。结果表明,非线性LS-SVM和PPR方法可以更加准确地模拟噻唑啉分子结构与杀菌活性之间的关系,能够成为研究稻瘟病抑制剂良好的建模工具。此外,这项研究为稻瘟病抑制剂的设计和开发提供了一种新的,简单而且有效的办法,同时得到的与其密切相关的分子结构信息。(2)运用定量结构保留关系方法对藏红花内43种芳香组分的SPME-GC-MS保留时间进行了预测。应用最佳多元线性回归(BMLR)和投影寻踪回归(PPR)方法分别建立了线性和非线性模型,两种方法均得到了较好的结果:线性模型的训练集和测试集的相关系数(R~2)分别为0.9434和0.8725,非线性模型则给出了较好的预测结果分别为0.9806和0.9456。通过对模型的稳定性和预测能力的比较,可以看出非线性PPR方法可以较好的应用到SPME-GC-MS保留行为研究领域内,同时该工作又可以为其他植物和中草药的分离研究提供一种简便有效的方法。 第四章主要讨论了定量构效关系在生命科学和医药研究领域内的应用,主要有以下几部分组成:(1)利用QSRR方法对55种药物在固相人工膜色谱内的保留指数进行了线性和非线性建模研究。在该工作中,线性BMLR方法被用来选取与保留指数最为相关的参数,同时建立线性回归模型;利用选取的描述符,应用PPR和LLR方法来建立更加准确的预测模型。通过模型对比,我们发现LLR作为一种新的建模方法,体现出较完美的预测能力,其训练集和测试集的预测结果为:复相关系数(R~2),0.9540,0.9305;均方根误差(RMSE),0.2418,0.3949。结果显示,新型LLR建模方法在QSRR方法研究中表现出了较好的预测能力,同时该方法定会成功的应用于其它类似的色谱研究领域内。(2)利用线性和非线性建模方法研究了80个N-羟基-a-苯磺酰乙酰胺(N-hydroxy-aphenylsulfonylacetamidederivatives,HPSAs)衍生物对三种类型的基质金属蛋白酶的抑制活性。其中线性BMLR方法用来选取关键的结构参数,同时建立线性模型对所选化合物的抑制活性进行了预测;然后以全局格式搜索PPR方法利用选取的参数建立非线性回归模型。最终,线性和非线性模型均能提供较为满意的预测结果。在该工作中,非线性PPR方法首次与格式搜索(GS)方法相结合并成功应用于对HPSAs的抑制活性的建模研究,得到了令人满意的预测结果。该方法的成功为其他模型参数的优化与选取提供了一种捷径。(3)利用线性回归方法和非线性回归方法-格式搜索支持向量机(GS-SVM)和PPR方法对MT3褪黑激素结合位点的亲和性进行了研究。在该工作中,遗传算法被用来选取与研究对象最为相关的结构参数,并建立线性回归模型对MT3褪黑激素结合位点的亲和性进行预测;利用选取的五个结构变量,采用非线性回归方法GS-SVM和PPR方法建立更加准确的模型。通过模型对比,我们发现非线性PPR方法能够对MT3褪黑激素结合位点的亲和性具有比较准确的预测能力。该方法的建立,为设计和开发新型MT3褪黑激素的新型配体提供了一种新型的研究方法。 第五章:QSAR方法在化学感应系统相对灵敏度的预测研究。在本章中,BMLR,SVM和LLR三种方法用来完成64种VOCs的气味检测阀值(ODTs)和鼻腔辛辣味阀值(NPTs)相对敏感性的QSAR建模研究,所得的预测结果和相应的实验数据基本吻合。相比之下,LLR方法能够获得更好的预测能力,因此,它在QSAR研究中是一种有效的机器学习算法。此外,本研究还确定了一些重要的分子结构信息,它们与VOC的相对敏感性密切相关。这些信息可以用来选择或制造一些新型的化学传感器,同时也说明LLR方法是一种很有前途的QSAR建模方法,可用于其他类似的化学传感器建模预测研究。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 邵学广,蔡文生;化学信息学及其课程建设[J];大学化学;2002年03期
2 徐筱杰;化学信息学的涵义及教育[J];大学化学;2002年01期
3 邵学广;化学信息学网络化教学系统的研制[J];化学教育;2001年11期
4 陈泓,曹庆文,李梦龙;化学信息学发展现状[J];化学研究与应用;2004年04期
5 李彬;浅谈化学信息学[J];内蒙古石油化工;2005年01期
6 彭彤;漫谈化学信息学的产生与发展[J];山东化工;2002年06期
7 帅行明;;论高职化学专业开设化学信息学课程的重要性[J];职业时空;2007年21期
8 罗海彬,刘明宏,邱志金,陈明旦;化学信息学网络考试系统的构建[J];大学化学;2002年04期
9 张万强;许志红;王宏胜;;化学信息学教学中的几点体会[J];广东化工;2010年07期
10 程丽;;化学信息学在综合设计性实验中的作用[J];中国科教创新导刊;2009年25期
11 解征;;化学信息学的研究进展[J];安徽化工;2008年01期
12 宋心琦;21世纪理论化学的重要课题之我见[J];大学化学;1999年01期
13 程翼宇,余杰,吴永江;色谱数据可视化及天然植物药指纹特征发现方法[J];化学学报;2002年02期
14 乔园园;刘建涛;刘冲;;化学信息学与开源软件[J];计算机与应用化学;2006年08期
15 苏振强,潘德思,山松,胡伟明,宁志强,李志斌,石乐明,廖晨钟,张大杰,乔伟,鲁先平;生化信息学在药物创新过程中的重要作用[J];中国新药杂志;2004年05期
16 乔园园;鹿涛;车云霞;;化学信息学与生物信息学开放性比较[J];化学进展;2007年04期
17 何险峰,周家驹;化学信息集成系统CASAC 3[J];计算机与应用化学;2002年03期
18 俞飞;王宇辉;朱福成;黄迎;解丽娜;凌敏;沈天翔;谢微;刘斌;姚建华;;化学信息学技术在农药研发中的作用[J];世界农药;2009年S1期
19 乔园园;孙可;刘冲;;化学信息学与药物发现研究的开放性[J];计算机与应用化学;2006年12期
20 鲁先平,王四海;“洋兔土龟”重开赛局[J];中国处方药;2002年02期
中国重要会议论文全文数据库 前10条
1 姚建华;;化学信息学的应用和发展[A];第十届全国计算(机)化学学术会议论文摘要集[C];2009年
2 白银娟;张逢星;董秦生;;化学信息学教学实践与探索[A];第八届全国大学化学教学研讨会论文集[C];2005年
3 邵学广;徐筱杰;;化学信息学(计算机化学)的研究进展[A];化学学科发展研究报告(2008-2009)[C];2008年
4 谢微;黄迎;朱福成;沈天翔;姚建华;;化学信息学的未来[A];中国化学会第26届学术年会化学信息学与化学计量学分会场论文集[C];2008年
5 梁逸曾;;化学计量学、化学信息学与生物信息学——定义、内涵及其融合趋势的几点思考[A];中国化学会第26届学术年会化学信息学与化学计量学分会场论文集[C];2008年
6 谢微;沈天翔;朱福成;黄迎;姚建华;;化学信息学在化学物质安全性评价中的应用[A];中国化学会第26届学术年会环境化学分会场论文集[C];2008年
7 熊庆;李功兵;郭延芝;李梦龙;;信息技术辅助化学信息学课程建设[A];中国化学会第27届学术年会第17分会场摘要集[C];2010年
8 黄迎;冯樑;解丽娜;凌敏;陈碧玲;姚建华;;化学信息学在有机环境污染物管理工作中的应用[A];中国化学会第27届学术年会第02分会场摘要集[C];2010年
9 冯樑;解丽娜;凌敏;胡静;黄迎;陈碧玲;王宇辉;李佳;姚建华;;化学信息学方法在中药研究中的应用[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年
10 沈天翔;朱福成;黄迎;谢微;姚建华;;化学信息学与“e-科学”[A];第九届全国计算(机)化学学术会议论文摘要集[C];2007年
中国博士学位论文全文数据库 前10条
1 胡黔楠;化学信息学中的数据挖掘[D];中南大学;2004年
2 赵春燕;QSAR研究在生命分析化学和环境化学中的应用[D];兰州大学;2006年
3 栾锋;支持向量机(SVM)和径向基神经网络(RBFNN)方法在化学、环境化学和药物化学中的应用研究[D];兰州大学;2006年
4 司宏宗;基因表达式编程与支持向量机在疾病诊断和QSAR/QSPR中的应用研究[D];兰州大学;2006年
5 郝明;基于化学信息学方法的药物分子计算研究[D];大连理工大学;2012年
6 俞书浩;功能基因组学和化学信息学协同的药物研发数据挖掘方法[D];上海交通大学;2013年
7 陈蕾;原始蛋白酶结构功能的生物信息学分析及化学基础[D];山东师范大学;2009年
8 杜红英;化学信息学新算法及在化学、生物与食品科学中的应用研究[D];兰州大学;2009年
9 任月英;QSPR/QSAR在药物、分析化学和环境科学中的应用[D];兰州大学;2007年
10 王杰;数学建模方法在药物化学及大鼠大脑新陈代谢中的应用研究[D];兰州大学;2009年
中国硕士学位论文全文数据库 前10条
1 刘志刚;天然药物网络数据库中活性分子3D结构的实现及其构效关系研究[D];四川大学;2002年
2 王冰;SVM在肾结石分类和计算热力学参数中的应用[D];兰州大学;2006年
3 阮晓芳;支持向量机方法在医学和环境化学中的应用研究[D];兰州大学;2007年
4 曹庆文;常用化学数据资源库的构建和基于ASP的WEB管理信息系统的设计与实现[D];四川大学;2003年
5 李学娟;中药中的西药成分分析及其对组合药物设计的指导意义[D];山东理工大学;2008年
6 姜莹英;氧气对代谢进化的影响:化学信息学与生物信息学的综合研究[D];山东理工大学;2010年
7 姜林;化学信息学方法研究及其在环境、生物学中的应用[D];四川大学;2006年
8 张静;MDL数据库与虚拟筛选技术跨平台对接技术研究与应用[D];长春理工大学;2009年
9 段爱霞;一些化学信息学方法在离子液体和生物学中的应用研究[D];西北师范大学;2009年
10 周新奇;小分子物质结构与熔点及蛋白亲和性定量构效关系研究[D];中南大学;2007年
中国重要报纸全文数据库 前10条
1 EVOLVE;生物信息学和化学信息学双剑合壁造新药[N];中国高新技术产业导报;2002年
2 ;“生物”、“信息”联手合璧造新药[N];医药经济报;2003年
3 本报实习记者 高成森;计算机分子模拟技术——使生命科学研究更精彩[N];中国医药报;2002年
4 ;李松:孜孜不倦攀高峰[N];科技日报;2002年
5 肖峰;论“信息主义”的兴起[N];光明日报;2007年
6 蒋寒;提高新药新材料研发效率[N];科技日报;2005年
7 岳阳;我国亟待完善外源化学物质安全预警系统[N];中国医药报;2006年
8 崔静;专家呼吁探索“旧药新用”促进创新[N];医药经济报;2007年
9 庄陈;“砍掉”新药开发1/3成本[N];医药经济报;2002年
10 余志平;组合信息学——大踏步进入后基因组时代[N];医药经济报;2002年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978