收藏本站
收藏 | 论文排版

基于深度学习的有机化合物合成可行性预测

于佳卉  
【摘要】:从巨大的化学空间中发现新的候选药物一直是药物化学家面临的一项重大挑战。作为计算机辅助药物设计的两种主流技术,虚拟筛选方法能从现有大型化合物数据库中筛选出最有可能与药物靶标结合的候选分子,而从头药物设计方法则使用分子生成技术产生具有潜在治疗效果的全新候选分子。不幸的是,由于在筛选或分子生成过程中往往很少考虑化合物的合成可行性,导致部分计算机推荐的分子很难甚至无法合成,进而大大降低了先导化合物发现和优化的效率。目前已有几种基于专家知识的预测方法和基于分子描述符的定量构效关系(QSAR)模型可用于分子合成可行性的评估,但由于其预测精度低和模型可解释性差等缺陷,它们在药物发现中的应用仍然相当有限。此外,部分结构相似分子的可合成性差异较大,但现有的预测方法对这些相似分子的区分能力较弱,因此如何准确快速地评估相似小分子的合成可行性也至关重要。在本论文中,我们采用基于图注意力机制的深度学习算法发展了用于分子合成可行性预测的可解释模型,并探讨了在假设的决策边界附近采样对预测模型的影响。主要内容及结果如下:(1)首先,收集了来自不同公共数据库的800,000个化合物,并基于图注意力机制构建用于分子合成可行性预测的二分类深度学习模型及经典的图卷积神经网络模型。基于不同的分子描述符组合,采用随机森林和极限梯度提升算法构建一系列机器学习模型。在所有预测模型中,基于图注意力机制的深度学习模型具有最好的泛化能力,在3个外部测试集上的预测准确度分别为0.985、0.801和0.759,AUC分别为0.999、0.881和0.850。通过分析测试集中分子结构相似度进一步表明了基于注意力机制的模型在区分高度相似的分子上更具优势,因此更加适用于真实化学空间中的分子合成可行性的预测。(2)此外,通过将单个原子权重映射到化合物上的方法对基于图注意力机制的模型的预测结果进行解释,分析单个原子对分子合成可行性预测结果的贡献和影响。通过计算原子状态向量间的皮尔森相关系数分析原子特征是如何演化的,结果表明引入注意力机制可以捕获到化学结构中的非局域效应。(3)最后,基于已构建的图注意力机制模型搭建了用于分子合成可行性预测的在线平台GASA,该平台可实现基于文本或结构的单个或批量数据的预测。此外,我们还提供了常用虚拟筛选库中化合物的可合成性预测结果供用户下载,旨在帮助药物研究人员在药物设计工作流程中快速筛选易于合成的分子。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 ;合成生物学发展[J];中国科技信息;2022年22期
2 郭长明;霍波洋;陈小文;;《合成语言——矛盾与和谐》[J];美苑;2015年S1期
3 Justine Chen;;ASIC和FPGA的实体合成及其差别[J];电子设计技术;2002年06期
4 刘守贵,廖虹;国内邻甲酚醛环氧树脂生产与应用展望[J];热固性树脂;2001年04期
5 平译;利用鸟粪合成禽畜饲料[J];粮食与饲料工业;2000年06期
6 张平远;利用鸟粪合成禽畜饲料[J];畜禽业;2000年06期
7 张帆;奕琦;;合成的曝光照[J];科学启蒙;2011年Z1期
8 ;奇怪的动物[J];初中生之友;2008年Z1期
9 ;世界首棵“合成树”[J];少儿科技;2008年10期
10 ;有機合成廠之夜[J];吉林政报;1995年05期
11 张建明;;合成原则及其意义[J];贵州民族学院学报(哲学社会科学版);2006年05期
12 解晓平;郝向红;黄家兴;;Hemetsberger吲哚合成法研究进展[J];化学试剂;2014年05期
13 徐林;脒的合成新法[J];中国医药工业杂志;2001年06期
14 陈代谟,廖建,张毅立,孙洪涛;合成肟的简易方法[J];厦门大学学报(自然科学版);1999年S1期
15 蒋俊树,姚日生,许波;咔唑的合成及其应用[J];安徽化工;1995年04期
16 王汉清;托瑞司他合成路线图解[J];中国医药工业杂志;1995年04期
17 王德林;范旭;赵俊业;;陆军合成营参谋训练[J];国防科技;2019年02期
18 马志宏;马振鹏;;论大数据背景下的侦查合成作战[J];湖南警察学院学报;2019年01期
19 王卫;我国F-T合成蜡技术有进展[J];齐鲁石油化工;2001年04期
20 林秀杰,龚叶南,薛桂芬;简论哌嗪的合成方法和应用前景[J];精细化工;1996年06期
中国重要会议论文全文数据库 前20条
1 吴四权;李晓燕;孙宏建;;PSiP钳式铁钴镍配合物的合成及性质研究[A];第十七届全国金属有机化学学术讨论会论文摘要集(1)[C];2012年
2 肖婷;陈晨;杜晨霞;吴养洁;;新型铱(Ⅲ)配合物的合成及磷光性能研究[A];第十七届全国金属有机化学学术讨论会论文摘要集(1)[C];2012年
3 王林林;张庆玲;卢冰;孙宏枚;沈琪;;含醚功能化咪唑盐的离子型铁(Ⅲ)配合物的合成及应用[A];第十七届全国金属有机化学学术讨论会论文摘要集(1)[C];2012年
4 卓馨;张有才;郑和根;;[Zn(pmO_2S)_2(H_2O)_2]·(OC_3H_6)]配聚物的合成[A];中国化学会第二十五届学术年会论文摘要集(上册)[C];2006年
5 李娟;高敏;陈强;杨丽珍;;聚酰胺-胺树状大分子的合成及其研究[A];第七届全国表面工程学术会议暨第二届表面工程青年学术论坛论文集(二)[C];2008年
6 吴骊珠;;多吡啶铂(Ⅱ)配合物的设计合成及功能研究[A];中国化学会第二十五届学术年会论文摘要集(上册)[C];2006年
7 牛庆芬;孙宏建;李晓燕;;三甲基膦支持的新型含硫有机钴配合物的合成及性质研究[A];第十七届全国金属有机化学学术讨论会论文摘要集(1)[C];2012年
8 王振东;张云贤;张斌;孙洪敏;杨为民;;不同形貌MCM-22分子筛的合成及其催化性能研究[A];第十七届全国分子筛学术大会会议论文集[C];2013年
9 姜其舟;石琪;徐红;董晋湘;;两种铜硅分子筛AV-23、CuSH-1Na的合成[A];第十五届全国分子筛学术大会论文集[C];2009年
10 张珊珊;孙涛;蓝林欣;李天铎;牛庆芬;;三甲基膦支持的新型含硫有机钴配合物的合成及性质研究[A];2017全国太阳能材料与太阳能电池学术研讨会摘要集[C];2017年
11 崔春晓;李慧;于涛;李晓强;杨先金;杨军;;通过Petasis反应合成多取代不饱和δ-环戊内酯衍生物的新方法[A];第十七届全国金属有机化学学术讨论会论文摘要集(1)[C];2012年
12 杨荣泽;张沛翎;曾孟慎;王盟强;颜富士;;以热液法利用χ-Al_2O_3合成奈米级片状gibbsite粉末之研究[A];第八届全国颗粒制备与处理学术和应用研讨会论文集[C];2007年
13 刘巧云;肖勇;陈硕平;袁良杰;;2ZnO·3B_2O_3·3.5H_2O不同形貌的控制合成[A];中国化学会2008年中西部地区无机化学、化工学术交流会会议论文集[C];2008年
14 蒋尚;王润伟;裘式纶;张宗弢;;一步合成多级孔花状的SAPO-34微球材料[A];中国化学会第30届学术年会摘要集-第三十二分会: 多孔功能材料[C];2016年
15 夏崇亮;解存飞;邓海宁;孙宏枚;沈琪;;含双酚功能化咪唑啉盐的离子型铁(Ⅲ)配合物的合成及应用[A];第十七届全国金属有机化学学术讨论会论文摘要集(1)[C];2012年
16 关莉莉;汪颖;吴佳;宋家庆;;纳米NaY分子筛的合成[A];第十五届全国分子筛学术大会论文集[C];2009年
17 姜小明;郭国聪;;(Hg_3Te_2)(Bi_2Cl_8)的合成与结构[A];中国化学会第27届学术年会第08分会场摘要集[C];2010年
18 涂海洋;汪成进;张爱东;;手性大环多胺锰(Ⅱ)配合物的合成[A];中国化学会第四届有机化学学术会议论文集(下册)[C];2005年
19 夏志林;伍林;秦晓蓉;易德莲;黄峰;严敏;;没食子酸丙酯锆配合物的合成及谱学性质[A];中国化学会第十四届有机分析及生物分析学术研讨会会议论文摘要集[C];2007年
20 肖国威;孙新站;万重庆;;一种100%转化的后合成交换多孔MOF材料制备与性质[A];第七届全国物理无机化学学术会议论文集[C];2016年
中国博士学位论文全文数据库 前20条
1 马诗雯;合成生物学的伦理学反思[D];大连理工大学;2020年
2 冀朋;合成生物学的哲学基础问题研究[D];华中科技大学;2021年
3 陈玮;利用活性污泥混合菌群合成聚羟基烷酸脂的研究[D];哈尔滨工业大学;2010年
4 席福贵;锆基金属有机框架材料的合成、修饰及催化应用[D];华东师范大学;2016年
5 謝國劍;漢語同構同義雙音合成詞研究[D];华东师范大学;2011年
6 陈建刚;粉煤灰合成沸石固磷机制及固磷能力强化技术研究[D];上海交通大学;2007年
7 戴志超;铕/铽配合物荧光分子探针的合成与应用研究[D];大连理工大学;2015年
8 殷曦;基于机器学习及统计计算模型的膜蛋白结构预测[D];上海交通大学;2017年
9 杨静;蛋白质残基相互作用预测及其在结构建模中的应用研究[D];上海交通大学;2018年
10 韩启迪;基于非线性成矿动力系统的机器学习方法应用研究[D];中国地质大学(北京);2019年
11 薛红新;基于机器学习方法的分类与预测问题研究[D];中北大学;2019年
12 刘浏;基于机器学习的恶意代码检测与分类技术研究[D];国防科技大学;2017年
13 陈旭展;基于机器学习的智能机器人环境视觉感知方法研究[D];华中科技大学;2019年
14 吴念;CO_2电还原的理论计算研究[D];武汉大学;2019年
15 胡胜山;面向机器学习的安全外包计算研究[D];武汉大学;2019年
16 王磊;基于机器学习的药物—靶标相互作用预测研究[D];中国矿业大学;2018年
17 张庆;钙钛矿型功能材料的基因组工程研究[D];上海大学;2018年
18 管月;医学肿瘤影像分类算法研究及其在肝癌上的应用[D];南京大学;2018年
19 郝小可;基于机器学习的影像遗传学分析及其应用研究[D];南京航空航天大学;2017年
20 施建明;基于机器学习的产品剩余寿命预测方法研究[D];中国科学院大学(中国科学院遥感与数字地球研究所);2018年
中国硕士学位论文全文数据库 前20条
1 于佳卉;基于深度学习的有机化合物合成可行性预测[D];浙江大学;2022年
2 王希;公安机关合成作战机制研究[D];西南政法大学;2018年
3 王榕;深度合成技术行政监管的困境和路径[D];甘肃政法大学;2021年
4 许庆;ZSM-22分子筛的合成与放大研究[D];山西大学;2017年
5 杨磊;合成生物学的伦理研究[D];北京协和医学院;2012年
6 张乾;地市级公安机关合成作战机制改进研究[D];中国人民公安大学;2020年
7 王涛;基于对孢菌素甙元C-7位及咔唑氮修饰的系列衍生物的合成研究[D];武汉工程大学;2017年
8 赵旻骏;2H-色烯衍生物的合成与抑制真菌活性[D];福建农林大学;2017年
9 邹文慧;抗癌药物Demethoxyfumitremorgin C中间体的立体选择性合成以及微波促进的氮杂吲哚合成方法研究[D];华东理工大学;2014年
10 刘浩然;“深度合成”技术发展的风险及其对策研究[D];成都理工大学;2021年
11 陈晓梅;机器学习方法用于二氢叶酸还原酶抑制剂的活性预测[D];四川大学;2007年
12 汪宏钊;计算机辅助白三烯受体拮抗剂的结构与活性关系研究[D];北京化工大学;2021年
13 董春来;基层公安实施“四侦一化”合成作战工作模式研究[D];华中师范大学;2020年
14 曾庆娟;合成生物技术伦理问题研究[D];湖南师范大学;2011年
15 张银珠;基于资源汇聚的程序合成方法[D];国防科技大学;2019年
16 陈斌斌;碳点的功能化、自放热合成及其在生化药物分析中的应用研究[D];西南大学;2017年
17 范梦婷;有机分子亲脂性的理论研究[D];南京大学;2021年
18 张悦;计算机环境下人声合成技术的艺术化运用[D];南京艺术学院;2016年
19 叶洪;水产品中九种合成麝香气相色谱质谱联用与气相色谱串联质谱分析研究[D];福建农林大学;2013年
20 周锦;5,15-二取代-β-卟啉醛的合成[D];天津大学;2010年
中国重要报纸全文数据库 前20条
1 记者 陈志刚;兰州:深化合成作战 现发命案全破[N];人民公安报;2019年
2 黄小高 本报记者 谢文华;“合成作战”的威力[N];宜春日报;2017年
3 印高乐;中国大陆合成皮产量跃居亚洲第二[N];国际经贸消息;2002年
4 ;ST合成通过GMP认证[N];证券日报;2003年
5 小沁;ST合成 股东持股部分被冻结[N];证券日报;2003年
6 记者 刘肖勇 通讯员 丁宁宁;国际合成生物设施联盟成立[N];广东科技报;2019年
7 记者 陈姝;像组装机器一样合成生物[N];深圳商报;2019年
8 张德斌;ST合成 天歌科技 大股东归还部分欠款[N];中国证券报;2003年
9 本报记者 孙兴维 特约记者 张应翔 王传峰;合成营,如何打开体系制胜之门[N];解放军报;2014年
10 本报记者 瞿剑;分子筛合成遇天花板 缩短差距需另辟蹊径[N];科技日报;2018年
11 本报记者 李丹;合成毒品及其危害[N];广安日报;2011年
12 本报记者 张年亮;合成毒品是全球公害[N];人民公安报;2015年
13 本报记者 李吉胜 通讯员 赵英伟;吉林:强化合成作战提升公安实战水平[N];人民公安报;2014年
14 见习记者 刘相华;西南合成披露重大合同[N];上海证券报;2010年
15 ;ST合成签定追缴欠款协议[N];证券日报;2003年
16 本报记者 申东;公安合成作战由战时合成变全天候[N];法制日报;2016年
17 本报记者 张年亮;合成毒品泛滥 打防并重刻不容缓[N];人民公安报;2015年
18 ;ST合成 实际控制人赎回债权[N];中国证券报;2003年
19 实习记者 胡定坤;合成生物学面临安全挑战 专家提出“中国方案”[N];科技日报;2019年
20 记者 赵凯;合成制药母公司多方签约[N];中国证券报;2000年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978