收藏本站
《东北师范大学》 2019年
收藏 | 手机打开
二维码
手机客户端打开本文

基于集成机器学习模型的分子激发能含时密度泛函理论计算精度研究

崔景霞  
【摘要】:分子激发能的研究是理论计算化学研究中的热点和难点之一。由于激发能包含分子的内在结构信息和电子性质,精确地预测包括电子跃迁吸收能与发射波长在内的分子激发态性质已然成为理论计算化学领域的关键问题研究关注之所在。经过多年研究和应用,量子化学方法现今已经超过仅能在理论上定量验证实验现象的水平,并发展成为可以在某些分子属性实验值无法获取或不准确的条件下准确预测物质基态、激发态性质和化学反应现象等。然而,并非全部计算结果均可与真实实验值精准相符,特别是对于较大分子的激发态有关的计算。这是由于对于复杂分子或大分子体系的激发态性质的计算复杂度高,尤其是当要保证一定精确度时的计算尤为耗时。实际实验条件下计算资源的局限性以及计算方法自身的固有近似性成为导致这种现象的主要原因。人工智能方法为解决这些问题,提供了一些简单而有效的策略来校正理论计算的误差,从而提高理论计算方法的准确性并拓展其应用范围。本论文将机器学习集成算法与量子化学计算方法相结合针对分子激发态的计算效率和准确性对计算结果加以改善。首先,基于AdaBoost和Bagging两种典型的机器学习集成架构建模,并将其应用于包含433个有机分子的数据集以期提高密度泛函理论计算电子光谱吸收能的精度。然后,再次将此二种集成模型应用于包含了113个荧光分子的数据集以提高荧光发射波长的回归精度。上述研究工作采用的方法,为分子性质的准确预测提供了一种有效且高效的替代途径,提高了理论方法的可靠性并扩展了其适用范围。本论文的研究工作可概括描述为如下几个部分:1.采用含时密度泛函理论(Time-Dependent Density Functional Theory,TDDFT)量子化学方法和机器学习结合的策略,提出了准确、稳健、高效的吸收能计算集成校正模型。该模型由集成了支持向量机(SVM)、广义回归神经网络(GRNN)和随机森林(RF)为基学习器回归方法的AdaBoost框架建立。通过该集成模型的校正,吸收能的TDDFT(TDB3LYP/STO-3G,6-31G*,6-311G**)计算结果精度得以明显改善。其中,最小STO-3G基组上的计算吸收能平均绝对误差(Mean Absolute Error,MAE)和均方根误差(Root Mean Square Error,RMSE)分别由0.62和0.79 eV降至0.11和0.14 eV。校正模型的验证参数可达R~2(0.97)、Q~2(0.98)、Q_c~2 _v(0.99),说明了较好的拟合性和预测性能。研究显示,所提出的集成校正模型仅需基于最小基组的TDDFT计算,就可以达到较高的大基组水平的精度,同时模型的计算时间与TDDFT计算时间相比,花费极小。2.探究基于线性拟合余弦夹角距离集成规则的回归模型,该模型建立在Bagging框架上,集成了包括GBDT、GRNN、ELM、RF与SVM在内的多种基机器回归学习方法。在该Bagging框架下,集成校正模型具有处理高维数据和较强泛化能力的优点,可以显著改进TDDFT的激发态计算。为求取高精度计算结果,同样仅需最小的计算资源(TD-B3LYP/STO-3G),吸收能(λ_(max))回归结果的MAE和RMSE即可分别从0.62减少到0.09 eV和从0.79到0.12 eV。此外,由于本研究提出的集成方法是基于加权平均Bagging算法将多种基学习器回归模型结果集成,其时间复杂度实际上与单基学习器算法相同,在保证极高精确度的同时亦具有高效性,比AdaBoost模型更为简洁。这表明Bagging集成可以作为降低昂贵计算成本而建立的较好校正模型工具之一。3.鉴于以上AdaBoost与Bagging集成模型对于吸收能计算结果的成功校正,尝试进一步将二者应用于包含113个近红外荧光分子的162个样本的数据集,对发射波长的计算精度进行校正。实验结果表明,集成模型可将TDDFT/STO-3G计算的发射波长的MAE值与RMSE值分别从1.094降低到0.014eV和从1.375降低到0.017eV。进一步证明了集成模型的适用性与有效性。
【学位授予单位】:东北师范大学
【学位级别】:博士
【学位授予年份】:2019
【分类号】:TP181;O641.1

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 邢红杰;魏勇乐;;基于相关熵和距离方差的支持向量数据描述选择性集成[J];计算机科学;2016年05期
2 常青;邱泽阳;李耀祥;;基于PDM的CAD/CAPP/CAM集成技术研究[J];机械研究与应用;2009年01期
3 李毓;徐成贤;;修剪Bagging集成的方法及其应用[J];系统工程理论与实践;2008年07期
4 肖贤建;B2B集成技术的体系结构[J];计算机与现代化;2005年03期
5 李波;;集成经营理论与实践探索[J];上海经济研究;2008年05期
6 陈晓瑜,严隽薇;CIMS中信息集成的技术及应用模型[J];微型电脑应用;1997年04期
7 朱波,何霆,王纹;CIMS应用集成技术问题研究[J];现代制造工程;2003年12期
8 王炳旸;;渔家傲·贺《道医集成》出版[J];中国道教;2019年03期
9 顾武雄;;集成设置与测试[J];网络安全和信息化;2018年09期
10 胡晓莉;;探析电子集成技术的现状及发展方向[J];山西农经;2016年16期
中国重要会议论文全文数据库 前10条
1 程丽丽;张健沛;杨静;马骏;;一种提高支持向量机集成差异性的学习方法[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
2 海峰;冯艳飞;李必强;;集成论的基本原理[A];Systems Engineering, Systems Science and Complexity Research--Proceeding of 11th Annual Conference of Systems Engineering Society of China[C];2000年
3 顾基发;唐锡晋;;综合集成系统建模[A];中国科学院系统科学研究所—上海理工大学上海系统科学研究院成立暨上海理工大学系统科学与系统工程研究所建所25周年[C];2005年
4 华建记;;基于智能交通集成系统的业务平台设计[A];第十四届中国智能交通年会论文集(2)[C];2019年
5 汪方宝;左防震;;面向制造企业集成的CAPP系统[A];制造业数字化技术——2006中国电子制造技术论坛论文集[C];2006年
6 陈黎敏;;设计与制造的集成[A];中国电子学会生产技术学分会机械加工专业委员会第八届学术年会论文集[C];2001年
7 沈祖志;杨扬;;关于流程企业CIMS集成技术的探讨[A];第七届计算机模拟与信息技术学术会议论文集[C];1999年
8 魏忠;;系统性信息安全综合集成量化评估体系的研究[A];中国信息协会信息安全专业委员会年会文集[C];2004年
9 高学武;;工程设计集成系统技术与实施[A];第十四届全国工程设计计算机应用学术会议大会报告文集[C];2008年
10 苏志华;杨冬青;唐世渭;王腾蛟;;基于结构分析和实体识别的信息集成[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
中国重要报纸全文数据库 前10条
1 ;Web服务提速应用集成[N];计算机世界;2003年
2 记者 孟宪峰;405套集成房屋“廊坊造”[N];河北日报;2020年
3 唐人;多品类集成或成未来主旋律[N];建筑时报;2019年
4 记者 崔昊;改革创新集成 为高质量发展探路[N];厦门日报;2019年
5 ;聚焦便民 集成改革 系统推进[N];湄洲日报;2019年
6 ;中车株机 集成与协同 中车株机数字化再造[N];中国信息化周报;2019年
7 本报记者 徐微;市双创中心创新集成效应凸显[N];长春日报;2019年
8 汤翠玲 记者 陈其珏;协鑫集成罗鑫:下半年光伏市场会更加火爆[N];上海证券报;2019年
9 本报记者 丁建峰;这项集成应用解决了657项技术难题[N];宁夏日报;2019年
10 北京林业大学教授 郭洪武;浅议装配式内装集成技术体系[N];中国建材报;2019年
中国博士学位论文全文数据库 前10条
1 崔景霞;基于集成机器学习模型的分子激发能含时密度泛函理论计算精度研究[D];东北师范大学;2019年
2 丁振峰;我国奥运备战集成创新的发展模式及运行机制研究[D];北京体育大学;2015年
3 刘冲;模拟电路故障诊断AdaBoost集成学习方法研究[D];大连海事大学;2011年
4 史宪睿;企业集成创新及其评价研究[D];大连理工大学;2006年
5 朱建忠;我国制造企业面向产品的技术集成机理研究[D];浙江大学;2009年
6 王卓昊;软件即服务模式下的信息集成方法及关键技术研究[D];大连理工大学;2012年
7 王永明;集成回归问题若干关键技术研究[D];华东师范大学;2015年
8 张芳芳;《(新刊)医学集成》的整理与研究[D];北京中医药大学;2014年
9 刘禹;集成建设系统研究[D];东北财经大学;2009年
10 陈捷娜;基于集成论的产业集群管理理论与实务研究[D];福州大学;2014年
中国硕士学位论文全文数据库 前10条
1 韩娜;集成支持向量机方法及在信用风险中的应用研究[D];郑州大学;2013年
2 高洪涛;支持向量机集成方法研究[D];河北大学;2011年
3 魏勇乐;基于信息理论学习的支持向量数据描述集成[D];河北大学;2016年
4 王婕婷;分类问题的集成理论与方法[D];山西大学;2015年
5 戴振华;基于企业层面的集成创新管理[D];河海大学;2004年
6 胡文峰;集成建筑探研[D];中南大学;2011年
7 张剑;集成房屋行业中小企业发展战略研究[D];西南财经大学;2009年
8 丁瑛;西周金文语义系统研究[D];华东师范大学;2010年
9 刘佳;基于集成创新的黑龙江省区域创新系统研究[D];哈尔滨工程大学;2008年
10 林海;产品功能集成创新研究[D];南京航空航天大学;2008年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026