收藏本站
《大连理工大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

PLS和GA应用于部分有机污染物的QSAR研究

丁光辉  
【摘要】:有机污染物定量结构-活性相关(QSAR)对于有机化合物的生态风险性评价、污染控制和预防等具有重要意义。QSAR研究常采用偏最小二乘回归分析(PLS)建立模型,以解决大量分子结构描述符的使用带来的变量间多重共线性问题。为了对众多的分子结构描述符进行筛选以得到最佳的QSAR模型,人们提出了各种变量选择方法。其中,基于遗传算法(GA)的变量选择方法由于结合了GA较强的全局优化搜索能力而具有较好的效果。但是,现有的各种变量选择方法均存在着一定的问题。 本文针对两个典型的不同样本容量的有机污染物QSAR研究,提出了不同的变量选择方法,就其变量选择及模型优化效果进行了深入地研究和探讨,在此基础之上建立了最佳的OSAR模型,并对所得的模型进行了相应的解释。 1.基于量子化学分子结构描述符和拓扑参数,应用PLS,建立了可以预测不同环境温度下多氯代二苯并二噁(口英)/呋喃(PCDD/Fs)固相蒸气压(Ps)和过冷液相蒸气压(P_L)的定量模型。 在建模过程中,提出并采用了三种适用于大样本QSAR研究的变量选择方法:①基于逐步回归分析的变量选择方法;②基于变量投影重要性参数VIP的变量选择方法;③基于PLS模型的Q_(cum)~2(经交叉验证得到的,模型中提取的PLS成分所能解释的因变量的累计方差的比例)和VIP的变量选择方法。研究发现:由于预测变量间多重共线性的影响,第一种方法的性能不稳定,不能得到较好的模型;第二种方法所依据的VIP并不是一个优良的搜索方向的判据,而且该方法的搜索范围较小,因此这种方法得到的模型常是局部最优解;第三种方法以Q_(cum)~2作为搜索方向的主要判据,而且其搜索范围较广,因此这种方法常常能得到较好的模型,是这三种方法中最好的变量选择方法。 在PCDD/Fs的蒸气压(P)的QSAR模型中加入了对熵因素的考察。研究结果表明:熵因素是影响PCDD/Fs的Ps的一个重要因素,而对PCDD/Fs的P_L没有重要影响。 建立的PCDD/Fs的尸s和P_L的温度依附性预测模型的Q_(cum)~2均高于0.970,表明模型具有较好的稳健性和预测能力,可以用于PCDD/Fs不同温度下P的预测。对所得的最佳模型的考察发现:影响PCDD/Fs的Ps的主要因素,按由强到弱的顺序,依次是温度、分子间色散力、熵因素、分子间的偶极-偶极作用力和偶极-诱导偶极作用力;影响PCDD/Fs的P_L的主要因素是温度和分子间色散力。 2.基于正辛醇/水分配系数(Kow)和一些理论分子结构描述符,应用PLS,建立了光合作用(PHS)抑制剂和乙酰乳酸合成酶(ALS)抑制剂两类除草剂对小球藻(Chtorella Vulgaris)急性毒性的QSARs。
【学位授予单位】:大连理工大学
【学位级别】:博士
【学位授予年份】:2006
【分类号】:X502

手机知网App
【引证文献】
中国硕士学位论文全文数据库 前2条
1 于海瀛;部分有机化合物空气/颗粒物分配系数与正辛醇/空气分配系数的预测研究[D];大连理工大学;2008年
2 徐兰;蒽醌化合物光解动力学及其机理研究[D];大连理工大学;2006年
【参考文献】
中国期刊全文数据库 前7条
1 郭明,许禄;新拓扑指数A_m在有机物气相色谱法中光离子化灵敏度的分析中的应用[J];分析化学;1996年12期
2 申琦,许禄,李华;新拓扑指数A_m在构效关系研究中的应用──Ⅰ.对烃类气相色谱的保留指数的分析[J];分析化学;1996年10期
3 易忠胜,刘树深;对多氯代二苯并二噁的定量结构-气相色谱保留行为关系研究[J];计算机与应用化学;2005年07期
4 王溢磊,吴国是,朱卫华,黄俊,余刚;用岭回归法改善定量构效关系中量子化学参数的多重相关[J];计算机与应用化学;2002年Z1期
5 姚瑜元,许禄,杨翌秋,袁秀顺;一种新的拓扑指数及其在有机化合物结构/性质相关性研究中的应用[J];环境科学学报;1994年01期
6 朱永平,余应年,陈星若;芳香胺致癌活性的Fisher判别研究[J];中华预防医学杂志;1999年01期
7 梁丽娜,郭平毅,李奇峰;中国除草剂产业现状、面临的问题及发展趋势[J];中国农学通报;2005年10期
【共引文献】
中国期刊全文数据库 前10条
1 吴大宏,赵人达;基于遗传算法与神经网络的桥梁结构健康监测系统研究初探[J];四川建筑科学研究;2002年03期
2 张安勤;数据挖掘与进化算法[J];安徽教育学院学报;2002年03期
3 安振刚,李谋渭,尹显东,于宁,唐伟;遗传神经网络在平整轧制力预报中的应用[J];鞍钢技术;2001年06期
4 程家兴,陈万里;列车控制问题的计算分析及自适应算法[J];安徽大学学报(自然科学版);2002年02期
5 汪东军,汪夏燕;神经元网络在精馏塔控制中的应用[J];安徽化工;2000年04期
6 蒋中;遗传算法在PID参数优化中的应用[J];安徽建筑工业学院学报;2000年01期
7 阮怀忠,张建中;基于改进遗传算法的TSP问题求解[J];安徽建筑工业学院学报(自然科学版);2003年04期
8 陈杰,周冬华;浮点数编码的遗传算法在模糊控制器参数寻优中的应用[J];安徽建筑工业学院学报(自然科学版);2004年02期
9 方潜生;硬件进化(EHW)的研究与进展[J];安徽建筑工业学院学报(自然科学版);2004年06期
10 张作仿;小麦品种联合试验中试点代表性与联试效果[J];安徽农业科学;1984年04期
中国重要会议论文全文数据库 前10条
1 田占东;张振宇;;用遗传算法确定反应速率方程参数[A];第三届全国爆炸力学实验技术交流会论文集[C];2004年
2 刘洁;李小昱;李培武;王为;张荣荣;张军;;数据处理方法在近红外光谱分析中的应用进展[A];节能环保 和谐发展——2007中国科协年会论文集(三)[C];2007年
3 刘大为;蔡国伟;刘德福;丁丽娟;;基于改进遗传算法的配电网电容器优化投切[A];2007中国电机工程学会电力系统自动化专委会供用电管理自动化学科组(分专委会)二届三次会议论文集[C];2007年
4 何平;周辉;;一种基于遗传算法的图像信息隐藏算法[A];全国第二届嵌入式技术联合学术会议论文集[C];2007年
5 鲁放;何世伟;;遗传算法在公交小区专线选线问题中的应用[A];第四届中国青年运筹与管理学者大会论文集[C];2001年
6 耿玉磊;张翔;;多目标优化的求解方法与发展[A];福建省科协第四届学术年会提升福建制造业竞争力的战略思考专题学术年会论文集[C];2004年
7 陈佳彬;张翔;;全局优化算法研究[A];福建省科协第五届学术年会数字化制造及其它先进制造技术专题学术年会论文集[C];2005年
8 陈碧云;;基于遗传算法的配电网故障定位系统[A];广西电机工程学会第七届青年学术交流会论文集[C];2002年
9 严方;莫耀赐;尹星光;严峰;;遗传算法在非线性电路中的应用[A];广西电机工程学会第七届青年学术交流会论文集[C];2002年
10 吴兆华;;贴装机贴装路径的优化研究[A];2004全国光学与光电子学学术研讨会、2005全国光学与光电子学学术研讨会、广西光学学会成立20周年年会论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 陈莉;KDD中的几个关键问题研究[D];西安电子科技大学;2003年
2 马晓慧;分子对接方法及 HIV整合酶抑制剂的设计研究[D];北京工业大学;2005年
3 侯格贤;遗传算法及其在跟踪系统中的应用研究[D];西安电子科技大学;1998年
4 裴继红;基于模糊信息处理的图像分割方法研究[D];西安电子科技大学;1998年
5 李海民;遗传算法性能及其在聚类分析中应用的研究[D];西安电子科技大学;1999年
6 陈军;软判决译码的研究[D];西安电子科技大学;1999年
7 刘皓玮;行车指挥系统的Petri网建模与列车运行调整的遗传优化的研究[D];铁道部科学研究院;2000年
8 李晓波;中国森林、湿地和野生动物自然保护区社会林业工程评价指标体系及其可持续发展模式的研究[D];中国林业科学研究院;2000年
9 施式亮;矿井安全非线性动力学评价模型及应用研究[D];中南大学;2000年
10 张国强;电力变压器绝缘结构优化和电磁方案自动设计的研究[D];华北电力大学;2000年
中国硕士学位论文全文数据库 前10条
1 方英武;机床整机结构边界元静态特性解析和优化方法研究[D];西安理工大学;2000年
2 刘兴伟;混沌控制算法和基于混沌思维的优化算法及应用研究[D];西安理工大学;2000年
3 潘伟;计算机视觉在农产品自动检测与分级中的研究——番茄的自动检测与分级[D];东北农业大学;2000年
4 江海英;公司财务危机预警模型——对我国上市公司ST板块的实证分析[D];暨南大学;2000年
5 陈海燕;螺管式步进比例电磁铁的设计计算[D];河北工业大学;2000年
6 王菊;电力网理论线损管理系统的设计实现[D];燕山大学;2000年
7 梁英;辐射状城市配电网优化规划研究[D];中国农业大学;2000年
8 韩海山;经济预测统计模型的研究与应用[D];大连理工大学;2000年
9 金颖;惯性约束受控热核聚变中的中子成像技术研究[D];大连理工大学;2000年
10 王福昌;股票价格预测与股票期权定价[D];大连理工大学;2000年
【同被引文献】
中国期刊全文数据库 前10条
1 戴树桂,宋文华,庄源益,颜慧,陈晓军;偶氮染料定量结构-生物降解关系(QSBR)研究[J];环境化学;1998年02期
2 徐满,张爱茜,韩朔睽,王连生;三维定量构效关系研究进展[J];环境科学研究;2002年01期
3 杨光富,刘华银,杨秀凤,杨华铮;以ALS为靶标的新型除草剂的分子设计、合成及生物活性──IX.磺酰脲类和三唑并嘧啶-2-磺酰胺类ALS抑制剂的比较分子力场分析[J];中国科学B辑;2000年02期
4 梅虎,梁桂兆,周原,李志良;支持向量机用于定量构效关系建模的研究[J];科学通报;2005年16期
5 朱杰,张万年,季海涛,周有骏,朱驹,吕加国;喜树碱及其衍生物的比较分子力场分析(CoMFA)研究[J];中国药物化学杂志;1999年04期
6 宋云龙,张万年,季海涛,盛春泉,周有骏,朱驹,吕加国;人工神经网络改进及其在喜树碱类化合物定量构效关系研究中的应用[J];中国药学杂志;2003年01期
7 陈红萍,刘永新,梁英华;正辛醇/水分配系数的测定及估算方法[J];安全与环境学报;2004年S1期
8 姬春煦;张骏;;基于主成分分析的股票指数预测研究[J];计算机工程与科学;2006年08期
9 陈刚;定量结构与生物降解性能关系的研究及应用[J];武汉理工大学学报(交通科学与工程版);2004年03期
10 李晓峰,刘光中;人工神经网络BP算法的改进及其应用[J];四川大学学报(工程科学版);2000年02期
中国博士学位论文全文数据库 前10条
1 陶少辉;最小二乘支持向量机的改进及其在化学化工中的应用[D];浙江大学;2006年
2 梅虎;肽的定量构效关系研究[D];重庆大学;2005年
3 申琦;定量结构活性相关性研究中的新型化学计量学算法研究[D];湖南大学;2005年
4 李春富;基于数据的软测量建模方法及其应用的研究[D];清华大学;2005年
5 宋国民;多分力车轮力传感器研究及其在汽车道路试验中的应用[D];东南大学;2001年
6 周萍;高光谱土壤成分信息的量化反演[D];中国地质大学(北京);2006年
7 赵春燕;QSAR研究在生命分析化学和环境化学中的应用[D];兰州大学;2006年
8 何宏庆;几类重要化学反应的微观机理及动力学性质的理论研究[D];吉林大学;2006年
9 马卫平;线性和非线性方法在QSAR/QSPR研究中的应用[D];兰州大学;2007年
10 付克昌;基于结构优化PCA的传感器故障诊断方法及其应用研究[D];浙江大学;2007年
中国硕士学位论文全文数据库 前10条
1 顾敬梓;部分除草剂正辛醇/水分配系数的QSPR研究[D];大连理工大学;2007年
2 茅晓延;改进型BP神经网络在N-亚硝基化合物致癌活性QSAR研究中的应用[D];浙江大学;2005年
3 张婷;定量结构性质关系研究及量子化学在其中的应用[D];中南大学;2007年
4 张丽;典型POPs的辛醇/空气分配系数的碎片常数模型研究[D];大连理工大学;2004年
5 吕建霞;化学计量学新算法在实际生化体系中的定量构效关系研究[D];湖南大学;2004年
6 徐永明;基于实验室光谱的土壤营养元素反演研究[D];中国科学院研究生院(遥感应用研究所);2005年
7 何琴;人工神经网络方法在分析化学中的应用研究[D];郑州大学;2005年
8 袁杨森;北京市大气颗粒物中有机污染源的生物标志物示踪[D];中国地质大学(北京);2007年
9 管章志;长江下游流域环境变化的粘土矿物表征及其意义[D];华东师范大学;2007年
10 杨萍;基于实验室高光谱反射数据的土壤成分含量估算研究[D];南京农业大学;2007年
【二级参考文献】
中国期刊全文数据库 前10条
1 朱永平,余应年,陈星若;N—亚硝基化合物致癌活性和物理化学行为相关性的研究[J];癌变畸变突变;1996年05期
2 籍国东,赵元慧,袁星;量化参数及其在定量结构-活性-性质相关研究中的应用[J];东北师大学报(自然科学版);1998年04期
3 陈洪,戴乾圜;多环芳烃“双区”理论的定量研究[J];环境化学;1982年04期
4 王化云;许禄;苏锵;;广义a_N指数及其应用——Ⅱ.中性磷萃取剂的广义a_N指数与其物理性质的相关分析[J];化学学报;1991年05期
5 戴乾圜,钟儒刚;N-亚硝基化合物结构致癌活性关系的双区理论定量模式辨认[J];中国科学B辑;1988年10期
6 戴乾圜,郑菁英,王宗一;芳胺结构致癌活性关系的双区理论定量阐释[J];中国科学B辑;1990年07期
7 杨曦,余刚,王连生;多氯代二苯并二(口恶)(口英)降解性的量子化学初探[J];计算机与应用化学;2002年Z1期
8 黄俊,余刚,张彭义;分子距边矢量结合神经网络法预测二(口恶)(口英)类化合物PCDFs的logK_(ow)值[J];计算机与应用化学;2002年Z1期
9 黄俊,余刚,杨曦,王溢磊,吴国是;多氯代二苯并呋喃(PCDFs)光解性质的量子化学研究[J];计算机与应用化学;2003年06期
10 李海屏;20世纪80年代以来世界除草剂新品种开发进展及特点(续)[J];农药科学与管理;2004年05期
【相似文献】
中国期刊全文数据库 前10条
1 梅虎;周原;廖志华;李志良;;HLA-A*0201限制性CTL表位定量结构与活性研究[J];化学学报;2006年09期
2 王宏,李庆波,刘则毅,徐可欣;遗传算法在近红外无创伤人体血糖浓度测量基础研究中的应用[J];分析化学;2002年07期
3 杨英杰;吕庆章;杨振华;牛静;;多巴胺D2受体抑制剂定量构效关系的研究[J];计算机与应用化学;2009年11期
4 云庆夏,袁金彪,卢才武,陈永锋;优化产品结构的遗传算法[J];中国矿业;2002年04期
5 吕庆章;杨英杰;李占潮;杨振华;;细胞色素P450 1A2抑制剂的定量构效关系研究[J];计算机与应用化学;2007年02期
6 彭珍瑞;魏薇;李国娜;吉万成;;3种空隙率测量建模方法的比较研究[J];传感器与微系统;2009年08期
7 廖平,喻寿益;用遗传算法精确求解平面直线度误差[J];机床与液压;1999年04期
8 何险峰,周家驹;基于线杂交和面变异的遗传算法DGA[J];计算机与应用化学;1999年06期
9 魏加华,张建立;非线性水污染控制系统规划的遗传算法[J];煤田地质与勘探;1999年02期
10 石先军;一种改进的遗传算法及其应用[J];武汉科技学院学报;2003年06期
中国重要会议论文全文数据库 前10条
1 兰新哲;张晓民;杨双平;虞海燕;崔聚荣;臧秋华;孙科社;韩建臻;桂国华;贺学兵;;酒钢高炉冶炼过程参数分析与优化[A];中国金属学会2003中国钢铁年会论文集(2)[C];2003年
2 周海清;王恭先;陈正汉;;基于面向对象遗传算法的抗滑桩优化设计程序的研制[A];中国土木工程学会第九届土力学及岩土工程学术会议论文集(下册)[C];2003年
3 吴建生;金龙;;基于实数编码的遗传算法神经网络预报建模研究[A];推进气象科技创新加快气象事业发展——中国气象学会2004年年会论文集(下册)[C];2004年
4 申元霞;张翠芳;;GA-BP算法在系统辨识中的应用[A];中国自动化学会、中国仪器仪表学会2004年西南三省一市自动化与仪器仪表学术年会论文集[C];2004年
5 刘辙;彭亮;崔广才;吴学礼;;混合遗传算法在车间调度中的应用[A];中国自动化学会全国第九届自动化新技术学术交流会论文集[C];2004年
6 曹春红;李文辉;张永坚;;遗传蚂蚁算法在几何约束求解中的应用[A];中国仪器仪表学会第六届青年学术会议论文集[C];2004年
7 姜楠;张春森;;遗传算法在图像模板匹配中的应用[A];高精度几何量光电测量与校准技术研讨会论文集[C];2008年
8 朱秀娥;周宝焜;;振动筛设计的遗传算法[A];福建省科协第三届学术年会装备制造业专题学术年会论文集[C];2003年
9 何奉道;梁向阳;;基于遗传算法的机车周转图优化编制方法[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
10 刘忠凯;薛正辉;任武;李伟明;高本庆;;用遗传算法优化八木天线[A];2005'全国微波毫米波会议论文集(第二册)[C];2006年
中国重要报纸全文数据库 前10条
1 林京;《神经网络和遗传算法在水科学领域的应用》将面市[N];中国水利报;2002年
2 程爱娟;旅行推销员问题(TSP)的人工智能解法及其应用[N];新疆科技报(汉);2001年
3 中国科技大学计算机系 邢方亮;计算智能百花齐放[N];计算机世界;2003年
4 包家庆;IDS五大发展趋势[N];网络世界;2002年
5 郭明波;来自蝙蝠的启发[N];北京科技报;2001年
6 易水;IT新词集锦[N];计算机世界;2003年
7 高澜庆;矿山企盼智能化[N];中国矿业报;2000年
8 顾正华 唐洪武 肖洋 河海大学水利水电工程学院 李云 南京水利科学研究院水工研究所;水流智能模拟大步走来[N];中国水利报;2005年
9 李磊;让电子政务更聪明[N];计算机世界;2001年
10 记者 吴苡婷;用技术挖出网络信息中“金子”[N];上海科技报;2009年
中国博士学位论文全文数据库 前10条
1 张旭;具有拓扑结构布局优化的理论及算法[D];大连理工大学;2004年
2 廖平;基于遗传算法的形状误差计算研究[D];中南大学;2002年
3 丁光辉;PLS和GA应用于部分有机污染物的QSAR研究[D];大连理工大学;2006年
4 周明;高新技术产业投资环境系统研究[D];西北工业大学;2006年
5 张需溥;小型化微带天线的设计与数值分析[D];上海大学;2004年
6 杨春成;空间数据挖掘中聚类分析算法的研究[D];解放军信息工程大学;2004年
7 方娟;基于移动代理的网格资源监控技术的研究[D];北京工业大学;2005年
8 崔晓芳;箱型结构焊接变形预测、控制及应用[D];大连交通大学;2005年
9 张材;薄带坯铸轧板形智能识别与控制系统研究[D];中南大学;2004年
10 田方;遗传算法的改进研究及其在压缩机性能分析与优化中的应用[D];东北大学;2006年
中国硕士学位论文全文数据库 前10条
1 朱奉梅;遗传算法在高校排课系统中的研究与应用[D];东北大学;2009年
2 孙晓丽;基于遗传算法的既有线平面及纵断面整正优化设计[D];中南大学;2010年
3 冯秋霞;解最小生成树问题的新的遗传算法[D];西安电子科技大学;2010年
4 郭佳;基于遗传算法的认知无线网络资源分配技术研究[D];西安电子科技大学;2010年
5 宋品;基于改进遗传算法的波束形成技术研究及其应用[D];西安电子科技大学;2010年
6 梁云静;基于遗传算法的主题爬虫搜索策略研究[D];湖北工业大学;2010年
7 高建兵;基于遗传算法的模糊推理控制系统的参数优化研究[D];辽宁工程技术大学;2011年
8 李振业;多向变异遗传算法及其优化神经网络的研究[D];华南理工大学;2011年
9 栾丽霞;遗传算法在潍坊商校排课系统的研究与应用[D];电子科技大学;2011年
10 王辉;基于改进遗传算法的物流配送路径优化研究[D];山东科技大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026