收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

真核启动子预测

熊清  
【摘要】:本文分为两部分:真核启动子预测和生物大分子定量构效关系(QSAR)研究。 基因转录是遗传信息传递和表达的枢纽,是基因表达调控机制发挥作用的重要环节。而启动子是决定转录起始点和转录频率的关键元件,因此启动子的识别对整个基因组功能的诠释具有重要作用。本文第一部分采用人工神经网络(ANN)、遗传算法(GA)和马尔科夫模型(MM)这三种模式识别算法,对启动子、外显子和内含子序列中核苷酸联体的分布特性作深入探讨,发现其中的某些普遍规律,并建立识别这些DNA序列基元特征模式的神经网络模型或马尔科夫模型,已成功用于未知序列的预测。本文第一部分开展的工作和所得结论如下: 1.发展了一种新的基于内容的真核生物蛋白编码基因启动子预测方法。分别建立三种不同DNA功能区域(启动子、外显子和内含子)的位置特异性权值矩阵(PWM),通过序列在三个DNA功能区域对应的位置特异性权值矩阵中的分值来作为特征参数量化序列信息,并通过反传神经网络(BP-ANN)建立序列特征参数与序列所属类别之间的映射关系来区分启动子和非启动子序列。实验结果表明:以此方法为基础构建的系统在训练集和测试集上均表现良好,对训练集和测试集中序列的平均预测率分别为99%和97%。 2.尝试将遗传算法与神经网络结合,用遗传算法优化神经网络的连接权值,建立遗传神经网络(GA-ANN)模型,并在此模型的基础上发展了一种新的基于内容的真核生物蛋白编码基因启动子预测方法。实验结果表明:我们以此模型为基础构建的GA-ANN系统对训练集和测试集中的启动子序列均能有效识别,在训练集和测试集上的平均预测率分别为99%和98%,优于先前建立的BP-ANN系统。 3.发展了一种基于马尔科夫链理论的人类蛋白编码基因启动子预测方法。三条马尔科夫链分别用于模拟启动子、外显子和内含子区域的序列随机生成过程并以此建立相应区域的概率模型,通过计算待预测序列在三个DNA功能区域出现的概率来对其所属类别进行判定,出现概率越大,表明该序列内部碱基状态转移模式最贴合相应区域概率模型所生成的序列模式,即序列出现在该区域的可能性最大,从而判定序列属于该功能区域。一个包含400条人启动子序列、400条人外显子序列和400条人内含子序列的数据集被用于训练和测试了以此方法为基础构建的系统。实验结果表明所构建的系统能较好地区分这三种不同的DNA序列,在测试集中平均分类准确性达84%。 QSAR是考察和分析基本分子结构特征与物化性质或生物活性之间的定量相关关系。针对DNA活性位点核苷酸序列和蛋白质(多肽)中氨基酸序列的序列定 重庆大学博士学位论文 量构效关系(QsAM)研究是后基因组即功能基因组或蛋白质组研究中的一个前沿 课题,对DNA和蛋白质的相互作用研究、蛋白质功能预测、基于蛋白质和以蛋白 质为靶标的药物设计均具有重要意义。分子结构参数化是进行定量构效关系研究 的重要组成部分和关键前提所在。本实验室曾提出了仅以各种非氢原子电负性及 各原子之间的相对距离为主要分子结构特征的分子电性距离矢量(州田DV)用于 药物分子和其它生物活性物质的结构表征。本文第二部分在本实验室前期工作的 基础上,对MEDV的应用范围进行扩展,将其分别应用于DNA和多肤的结构表 征中。同时在原子类型划分方面对原有MEDV进行了改进,提出按键分类的分子 电性距离矢量(BMEDV),使之更能体现原子所处微环境对原子电负性和分子活 性的影响。本文第二部分开展的工作和所得结论如下: 1.将MEDv的应用范围扩展至DNA体系,应用到启动子强度的QSAR研究 中。由于DNA序列的结构差异主要表现在碱基上,在对启动子进行结构表征时, 采用对整个启动子进行表征(V从L)和仅用碱基进行表征(Vss)两种方案。借助 多元线性回归(MLR)和逐步回归(S侧[R.)技术,分别建立两种表征方案下MEDV 参数与启动子强度之间的最优QSAR模型。结果表明:v从L和vss方案下选择最 佳参数的个数都为2,分别为呱3、嶙;和M小M23;两种方案下的相关系数分别 为0.902、0.905;交互检验相关系数分别为0.878、0.882;说明模型具有良好的估 计能力和较强的预测能力。同时,通过对两种方案进行对比分析发现:无论是估 计能力还是预测能力,Vss表征方案都优于V从L表征方案。这说明了DNA的结构 特征主要表现在碱基上,可以用碱基代替DNA进行结构表征与QsAR研究,从而 减小计算复杂度,提高研究效率。 2.提出一个新的分子结构描述子一按键分类的分子电性距离矢量(B MEDV) 来表征变形虫穿孔肤及其类似物的分子结构,以对人类病原体白色念珠菌(Candida alhicans)的最低生长抑制浓度(如C)的对数值为抗菌活性指标,借助多元线性 回归和逐步回归分别建立QsAR模型。结果表明:所得模型相当稳定且有较强的 预测能力;VALL、Vs、Vss、VMos、VMoss五种表征方案下最优模型的相关系数分 别为:0.943、0.912、0.904、0.866、0.945;交互检验的相关系数分别为:0.737、 0.843、0.815、0.745、0.830。通过对五种表征方案进行对比分析发现,多肤的结 构特征主要表现在氨基酸的残基上,可以用残基的矢量描述子来表征整个多肤的 结构,从而使表征过程更为简洁有效?


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 仲如;两个人组蛋白H1基因的亚克隆和它们启动子核苷酸顺序的比较[J];中国生物化学与分子生物学报;1986年02期
2 还连栋,董可宁,庄增辉,薛禹谷;变铅青链霉菌启动子的克隆和表达[J];遗传学报;1991年01期
3 冯霞;李亚男;陈大清;;生长素基因家族及其启动子、反应因子的研究进展[J];长江大学学报(自科版)农学卷;2008年01期
4 郭时金;周春凤;张志亭;沈志强;;转生长激素基因动物研究概况[J];畜禽业;2008年06期
5 王静澄;李昊;崔东清;刘军梅;叶梅霞;张志毅;安新民;;毛白杨PtSEP3-1基因启动子的克隆分析及其表达载体构建[J];基因组学与应用生物学;2010年02期
6 王振江;;rDNA大豆植株首次宣布培育成功[J];生物技术通报;1985年01期
7 张耀洲,吴祥甫,李载平;氯霉素乙酰基转移酶基因在家蚕核型多角体病毒P10基因启动子控制下的表达[J];病毒学报;1993年04期
8 蒋志戎,王德芳,曾畿生;生长激素基因[J];国际遗传学杂志;1993年06期
9 徐恒,邱薇,沈斌,吴峰,刘世贵;大肠杆菌-分枝杆菌启动子探针型穿梭载体pEQ3的构建[J];四川大学学报(自然科学版);1997年03期
10 朱怡非,朱春宝,朱宝泉;外源基因在链霉菌中的表达[J];国外医药.抗生素分册;1997年05期
11 章冰,卫志明;水稻遗传转化技术[J];植物生理学通讯;1998年06期
12 黄朝晖,王金福;增强子作用机制研究进展[J];生命的化学;1999年05期
13 袁灿!分子生物学研究中心,长沙,410078,朱敏!分子生物学研究中心,长沙,410078,刘智!分子生物学研究中心,长沙,410078,谢慎思!分子生物学研究中心,长沙,410078;SRY基因启动子不同模块的克隆及功能分析[J];湖南医科大学学报;2000年03期
14 马政文,陆佩华,黄立东,林琳;上海地区汉族人HLA-DQA1启动子多态性以及QAP、DQA1单元型连锁分析[J];中国免疫学杂志;2000年07期
15 曹新,曾溢滔;山羊β-酪蛋白基因启动子指导人血清白蛋白基因在小鼠组织中的特异性表达[J];遗传;2001年06期
16 储成才,陈帅,司丽珍;转基因表达的精细调控[J];杭州师范学院学报(自然科学版);2001年04期
17 肖庆利,张志芳,易咏竹,何家禄,吴祥甫;家蚕核多角体病毒解旋酶基因启动子功能区域缺失分析[J];生物化学与生物物理学报;2002年05期
18 熊兴华,官春云,李恂,谭小力,李家洋;油菜种子特异表达napin基因启动子的克隆及序列分析[J];生物技术;2003年03期
19 李军,龚喜明,林惠琼,宋全波,陈珈,王学臣;DGP1,一个受干旱诱导的保卫细胞特异性启动子的构建与功能分析[J];中国科学C辑;2004年04期
20 程树东,凌统,李英文;转基因鱼研究中存在的问题[J];北京水产;2005年04期
中国重要会议论文全文数据库 前10条
1 金磊;倪培华;应雅韵;;肝酯酶基因-763A/G多态性与混合型高脂血症的关系[A];中华医学会第八次全国检验医学学术会议暨中华医学会检验分会成立30周年庆典大会资料汇编[C];2009年
2 王松柏;杨在清;陈小冬;;STEAP4基因与启动子的克隆及其转录活性调控研究[A];全国动物生理生化第十一次学术交流会论文摘要汇编[C];2010年
3 杜爱芳;庞林海;周前进;侯玉慧;高翔;;秀丽隐杆线虫肌动蛋白启动子Act-1的克隆和分析[A];中国畜牧兽医学会家畜寄生虫学分会第九次学术研讨会论文摘要集[C];2006年
4 李志邈;杨悦俭;王荣青;叶青静;阮美颖;周国治;姚祝平;;番茄根特异表达基因LeGRP2启动子的克隆及其功能的初步分析[A];中国园艺学会十届二次理事会暨学术研讨会论文摘要集[C];2007年
5 王秀亮;陈卫;梁光萍;陈建;苏踊跃;杨陈;罗向东;;人β1整合素远端启动子542bp报告基因载体构建和鉴定及启动活性分析[A];第六届全国烧伤救治专题研讨会论文汇编[C];2009年
6 陈弟诗;郭万柱;徐志文;陈杨;李雯;王小玉;;猪霍乱沙门氏菌携带的双启动子表达载体pEGFPPtrcR的构建[A];首届中国兽药大会——兽医生物制品学、兽医微生物学学术论坛论文集(2008)[C];2008年
7 黄玉屏;杨洋;沈萍;沈韫芬;;大肠杆菌-酿酒酵母启动子探针穿梭载体的构建[A];生命科学与微生物专辑[C];2004年
8 龙海涛;李洪清;李玲;;蓝猪儿捕获启动子系统建立[A];2006中国植物细胞发育与分子生物学学术研讨会论文集[C];2006年
9 王正加;黄有军;郑炳松;夏国华;金松恒;黄坚钦;;山核桃CcLFY基因及其启动子克隆与功能鉴定[A];第六届全国林木遗传育种大会论文集[C];2008年
10 杜芳芳;白俊杰;李胜杰;樊佳佳;;大口黑鲈POU1F1启动子区域SNP突变对生长的影响[A];2010年中国水产学会学术年会论文摘要集[C];2011年
中国博士学位论文全文数据库 前10条
1 姜安丽;人同源盒基因NKX3.1启动子的克隆及其调控区的鉴定[D];山东大学;2005年
2 祝秉东;人β-防御素-1基因表达与转录调控[D];四川大学;2004年
3 刘南南;水稻种胚LOX3基因及启动子的功能分析[D];南京农业大学;2006年
4 柳小庆;玉米胚特异性高表达启动子的基因组规模筛选、克隆和功能鉴定[D];中国农业科学院;2014年
5 汤绍辉;人肝癌胰岛素样生长因子Ⅱ基因启动子结构与功能研究[D];暨南大学;2004年
6 敖翔;硫化叶菌启动子Initiator元件功能研究[D];华中农业大学;2013年
7 苟吉庆;植物顶端组织高效诱导型启动子的创建与表达调控研究[D];中国农业科学院;2001年
8 马诚太;不同启动子和插入位点表达AIV-H9 HA抗原的重组马立克氏病病毒的构建和比较研究[D];山东农业大学;2014年
9 任茂智;棉花nodulin-like和arf1基因及其启动子的分离和功能分析[D];中国农业科学院;2004年
10 罗先润;Survivin启动子马区动CD/TK双自杀基因对胃癌的靶向治疗作用[D];郑州大学;2012年
中国硕士学位论文全文数据库 前10条
1 徐亚维;玉米淀粉分支酶SBEⅡb基因启动子的克隆与功能分析[D];吉林农业大学;2005年
2 傅晓燕;耐热β-半乳糖苷酶bgaB基因在枯草芽孢杆菌中的表达[D];江南大学;2005年
3 李华;HBV核心区启动子反义真核表达载体的构建[D];郑州大学;2010年
4 曾海涛;靛蓝基因表达载体的构建及香石竹CHS启动子克隆研究[D];南京林业大学;2004年
5 吴滨;人酰基辅酶A:胆固醇酰基转移酶-1基因P1启动子的TNF-α效应元件分析鉴定[D];华东师范大学;2004年
6 李艳军;棉花启动子prom6下游序列克隆及纤维特异基因GhF1的功能研究[D];石河子大学;2005年
7 张金平;麻疯树(Jatropha curcas L.)毒蛋白curcin基因及其启动子的初步研究[D];四川大学;2005年
8 刘志敏;胃癌中错配修复基因hMLH1启动子甲基化对蛋白表达的影响[D];大连医科大学;2007年
9 吴祖剑;基于粗糙集理论的基因序列研究[D];中南大学;2008年
10 景福远;利用基因工程技术提高青蒿中青蒿素含量的研究[D];上海交通大学;2008年
中国重要报纸全文数据库 前10条
1 记者 钱铮;人类DNA上启动子数量可能超过十九万[N];人民日报;2006年
2 钱铮;人类DNA上启动子数量可能超过19万个[N];医药经济报;2006年
3 陈勇;专家有突破 借助基因杀死癌细胞[N];人民日报;2005年
4 记者 何德功;抗癌病毒可以破坏癌细胞[N];新华每日电讯;2002年
5 记者 陈卫东;我破解基因工程产业化难题[N];科技日报;2007年
6 张中桥;第四军医大学西京医院实现肿瘤特异性RNA干扰[N];中国医药报;2006年
7 记者  张喜玉;中石化全面启动子公司整合进程[N];上海证券报;2006年
8 ;基因药物治癌关键障碍被攻克[N];医药经济报;2005年
9 ;中石化全面启动子公司整合进程[N];财会信报;2006年
10 ;金风送爽满篮丰[N];中国医药报;2005年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978