收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

DNA信号序列分析的基因预测方法研究

郭烁  
【摘要】: 生物信息学是21世纪最具发展前途的一门科学,它致力于解释丰富的基因信息并从中揭示和提取规律,最终达到全面认识生命及其过程的目的。而解释和理解基因组序列的关键是基因预测,即识别基因组中所有的功能单元,包括编码蛋白质的DNA片段和其它功能单元。由于生物基因多样性、基因结构复杂以及该学科较为年轻等原因,现有的生物识别算法在辨识精度、计算量、适用范围等方面还存在很多问题。针对上述问题,本文从基因预测的三个方面进行研究: 1.剪接位点预测方法研究:剪接位点辨识是基因预测的一个重要环节。本文基于Takagi-Sugeno(T-S)模糊模型具有泛化性较好、鲁棒性强、结构简单等优点,提出一种基于模糊似然函数的模糊聚类和最小二乘相结合的T-S建模方法;根据剪接位点上下游附近序列的统计特征与附近序列碱基组成随GC含量高低变化的特征分别建立剪接位点T-S预测模型,有效地提高了识别精度。为了进一步提高辨识精度,减少计算量,提出基于序列中碱基的组成信息以及位置信息的改进贝叶斯剪接位点预测模型。基于核方法理论,算法提出了贝叶斯特征映射方法,通过将DNA序列映射到新的特征空间,推导出决策属性和各条件属性对数值间存在线性关系,并用最小二乘法求出这种线性关系系数,设计出一种新的贝叶斯分类器。仿真结果表明,该算法的计算效率高、结构简单、分类精度高,优于SVM-B和朴素贝叶斯方法,能够适应大数据量DNA序列结构辨识。 2.蛋白质编码区的预测方法研究:蛋白质编码区辨识是基因预测的重要研究课题。本文提出一种辨识外显子精确位置的综合算法。首先根据蛋白质编码区的保守序列,建立支持向量机二元分类器。然后依据密码子第一位碱基的“周期3行为”,用短时傅立叶变换对分类器的输出值进行分析,精确辨识出编码区的位置。由于基因结构复杂多样,为了提高辨识精度,基因中碱基的位置应分为3部分。用支持向量机二元分类器不能很好辨识基因中碱基所在位置,而支持向量机多分类器的结构较复杂。用Takagi-Sugeno模糊模型建立基因序列模型,输出值反映输入窗中心碱基是否属于:非编码区碱基、编码区密码子第一位碱基或编码区密码子非第一位碱基。然后用短时傅立叶变换对模型的输出值进行分析,精确辨识出编码区的位置。 3.人类基因启动子预测方法研究:真核基因启动子辨识是基因预测的难点。本文提出基于寡核苷酸位置分布密度模型的启动子识别方法。首先,使用高斯混合模型(GMM)建立寡核苷酸的位置分布密度模型以提取一些重要的基序,这些基序往往对生物信号起着重要调控作用。采用期望最大化算法(EM)估计GMM模型参数,应用模糊聚类指导GMM模型混合度和初始均值的选取,较好地保证了GMM模型的精度;然后根据提取的寡核苷酸位置密度采用基于最小二乘的加权贝叶斯分类器辨识人类基因启动子。该算法的计算量小、适合海量数据的建模。为了更有效利用启动子序列固有信号特征以提高辨识精度,提出通过贝叶斯特征映射将原启动子序列投影到高维寡核苷酸位置分布密度空间,基于构建新的核函数,建立最小二乘支持向量机模型辨识人类基因启动子。核函数的特征变换综合了启动子序列的寡核苷酸组成信息和位置信息,能够较好反映实际的转录调控机制。该方法泛化性能好、计算量与输入维数无关。该预测方法可应用到几个其它生物问题。 最后对本文研究工作进行了总结,并指出今后的工作方向。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 陈叙龙,张清敏,张毓琪,张宝东,陈素平;鲤鱼肝胰脏线粒体DNA的分离、纯化方法[J];环境化学;1994年03期
2 周晓慧;DNA与免疫[J];承德医学院学报;1998年02期
3 张爱民,张建民;论基因组的分子进化[J];菏泽师范专科学校学报;1998年02期
4 房经贵,章镇,刘大钧,马正强,JossiHillel;一种从贮藏较久番茄叶中提取适于PCR扩增的DNA的方法[J];植物生理学通讯;2000年01期
5 朱长军,张利宁,马春红,曹英林,宋静;一种新型杆状病毒亲本株的鉴定及病毒DNA的纯化[J];山东医科大学学报;2000年01期
6 张秀花,弓巧娟;分子内电荷转移荧光探针DMAHF的介质效应及与DNA的作用[J];山西大学学报(自然科学版);2000年01期
7 宗仁鹤,白春礼,李振刚,汪新文,聂焰,龚为穗,杨安庆,龚立三;激光对DNA作用机理的AFM研究[J];激光生物学报;2001年01期
8 宗志新,龚国权;阿的平荧光猝灭法测定 DNA(英文)[J];兰州大学学报(自然科学版);2002年02期
9 张李阳;固体发酵红曲霉菌生物量测定方法的研究[J];南京晓庄学院学报;2002年04期
10 徐治立;论基因科技的二重性[J];系统辩证学学报;2002年03期
11 罗文永,陈建伟,刘彦卓,肖昕,毛兴学,李晓方;快速鉴定阳性重组质粒方法的改进试验[J];广东农业科学;2004年02期
12 张志忠,吴菁华,吕柳新,陈桂信;一种适于PCR检测的DNA微量提取方法[J];亚热带植物科学;2004年01期
13 宫霞 ,施用晖 ,乐国伟;抗菌活性肽与细菌染色体DNA的相互作用机理[J];自然科学进展;2004年05期
14 沈子威,王竞,张志诚,黄美珍;激光诱导动物细胞基因转移的研究[J];清华大学学报(自然科学版);1991年06期
15 张四明;分子生物学技术及其在渔业科学中的应用[J];水产学报;1997年S1期
16 沈鹤柏,倪丽华,杨海峰,王则民,章宗穰;稀土金属离子对DNA作用的紫外和荧光光谱法研究[J];上海师范大学学报(自然科学版);1998年01期
17 曾宪春,罗锋,蒋达和,朱帆,李文鑫;一种快速有效纯化DNA序列分析模板的方法[J];生物技术;1998年05期
18 张永良,胡海霞,郭庆林,沈喜,李春光,郑世英,徐利泉,周富高;精子DNA微波Feulgen染色及意义[J];中国优生与遗传杂志;1998年04期
19 谢菊芳,宋国清,廖贡献,张菁,居超明;PCT高压静电场的植物细胞效应及量子模型[J];电子学报;1999年06期
20 张蓉颖,庞代文,蔡汝秀;DNA与其靶向分子相互作用研究进展[J];高等学校化学学报;1999年08期
中国重要会议论文全文数据库 前10条
1 刘海英;陈刚;步宇翔;;碱基对的多铜修饰对DNA导电性的增强作用[A];中国化学会第28届学术年会第13分会场摘要集[C];2012年
2 赵宏远;李俊杰;桑润滋;;单细胞凝胶电泳技术检测不同处理山羊精子DNA损伤[A];中国畜牧兽医学会动物繁殖学分会第十五届学术研讨会论文集(下册)[C];2010年
3 刘玲;付强;朱化彬;彭秀丽;郝海生;杜卫华;赵学明;王栋;;牛毛囊基因组DNA制备方法的比较研究[A];中国畜牧兽医学会动物繁殖学分会第十五届学术研讨会论文集(上册)[C];2010年
4 梁春柳;;一个新的筛选化合物与DNA交互作用的简便方法[A];2010年全国药物毒理学学术会议论文集[C];2010年
5 张文众;李永宁;方瑾;梁春来;张倩男;;体外新评价方法——完整细胞核DNA检测板[A];全国生化/工业与卫生毒理学学术会议论文集[C];2010年
6 邹丹丹;汪海林;;基于DNA甲基化结合蛋白MBD的甲基化分析[A];中国化学会第28届学术年会第2分会场摘要集[C];2012年
7 张晔;杜智;杨斌;高英堂;;检测外周血中游离DNA的应用前景(综述)[A];天津市生物医学工程学会第29届学术年会暨首届生物医学工程前沿科学研讨会论文集[C];2009年
8 赵淑珍;刘光珍;;DNA免疫吸附治疗狼疮性肾炎的临床观察[A];第十一届全国中西医结合肾脏病学术会议论文汇编[C];2010年
9 陈士林;;中药DNA条形码鉴定体系[A];第十届全国药用植物及植物药学术研讨会论文摘要集[C];2011年
10 陆佳飞;周克隆;王缦;;磁珠法快速提取乙型肝炎病毒DNA的研究及其在诊断试剂中的应用[A];第五次全国免疫诊断暨疫苗学术研讨会论文汇编[C];2011年
中国博士学位论文全文数据库 前10条
1 郭烁;DNA信号序列分析的基因预测方法研究[D];大连海事大学;2010年
2 刘晓;基于纠错编码理论的DNA序列编码特性分析[D];重庆大学;2010年
3 魏华丽;落叶松体细胞胚胎发生过程中DNA甲基化分析及MET1、DDM1克隆研究[D];中国林业科学研究院;2010年
4 郭晓兰;端粒功能异常诱导的DNA损伤反应及其在肿瘤发生中的作用与分子机制[D];重庆医科大学;2010年
5 陈志健;1.8 GHz微波对X射线和阿霉素致淋巴细胞DNA损伤修复及对蛋白表达的影响[D];浙江大学;2010年
6 朱慧芳;Y家族DNA聚合酶对化学致癌物MNNG应答的转录调控研究[D];浙江大学;2009年
7 万超;抗猪瘟嵌合DNA疫苗及TRIF的DNA疫苗佐剂效应研究[D];武汉大学;2009年
8 赵丽霞;克隆绵羊印记相关基因的DNA甲基化研究[D];内蒙古农业大学;2010年
9 沈美龙;基于DNA免疫的乙型肝炎病毒表面抗原大中小蛋白的免疫原性研究[D];南京医科大学;2010年
10 徐铁刚;细菌DNA磷硫酰化修饰与限制[D];上海交通大学;2008年
中国硕士学位论文全文数据库 前10条
1 张俊红;家蚕细小病毒样病毒(中国株)DNA聚合酶基因的克隆与表达[D];江苏大学;2010年
2 李芳;基于磁性微粒的法医样本DNA纯化[D];西北大学;2011年
3 芦丽淦;柚皮素及聚乙二醇增强乙肝DNA疫苗免疫效果的研究[D];河南大学;2010年
4 吴琴琴;基于DNA序列的功能位点识别[D];苏州大学;2010年
5 杨锦艳;六种香豆素有效成分与DNA相互作用的研究[D];山西医科大学;2010年
6 林启凰;用于乳腺蛋白标志基因检测的DNA电化学生物传感器的研究[D];福建医科大学;2010年
7 于文静;亚麻韧皮部特异启动子克隆与26份种质DNA指纹图谱构建[D];中国农业科学院;2010年
8 Rebecca Simisola Agboola;硼(B)和氯化钠胁迫处理诱导高粱(Sorghum bicolor)自交系发生形态和DNA甲基化的变异[D];东北师范大学;2010年
9 石微;溴氰菊酯致大鼠DNA损伤及损伤后修复功能的影响[D];青岛大学;2010年
10 张诺;DNA-纳米羟基磷灰石修饰电极的制备及在生物分析中的应用[D];济南大学;2010年
中国重要报纸全文数据库 前10条
1 陈杰;信息技术将重组汽车DNA[N];科技日报;2010年
2 刘霞;科学家研发出新型人工合成DNA载体[N];科技日报;2010年
3 南方;化危为机 企业需韧性生长的DNA[N];中国企业报;2009年
4 吴强;港大引新技术DNA辨食材[N];中国食品质量报;2010年
5 本报记者 施晓焰 通讯员 马丽娟;云南:DNA数据库成“打拐”得力帮手[N];人民公安报;2009年
6 张巍巍;垃圾DNA可促进癌症发展首获证实[N];科技日报;2010年
7 常丽君;虱子DNA表明人类17万年前首次穿衣[N];科技日报;2011年
8 记者 冯卫东;DNA碱基序列决定其光敏性假设获证实[N];科技日报;2008年
9 许文强;拆、装更便捷的DNA双螺栓结构模型[N];大众科技报;2008年
10 记者 常丽君;研究人员发现自组装DNA链的最佳长度[N];科技日报;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978