收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

DNA信号序列分析的基因预测方法研究

郭烁  
【摘要】: 生物信息学是21世纪最具发展前途的一门科学,它致力于解释丰富的基因信息并从中揭示和提取规律,最终达到全面认识生命及其过程的目的。而解释和理解基因组序列的关键是基因预测,即识别基因组中所有的功能单元,包括编码蛋白质的DNA片段和其它功能单元。由于生物基因多样性、基因结构复杂以及该学科较为年轻等原因,现有的生物识别算法在辨识精度、计算量、适用范围等方面还存在很多问题。针对上述问题,本文从基因预测的三个方面进行研究: 1.剪接位点预测方法研究:剪接位点辨识是基因预测的一个重要环节。本文基于Takagi-Sugeno(T-S)模糊模型具有泛化性较好、鲁棒性强、结构简单等优点,提出一种基于模糊似然函数的模糊聚类和最小二乘相结合的T-S建模方法;根据剪接位点上下游附近序列的统计特征与附近序列碱基组成随GC含量高低变化的特征分别建立剪接位点T-S预测模型,有效地提高了识别精度。为了进一步提高辨识精度,减少计算量,提出基于序列中碱基的组成信息以及位置信息的改进贝叶斯剪接位点预测模型。基于核方法理论,算法提出了贝叶斯特征映射方法,通过将DNA序列映射到新的特征空间,推导出决策属性和各条件属性对数值间存在线性关系,并用最小二乘法求出这种线性关系系数,设计出一种新的贝叶斯分类器。仿真结果表明,该算法的计算效率高、结构简单、分类精度高,优于SVM-B和朴素贝叶斯方法,能够适应大数据量DNA序列结构辨识。 2.蛋白质编码区的预测方法研究:蛋白质编码区辨识是基因预测的重要研究课题。本文提出一种辨识外显子精确位置的综合算法。首先根据蛋白质编码区的保守序列,建立支持向量机二元分类器。然后依据密码子第一位碱基的“周期3行为”,用短时傅立叶变换对分类器的输出值进行分析,精确辨识出编码区的位置。由于基因结构复杂多样,为了提高辨识精度,基因中碱基的位置应分为3部分。用支持向量机二元分类器不能很好辨识基因中碱基所在位置,而支持向量机多分类器的结构较复杂。用Takagi-Sugeno模糊模型建立基因序列模型,输出值反映输入窗中心碱基是否属于:非编码区碱基、编码区密码子第一位碱基或编码区密码子非第一位碱基。然后用短时傅立叶变换对模型的输出值进行分析,精确辨识出编码区的位置。 3.人类基因启动子预测方法研究:真核基因启动子辨识是基因预测的难点。本文提出基于寡核苷酸位置分布密度模型的启动子识别方法。首先,使用高斯混合模型(GMM)建立寡核苷酸的位置分布密度模型以提取一些重要的基序,这些基序往往对生物信号起着重要调控作用。采用期望最大化算法(EM)估计GMM模型参数,应用模糊聚类指导GMM模型混合度和初始均值的选取,较好地保证了GMM模型的精度;然后根据提取的寡核苷酸位置密度采用基于最小二乘的加权贝叶斯分类器辨识人类基因启动子。该算法的计算量小、适合海量数据的建模。为了更有效利用启动子序列固有信号特征以提高辨识精度,提出通过贝叶斯特征映射将原启动子序列投影到高维寡核苷酸位置分布密度空间,基于构建新的核函数,建立最小二乘支持向量机模型辨识人类基因启动子。核函数的特征变换综合了启动子序列的寡核苷酸组成信息和位置信息,能够较好反映实际的转录调控机制。该方法泛化性能好、计算量与输入维数无关。该预测方法可应用到几个其它生物问题。 最后对本文研究工作进行了总结,并指出今后的工作方向。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 程相春;;DNA与几种表面活性剂的作用[J];化学工程师;2011年06期
2 刘杰;陶健;;抗肿瘤药物的现状及发展趋势[J];科技致富向导;2011年23期
3 季超;张凌云;窦硕星;王鹏业;;原子力显微镜观测生物大分子图像的一种处理方法[J];物理学报;2011年09期
4 孔敏敏;李艳华;董宇辉;王文雅;袁其朋;;大肠杆菌DNA复制相关蛋白PriC的初步研究[J];中医学报;2011年06期
5 劳文艳;商迎辉;焦正;劳凤学;;聚乙二醇修饰多壁碳纳米管对质粒DNA的影响[J];上海大学学报(自然科学版);2011年03期
6 冉诗勇;王艳伟;杨光参;;DNA分子力学性质的测量[J];物理实验;2011年07期
7 黄媛;陶颖;张文露;黄爱龙;胡接力;;一种新的DNA分子克隆方法[J];中国科学:生命科学;2011年09期
8 史蕾;;单羟基Corrole与DNA相互作用研究[J];广东第二师范学院学报;2011年03期
9 朱新霞;艾尼江;闫洁;赵海;;同步提取棉花DNA和RNA的方法[J];石河子大学学报(自然科学版);2011年03期
10 刘胜洪;刘文;刘明峰;杨凤婷;刘庆生;梁红;;一种高效提取猕猴桃DNA和RNA的方法[J];生物技术通报;2011年09期
11 刘炜;张琼梅;;岩白菜素与DNA相互作用的光谱研究[J];海南师范大学学报(自然科学版);2011年02期
12 郑玉萍;范玉华;张霞;王强;刘善斌;毕彩丰;;一种新型希夫碱Cu(Ⅱ)配合物的合成、表征及与DNA的相互作用[J];中国海洋大学学报(自然科学版);2011年09期
13 马利华;武安全;杨同文;;巧用DNA凝胶回收柱提纯种子RNA[J];生物学通报;2011年03期
14 阙冬梅;张军民;胡永轩;鲁莎;王丽;覃巍;;TLR9参与巨噬细胞吞噬马尔尼菲青霉的作用研究[J];中国人兽共患病学报;2011年06期
15 郭贵春;杨维恒;;基因理论发展过程中的隐喻思维[J];科学技术哲学研究;2011年05期
16 方家松;张利;;探索深部生物圈[J];中国科学:地球科学;2011年06期
17 马玉韬;车进;刘大铭;;基于傅里叶分析的蛋白质编码区预测中功率谱密度计算方法研究[J];宁夏大学学报(自然科学版);2011年02期
18 牛建峰;高胜寒;骆迎峰;袁野;王广策;胡松年;;条斑紫菜低覆盖度基因组草图分析[J];海洋科学;2011年06期
19 姜雪鸥;钟金城;;miRNA的研究进展及其展望[J];中国草食动物;2011年04期
20 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 刘海英;陈刚;步宇翔;;碱基对的多铜修饰对DNA导电性的增强作用[A];中国化学会第28届学术年会第13分会场摘要集[C];2012年
2 赵宏远;李俊杰;桑润滋;;单细胞凝胶电泳技术检测不同处理山羊精子DNA损伤[A];中国畜牧兽医学会动物繁殖学分会第十五届学术研讨会论文集(下册)[C];2010年
3 刘玲;付强;朱化彬;彭秀丽;郝海生;杜卫华;赵学明;王栋;;牛毛囊基因组DNA制备方法的比较研究[A];中国畜牧兽医学会动物繁殖学分会第十五届学术研讨会论文集(上册)[C];2010年
4 梁春柳;;一个新的筛选化合物与DNA交互作用的简便方法[A];2010年全国药物毒理学学术会议论文集[C];2010年
5 张文众;李永宁;方瑾;梁春来;张倩男;;体外新评价方法——完整细胞核DNA检测板[A];全国生化/工业与卫生毒理学学术会议论文集[C];2010年
6 邹丹丹;汪海林;;基于DNA甲基化结合蛋白MBD的甲基化分析[A];中国化学会第28届学术年会第2分会场摘要集[C];2012年
7 张晔;杜智;杨斌;高英堂;;检测外周血中游离DNA的应用前景(综述)[A];天津市生物医学工程学会第29届学术年会暨首届生物医学工程前沿科学研讨会论文集[C];2009年
8 赵淑珍;刘光珍;;DNA免疫吸附治疗狼疮性肾炎的临床观察[A];第十一届全国中西医结合肾脏病学术会议论文汇编[C];2010年
9 陈士林;;中药DNA条形码鉴定体系[A];第十届全国药用植物及植物药学术研讨会论文摘要集[C];2011年
10 陆佳飞;周克隆;王缦;;磁珠法快速提取乙型肝炎病毒DNA的研究及其在诊断试剂中的应用[A];第五次全国免疫诊断暨疫苗学术研讨会论文汇编[C];2011年
中国博士学位论文全文数据库 前10条
1 郭烁;DNA信号序列分析的基因预测方法研究[D];大连海事大学;2010年
2 郭晓兰;端粒功能异常诱导的DNA损伤反应及其在肿瘤发生中的作用与分子机制[D];重庆医科大学;2010年
3 陈志健;1.8 GHz微波对X射线和阿霉素致淋巴细胞DNA损伤修复及对蛋白表达的影响[D];浙江大学;2010年
4 朱慧芳;Y家族DNA聚合酶对化学致癌物MNNG应答的转录调控研究[D];浙江大学;2009年
5 万超;抗猪瘟嵌合DNA疫苗及TRIF的DNA疫苗佐剂效应研究[D];武汉大学;2009年
6 孙晓南;融合多肽靶向DNA蛋白激酶自主磷酸化的放射增敏实验研究[D];浙江大学;2011年
7 赵丽霞;克隆绵羊印记相关基因的DNA甲基化研究[D];内蒙古农业大学;2010年
8 沈美龙;基于DNA免疫的乙型肝炎病毒表面抗原大中小蛋白的免疫原性研究[D];南京医科大学;2010年
9 徐铁刚;细菌DNA磷硫酰化修饰与限制[D];上海交通大学;2008年
10 高鹏;特异性介导DNA转导的多结构域嵌合蛋白的构建、表达及鉴定[D];吉林大学;2011年
中国硕士学位论文全文数据库 前10条
1 李芳;基于磁性微粒的法医样本DNA纯化[D];西北大学;2011年
2 黎君;1,2-二氯乙烷对人外周血淋巴细胞DNA损伤的人群调查和实验室研究及神经行为功能测试研究[D];浙江大学;2011年
3 芦丽淦;柚皮素及聚乙二醇增强乙肝DNA疫苗免疫效果的研究[D];河南大学;2010年
4 杨锦艳;六种香豆素有效成分与DNA相互作用的研究[D];山西医科大学;2010年
5 林启凰;用于乳腺蛋白标志基因检测的DNA电化学生物传感器的研究[D];福建医科大学;2010年
6 于文静;亚麻韧皮部特异启动子克隆与26份种质DNA指纹图谱构建[D];中国农业科学院;2010年
7 Rebecca Simisola Agboola;硼(B)和氯化钠胁迫处理诱导高粱(Sorghum bicolor)自交系发生形态和DNA甲基化的变异[D];东北师范大学;2010年
8 石微;溴氰菊酯致大鼠DNA损伤及损伤后修复功能的影响[D];青岛大学;2010年
9 张诺;DNA-纳米羟基磷灰石修饰电极的制备及在生物分析中的应用[D];济南大学;2010年
10 郭珈辰;基于图形表示的DNA相似性分析及进化树构建算法研究[D];湖南大学;2010年
中国重要报纸全文数据库 前10条
1 记者 李含;“DNA之父”詹姆斯·沃森做客清华论坛[N];新清华;2008年
2 ;英国:含冤入狱27年,DNA助他洗脱罪名[N];新华每日电讯;2009年
3 李志晖 秦亚洲 曹国厂;我国大规模利用DNA技术“打拐”[N];中国改革报;2009年
4 本报驻特拉维夫记者 陈克勤;DNA伪造带来的震动[N];光明日报;2009年
5 本报记者 张巍巍;DNA样本也能作假[N];科技日报;2009年
6 记者 郑晓春;可区分真伪DNA的检测技术问世[N];科技日报;2009年
7 沈建民;企业公民DNA从何而来[N];21世纪经济报道;2009年
8 记者 魏萍;做DNA鉴定不用去外地[N];宁夏日报;2010年
9 日报记者 曾繁华 闫友明 通讯员 刘晓颖;DNA:我的应用很广泛[N];柳州日报;2010年
10 韦崇结 刘晓颖;DNA,让作恶之徒现原形[N];广西政协报;2010年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978