收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

生物序列模式挖掘与识别算法的研究

刘维  
【摘要】:生物信息学是综合运用生物学、数学、物理学、信息科学以及计算机科学等诸多学科的理论方法的崭新交叉学科,它是整个生命科学发展的重要组成部分,已成为生命科学研究的前沿。生物信息学的核心是基因组信息学,包括基因组信息的获取、处理、存储、分配和解释,即以计算机、网络为工具,用数学等科学理论、方法和技术研究生物大分子,主要包括脱氧核糖核酸(DNA)和蛋白质(Protein)的序列、结构和功能。基因组信息学的关键是“读懂”基因组的核苷酸顺序,即全部基因在染色体上的确切位置以及各DNA片段的功能,这对于人类疾病基因发现、基因与蛋白质的表达与功能研究、合理化药物设计等方面都有着重要的意义。为了能达到上述目的,生物序列模式挖掘和识别是其重要的两个关键技术。 本文针对生物序列模式挖掘和识别研究中的关键问题,主要研究了生物单序列、双序列频繁模式挖掘的研究和算法设计;生物数据的嵌入式频繁子树挖掘研究和算法设计;基因调控元件的识别以及CpG岛的位置识别等问题。取得的研究成果如下: (1)提出了生物单序列及多序列频繁模式的快速挖掘算法。针对传统生物序列频繁模式挖掘算法会在挖掘过程中大量构建投影数据库并产生大量短的模式而导致的挖掘效率低下的问题,本文分别提出了基于基本模式前缀树的生物单序列频繁模式挖掘算法SSPM和多序列频繁模式挖掘算法MSPM。算法挖掘时能从基本模式长度开始,避免了产生大量的短的生物序列模式,同时运用基本频繁模式前缀树进行模式扩展,避免了不相关模式的干扰,实验结果证实这两个算法不仅明显提高了挖掘效率,并能得到有效的挖掘结果。 (2)提出了一种基于嵌入式子树结构的生物数据挖掘算法,应用嵌入式频繁子树算法挖掘RNA分子的公共拓扑模式。针对目前生物数据挖掘过程中存在的生物数据量大、序列模式相似度高等问题,本文提出了一种快速高效的频繁嵌入式子树挖掘算法IRTM。该算法采用垂直方式挖掘,引入了独特的字符串编码方法表示树,同时利用域表(Scope-List)进行子串扩增和频繁性测试,加以优越的剪枝技术极大地压缩了搜索空间,加快了运行速度。通过与经典的Patternmatcher算法以及TreeMiner算法的对比实验表明本文算法极大提高了挖掘效率,具有更加优越的性能。 (3)提出了一种基于蚁群优化的基因调控元件识别算法。针对已有的算法大都存在容易过早陷入局部最优以及时间复杂度过高等问题,本文提出了一种识别基因调控的新型优化算法ACRR(ant-colony-regulatory-recognition)。该算法利用蚁群优化算法能够较快求解复杂优化问题的优越性来解决此问题,不仅提高了解的质量,而且大大的降低了算法的时间复杂度。实验结果表明,与其他类似算法相比,本文算法所得结果的准确性更高,具有更快的识别速度。 (4)提出了一种基于条件随机场模型的CpG岛的位置识别新方法。为克服已有模型的标注偏差、需要独立假设等缺点,本文提出了用条件随机场(CRFs)模型来识别CpG岛的位置的新方法。该方法将识别CpG岛的位置的问题转化为序列标记问题,根据CpG岛的位置的性质设计了相应的特征函数,通过对样本集的训练,得到样本序列和标签序列的联合概率中各个特征函数式的权重参数。然后根据所得到的分布模型,对于输入序列确定最有可能的标注序列,从而识别CpG岛的位置。通过对标准数据库数据测试,本文算法是可行的、高效的,比HMM方法有更高的准确率。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 肖冰,王伟,邓飞其;一种多维关联规则算法的研究[J];重庆工商大学学报(自然科学版);2005年04期
2 邵平;杨路明;;旋转45°矩形窗口的积分图像算法改进及应用[J];计算机应用与软件;2008年03期
3 陈苏豫;;用BOOTH算法改进的计算机定点乘法运算[J];晋中学院学报;2008年03期
4 梁勇;孟桥;陆佶人;;Lyapunov指数的算法改进与加权预测[J];声学技术;2006年05期
5 邵平;杨路明;曾耀荣;;计算旋转Harr型特征的积分图像算法改进[J];计算机技术与发展;2006年11期
6 卢铭娜;朱学峰;郭永玲;陈玉霜;;PID控制器微分算法的改进研究和仿真[J];自动化技术与应用;2006年10期
7 杨盘洪;赵建安;朱军祥;杨静;;机动目标跟踪的自适应网格交互多模算法改进[J];仪器仪表学报;2006年S3期
8 连志春;王春光;张洁;;基于小波网络的BP算法改进研究[J];计算机工程与应用;2007年02期
9 陈郁;秦奋;余明全;;B-P神经网络改进及其在Matlab中应用程序发布的研究[J];河南教育学院学报(自然科学版);2007年02期
10 吴建华;邹德旋;李静辉;;一种快速精确的虹膜定位方法[J];仪器仪表学报;2007年08期
11 王玉琨;魏国军;;图像测量中的边界跟踪算法改进[J];橡胶工业;2008年09期
12 陈应霞;陈艳;;关联规则中的Apriori挖掘算法改进[J];长江大学学报(自然科学版)理工卷;2008年04期
13 高经纬;张培林;姜乐华;任国全;;一种人工免疫系统改进算法的仿真研究[J];军械工程学院学报;2009年03期
14 汪丹;;适用于科学合作的知识媒介算法改进[J];图书情报工作;2009年11期
15 王世珍;;基于改进蚁群算法的带时间窗的多目标车辆调度研究[J];科协论坛(下半月);2009年09期
16 徐静婷;;改进差分进化算法研究及应用[J];电子技术;2010年05期
17 张明杰;陈汶滨;;基于加气站槽车调度的模型建立与算法研究[J];信息技术;2011年05期
18 韩瑞峰,张永奎;改进遗传算法与其他算法的比较实验研究[J];电脑开发与应用;2002年11期
19 戴永寿;马西庚;姜浩;;横向延时自适应滤波器改进及应用[J];电子测量技术;2002年06期
20 李彦保,赵忠,卫育新,李辉;陀螺寻北仪的算法改进[J];兵工自动化;2004年05期
中国重要会议论文全文数据库 前10条
1 许爱芬;杨胜奎;王鹏;黄勇;钱继锋;;C功能刀具半径补偿的优化算法[A];先进制造技术论坛暨第五届制造业自动化与信息化技术交流会论文集[C];2006年
2 覃喜庆;韩韬;彭春萍;;非制冷红外热像仪实用图像增强技术研究[A];中国造船工程学会电子技术学术委员会2006学术年会论文集(下册)[C];2006年
3 魏俊超;;BP神经网络算法改进研究[A];山东省计算机学会2005年信息技术与信息化研讨会论文集(一)[C];2005年
4 王彤;;对Web使用记录挖掘算法的改进[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
5 潘大夫;汪渤;;一种改进的Canny算法[A];第二十七届中国控制会议论文集[C];2008年
6 郝红星;吴玲达;宋汉辰;;一种残损图像修补算法改进与实现[A];第18届全国多媒体学术会议(NCMT2009)、第5届全国人机交互学术会议(CHCI2009)、第5届全国普适计算学术会议(PCC2009)论文集[C];2009年
7 申东日;冯少辉;陈义俊;;BP网络学习算法的改进[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
8 庞金城;林京;黄晓砥;;宽带信号常规波束形成方位估计算法改进[A];中国声学学会2007年青年学术会议论文集(上)[C];2007年
9 赵运基;裴海龙;;光强自适应补偿的Camshift算法[A];中国自动化学会控制理论专业委员会D卷[C];2011年
10 李国栋;;定点DSP实现均衡的算法改进与仿真[A];系统仿真技术及其应用(第7卷)——'2005系统仿真技术及其应用学术交流会论文选编[C];2005年
中国博士学位论文全文数据库 前10条
1 邱剑锋;人工蜂群算法的改进方法与收敛性理论的研究[D];安徽大学;2014年
2 潘磊;若干社区发现算法研究[D];南京大学;2014年
3 李晓斌;交通出行信息服务平台及其关键技术应用研究[D];华南理工大学;2010年
4 周郭许;盲信号分离若干关键问题研究[D];华南理工大学;2010年
5 严春满;图像稀疏编码算法及应用研究[D];西安电子科技大学;2012年
6 刘维;生物序列模式挖掘与识别算法的研究[D];南京航空航天大学;2010年
7 谢宗伯;信号的噪声抑制理论与技术研究[D];华南理工大学;2010年
8 文飞;非圆信号参数估计方法研究[D];电子科技大学;2014年
9 吴学雁;金融时间序列模式挖掘方法的研究[D];华南理工大学;2010年
10 张重毅;群智能优化及模拟算法研究与应用[D];吉林大学;2013年
中国硕士学位论文全文数据库 前10条
1 包震宇;基于粗糙集对Apriori算法的改进[D];上海师范大学;2010年
2 刘红卫;线性回归模型中多重共线性问题的应对策略及其几点改进[D];西南交通大学;2006年
3 周育乾;基于粒子群优化算法的滤波器设计与实现[D];南京理工大学;2007年
4 刘恒辉;红外图像处理算法研究及其FPGA实现[D];武汉理工大学;2008年
5 黄永;改进蚁群算法及其在公交线网优化中的应用[D];华东师范大学;2010年
6 杨海;蚁群算法及其在智能交通中的应用[D];山东师范大学;2008年
7 皇甫丽英;G.728算法改进及低码率LD-CELP算法研究[D];太原理工大学;2002年
8 刘佳;基于Gibbs算法的改进算法及其在识别MOTIF中的应用[D];吉林大学;2010年
9 杨丹;人工蜂群算法的改进及应用研究[D];安徽大学;2014年
10 武燕;粒子群改进算法及在混合神经网络中的应用研究[D];景德镇陶瓷学院;2014年
中国重要报纸全文数据库 前5条
1 四川省畜牧科学研究院 易礼胜;饲料配方软件的算法[N];中国畜牧兽医报;2008年
2 黄慧琴 陈松;阿尔戈马钢铁厂转炉工艺的改进措施[N];世界金属导报;2007年
3 记者 胡亚 通讯员 孟晋宝;我国陆表遥感产品验证实验完成[N];中国气象报;2008年
4 易水;IEEE 802.11i 提升无线网的安全[N];计算机世界;2003年
5 本报记者 于翔;搜索整合前路漫漫[N];网络世界;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978