收藏本站
《大连理工大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

基于机器学习方法的蛋白质亚细胞定位预测研究

马军伟  
【摘要】:随着生物信息的爆炸性增长,采用实验的方法收集和分析相关的生物信息已远远不能满足实际研究的需要。人们已经迫切认识到,采用智能数据处理技术解决上述问题可以大大节省时间和成本。蛋白质序列信息是这个领域的研究重点之一,本论文运用机器学习方法对蛋白质亚细胞定位预测和蛋白质结构类预测展开研究,主要工作如下: 1、针对革兰阴性杆菌亚细胞定位预测问题,本文提出了改进的选择性集成Elman神经网络方法。首先以Elman网络作为基底分类器;然后利用多种不同的算法来训练Elman网络,以增加基底分类器的多样性;最后用GASEN算法选择合适的网络进行集成,使集成后的各个网络彼此互补,相互协调。采用氨基酸组成成分分析表示蛋白质序列,在自相容验证、留一法验证和独立测试集验证等三种实验模型上都取得了良好的效果。 2、针对蛋白质亚细胞定位预测问题,本文构造了一种新颖的亚细胞定位预测系统ELM-PCA,可以预先确定传统的伪氨基酸组成成分分析模型中反映氨基酸序列次序效应的参数。在该系统中,首先让参数λ取最大以包含尽可能多的序列次序信息,然后用主成分分析技术提取关键主特征,最后采用Elman神经网络作为分类器,实验表明ELM-PCA的性能要优于已有的预测系统;同时,将主成分分析技术和伪氨基酸组成模型结合,形成了新的蛋白质表示模型PPseAAC,在几个常用的机器学习算法实验中表明此模型要优于原始模型。 3、针对蛋白质结构类的预测问题,本文提出了改进的局部线性嵌入映射(LLE)算法,克服了传统局部线性嵌入映射算法在求取最优重构权值时常常出现的奇异现象。改进的算法基于共轭梯度算法,具有有限步收敛的性质,求解过程中不涉及矩阵的逆运算。在此基础上,把此改进的局部线性嵌入映射算法应用于蛋白质结构类的预测,采用k-nn分类器,伪氨基酸组成模型中参数λ值大于序列长度L。在Jackknife实验中,结果显示本方法具有较好的预测性能。
【学位授予单位】:大连理工大学
【学位级别】:博士
【学位授予年份】:2011
【分类号】:Q51;TP181

【参考文献】
中国期刊全文数据库 前9条
1 李国正,杨杰,孔安生,陈念贻;基于聚类算法的选择性神经网络集成[J];复旦学报(自然科学版);2004年05期
2 何力;张军平;周志华;;基于放大因子和延伸方向研究流形学习算法[J];计算机学报;2005年12期
3 赵连伟,罗四维,赵艳敞,刘蕴辉;高维数据流形的低维嵌入及嵌入维数研究[J];软件学报;2005年08期
4 张振跃,查宏远;Principal Manifolds and Nonlinear Dimensionality Reduction via Tangent Space Alignment[J];Journal of Shanghai University;2004年04期
5 张松;黄波;夏学峰;孙之荣;;蛋白质亚细胞定位的生物信息学研究[J];生物化学与生物物理进展;2007年06期
6 张松;夏学峰;沈金城;孙之荣;;基于序列保守性和蛋白质相互作用的真核蛋白质亚细胞定位预测[J];生物化学与生物物理进展;2008年05期
7 李凤敏,李前忠;蛋白质亚细胞定位的识别[J];生物物理学报;2004年04期
8 李晓琴,罗辽复;氨基酸组成聚类、蛋白质结构型和结构型的预测[J];生物物理学报;1998年04期
9 张春霆;蛋白质结构分类与结构类预测研究[J];中国科学基金;2000年05期
【共引文献】
中国期刊全文数据库 前10条
1 巩玉志;王士杰;武换娥;;支持向量机在深层搅拌桩复合地基承载力预测中的应用研究[J];四川建筑科学研究;2008年02期
2 刘金红;陆余良;施凡;宋舜宏;;基于语义上下文分析的因特网人物信息挖掘[J];安徽大学学报(自然科学版);2009年04期
3 何朝林,王旭;证券组合模型系数的二次规划求解[J];安徽机电学院学报;2001年02期
4 潘希姣;;多子群粒子群集成神经网络[J];安徽建筑工业学院学报(自然科学版);2007年02期
5 王勇;陈克平;姚勤;;系统发生分析软件PAUP和TreePuzzle使用方法介绍[J];安徽农业科学;2008年02期
6 李亭;杨敬锋;彭晓琴;陈志民;;基于最大似然法集成的黄曲条跳甲预警模型[J];安徽农业科学;2008年25期
7 时雷;虎晓红;席磊;段其国;;集成学习技术在农业中的应用[J];安徽农业科学;2008年26期
8 王勇;陈克平;姚勤;;系统发生分析程序MrBayes 3.1使用方法介绍[J];安徽农业科学;2009年33期
9 王彬;牟欣;李敬明;;全球通手机“套餐”资费方案模型[J];白城师范学院学报;2009年03期
10 王丽颖;赵连丽;赵连忠;;多目标规划模型的应用研究[J];白城师范学院学报;2010年06期
中国重要会议论文全文数据库 前10条
1 叶红云;倪志伟;陈恩红;;一种混合型集成学习演化决策树算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 胡扬;桂卫华;;人工代谢技术在医药领域中的应用研究[A];第二十九届中国控制会议论文集[C];2010年
3 ;Predictive Control Based on Multi-network for a Deep Seabed Mining Robot Vehicle[A];中国自动化学会控制理论专业委员会A卷[C];2011年
4 杜方键;杨宏晖;;K均值聚类优化集成学习[A];2011'中国西部声学学术交流会论文集[C];2011年
5 蒋全胜;贾民平;胡建中;许飞云;;一种基于流形学习的故障模式识别方法[A];第九届全国振动理论及应用学术会议论文集[C];2007年
6 杜晓凤;丁友东;;FloatBag选择性神经网络集成及其在人脸检测中的应用[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
7 夏俊士;杜培军;张伟;;遥感影像多分类器集成系统的设计与实现[A];中国测绘学会2010年学术年会论文集[C];2010年
8 徐云峰;;一种新的取证计算模型的研究与实现[A];第二十一次全国计算机安全学术交流会论文集[C];2006年
9 陈华杰;韦巍;;一种基于元泛化的Bagged Boosting算法[A];2005中国控制与决策学术年会论文集(上)[C];2005年
10 ;Study of Selective Ensemble Learning Method and Its Diversity Based on Decision Tree and Neural Network[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
中国博士学位论文全文数据库 前10条
1 于化龙;基于DNA微阵列数据的癌症分类技术研究[D];哈尔滨工程大学;2010年
2 李建平;面向异构数据源的网络安全态势感知模型与方法研究[D];哈尔滨工程大学;2010年
3 梁洪;基于内容的医学图像检索及语义建模关键技术研究[D];哈尔滨工程大学;2010年
4 邬俊;基于交互式语义推理的图像检索算法研究[D];大连海事大学;2010年
5 高山;蛋白质点突变效果预测与突变数据库研究[D];南开大学;2010年
6 张宁;蛋白质Beta折叠的分析与预测及生物信息工具开发[D];南开大学;2010年
7 邓斌;B2C在线评论中的客户知识管理研究[D];电子科技大学;2010年
8 王晓东;双机架紧凑式炉卷轧机模型自适应优化控制[D];昆明理工大学;2008年
9 苏煜;基于SCF范式的在线P300脑机接口研究[D];浙江大学;2010年
10 杜方;复杂网络系统间相似性识别及其应用[D];浙江大学;2010年
中国硕士学位论文全文数据库 前10条
1 马冉冉;集成学习算法研究[D];山东科技大学;2010年
2 王萍;语音情感识别研究[D];山东科技大学;2010年
3 吕万里;中文文本分类技术研究[D];山东科技大学;2010年
4 朱耿峰;支持向量机在冲击地压预测模型中的应用研究[D];山东科技大学;2010年
5 江达秀;基于HMAX模型的人脸表情识别研究[D];浙江理工大学;2010年
6 韩聪;家蚕OCIAD2基因的克隆表达及其定位研究[D];浙江理工大学;2010年
7 石国强;基于规则的组合分类器的研究[D];郑州大学;2010年
8 张杰;基于支持向量机和蛋白质全序列的蛋白质—蛋白质相互作用预测[D];郑州大学;2010年
9 陈松峰;利用PCA和AdaBoost建立基于贝叶斯的组合分类器[D];郑州大学;2010年
10 吴正娟;特征变换在组合分类中的应用研究[D];郑州大学;2010年
【二级参考文献】
中国期刊全文数据库 前1条
1 李凤敏,李前忠;用离散量方法预测蛋白质亚细胞定位[J];内蒙古大学学报(自然科学版);2003年04期
【相似文献】
中国期刊全文数据库 前10条
1 王永章,张大鹏;苹果果实发育过程中α-淀粉酶的活性、数量变化和亚细胞定位(英文)[J];Acta Botanica Sinica;2002年01期
2 孙林光;银巍;黄奕俊;程文芳;苏兴文;邱鹏新;颜光美;;大鼠神经元Arnt2亚细胞定位的预测与分析[J];中国病理生理杂志;2006年07期
3 丁小凤;胡 翔;张健;;GAS41蛋白的表达、抗体制备及其亚细胞定位[J];激光生物学报;2005年06期
4 张春岩;蔡青;于顺;徐群渊;陈彪;杨慧;;α-突触核蛋白在正常大鼠脑神经元中的亚细胞定位[J];解剖学报;2006年03期
5 刘巅;李娅;李连强;朱飞;;异戊烯基焦磷酸(IPP)异构酶的生物信息学分析[J];安徽农业科学;2007年20期
6 黄妤;张学文;;生长素结合蛋白ABP1研究进展[J];安徽农业科学;2007年29期
7 夏宗良;王美平;刘全军;王道文;;大麦黄矮病毒GAV株系ORF4基因在杆状病毒-昆虫细胞系统中的表达及亚细胞定位[J];生物工程学报;2007年06期
8 姚峰;周军媚;王佐;危当恒;姜志胜;刘录山;吴端生;;SDF-1α基因与绿色荧光蛋白融合载体的构建及亚细胞定位[J];中国比较医学杂志;2008年03期
9 罗畅;丁小凤;孙一兵;韩梅;;EPS8蛋白的表达、多克隆抗体制备及其亚细胞定位[J];湖南师范大学自然科学学报;2008年02期
10 马立安;江涛;张忠明;;拟南芥Ran小GTP结合蛋白在细胞有丝分裂中的定位[J];华中农业大学学报;2008年06期
中国重要会议论文全文数据库 前10条
1 ;石斑鱼死亡调节相关基因GRIM-19的克隆和亚细胞定位分析[A];2010年中国水产学会学术年会论文摘要集[C];2011年
2 王韻;周新;汪炳华;陈丽达;曹金秀;;MM-LDL对内皮细胞cPLA_2活性、表达及亚细胞定位的影响[A];湖北省暨武汉生物化学与分子生物学学会第八届会员代表大会和第十五次学术年会论文摘要汇编[C];2004年
3 周建华;曹慧秋;文继舫;邓征浩;屈晓辉;姜昕;;FGF-2调控肺癌细胞Survivin的表达及Smac亚细胞定位的机制[A];中华医学会病理学分会2006年学术年会论文汇编[C];2006年
4 刘金花;伍欣星;;人乳头瘤病毒16型变异株E7蛋白在HeLa细胞中的表达及其亚细胞定位[A];湖北省暨武汉市生物化学与分子生物学学会第八届第十七次学术年会论文汇编[C];2007年
5 张晓艳;唐娟;应航宇;李红艳;尤立平;蔓小红;陈扬鑫;;FoxO亚类的亚细胞定位及表达与银屑病表皮增殖的关系[A];中华医学会第16次全国皮肤性病学术年会摘要集[C];2010年
6 王晓杜;陈培君;沈阳;马志永;;猪流感病毒聚合酶PB1蛋白亚细胞定位的研究[A];中国畜牧兽医学会家畜传染病学分会第七届全国会员代表大会暨第十三次学术研讨会论文集(上册)[C];2009年
7 袁二燕;张洁;吕宗舜;陈平;林烈;汤国庆;;CPD1、CPD2和MB在人胃腺癌SGC-7901细胞的亚细胞定位及其介导的光动力对细胞的杀伤效应研究[A];中华医学会第12次全国内科学术会议论文汇编[C];2009年
8 陈剑清;盖其静;张耀洲;;全反式维甲酸(ATRA)对BmNIF31蛋白亚细胞定位的影响[A];华东六省一市生物化学与分子生物学会2008年学术交流会论文摘要汇编[C];2008年
9 江艳;童富淡;张耀洲;;家蚕BmCycH蛋白的相关研究[A];华东六省一市生物化学与分子生物学会2009年学术交流会论文摘要汇编[C];2009年
10 马良;张耀洲;;家蚕中BmIBP基因的表达分析和亚细胞定位[A];华东六省一市生物化学与分子生物学会2009年学术交流会论文摘要汇编[C];2009年
中国重要报纸全文数据库 前2条
1 张学全;克隆人类全长功能基因获突破[N];中国高新技术产业导报;2004年
2 本报记者 齐冰;破解蛋白质秘密已经开始 [N];健康时报;2004年
中国博士学位论文全文数据库 前10条
1 张付云;壳寡糖诱导烟草抗性相关基因的克隆和鉴定[D];中国科学院研究生院(大连化学物理研究所);2007年
2 梅素玉;基于机器学习的蛋白亚细胞定位预测[D];复旦大学;2010年
3 刘智新;基于量子算法的苹果及PCD相关蛋白亚细胞定位体系研究[D];山东农业大学;2013年
4 邱荣元;P21亚细胞定位改变对HepG2细胞增殖和凋亡的影响[D];华中科技大学;2010年
5 孙燕;人ZNF268基因在早期胚胎发育中的特性和功能研究[D];武汉大学;2003年
6 肖海华;苹果属山定子Mb.nramp1基因克隆及其功能的初步研究[D];中国农业大学;2005年
7 祁碧菽;水稻Ca~(2+)/H~+反向转运体OsCAX3的功能、表达特性及调控序列研究[D];中国农业大学;2005年
8 王志峰;成对盒基因Pax9的亚细胞定位及对细胞生物学行为的调控研究[D];武汉大学;2005年
9 刘永忠;ASB-8基因的克隆及其生物学功能研究[D];复旦大学;2003年
10 熊文碧;HMGN2的亚细胞定位及其重组免疫毒素的研究[D];四川大学;2005年
中国硕士学位论文全文数据库 前10条
1 高永娟;人类基因CREB4的功能初步研究[D];华东师范大学;2005年
2 汤雪燕;绿色荧光蛋白融合表达法研究黄瓜α-半乳糖苷酶亚细胞定位[D];扬州大学;2009年
3 何昆;eIF-5A基因钓取、蛋白质表达、抗体制备及其功能的初步研究[D];中国人民解放军军事医学科学院;2003年
4 刘曼;利用GFP标记对胞外钙调素定位的研究[D];河北师范大学;2003年
5 齐兴云;盐芥ThTRXh蛋白的亚细胞定位及AtTRXh突变体的表型分析[D];山东师范大学;2006年
6 王翔;XIAP与XAF1在正常口腔黏膜角质形成细胞和Tca8113细胞中的表达与定位[D];吉林大学;2006年
7 周妮;LP4/2A融合基因在玉米中的亚细胞定位分析[D];中国农业科学院;2011年
8 高芸;基于基因本体论的生物信息个人数据库与其在蛋白质亚细胞定位预测研究中的应用[D];东华大学;2005年
9 王秋霞;盐芥和拟南芥硫氧还蛋白在氧化胁迫中的功能研究[D];山东师范大学;2008年
10 杨文竹;转植酸酶基因玉米中植酸酶的亚细胞定位[D];中国农业科学院;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026