收藏本站
《大连理工大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

同源寡聚蛋白质的信息熵分类方法

曲娟  
【摘要】:人类基因组计划已进入到后基因组时代,对蛋白质结构和功能的研究和预测成为其主要的研究方向之一。由于通过实验确定蛋白质的结构和功能速度较慢,而且会遇到一些目前无法解决的困难。因此探索利用理论及计算方法来从氨基酸序列快速地推断出蛋白质的结构和功能具有重要意义。本文从氨基酸序列出发,研究了同源寡聚蛋白质分类,主要工作如下: 本文介绍了特征提取方法和同源寡聚蛋白质分类的研究现状,并对同源二聚体和同源非二聚体蛋白质使用了基于伪氨基酸组成成分特征提取和信息熵方法进行分类研究。伪氨基酸组成成分特征提取方法以传统的氨基酸组成成分为基础,又考虑了不同层次残基之间的相互影响,包含了蛋白质序列的许多信息,根据这一特点,本文使用了伪氨基酸组成成分作为特征提取方法。FDOD方法是基于信息熵的信息离散性度量函数,它和叉熵之间存在内在的联系,文中对它们之间的关系进行了研究,并在叉熵的基础上对多分布偏差度量进行了进一步的思考。由于FDOD是叉熵的一种形式,因此在它的基础上根据特征向量的提取情况,对同源寡聚蛋白质进行分类。其分类能力比使用子序列分布为2的FDOD方法要好。 本文中在原数据集中随机抽取一些数据构建了一个子数据集,并使用同样的方法对子数据集进行分类。比较了两个数据集的分类结果,表明数据集的大小对分类系统的影响较大。同时,对伪氨基酸组成成分特征提取方法的中权重因子的选取进行了讨论,说明它可用于调节氨基酸序列次序信息对分类系统的影响程度,在计算中可根据结果的优劣适当选取。
【学位授予单位】:大连理工大学
【学位级别】:硕士
【学位授予年份】:2006
【分类号】:Q51

【引证文献】
中国博士学位论文全文数据库 前2条
1 孙鹏飞;基于计算智能技术的蛋白质结构预测方法研究[D];哈尔滨工程大学;2010年
2 郑婷婷;随机商分形模型及其在蛋白质分析中的应用[D];安徽大学;2007年
【参考文献】
中国期刊全文数据库 前2条
1 张绍武,潘泉,张洪才,张云龙,王海瑜;基于支持向量机和贝叶斯方法的蛋白质四级结构分类研究[J];生物物理学报;2003年02期
2 施建宇;潘泉;张绍武;程咏梅;;基于氨基酸组成分布的蛋白质同源寡聚体分类研究[J];生物物理学报;2006年01期
中国博士学位论文全文数据库 前3条
1 靳利霞;蛋白质结构预测方法研究[D];大连理工大学;2002年
2 宋杰;生物信息数据挖掘中的若干方法及其应用研究[D];大连理工大学;2005年
3 张绍武;基于支持向量机的蛋白质分类研究[D];西北工业大学;2004年
【共引文献】
中国期刊全文数据库 前10条
1 张振慧;王正华;王勇献;;基于分组重量编码的蛋白质同源寡聚体分类研究[J];国防科技大学学报;2007年02期
2 张绍武;潘泉;程咏梅;施建宇;;基于一种新的特征提取法和支持向量机的膜蛋白分类研究[J];计算机与应用化学;2006年04期
3 张光亚;葛慧华;方柏山;;基于不同序列特征值预测氧化还原酶辅酶类型的研究[J];计算机与应用化学;2008年05期
4 杨炳儒;周谆;侯伟;;合成金字塔预测模型中内含的改进型CBA预测方法[J];计算机应用研究;2009年12期
5 张云龙,潘泉,张洪才;一种基于SVR的综合预测方法及应用[J];空军工程大学学报(自然科学版);2005年03期
6 张光亚;方柏山;;基于氨基酸组成分布的嗜热和嗜冷蛋白随机森林分类模型[J];生物工程学报;2008年02期
7 王勇;詹钟炜;吴凌云;章祥荪;;改进的自组织映射(SOM)蛋白质折叠算法和计算实现[J];系统科学与数学;2005年05期
8 谭显胜;袁哲明;周铁军;熊洁仪;王春娟;;支持向量机及组合预测在蛋白质四级结构分类中的应用[J];现代生物医学进展;2008年04期
9 王娴,李骜,王明会,冯焕清;基于支持向量机方法的蛋白质氨基酸残基可溶性预测[J];生物物理学报;2005年01期
10 林昊;李前忠;;基于二次判别的果蝇启动子识别[J];生物物理学报;2006年05期
中国重要会议论文全文数据库 前6条
1 郑婷婷;毛军军;吴涛;宋杰;;多重分形和商空间理论在蛋白质结构类分析中的应用[A];第二十六届中国控制会议论文集[C];2007年
2 张俊华;;信息差在降雨分析中的应用[A];中国运筹学会第六届学术交流会论文集(下卷)[C];2000年
3 张俊华;方伟武;;调查表分析中变量选择的一些方法(英文)[A];中国运筹学会第六届学术交流会论文集(下卷)[C];2000年
4 ;ASYMPTOTIC DISTRIBUTIONS OF A MEASURE OF INFORMATION DISCREPANCY AMONG MULTIPLE DISCRETE DISTRIBUTIONS[A];中国运筹学会第七届学术交流会论文集(下卷)[C];2004年
5 张俊华;方伟武;;调查表数据分析中变量选择和判别分析的一些方法及简单比较[A];面向复杂系统的管理理论与信息系统技术学术会议专辑[C];2000年
6 方舜岚;方伟武;;基于信息理论的多专家评议分析及综合决策系统[A];2001年中国管理科学学术会议论文集[C];2001年
中国博士学位论文全文数据库 前10条
1 孙鹏飞;基于计算智能技术的蛋白质结构预测方法研究[D];哈尔滨工程大学;2010年
2 罗建宏;粒计算分类知识发现算法及其应用[D];浙江大学;2010年
3 李清光;中国茶叶国际竞争力的形成和提升研究[D];江南大学;2012年
4 宋杰;生物信息数据挖掘中的若干方法及其应用研究[D];大连理工大学;2005年
5 张敏;生物信息学中多序列比对等算法的研究[D];大连理工大学;2005年
6 张绍武;基于支持向量机的蛋白质分类研究[D];西北工业大学;2004年
7 王娴;蛋白残基可溶性预测及基因表达数据分析方法研究[D];中国科学技术大学;2007年
8 张振慧;蛋白质分类问题的特征提取算法研究[D];国防科学技术大学;2006年
9 刘靖旭;支持向量回归的模型选择及应用研究[D];国防科学技术大学;2006年
10 郑婷婷;随机商分形模型及其在蛋白质分析中的应用[D];安徽大学;2007年
中国硕士学位论文全文数据库 前10条
1 安文娟;Fisher和支持向量综合分类器[D];辽宁师范大学;2010年
2 张书春;数据挖掘技术在SMS系统中的应用研究[D];郑州大学;2010年
3 于晓丽;蛋白质结构分类研究[D];华北电力大学(北京);2011年
4 曾聪;膜蛋白分类的特征提取算法和数据集构建技术研究[D];国防科学技术大学;2010年
5 陈贵华;基于自适应模糊核聚类的多模型软测量建模研究[D];华东理工大学;2012年
6 陈德呈;乙烯精馏过程软测量技术应用研究[D];华东理工大学;2012年
7 王海瑜;基于多分类器组合的蛋白质结构预测研究[D];西北工业大学;2004年
8 马剑;项目评审模型、算法及在基金评审中的应用[D];大连理工大学;2004年
9 张文;信息离散性度量方法及其在生物进化中的应用[D];大连理工大学;2005年
10 邵壮超;基于多分类器组合的蛋白质—蛋白质相互作用位点预测研究[D];西北工业大学;2006年
【同被引文献】
中国期刊全文数据库 前10条
1 阮晓钢,孙海军;编码方式对蛋白质二级结构预测精度的影响[J];北京工业大学学报;2005年03期
2 钟义信;;人工智能理论:从分立到统一的奥秘[J];北京邮电大学学报;2006年03期
3 权小宏;;局部Hurst指数方法在研究我国股市大跌中的应用[J];北京邮电大学学报(社会科学版);2006年02期
4 魏鹏;唐立春;;基于辅助问题和序列二次规划法的电网分区并行最优潮流算法[J];长沙电力学院学报(自然科学版);2006年04期
5 罗晓华;何中市;;多重分形及其良恶性肺结节的识别[J];东莞理工学院学报;2006年01期
6 赵晶;唐焕文;朱训芝;;模拟退火算法的一种改进及其应用研究[J];大连理工大学学报;2006年05期
7 黄京飞,刘次全;蛋白质结构的分形及其与进化关系的研究[J];动物学研究;1997年02期
8 邢焕来;潘炜;邹喜华;;一种解决组合优化问题的改进型量子遗传算法[J];电子学报;2007年10期
9 唐焕文,靳利霞,计明军;蛋白质结构预测的优化模型与方法[J];工程数学学报;2002年02期
10 郝慧梅;任志远;;近50a固阳县气候的Hurst分析[J];干旱区研究;2006年01期
中国博士学位论文全文数据库 前9条
1 靳利霞;蛋白质结构预测方法研究[D];大连理工大学;2002年
2 吴涛;构造性知识发现方法研究[D];安徽大学;2003年
3 孙德山;支持向量机分类与回归方法研究[D];中南大学;2004年
4 陈万里;基于商空间理论和粗糙集理论的粒计算模型研究[D];安徽大学;2005年
5 周志坚;基于遗传算法的神经模糊技术应用研究[D];华南理工大学;1999年
6 毛军军;基于商空间粒度理论的商分形模型及其应用[D];安徽大学;2006年
7 宋杰;仿生计算在生物信息学中的应用[D];安徽大学;2006年
8 李玉岗;生物大分子序列比对和蛋白质结构分类算法[D];中国科学院研究生院(计算技术研究所);2004年
9 杨燕;基于计算智能的聚类组合算法研究[D];西南交通大学;2006年
中国硕士学位论文全文数据库 前3条
1 马燕舞;中国股票市场有效性研究[D];西北农林科技大学;2003年
2 顾民;神经网络、模糊系统、支持向量机内在联系研究[D];电子科技大学;2004年
3 江信毅;基于复杂性科学的股票市场运行特征模型研究[D];重庆大学;2004年
【二级引证文献】
中国期刊全文数据库 前1条
1 张睿;黄晋英;张永梅;;计算智能方法及应用研究[J];电脑开发与应用;2012年10期
【二级参考文献】
中国期刊全文数据库 前10条
1 孙啸;生物信息学——揭示生物分子数据的内涵[J];电子科技导报;1998年11期
2 田盛丰,黄厚宽;基于支持向量机的数据库学习算法[J];计算机研究与发展;2000年01期
3 宋晓峰;陈德钊;俞欢军;胡上序;;支持向量机中优化算法[J];计算机科学;2003年03期
4 张文,唐焕文,方伟武,修志龙;信息离散性度量方法在SARS病毒研究中的应用[J];计算机与应用化学;2003年06期
5 张学工;关于统计学习理论与支持向量机[J];自动化学报;2000年01期
6 卢增祥,李衍达;交互支持向量机学习算法及其应用[J];清华大学学报(自然科学版);1999年07期
7 张绍武,潘泉,陈润生,张洪才;基于支持向量机的蛋白质同源寡聚体分类研究[J];生物化学与生物物理进展;2003年06期
8 王冰,唐焕文,修志龙,方伟武;基于信息离散性度量方法的大肠杆菌全基因组比较研究[J];中国生物工程杂志;2003年11期
9 张绍武,潘泉,张洪才,张云龙,王海瑜;基于支持向量机和贝叶斯方法的蛋白质四级结构分类研究[J];生物物理学报;2003年02期
10 汤海旭,丁达夫;基于结构比较的蛋白质同源模建系统及其评估Ⅱ侧链的安装[J];生物物理学报;1996年01期
中国博士学位论文全文数据库 前1条
1 黄积涛;蛋白质结构、运动与功能[D];天津大学;2003年
【相似文献】
中国期刊全文数据库 前10条
1 张小慧,李桂源;基因组生物信息学在大规模测序中的应用[J];医学与社会;2000年01期
2 朱佳鸣,郭勇,唐权,祖云霞;国内外生物信息学WWW服务器及数据库[J];微生物学通报;2002年01期
3 马轩,杜雄明;生物信息学应用于植物科学的三个实例[J];自然杂志;2004年01期
4 刘晓,施锐,张士璀,戴桂林;生物信息学与生物经济[J];生物学杂志;2004年04期
5 郑伟国,郭英,常春艳;生物信息学的现状与未来[J];口岸卫生控制;2004年05期
6 ;科学出版社生命科学编辑部新书推介[J];中国生物工程杂志;2005年04期
7 崔向军;;生物信息学在DNA局域结构研究中的应用[J];内蒙古科技与经济;2006年24期
8 李强;胡志东;;蛋白质组学技术研究[J];医学综述;2007年11期
9 ;生物信息学试题答案(2)[J];外科理论与实践;2007年04期
10 陈润生;当前生物信息学的重要研究任务[J];生物工程进展;1999年04期
中国重要会议论文全文数据库 前10条
1 陆文聪;钮冰;;基于数据挖掘的生物信息学研究进展[A];中国化学会第27届学术年会第15分会场摘要集[C];2010年
2 阮林;何颖;邹泽红;傅意玲;陈惠芳;陶爱林;;外源蛋白过敏原性生物信息学评价[A];中华医学会2010年全国变态反应学术会议暨中欧变态反应高峰论坛参会指南/论文汇编[C];2010年
3 陈婷婷;郭婷婷;李林;安冬;;基于生物信息学的功能蛋白基因序列分类研究[A];2011年全国通信安全学术会议论文集[C];2011年
4 李媛;崔尚金;李建伟;于康震;;分子生态学与生物信息学[A];中国畜牧兽医学会禽病学分会第十一次学术研讨会论文集[C];2002年
5 冯文龙;赵清杰;;基于遗传算法的DNA多序列比对问题[A];2007年中国智能自动化会议论文集[C];2007年
6 康晓东;;生物信息学及其研究对象[A];2003年全国医学影像技术学术会议论文汇编[C];2003年
7 王智宇;童强松;曾甫清;刘媛;顾朝辉;郑丽端;蔡嘉斌;蒋国松;;小鼠睾丸特异性基因TSEG-4的克隆及表达分析[A];第十五届全国泌尿外科学术会议论文集[C];2008年
8 卢学春;杨波;朱宏丽;姚善谦;;采用生物信息学方法优化依硫磷酸联合方案治疗MDS的应用研究[A];中国科协海峡两岸学术研讨会——2008血液肿瘤论坛会议会编[C];2008年
9 冯雷;施定基;郭永恩;石乐军;谢碧文;曹春晖;;生物信息学在海洋药物研制中的应用[A];首届中国兽药大会——兽医生物制品学、兽医微生物学学术论坛论文集(2008)[C];2008年
10 蒋智钢;吴聪明;张万江;沈建忠;;蛋白质组学及其在细菌耐药性研究中的应用[A];中国畜牧兽医学会兽医药理毒理学分会第十次研讨会论文摘要集[C];2009年
中国重要报纸全文数据库 前10条
1 本报记者 李恩青;生物信息学:促动BT与IT双赢[N];中国高新技术产业导报;2001年
2 刘义;生物信息学产业浮出水面[N];中国高新技术产业导报;2000年
3 中科院院士 强伯勤;生物信息学蕴有巨大效益[N];光明日报;2002年
4 白毅;加强生物信息学建设推动人类基因组研究[N];中国医药报;2002年
5 英潮;生物信息学演绎“变脸”[N];中药报;2002年
6 周颖;李梢:生物信息学为证候研究提供新视角[N];中国中医药报;2006年
7 中国科学院院士 张春霆 郝柏林;生物信息学孕育大产业[N];经济日报;2000年
8 刘丽丽;高性能计算为生物信息学加速[N];计算机世界;2007年
9 田耕;新世纪的新学科 生物信息学[N];大众科技报;2000年
10 严飞;生物信息学 新世纪的新科学[N];大众科技报;2002年
中国博士学位论文全文数据库 前10条
1 宋杰;生物信息数据挖掘中的若干方法及其应用研究[D];大连理工大学;2005年
2 张敏;生物信息学中多序列比对等算法的研究[D];大连理工大学;2005年
3 张革新;α-淀粉酶性能与结构关系的生物信息学研究[D];江南大学;2005年
4 李艳芸;HLA-DRB1基因编码区SNPs的分析及其与宫颈癌的相关性研究[D];天津医科大学;2006年
5 童庆;面向基因预测的信息处理方法研究[D];中国科学技术大学;2006年
6 刘立芳;生物信息学中的多序列比对与模体识别问题研究[D];西安电子科技大学;2006年
7 郭雨珍;蛋白质结构预测和比较的优化研究[D];大连理工大学;2007年
8 曾智勇;猪呼肠孤病毒SC-A株的分离鉴定及全基因组cDNA文库的构建和分子遗传特征分析[D];四川农业大学;2006年
9 熊赟;生物序列模式挖掘与聚类研究[D];复旦大学;2007年
10 张晓丽;几种舌苔蛋白组学初步研究[D];湖北中医学院;2008年
中国硕士学位论文全文数据库 前10条
1 曲娟;同源寡聚蛋白质的信息熵分类方法[D];大连理工大学;2006年
2 张海霞;蛋白质二级结构预测方法研究[D];大连理工大学;2004年
3 詹超;支持向量机在基因表达数据分类中的研究[D];武汉理工大学;2006年
4 郭俊恩;蚁群遗传算法在序列比对中的应用[D];江南大学;2008年
5 潘志宏;植物化感作用代谢途径模拟预测系统的构建与应用[D];福建农林大学;2009年
6 郭洪峰;特异上调HO-1基因表达的人工转录因子构建[D];第三军医大学;2009年
7 方志友;合成PHA基因组克隆片段的序列分析及相关基因的分离[D];安徽农业大学;2002年
8 成华;数据挖掘在糖尿病数据中的应用研究[D];中国科学院研究生院(软件研究所);2003年
9 卜宪娜;海洋嗜冷杆菌的鉴定及所产低温碱性脂肪酶的基因工程和生物信息学研究[D];中国海洋大学;2004年
10 刘鹏;一个ZM401基因家族新成员(ZM908)的克隆及其功能研究[D];中国农业大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026