收藏本站
《中国科学院研究生院(上海生命科学研究院)》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

基于蛋白质序列和生物医学文献的蛋白质功能挖掘

俞晓晶  
【摘要】:运用计算手段对蛋白质功能进行分类预测是当前生物信息学的研究热点之一,本文针对包含蛋白质功能信息的两大载体:蛋白质序列和生物医学文献,运用机器学习和自然语言处理技术进行挖掘分析。 在蛋白质序列分析方面,采用了经典氨基酸组成、基于氨基酸组成的氨基酸序列物理化学组成与分布法和蛋白质功能域组成法三种不同的蛋白质序列描述方法。应用最近邻算法、支持向量机、极大似然估计以及期望最大化算法等机器学习算法,我们分别尝试研究蛋白质四级结构分类、DNA/RNA结合蛋白质预测以及蛋白质功能分类问题,获得了较满意的分类预测准确率。蛋白质序列分析的结果显示蛋白质功能域组成是蛋白质序列信息非常高效的描述符,表明功能域在蛋白质功能行使中发挥着重要作用。据此,我们在MEDLINE的摘要数据库中运用自然语言处理技术挖掘关于蛋白质功能域相互作用的信息,加上从其它实验室得到的数据,一共搜集到175条功能域与功能域相互作用的信息和355条功能域与其它生物分子相互作用的信息。在此基础上,我们整合了Pfam、Swiss-Prot、InterPro、GO、DIP、KEGG等其它数据库与功能域相关的信息,构建了蛋白质功能域相互作用数据库(Database of Domain Interactions and Bindings,DDIB)。用户可以通过地址http://www.ddib.org访问查询。
【学位授予单位】:中国科学院研究生院(上海生命科学研究院)
【学位级别】:博士
【学位授予年份】:2006
【分类号】:Q51;Q811.4

【引证文献】
中国期刊全文数据库 前1条
1 张向喆;王明辉;赵洪波;王起山;潘玉春;;生物医学文本中命名实体识别研究[J];上海交通大学学报(农业科学版);2010年02期
中国博士学位论文全文数据库 前1条
1 李婧;小鼠bHLH转录因子家族预测及其大脑调控网络的构建[D];上海交通大学;2007年
中国硕士学位论文全文数据库 前2条
1 赵浣萍;基于改进型Multi-Agent多分类器融合算法在乳腺钼靶肿块分类中的研究[D];杭州电子科技大学;2012年
2 武利;蛋白质二级结构类预测中的信息提取与预测方法研究[D];杭州电子科技大学;2012年
【参考文献】
中国期刊全文数据库 前3条
1 李保利,陈玉忠,俞士汶;信息抽取研究综述[J];计算机工程与应用;2003年10期
2 俞晓晶,林建成,石铁流,李亦学;一种基于结构域的蛋白质功能分类预测新方法[J];科学通报;2004年20期
3 张春霆;生物信息学的现状与展望[J];世界科技研究与发展;2000年06期
【共引文献】
中国期刊全文数据库 前10条
1 杨绪兵,韩自存;ε不敏感的核Adaline算法及其在图像去噪中的应用[J];安徽工程科技学院学报(自然科学版);2003年04期
2 陶秀凤,唐诗忠,周鸣争;基于支持向量机的软测量模型及应用[J];安徽工程科技学院学报(自然科学版);2004年02期
3 黄啸;;生物信息学在蛋白质组学上的应用[J];安徽农业科学;2006年23期
4 许高程;张文君;王卫红;;支持向量机技术在遥感影像滑坡体提取中的应用[J];安徽农业科学;2009年06期
5 郭立萍;唐家奎;米素娟;张成雯;赵理君;;基于支持向量机遥感图像融合分类方法研究进展[J];安徽农业科学;2010年17期
6 管翠萍;;药物靶标G蛋白偶联受体的识别预测[J];安徽农业科学;2010年24期
7 刘婷婷;;基于支持向量机的水稻纹枯病识别研究[J];安徽农业科学;2011年28期
8 冯学军;;最小二乘支持向量机的研究与应用[J];安庆师范学院学报(自然科学版);2009年01期
9 高闯;王立东;周世宇;;基于支持矢量机的宫颈细胞分类[J];辽宁科技大学学报;2009年03期
10 邹心遥;姚若河;;基于LSSVM的威布尔分布形状参数估计(英文)[J];半导体技术;2008年06期
中国重要会议论文全文数据库 前10条
1 ;An effective procedure exploiting unlabeled data to build monitoring system[A];中国科学院地质与地球物理研究所第11届(2011年度)学术年会论文集(下)[C];2012年
2 ;A Novel Kernel PCA Support Vector Machine Algorithm with Feature Transition Function[A];第二十六届中国控制会议论文集[C];2007年
3 ;A Novel Proximal Support Vector Machine and Its Application in Radar Target Recognition[A];第二十六届中国控制会议论文集[C];2007年
4 吕蓬;柳亦兵;马强;魏于凡;;支持向量机在齿轮智能故障诊断中的应用研究[A];第二十六届中国控制会议论文集[C];2007年
5 ;Fault Pattern Recognition of Rolling Bearings Based on Wavelet Packet and Support Vector Machine[A];第二十七届中国控制会议论文集[C];2008年
6 蒋少华;桂卫华;阳春华;唐朝晖;蒋朝辉;;基于主元分析与支持向量机的方法及其在密闭鼓风炉过程监控诊断中的应用[A];第二十七届中国控制会议论文集[C];2008年
7 王海丰;李壮;任洪娥;赵鹏;;基于非下采样Contourlet变换和SVM的纹理图像分割算法[A];第二十九届中国控制会议论文集[C];2010年
8 ;State Estimation Model of Ferment Process Based on PSO[A];第二十九届中国控制会议论文集[C];2010年
9 ;Image Classification with Ant Colony Based Support Vector Machine[A];中国自动化学会控制理论专业委员会A卷[C];2011年
10 常俊林;魏巍;梁君燕;;基于支持向量机的SURF改进算法[A];中国自动化学会控制理论专业委员会C卷[C];2011年
中国博士学位论文全文数据库 前10条
1 赵莹;半监督支持向量机学习算法研究[D];哈尔滨工程大学;2010年
2 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
3 孔凡芝;引线键合视觉检测关键技术研究[D];哈尔滨工程大学;2009年
4 郑大腾;柔性坐标测量机空间误差模型及最佳测量区研究[D];合肥工业大学;2010年
5 柏坚;非线性数学地质模型研究及在滇东南金矿成矿预测中的应用[D];中国地质大学(北京);2010年
6 姚志明;基于步态触觉信息的身份识别研究[D];中国科学技术大学;2010年
7 张昌明;新疆汉族、维吾尔族及哈萨克族食管癌血清蛋白质指纹图谱研究[D];新疆医科大学;2010年
8 陈志国;基于群体智能的机器视觉的关键技术研究[D];江南大学;2010年
9 王晓明;基于统计学习的模式识别几个问题及其应用研究[D];江南大学;2010年
10 刘卫红;垃圾邮件检测与过滤关键技术研究[D];华南理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 朱杰;一种基于聚类的支持向量机反问题求解算法[D];河北大学;2007年
2 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
3 朱耿峰;支持向量机在冲击地压预测模型中的应用研究[D];山东科技大学;2010年
4 江达秀;基于HMAX模型的人脸表情识别研究[D];浙江理工大学;2010年
5 李朋勇;基于全矢高阶谱的故障诊断方法及其应用研究[D];郑州大学;2010年
6 刘磊;多泥沙河流水库优化调度研究[D];郑州大学;2010年
7 辛保兵;既有预应力混凝土梁桥剩余承载力评估方法研究[D];郑州大学;2010年
8 王巧立;微生物发酵过程的建模与优化控制研究[D];郑州大学;2010年
9 刘松;基于OCSVM和主动学习的DDOS攻击分布式检测系统[D];郑州大学;2010年
10 林天威;基于视频流的人脸识别系统研究[D];哈尔滨工程大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 王智平,刘在德,高成秀,路阳;遗传算法在BP网络权值学习中的应用[J];甘肃工业大学学报;2001年02期
2 谢华;夏顺仁;张赞超;;医学图像识别中多分类器融合方法的研究进展[J];国际生物医学工程杂志;2006年03期
3 王化坤;钱伟懿;;基于蛋白质二级结构序列的结构型预测[J];河北理工大学学报(自然科学版);2008年03期
4 林和平;杨晨;;模糊主成分分析方法的研究与分析[J];航空计算技术;2006年06期
5 李保利,陈玉忠,俞士汶;信息抽取研究综述[J];计算机工程与应用;2003年10期
6 韩宏;杨静宇;;多分类器组合及其应用[J];计算机科学;2000年01期
7 张春霆;生物信息学的现状与展望[J];世界科技研究与发展;2000年06期
8 张林;徐勇;刘福成;;多Agent系统的技术研究[J];计算机技术与发展;2008年08期
9 柴春梅;李翔;林祥;;基于改进KNN算法实现网络媒体信息智能分类[J];计算机技术与发展;2009年01期
10 罗林波;陈绮;;氨基酸序列特征提取方法研究[J];计算机技术与发展;2010年02期
中国博士学位论文全文数据库 前6条
1 靳利霞;蛋白质结构预测方法研究[D];大连理工大学;2002年
2 徐伟栋;乳腺X线图像的计算机辅助诊断技术研究[D];浙江大学;2006年
3 何洁月;面向蛋白质结构预测的计算生物学技术研究[D];东南大学;2006年
4 张振慧;蛋白质分类问题的特征提取算法研究[D];国防科学技术大学;2006年
5 姜娈;基于乳腺X线摄片的计算机辅助检测肿块方法研究[D];华中科技大学;2009年
6 顾斐;蛋白质若干结构预测问题研究及其软件实现[D];浙江大学;2009年
中国硕士学位论文全文数据库 前3条
1 陈岩;基于有监督奇异值分解和类随机森林决策方法的肿瘤特征基因筛选研究[D];杭州电子科技大学;2009年
2 姜英仙;基于多视图的乳腺癌辅助检测[D];华中科技大学;2007年
3 姜彬;膜蛋白分类问题的特征提取算法研究[D];国防科学技术大学;2008年
【二级引证文献】
中国期刊全文数据库 前1条
1 王春雨;王芳;;基于条件随机场的农业命名实体识别研究[J];河北农业大学学报;2014年01期
中国硕士学位论文全文数据库 前4条
1 孙静;基于组合分类器的生物命名实体识别[D];大连理工大学;2010年
2 唐守忠;文本挖掘关键技术研究[D];北京林业大学;2013年
3 彭新茗;基于多层学习的病历实体识别算法设计与实现[D];东北大学;2013年
4 张仁军;生物医学文本中基因名识别的特征选择方法研究[D];青岛大学;2014年
【二级参考文献】
中国期刊全文数据库 前1条
1 叶玉珍,解涛,丁达夫;蛋白质功能基团三维模体及其应用[J];科学通报;2000年12期
【相似文献】
中国期刊全文数据库 前10条
1 张玲,林澄涛,王恒;基因组范围的蛋白质功能研究方法初探[J];生物化学与生物物理进展;2001年05期
2 刘秀艳,滕胜;应用计算机识别蛋白质功能[J];生命的化学;2000年03期
3 张成林;李建远;;蛋白质相互作用的研究方法[J];中外医学研究;2011年04期
4 王大成;;蛋白质的三维结构研究[J];生物化学与生物物理进展;1980年05期
5 ;增强食欲的蛋白质[J];生命世界;2006年05期
6 陈丽娜;王倩;尚玉奎;张良才;孙钊;何伟明;赵研;李琬;王宏;何月涵;李霞;;人类蛋白质结构互作网络——结构域对网络拓扑与蛋白质功能的影响[J];生物化学与生物物理进展;2010年05期
7 陶站华,王淑静,刘兴汉;蛋白质转导技术及其应用[J];医学分子生物学杂志;2005年02期
8 高飞雪;杨俊林;;我国科学家在蛋白质功能设计领域取得重要进展[J];中国科学基金;2007年05期
9 杨运春;;“生命活动的主要承担者——蛋白质”的教学设计[J];生物学通报;2008年07期
10 王祥余;朴永哲;翟明昌;王晓丹;程贺;赵长新;;酿酒酵母FFC2146胞内蛋白及胞外蛋白双向电泳条件优化及图谱建立[J];微生物学通报;2011年02期
中国重要会议论文全文数据库 前10条
1 刘银坤;;疾病蛋白质组学研究重点和临床应用展望[A];中华医学会第七次全国检验医学学术会议资料汇编[C];2008年
2 高飞;;泛素样蛋白NEDD8对乳腺癌相关蛋白3(BCA3)的修饰及BCA3对NFκB活性的抑制[A];中国细胞生物学学会2005年学术大会、青年学术研讨会论文摘要集[C];2005年
3 刘俊峰;王新泉;王占新;安晓敏;常文瑞;梁栋材;;造血干细胞中特异表达新基因kd93的重组表达和晶体结构研究[A];中国科协2005年学术年会生物物理与重大疾病分会论文摘要集[C];2005年
4 林东海;;用异核多维NMR技术测定蛋白质的溶液结构[A];第十四届全国波谱学学术会议论文摘要集[C];2006年
5 徐加豹;蔡浩洋;张义正;李校;;基于基因网络预测哺乳动物线粒体蛋白质的功能[A];中国遗传学会第八次代表大会暨学术讨论会论文摘要汇编(2004-2008)[C];2008年
6 张小伟 ;张群业 ;鲁静 ;黄秋花;;全反式维甲酸诱导NB4细胞分化蛋白组中蛋白修饰及Isoforms变化的初步研究[A];中国蛋白质组学第三届学术大会论文摘要[C];2005年
7 宋卓;阮吉寿;张涛;;基于氨基酸序列预测蛋白质的功能性点突变[A];第十次中国生物物理学术大会论文摘要集[C];2006年
8 宋卓;阮吉寿;张涛;;基于氨基酸序列预测蛋白质的功能性点突变[A];第十次中国生物物理学术大会论文摘要集[C];2006年
9 刘克良;梁远军;;肽类药物研究进展[A];2006第六届中国药学会学术年会大会报告集[C];2006年
10 许越;;非损伤型扫描离子选择电极技术及其在基因组研究后期的应用[A];生物膜与重大疾病学术研讨会论文集[C];2004年
中国重要报纸全文数据库 前10条
1 记者 吴仲国;日首次公开招募研究人员[N];科技日报;2001年
2 记者 耿挺;蛋白质功能算出来[N];上海科技报;2007年
3 采访记者 姜洪良;弱碱性活蛋白 创造蛋白质功能的升级[N];中国食品质量报;2005年
4 记者 刘恕;我国启动四项重大科学研究计划[N];科技日报;2006年
5 记者 顾钢;科学家发现干细胞蛋白质调控新机制[N];科技日报;2007年
6 刘云涛;北大蛋白质功能设计研究获新进展[N];中国医药报;2007年
7 记者:周清春;蛋白质研究:触摸生命的本质[N];科技日报;2006年
8 华琳 王治强;我校三项“973”项目通过科技部验收[N];新清华;2005年
9 梁远军 刘克良;肽类药物研究: 无限风光在险峰[N];中国医药报;2007年
10 白京丽;我国应重视对糖的研究[N];中国医药报;2000年
中国博士学位论文全文数据库 前10条
1 蔡从中;支持向量机及其在生物材料功能研究中的应用[D];重庆大学;2003年
2 施绍萍;基于支持向量机的蛋白质功能预测新方法研究[D];南昌大学;2012年
3 马志强;蛋白质功能预测的非同源性计算方法研究[D];吉林大学;2009年
4 董少忠;一个HSV-1刺激相关基因的克隆及其功能的初步分析[D];中国协和医科大学;2003年
5 李健峰;与HSV-1感染相关的细胞立即早期基因产物HTRP在细胞辅抑制因子复合物中功能的分析[D];中国协和医科大学;2004年
6 陈义明;基于分类的蛋白质功能预测技术研究[D];国防科学技术大学;2010年
7 孙承磊;基于数据挖掘技术的蛋白质功能预测研究[D];上海大学;2013年
8 段谟杰;蛋白质结构预测与结构比对方法的研究[D];华中科技大学;2009年
9 徐超;结构基因组数据库构建及蛋白质主链构象的计算分析[D];中国科学技术大学;2008年
10 李林辉;小立碗藓冷胁迫下表达序列标签分析及其相关基因Cor166的功能初探[D];首都师范大学;2005年
中国硕士学位论文全文数据库 前10条
1 李希;基于序列特征的蛋白质功能类预测方法研究[D];湖南大学;2010年
2 邓小龙;基于随机游走的蛋白质功能预测方法的研究[D];吉林大学;2012年
3 王博;基于频繁功能模式的蛋白质功能预测[D];吉林大学;2012年
4 贾元丰;基于复杂网络社团结构与贝叶斯网络模型的蛋白质功能预测[D];山西大学;2013年
5 蔡娟;基于蛋白质相互作用网络及聚类算法的蛋白质功能预测方法研究[D];中南大学;2012年
6 胡伟凤;基于不确定网络的蛋白质功能模块挖掘算法研究[D];湖南大学;2013年
7 贾翠翠;基于随机游走的蛋白质功能预测算法设计与实现[D];黑龙江大学;2014年
8 刘钦锋;蛋白质序列编码与功能预测[D];湖南大学;2011年
9 黄淑云;基于序列的蛋白质功能预测研究[D];南昌大学;2012年
10 呙中美;基于融合特征的蛋白质亚细胞定位预测[D];湖南大学;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026