收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于半结构化文本的转运蛋白底物信息提取系统

陈燕明  
【摘要】:随着大量可用的分子生物数据的出现,在专有生物数据库中自动提取生物信息的方法有了长足的发展。在本篇论文中,为了完善转运蛋白底物数据库(TSdb)中的数据,我们构建一个信息提取工具(简称TTSI:Tool of Transporter Substrate Interaction),它能在UniProt数据库中提取转运蛋白底物信息。在TTSI中最重要的组件是最大熵分类器,该分类器是通过对UniProt数据库中的蛋白质注释进行训练来获得。它主要用来筛选出蛋白质注释中表达了转运关系语句,并把语句中的转运底物名称映射成KEGG Ligand Compound数据库中的ID。由十字交叉实验获得的结果表明训练出来的提取转运蛋白底物信息的分类器具有较高的分类准确度和召回率。我们使用该工具来提取UniProt数据库中人类蛋白质注释中可能的转运蛋白底物关系数据时,经过分类器的筛选后,仅剩1%的注释语句需要生物学专家去手工验证,并且在与其它的专有转运蛋白数据库中的数据进行对比后发现有68.63%的转运蛋白底物关系对是新提取出来的。TTSI工具能够极大地减少生物专家在UniProt数据库中提取转运蛋白底物关系数据的工作量,新提取的结果能够较好地完善TSdb数据库中的数据和帮助生物专家进行与转运蛋白相关的生物实验设计、对生物体内转运蛋白系统的分析、在代谢通路中进行转运蛋白的定位。本文所用的方法具有简单、通用等特性,所以它能够很容易的应用到其他专用的生物数据库中。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 ;美揭示神经元转运蛋白的分子运动机制[J];科技传播;2011年08期
2 陈国红;数据库技术及其发展趋势[J];纺织高校基础科学学报;2001年03期
3 吴尧;;传媒企业如何用好数据库[J];新闻导刊;2009年03期
4 徐琳;杨晓春;;高水平数据库国际会议简述[J];中国科学基金;2006年04期
5 赵迎春;近十五年来我国数据库研究状况[J];晋图学刊;2000年02期
6 秦杰;杨树强;窦文华;;XML数据库技术研究[J];计算机科学;2003年08期
7 陈继东;;数据库发展史[J];程序员;2004年06期
8 周龙骧;未来十年数据库研究预言[J];中国计算机用户;1999年24期
9 王芳;;分布式数据库并发访问的控制和实现[J];南京工业职业技术学院学报;2006年04期
10 徐志刚;高鹏;谢健伟;;基于ArcGis的永春县土地利用数据库研究[J];长江大学学报(自然科学版);2011年01期
11 顾茜;;统一用户数据库研究初探[J];当代通信;2005年24期
12 陈啸然;任源浩;周梅仙;毛善国;李朝晖;;江苏蝴蝶电子检索网站后台数据库研究[J];安徽农学通报(上半月刊);2010年23期
13 徐雷云,朱俊高;基于SQL的土体数据库建立与应用[J];岩土力学;2005年S1期
14 李明明;王勇;容波;王婷;;基于GIS的秦始皇陵兵马俑文物保护数据库研究[J];宝鸡文理学院学报(自然科学版);2007年03期
15 周建军;;P2P技术的分布式数据库研究[J];信息与电脑(理论版);2009年11期
16 ;第27届中国数据库学术会议(NDBC 2010)系统演示征文通知[J];计算机科学与探索;2010年02期
17 ;第27届中国数据库学术会议(NDBC 2010)系统演示征文通知[J];计算机科学;2010年02期
18 程莹;张云勇;房秉毅;徐雷;;云计算时代的数据库研究[J];电信技术;2011年01期
19 萨师煊;;本刊十周年纪念征文之一——数据库的理论与实践[J];计算机科学;1983年01期
20 陈伟华;;中小型异步电机数据库系统设计[J];电机与控制应用;1992年04期
中国重要会议论文全文数据库 前10条
1 藏猛;杨国宇;李宏基;鲁维飞;郭豫杰;;猪锌转运蛋白基因的克隆及其在仔猪体内的组织分布[A];全国动物生理生化第十一次学术交流会论文摘要汇编[C];2010年
2 王玲玲;杨磊;李菲;;人类铜转运蛋白1蛋氨酸富集区与银离子的相互作用[A];中国化学会第28届学术年会第3分会场摘要集[C];2012年
3 马映华;费俭;梅镇彤;段书惠;胡佳华;郭礼和;;应用转基因小鼠模型研究γ-氨基丁酸(GABA)转运蛋白在学习与记忆及中枢神经系统中的作用[A];中国细胞生物学学会第七次会议论文摘要汇编[C];1999年
4 叶玲;ArthurL.Kruckeberg;JanA.Berden;KarelvanDam;;绿色荧光蛋白标记的己糖转运蛋白Hxt7在酵母细胞中的细胞生物学和动力学研究[A];第九次全国生物物理大会学术会议论文摘要集[C];2002年
5 王颖;麦维军;张明永;梁承邺;Serge Delrot;;水稻谷胱苷肽转运蛋白(OsGI1)启动子的分离和鉴定[A];中国的遗传学研究——中国遗传学会第七次代表大会暨学术讨论会论文摘要汇编[C];2003年
6 孙其飞;高媛;刘细保;孙启鸿;王松灵;;人唾液酸转运蛋白在涎腺的表达和定位[A];第三次全国涎腺疾病学术会议论文汇编[C];2006年
7 白雪源;陈香美;傅博;汪扬;冯哲;;高亲和力钠依赖二羧酸转运蛋白基因诱导人二倍体细胞衰老的分子机制研究[A];遗传学进步与人口健康高峰论坛论文集[C];2007年
8 彭代智;汪仕良;黎鳌;;烧伤病人血清微量元素和转运蛋白的变化及其临床意义[A];全国第三届烧伤外科学术交流会议论文摘要[C];1991年
9 鲍江;林海;;长期应激对家禽骨骼肌葡萄糖转运蛋白的影响[A];中国家禽科学研究进展——第十四次全国家禽科学学术讨论会论文集[C];2009年
10 王中山;向泉桔;王广珺;王海燕;张义正;;黄孢原毛平革菌寡肽转运蛋白基因家族的研究[A];中国的遗传学研究——遗传学进步推动中国西部经济与社会发展——2011年中国遗传学会大会论文摘要汇编[C];2011年
中国博士学位论文全文数据库 前10条
1 何娅妮;人纳/二羧基转运蛋白1的融合表达及其在肾结石发病中的作用[D];军医进修学院;2001年
2 高山;蛋白质点突变效果预测与突变数据库研究[D];南开大学;2010年
3 章丽辉;靶向寡肽转运蛋白(PEPT1)的新型结构载体前药研究[D];上海交通大学;2012年
4 卢伟东;革兰氏阳性中度嗜盐菌甘氨酸甜菜碱转运蛋白基因的克隆和功能分析[D];中国农业大学;2004年
5 杨凌;ABC转运蛋白的抑制增强伊马替尼对大鼠C6胶质瘤细胞抑制作用的研究[D];南方医科大学;2010年
6 伍国强;Na~+转运蛋白基因在荒漠植物霸王响应盐和干旱中的作用研究[D];兰州大学;2011年
7 赵军;正电子发射断层(PET)基础与临床研究:帕金森病(PD)PET受体显像实验与临床研究[D];复旦大学;2003年
8 胡佳华;1.γ-氨基丁酸转运蛋白Ⅰ(GAT1)在小鼠中枢神经系统中的生理功能 2.雄性生殖系统中基因表达与功能的初步研究[D];中国科学院研究生院(上海生命科学研究院);2003年
9 王翠娣;1. 用含有Cre重组酶的腺苷病毒载体来敲除成熟小鼠脑中腺苷Al受体及N-甲基D-天门冬氨酸(NMDA)受体的局部基因来研究腺苷在觉醒/睡眠转化中的作用 2. 5-羟色胺转运蛋白的表达与“获得性无助”(抑郁症的动物模型)的关系[D];中国协和医科大学;2003年
10 曹冬梅;苹果属小金海棠缺铁胁迫相关基因的克隆和表达分析[D];中国农业大学;2003年
中国硕士学位论文全文数据库 前10条
1 陈燕明;基于半结构化文本的转运蛋白底物信息提取系统[D];北京理工大学;2011年
2 杨若楠;小立碗藓CorA-type的镁离子转运体(PpMGTs)的分离、功能鉴定及互作初步探索[D];首都师范大学;2009年
3 杨爽;5—羟色胺转运蛋白(SERT)基因与精神分裂症的关联分析及其单核苷酸多态(SNP)研究[D];西北大学;2001年
4 徐文博;ABC转运蛋白ABCG2在皮肤恶性黑素瘤中的表达及意义[D];郑州大学;2010年
5 严鹏飞;人假想镁离子转运蛋白在胃癌细胞多药耐药性形成中的作用及机制[D];第四军医大学;2004年
6 胡欣;水稻4号染色体长臂74.5~78.2cM区段的基因注解以及水稻两组基因frr和trs的结构与功能研究[D];中国科学院研究生院(上海生命科学研究院);2004年
7 崔喜荣;小麦磷转运蛋白基因TaPT2-1的分子特征和转录调控特性研究[D];河北农业大学;2011年
8 王伟;胆固醇酯转运蛋白基因单核苷酸多态性与冠心病的相关研究[D];武汉大学;2004年
9 刘琦;头孢妥仑人体生物等效性及大鼠体内药物代谢动力学研究[D];大连医科大学;2007年
10 刘俊超;水稻硫酸盐转运蛋白OsSultr2;1的表达与功能研究[D];山东大学;2009年
中国重要报纸全文数据库 前10条
1 刘霞;美揭示神经元转运蛋白的分子运动机制[N];科技日报;2011年
2 本报记者 尹一捷;王敏:做技术要有好胜心[N];计算机世界;2011年
3 钱铮;特定蛋白质影响营养吸收[N];人民日报;2007年
4 谢涛;发布DB2V9.0 IBM全面支持XML[N];电脑商报;2006年
5 王斐;中国石油测井启动测井解释数据库研究[N];中国石油报;2008年
6 胡彦峰李长文;中油测井解释数据库研究项目启动[N];中国石油报;2007年
7 胡彦峰李长文;测井解释数据库研究项目启动[N];中国石油报;2007年
8 李泉郝社锋 王旭雁;江苏地调院数据库研究填补国内技术空白[N];中国矿业报;2007年
9 《中山大学学报》(文科版)主编、中山大学中文系教授 吴承学;警惕“数据库体”论文泛滥[N];社会科学报;2007年
10 文明;“2006年中国首届杰出数据库工程师评选”正式启动[N];科技日报;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978