收藏本站
《中国人民解放军军事医学科学院》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于本体的蛋白质相互作用信息文本挖掘方法研究

李满生  
【摘要】: 蛋白质相互作用(Protein-Protein Interaction, PPI)是生命活动中一种极其重要的生物分子关系,其研究不仅具有理论意义,还具有较强的应用价值。近年来,随着研究深入,报道各种蛋白质相互作用的生物医学文献数目激增,生物学家阅读文献获取蛋白质相互作用信息的速度难以追赶文献增长速度,从而从文献中挖掘蛋白质相互作用知识成为人们面临的一大挑战。采用文本挖掘手段自动从文本中挖掘蛋白质相互作用信息,并将这些信息进行结构化展示是解决这一挑战的有效方法。目前,该领域当前存在一些重要问题亟待解决,例如蛋白质相互作用关系挖掘方法所取得的效果还有待提升;很少有工作进一步挖掘蛋白质相互作用注释信息;用于描述蛋白质相互作用信息知识体系不完善以及蛋白质相互作用信息展示缺乏一个良好结构等等。针对这一系列问题,我们提出本课题目标:在蛋白质相互作用关系挖掘基础上,进一步挖掘蛋白质相互作用的注释信息。 首先,我们构建了蛋白质相互作用本体。为了更好地挖掘蛋白质相互作用注释信息,本文从蛋白质相互作用实质——生物分子事件——入手,提出蛋白质相互作用本体框架,一个蛋白质相互作用事件应该包括蛋白质相互作用发生时间、地点、发生方式、结果以及证据等方面信息。通过这个框架明确了蛋白质相互作用信息的范畴,通过重用现有本体以及重新构建蛋白质相互相互作用类型本体,整合得到了包括蛋白质状态、蛋白质相互作用类型、生物学过程、亚细胞定位、生物学功能以及检测方法六个部分在内的蛋白质相互作用本体。 然后,开发了对文本进行了蛋白质相互作用关系挖掘的SVM方法。该方法为了判断蛋白质相互作用关系是否存在需要选择句子特征,包括词特征、词性特征、逻辑特征以及句法特征,并对这些特征进行组合。在测试语料上,基于SVM方法取得了准确率为82.4%,召回率为73.7%和F值为77.8%的效果。我们将该方法用于小鼠肝脏蛋白质相关文献中蛋白质相互作用关系挖掘任务。另外,还基于网络服务工具ProteinCorral对同样的语料集进行蛋白质相互作用关系挖掘。然后对两种方法进行了比较。 进一步,我们在蛋白质相互作用关系挖掘基础上,基于蛋白质相互作用本体受控词汇对这些蛋白质相互作用关系进行注释信息挖掘,其中49.1%的蛋白质相互作用(PPI)能够从句子中挖掘其注释信息。同时,我们采用网络服务工具EBIMed实现蛋白质相互作用信息挖掘任务,分析发现,45.0%的蛋白质相互作用在句子中找到功能注释,90.1%的蛋白质相互作用在摘要中有功能注释。 最后,设计了数据库用于存储得到的小鼠肝脏相关蛋白质相互作用信息,构建在线服务平台,为用户提供基于本体、蛋白质名称和蛋白质相互作用三种方式来查询蛋白质相互作用。基于本体的层次结构在整体上展示了蛋白质相互作用信息分布,为用户查找相应功能蛋白质相互作用及其注释信息提供了帮助。 综上所述,本文工作有以下几点创新之处: (1)新的蛋白质相互作用本体的构建。从生物分子事件角度出发,提出一个符合蛋白质相互作用信息描述以及适用于文本挖掘任务的本体,该本体概括了蛋白质相互作用发生的生物学过程、亚细胞定位、生物学功能、相互作用类型、相互作用发生证据以及发生相互作用时蛋白质状态等信息。 (2)将SVM方法在蛋白质相互作用关系文本挖掘方面的成功应用。将蛋白质相互作用关系挖掘作为一个分类问题,选取并组合句子相关特征用于判断蛋白质相互作用关系,进一步提高了蛋白质相互作用关系挖掘的效果。 (3)基于本体受控词汇对蛋白质相互作用注释信息的挖掘。蛋白质相互作用注释信息对于蛋白质相互作用动态子网络构建极其重要,这些信息能够更准确地描述蛋白质相互作用在细胞活动中发生的时间、地点以及完成的生物学功能。 (4)基于本体对蛋白质相互作用信息进行查询与展示。鉴于本体具有良好层次结构,我们利用本体对蛋白质相互作用信息进行了展示和分类,更利于研究人员对蛋白质相互作用信息查询以及进行不同功能的蛋白质相互作用比较。 总之,本文提出了一种从文献中挖掘蛋白质相互作用及其注释信息的新方法,基于本体的蛋白质相互作用表示方法有利于更好的描述蛋白质相互作用信息,在线数据库可以为蛋白质相互作用信息的查询和使用提供了更方便的服务。
【学位授予单位】:中国人民解放军军事医学科学院
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:Q51

【相似文献】
中国期刊全文数据库 前10条
1 杨生举;马燕玲;;科研项目立项决策支持系统设计与实现[J];甘肃科技;2011年13期
2 于娟;党延忠;;术语工作中文本挖掘方法的应用探索——信息管理与知识管理科技名词审定工作方法[J];中国科技术语;2011年04期
3 罗玮;周天鸿;闫道广;;ORP8与SPAG5相互作用并影响细胞周期[J];现代生物医学进展;2011年14期
4 谢晔;霍国庆;刘丽红;张晓东;牛玉颖;;团队领导研究的回顾及展望[J];科学学与科学技术管理;2011年07期
5 李芹芹;史道华;杨牛牛;;基于雷帕霉素与FRB结合的蛋白质间相互作用的相关技术[J];生物技术通报;2011年09期
6 吴怡;王岚;刘兰;韩清;;顺序转化法进行酵母双杂交筛选相互作用蛋白质[J];沈阳医学院学报;2011年03期
7 杜芳芳;;数据挖掘技术在远程教学辅助系统中的应用研究[J];河南科技;2011年12期
8 郭佳效;侯信;;糖芯片最新研究进展[J];化学进展;2011年08期
9 陈晓娟;杨宇东;孙莉;胡日查;邢雅玲;陈忠斌;;SARS冠状病毒PLpro蛋白酶对泛素样分子的DUB活性[J];中国生物化学与分子生物学报;2011年07期
10 董国福;吴可;;生物大分子EPR距离测量方法应用新进展[J];中国体视学与图像分析;2011年02期
中国重要会议论文全文数据库 前10条
1 王红阳;;蛋白质相互作用谱研究的思考[A];中国蛋白质组学第二届学术大会论文摘要论文集[C];2004年
2 夏献民;严定国;胡俊波;王桂华;徐戎;曾繁典;;蛋白质相互作用能作为药物研发的靶点吗[A];药学发展前沿论坛及药理学博士论坛论文集[C];2008年
3 许超;张家海;黄小娟;孙建萍;徐应琪;唐雅君;吴季辉;旌蕴逾;黄秋花;张庆华;;核磁共振波谱研究蛋白质相互作用[A];第十四届全国波谱学学术会议论文摘要集[C];2006年
4 郭延芝;余乐正;李梦龙;;利用蛋白质序列信息预测蛋白质相互作用[A];第九届全国计算(机)化学学术会议论文摘要集[C];2007年
5 杨晓明;王建;许望翔;虞东辉;杨永升;刘琼明;周颖;张翠莉;吴志豪;张万巧;刘涛;唐刘君;原艳芝;郝峰;金超智;贺福初;;人类肝脏重要蛋白质相互作用连锁图研究进展[A];中国蛋白质组学第三届学术大会论文摘要[C];2005年
6 张智红;储军;秦岭松;骆清铭;;活细胞内多对蛋白质间相互作用的同步光学成像研究[A];第十一次中国生物物理学术大会暨第九届全国会员代表大会摘要集[C];2009年
7 李令东;田瑞军;唐伟;邹汉法;赵宗保;;携异戊烯链小分子与蛋白质相互作用的研究[A];第六届全国化学生物学学术会议论文摘要集[C];2009年
8 陈吉楠;张红;Amy E.Keating;蒋太交;;多层次整合思路预测参与酵母囊泡转运的coiled coil介导的蛋白质相互作用[A];第十一次中国生物物理学术大会暨第九届全国会员代表大会摘要集[C];2009年
9 朱泳璋;李擎天;褚嘉佑;石铁流;郭晓奎;;利用蛋白质相互作用网络系统分析百日咳杆菌相变异[A];2006中国微生物学会第九次全国会员代表大会暨学术年会论文摘要集[C];2006年
10 朱泳璋;李擎天;褚嘉佑;石铁流;郭晓奎;;利用蛋白质相互作用网络系统分析百日咳杆菌相变异[A];上海市预防医学会第二届学术年会论文汇编[C];2006年
中国重要报纸全文数据库 前10条
1 甄蓓;我科学家成功绘制人类肝脏蛋白质相互作用网络连锁图[N];科技日报;2011年
2 本报记者 施鹏;非结构信息和文本挖掘[N];21世纪经济报道;2009年
3 通讯员 甄蓓 特约记者 吴志军;肝脏蛋白质相互作用图绘出[N];健康报;2011年
4 周青 编译;文本挖掘工具实现非结构化数据价值[N];计算机世界;2004年
5 胡德荣;蛋白质相互作用网络预测新方法被发现[N];健康报;2007年
6 余志平 编译;PCAs给我们带来了什么?[N];中国医药报;2007年
7 ;SAS公司收购Teragram 强化BI领域地位[N];计算机世界;2008年
8 本报记者 张晶;怎样挖掘专家的活的经验和智慧[N];科技日报;2011年
9 毛黎;美开发细胞内蛋白质相互作用标识技术[N];科技日报;2007年
10 白毅;我国计算生物学研究取得重要进展[N];中国医药报;2007年
中国博士学位论文全文数据库 前10条
1 张万巧;细胞周期调控蛋白质相互作用网络及接头分子TANK募集细胞周期激酶PLK1抑制NF-κB信号通路的机制研究[D];中国人民解放军军事医学科学院;2010年
2 何文英;若干中草药活性组分与几种球状蛋白质相互作用的研究[D];兰州大学;2006年
3 唐江宏;有机小分子与人血清白蛋白的相互作用研究[D];兰州大学;2006年
4 刘月明;人新基因EOLA1生物学特性及相互作用蛋白研究[D];第三军医大学;2004年
5 徐晓丽;拟南芥线粒体中交替型NAD(P)H脱氢酶活性复合体的蛋白质相互作用研究[D];兰州大学;2010年
6 符庆瑛;大肠杆菌双杂交筛选AMPKα2相互作用蛋白[D];第三军医大学;2007年
7 唐刘君;大规模人类肝脏蛋白质相互作用网络研究[D];中国人民解放军军事医学科学院;2009年
8 陈永对;颗粒蛋白前体与血管生成素相互作用及其功能研究[D];浙江大学;2009年
9 樊晋宇;基于mCherry的双分子荧光互补系统研究[D];华中科技大学;2008年
10 刘暴;兔急性下肢缺血模型的建立及比较蛋白质组学的研究[D];中国协和医科大学;2003年
中国硕士学位论文全文数据库 前10条
1 黄娟;基于文本挖掘技术的蛋白质相互作用预测方法研究[D];中南大学;2009年
2 刘明岩;面向语义关系发现的文本挖掘研究[D];南京理工大学;2010年
3 薛浩;基于SOM聚类的WEB文本挖掘及其结果的可视化研究[D];南京航空航天大学;2010年
4 李钝;基于粗糙集理论的文本挖掘技术研究[D];山西大学;2003年
5 程春惠;公安犯罪案件文本挖掘关键技术研究[D];浙江大学;2010年
6 徐爱华;面向文本分类的中文文本挖掘技术研究及实现[D];武汉理工大学;2004年
7 刘岩;基于Web的文本挖掘技术的研究[D];哈尔滨工程大学;2004年
8 姚继伟;基于XML的Web文本挖掘的研究[D];吉林大学;2010年
9 易高翔;Web文本挖掘研究与实现[D];武汉科技大学;2004年
10 赵振华;重复基因在分子互作网络中的分歧进化及相互作用网络构建[D];西北农林科技大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026