收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于生物质谱的蛋白质组学数据处理及检索质量控制研究

贠栋  
【摘要】: 本论文的主要贡献:1.建立了复旦大学蛋白质组研究中心实验平台的数据模板,并应用于人类肝脏蛋白质组计划(Human Liver Proteome Project,HLPP)的数据交流和管理,为大规模实验数据管理和交流的标准化提供了实际经验和实现思路;2.基于2-DE(二维电泳)-MALDI-TOF/TOF(基质辅助激光解析飞行时间质谱)及类似的以蛋白质为最终分离单元的组学实验,提出了一种优化的搜索策略,避免了因共享质荷比所产生的假阳性结果,同时采用迭代搜索全面反映单元内的蛋白存在;3.针对MALDI-TOF/TOF的相关数据,通过图谱特征变量的提取和线性判别分析(Linear Discriminant Analysis,LDA),建立了PMF(PeptideMass Fingerprint)和PFF(Peptide Fragment Fingerprint)图谱的评价模型,并应用于检索质量控制研究中;4.为配合人类肝脏蛋白质组的数据分析,构建了四个参考数据集:人类及小鼠肝脏蛋白质组数据集、健康人血浆蛋白质组数据集、健康人心脏蛋白质组学数据集以及肝病相关基因及蛋白质数据集;5.应用液相等电聚焦预富集方法(Liquid-phase Isoelectric Focusing,LIEF)对小鼠肝脏蛋白质组进行分析,证明了LIEF和多实验路线结合的策略在复杂样本蛋白质组学研究中的优势。 在复杂的生命过程中,蛋白质是各种生命活动的具体实现者。1994年Williams正式提出了蛋白质组的概念,1995年Willkins正式提出了“Proteome(蛋白质组)”的专业术语及其定义。十余年来,蛋白质组学蓬勃发展,已成为生命科学、化学、信息科学等领域研究的重点与交叉的热点,被广泛地应用于各类模式生物和人类的探索之中。随着生物质谱技术的成熟,尤其是电喷雾(ESI)和基质辅助激光解吸(MALDI)等接口技术在20世纪后期的突破性发展,质谱检测满足了高通量、高分辨率的要求,逐渐替代了先前的Edman测序等生物化学手段进而成为蛋白质组鉴定的首选平台。但从蛋白质组学的发展现况来看,由于分离和检测过程还存在诸多的不完善,实验结果往往受蛋白质分离效果、丰度、化学特性等因素的影响;而各类检索算法也或多或少的存在缺陷。它们导致检索结果中常伴随有假阳性(False Positive)和假阴性(False Negative)的问题。而其解决需要实验科学和信息科学双方面的努力,其中除实验技术不断改进和发展外,数据处理流程的优化及检索质量的控制至关重要,但至今仍缺乏公认的理想数据处理范本。本文基于复旦大学蛋白质组研究中心的生物质谱平台,对目前蛋白质组数据处理流程中所涉及的数据标准化管理、检索策略的优化和质量控制等重要方面,进行了系列尝试,为进一步提高蛋白质鉴定的可靠性,以及更精确地展示生物样本的蛋白质组提供了理论依据和实现思路。 论文共分六章,内容摘要如下: 第一章:前言。概述了蛋白质组学的发展历程,对目前主要的技术体系和发展方向进行了评述。其中对蛋白质组学研究中所涉及的数据处理方法,进行了详细的综述,主要包括:数据处理流程、数据检索软件的分类及简介、数据处理所面临的挑战和目前研究的热点等。基于这些总结和评述,提出了本文的研究方向和思路。 第二章:蛋白质组实验流程及数据标准化管理初探。针对HLPP中复旦大学相关仪器设备与产出数据的特点,基于PSI(The Proteomics Standards Initiative)原则,对实验流程和数据产出进行了信息抽提,并建立了相关的数据模板。其中,所涉及的实验流程包含了目前主流的实验平台,数字化地反映了双向凝胶电泳(2-DE)、多维液相(MDLC)等分离技术及MALDI、ESI质谱的实验参数和数据参数。模板已应用于HLPP实际的数据交流和管理中,并为标准化管理大规模实验数据提供了实际经验。 第三章:大规模质谱数据分析中的非同质荷比迭代检索规则。由于目前分离过程尚无法保证每一分离单元只含一种蛋白质,因而常影响到后续的搜索过程,并产生假阳性或假阴性的匹配结果。在本章工作中,通过数据库统计和对实验数据的模拟匹配,发现检索结果之间质荷比的共享是产生假阳性的重要原因。因此,本文提出了一种优化的检索策略,首先以改进的半小数规则和频度限制对质谱进行去噪处理,然后以匹配分数高低及是否包含共享质荷比作为可信结果的评判标准,再将质谱文件中已匹配的质荷比进行过滤,产生新的质谱搜索文件并进行迭代搜索,直到没有可信结果产出为止。为进一步保证结果的可信度,反转数据库方法也被用于其中。在标准蛋白实验和法国人肝蛋白质组实验中的应用显示,非同质荷比迭代规则和反转数据库方法的结合可以更全面地反映蛋白质组的组分,同时赋予了检索结果更好的可信度。至此,为2-DE-MALDI TOF/TOF及类似实验平台,提供了一套系统可信的数据分析方法。 第四章:MALDI TOF/TOF质谱图谱的质量评价及其在检索质量控制研究中的应用。作为生物质谱数据分析的根本,质谱图谱的质量与检索结果之间息息相关,但目前相关研究所涉及的数据基本来源于离子阱质谱(主要为LTQ,LCQ)的串级数据,对于PMF图谱及基于MALDI TOF/TOF的串级数据的评价则非常少见。本文基于MALDI TOF/TOF所产生的大规模数据,通过图谱特征变量的提取和线性判别分析,建立了相应的PMF和PFF数据的评价模型。在评价模型的基础上,通过反转库分析方法,进一步讨论了PMF图谱与相关PFF图谱质量之间的影响关系、图谱质量与蛋白质检索鉴定之间的关系,最终定义了WellQuality指数,对源于同一分离单元的PMF和PFF的质量进行了统一的评价。结果显示,质谱质量是决定蛋白质匹配是否成功的决定性因素,好的图谱往往是高质量匹配的先决条件。Well Quality指数可以很好地反映分离单元质谱检测的优劣,其指数与鉴定成功率和得分之间存在着明显的线性关系。此外,对于质量较好的图谱,随机匹配的可能性也在增加,因此本文同时采用了一种新的分数背景扣除方式进行质量控制,取得了良好的效果。MALDI TOF/TOF图谱的质量评价为蛋白质鉴定的质量控制提供了新的思路,同时也对蛋白质组学实验优化和机理研究提供了新的途径。 第五章:肝脏蛋白质组参考数据集的建立及初步分析。对于组织样本的大规模蛋白质组研究方兴未艾,所产生的数据量极其可观。本章针对肝脏、血浆、心脏的蛋白质组和肝病相关基因及蛋白质的研究,建立了相关的参考数据集,并进行了初步分析。为保证数据的完备性和可靠性,基于NCBI PubMed医学文献数据库,采用人工搜索和判读的方式,对近年发表在国际知名杂志上的相关研究成果进行了遍历查询,并尽可能提取蛋白质组研究的相关参数。最终构建成四个参考数据集:人及小鼠肝脏蛋白质组数据集、健康人血浆蛋白质组数据集、健康人心脏蛋白质组学数据集以及肝病相关基因及蛋白质数据集。数据集的初步分析表明:各数据集的蛋白质存在一定的交互,而HLPP数据集对各参考数据集的覆盖均非常大。这样的重叠很可能反映了机体内各组织器官间的一些共性。同时作为机体最为重要的代谢器官,肝脏合成了很大部分的血浆蛋白,数据集间的高度交盖暗示了肝脏对于人体的重要性。这些数据的收集和整理对相关科学研究提供了系统可信的数据参考,有助于相关研究的深入和发展。 第六章基于液相等电聚焦预富集方法(LIEF)的小鼠肝脏蛋白质组研究及数据分析。预分离技术已被证明可大大促进蛋白质的鉴定效果,对低丰度蛋白尤其明显。本章通过LIEF技术对小鼠肝脏中的蛋白质进行了预富集,并结合二维凝胶电泳(2-DE)和一维反相色谱(SDS-PAGE RPLC)分析策略对富集的蛋白质进行了分析。结果表明:LIEF技术可大大增加后续2-DE分析中蛋白质斑点的数目,同时大幅度提高相应的检索质量。LIEF富集后的LC路线和2-DE之间存在良好的互补性,这说明新技术的应用和现有实验路线的融合是全面高效分析复杂生物样本蛋白质组的有效途经。同时,LIEF可以更好的反映包含修饰信息的蛋白质斑点,这对深入挖掘表达谱数据的功能状态具有重要的意义。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 李峰;杨芳;肖志强;陈主初;;临床蛋白质组学——蛋白质组学在临床研究中的应用[J];生物化学与生物物理进展;2006年01期
2 ;第五届中国蛋白质组学大会暨首届粤港蛋白质组学学术交流会在广州和香港分别召开[J];中国生物化学与分子生物学报;2007年10期
3 ;第六届中国蛋白质组学大会[J];中国农业科技导报;2008年06期
4 ;第七届中国蛋白质组学大会暨第三届国际蛋白质组学论坛成功召开[J];生命的化学;2011年04期
5 刘东;刘威;吴玉章;;研究生蛋白质组学教学改革与实践[J];现代医药卫生;2013年03期
6 李林,吴家睿,李伯良;蛋白质组学的产生及其重要意义[J];生命科学;1999年02期
7 金玉兰;邢刚;阮系真;;微生物蛋白质组学研究现状[J];浙江畜牧兽医;2014年01期
8 桑石磊;谭玉梅;刘永翔;刘作易;;蛋白质组学关键技术及应用[J];农技服务;2014年04期
9 陈龙;蛋白质组学[J];生物学教学;2000年11期
10 李林,sunm.shcnc.ac.cn;蛋白质组学的进展[J];生物化学与生物物理进展;2000年03期
11 王大东;蛋白质组与蛋白质组学[J];国外医学(分子生物学分册);2000年03期
12 葛学美,张慧,刘志民;蛋白质组学在受体及信号转导研究中的应用[J];第二军医大学学报;2001年11期
13 李峰,关勇军,陈主初;蛋白质组学及其在肿瘤研究中的应用[J];生物化学与生物物理进展;2001年02期
14 甄朱;蛋白质组学进展[J];生物工程学报;2001年05期
15 陈章权,彭世清,陈守才;蛋白质组学在感染性疾病研究中的应用[J];生命的化学;2001年05期
16 何大澄,赵和平;从基因组学到蛋白质组学[J];生物学通报;2002年09期
17 吴谋胜,彭宣宪;微生物蛋白质组学研究进展[J];微生物学报;2002年02期
18 曾嵘,夏其昌;蛋白质组学研究进展与趋势[J];中国科学院院刊;2002年03期
19 卫功宏,印莉萍;蛋白质组学相关概念与技术及其研究进展[J];生物学杂志;2002年04期
20 刘双,肖献忠;蛋白质组学发展的思考[J];医学与哲学;2002年10期
中国重要会议论文全文数据库 前10条
1 汪世华;胡开辉;;蛋白质组学的应用与发展趋势[A];福建省科协第五届学术年会提高海峡西岸经济区农业综合生产能力分会场论文集[C];2005年
2 马亚兵;;蛋白质组学与中药现代化研究[A];山东省微量元素科学研究会第三届学术研讨会论文汇编[C];2006年
3 果德安;;蛋白质组学技术在中药研究中的应用[A];中医药中青年科技创新与成果展示论坛论文集[C];2009年
4 李克;苟黎明;邵小宝;朱慧;;蛋白质组学研究中高丰度蛋白去除方法的研究进展[A];中华医学会第八次全国检验医学学术会议暨中华医学会检验分会成立30周年庆典大会资料汇编[C];2009年
5 蒋与刚;刘静;庞伟;;营养蛋白质组学研究进展与展望[A];膳食变迁对民众健康的影响:挑战与应对——第二届两岸四地营养改善学术会议学术报告及论文摘要汇编[C];2010年
6 李学任;魏路清;;蛋白质组学技术在肺部疾病应用及进展[A];中华医学会第三届全国间质性肺病暨弥漫性泛细支气管炎学术会议论文汇编[C];2010年
7 郝佩;刘琪;黄音;林建;杨少友;李亦学;;整合的蛋白质组学数据分析系统[A];中国蛋白质组学首届学术大会论文摘要集[C];2003年
8 梁宋平;张丽军;柳亦松;曹锐;谢锦云;;细胞质膜蛋白质组学研究方法与应用[A];中国蛋白质组学首届学术大会论文摘要集[C];2003年
9 张学敏;;蛋白质组学研究面临的困惑与挑战[A];中国蛋白质组学第二届学术大会论文摘要论文集[C];2004年
10 杨礼富;;蛋白质组学主要研究技术以及微生物蛋白质组学研究进展[A];中国蛋白质组学第二届学术大会论文摘要论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 熊继先;磷酸化蛋白质组学新方法的研究与应用[D];湖南师范大学;2010年
2 贠栋;基于生物质谱的蛋白质组学数据处理及检索质量控制研究[D];复旦大学;2007年
3 张婕;蛋白质组学多维色谱质谱分析平台新技术新方法研究[D];复旦大学;2006年
4 张磊砢;病毒粒子以及病毒和宿主相互作用的蛋白质组学分析[D];武汉大学;2013年
5 郝建荣;Pseudomonas stutzeri SDM催化特性及蛋白质组学研究[D];山东大学;2006年
6 贾韦韬;生物质谱新技术与新方法及其在蛋白质组学中的应用研究[D];复旦大学;2006年
7 袁泉;双向凝胶电泳技术研究及其在蛋白质组学中的应用[D];中国科学院研究生院(上海生命科学研究院);2004年
8 赵勇;生物质谱在蝎毒素蛋白质组学中的应用及其蛋白质翻译后修饰检测研究[D];武汉大学;2011年
9 熊霞;大鼠背根神经节细胞质膜蛋白质组学研究[D];湖南师范大学;2009年
10 陈平;蛋白质组学研究相关技术的发展及其在大鼠海马细胞膜蛋白质组研究中的应用[D];湖南师范大学;2005年
中国硕士学位论文全文数据库 前10条
1 高雪;基于知识图谱的蛋白质组学发展研究[D];中国人民解放军军事医学科学院;2011年
2 曾勇;人类外周血单核细胞蛋白质组学研究[D];湖南师范大学;2012年
3 庞乐君;基因组学和蛋白质组学对新药研发的影响[D];中国人民解放军军事医学科学院;2005年
4 曹璟;中介蝮蛇毒蛋白质组学研究[D];陕西师范大学;2007年
5 张罗敷;三维串联液质联用蛋白质组学分离方法的建立[D];上海交通大学;2012年
6 王馨悦;线虫磷酸化蛋白质组学的系统分析[D];吉林大学;2013年
7 邢晓华;果蝇组织特异性的定量蛋白质组学研究[D];北京工业大学;2013年
8 周红;间斑寇蛛粗毒的采集、生物活性分析和蛋白质组学研究[D];湖南师范大学;2005年
9 聂松;关于蛋白质组学的几种方法学研究[D];湖南师范大学;2004年
10 唐育虹;波谱解析在蛋白质组学中的应用与研究[D];同济大学;2006年
中国重要报纸全文数据库 前10条
1 阳光;中科院大连化物所为蛋白质组学研究提供新方法[N];中国医药报;2007年
2 李江;第六届中国蛋白质组学大会召开[N];医药经济报;2009年
3 吴志军 郝成涛;我科学家荣获首届“国际蛋白质组学成就奖”[N];科技日报;2009年
4 郝成涛;贺福初荣获国际蛋白质组学成就奖[N];中国医药报;2009年
5 吴志军 记者 张锋;我国人类重大疾病蛋白质组学研究启动[N];解放军报;2002年
6 高等学校蛋白质组学研究院;蛋白质组学将造福人类[N];科技日报;2001年
7 齐继成;方兴未艾的蛋白质组学研究[N];中国医药报;2002年
8 王兵;走近蛋白质组学研究[N];中国医药报;2002年
9 吴志军 胥金章;我国启动重大疾病蛋白质组学研究项目[N];中国高新技术产业导报;2002年
10 郝成涛;我国蛋白质组学研究势头强劲[N];中国医药报;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978