收藏本站
《中国人民解放军军事医学科学院》 2009年
收藏 | 手机打开
二维码
手机客户端打开本文

基于质谱血清多肽组谱图的管理分析系统构建与应用研究

曹源  
【摘要】: 在后基因组时代,随着人类和其他模式生物基因组测序的完成以及质谱仪器和方法取得的重要突破,蛋白质组学在基础研究和临床应用等方面取得了巨大进展。临床蛋白质组学是蛋白质组学新近出现的一个分支学科,它侧重于蛋白质组学技术在临床医学领域的应用研究,包括疾病预防、早期诊断和辅助治疗等方面。临床蛋白组学涉及多种数据类型,血清多肽组谱图(简称血肽图)是其中比较重要的一种,是基于非凝胶系统的临床蛋白质组学应用研究,其基本原理是通过基质辅助激光解吸电离飞行时间质谱(matrix-assisted laser desorption/ionization time-of-flight mass spectrometry, MALDI-TOF/MS)或表面增强激光解吸电离飞行时间质谱( surface-enhanced laser desorption/ionization time-of-flight mass spectrometry, SELDI-TOF/MS)检测血清中多肽组的精确质量数,然后采用生物信息学方法处理获得的一种数据。通过比较疾病与健康对照血肽图的差异,人们可以发现疾病特异表达的蛋白或多肽,进而有助于在蛋白水平研究疾病的发生机制。 血肽图技术在生物标志物发现、疾病早期诊断和个性化治疗等领域有着广泛的应用前景。然而血肽图技术应用于临床研究过程中必须考虑下列一些因素。首先是样本选择对血肽图技术的影响,对于临床研究所需要收集的疾病患者和正常对照人群样本,要考虑到样本个体间差异和个体内差异,正常对照人群个体间差异包括年龄、性别、种族、家族史和疾病史等,疾病患者样本最好包含完整的疾病亚型,收集的信息要尽可能完整,以便满足构建数学模型和验证的需要。其次是样本收集对血肽图技术的影响,这属于分析前差异,包括样本收集、存储和运送过程中由于环境条件差异对样本所产生的影响,由于这些差异一般与疾病无关,有可能增加寻找与疾病相关的差异蛋白质或多肽的复杂性,最终影响血肽图分析的结果。最后是仪器分析的差异对血肽图技术的影响,血肽图技术需要的质谱仪器主要是MALDI-TOF/MS和SELDI-TOF/MS。由于质谱实验过程中存在多种影响因素,质谱产生的原始谱图数据包含了大量的噪音信号,必须进行预处理以去除干扰。 鉴于血肽图具有变量个数和样本数目均众多的特点,面对这样复杂的数据,只有通过生物信息学方法,才能识别出与疾病密切相关的一组多肽峰,发现血肽图中与疾病相关的特征信息。然而,现有的数据管理与分析工具已经无法满足当前的需要,而商业化软件由于价格昂贵,也在一定程度上制约了血肽图技术的广泛应用。为此,我们将临床蛋白质组学与生物信息学相结合,开发了一套基于质谱血清多肽组谱图的管理分析系统BioSunMS。该系统基于ECLIPSE插件架构,采用JAVA语言开发,具有易于发布及二次开发,界面友好,跨系统平台等特点,便于管理临床样本、质谱谱图和对质谱谱图进行预处理和建模分析,从而为相关研究人员方便快捷地开展疾病分类与分型研究提供帮助,最后,我们以基于肺癌患者血肽图的样本分类和分型研究为例说明BioSunMS的功能,具体内容如下。 1.血肽图数据库构建 血肽图数据库主要用来存放正常人以及多种肿瘤(包括肺癌、肝癌、乳腺癌、直肠癌、前列腺癌和白血病等)患者的血清多肽谱、样本及其临床相关信息。该数据库主要包含样品来源、诊断方法、样品处理过程、质谱检测方法、血清多肽质谱数据等内容。该数据库主要提供了下列重要功能:血清多肽图查询,通过该系统,用户可获得特定肿瘤的血肽图的标志谱峰及其对应的多肽序列;各种疾病血肽图数据的提交,通过此系统,研究人员可以将自己实验室收集的疾病血肽图数据,提交到本数据库中,从而丰富了数据库中的疾病种类;血肽图疾病信息分析,检测人员将临床获得的血肽图直接通过本数据库进行查询,从而得到疾病相关信息。 2.血肽图数据处理与分析的软件开发 为了快速准确地开展以血肽图数据为基础的肿瘤分类与分型研究,开发了血多肽数据处理与分析模块。数据处理模块可实现对获得的血肽图质谱数据实现质谱图展示、数据导入、导出、格式转化和预处理等功能。数据分析模块具有对预处理后的数据进行统计学分析,找到特征谱峰,建立血肽图模型,对盲样进行判别等功能,可实现快速、自动化发现生物标志物等相关分析。 3.基于血肽图数据的肿瘤分类与分型研究 以支持向量机(SVM)、主成分分析(PCA)、遗传算法(GA)、朴素贝叶斯方法(Na?ve Bayes)和偏最小二乘法(PLS)等常用的统计学及机器学习方法为工具,以血肽图数据库中的数据为基础,构建了基于血肽图数据的肿瘤分类与分型模块,并提供模型参数优化功能,便于相关人员开展肿瘤分类与分型研究工作。 4.肿瘤特征性血肽图模型建立 该研究是与国家仪器分析中心合作开展的。在前期工作中,国家仪器分析中心已经完成了1000例健康人群和2000多例肺癌、肝癌、乳腺癌、直肠癌、前列腺癌和白血病等肿瘤患者的血肽图高分辨质谱数据采集。在此基础上,运用BioSunMS系统对数据库中254例肺癌组以及257例正常对照组的血肽图进行分析。首先,我们以150例肺癌组样本和150例对照组样本的血肽图数据构建了训练集,剩余104例肺癌组样本和107例正常对照组样本的血肽图构建了测试集。通过t检验进行变量选择,以P0.005为标准,筛选出74个特征谱峰。以这些变量为基础,我们采用SVM方法构建了肺癌血肽图的分类模型,并用测试集进行了验证。对于测试集,分类准确度、敏感性和特异性分别是92.3%,96.3%,94.3%。通过上述分析,我们发现了一些肺癌特征质谱谱峰信息,并以这些谱峰信息为特征,构建了基于质谱血肽图的肺癌早期诊断模型,对肺癌的早期诊断研究进行了初步的探索。 综上所述,该研究构建了一个集质谱血清多肽组谱图的数据库管理和分析为一体的软件BioSunMS,并应用该系统对肺癌血肽图数据进行了初步分析,构建了肺癌血肽图早期诊断模型,为基于质谱血肽图的相关研究提供了生物信息学支持。
【学位授予单位】:

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 李治洪;肽图分析在基因工程药物质量控制中的应用[J];药学进展;1998年03期
2 张培培,杨化新,徐康森;胰岛素的HPLC肽图谱分析[J];药物生物技术;1996年02期
3 邓兆勇,苏广海;高效液相色谱法测定脑活素注射液中的氨基酸含量及肽图分析[J];中国生化药物杂志;1995年01期
4 杨珺,毛旭虎,朱永红,邹全明;rUreB亚单位疫苗中试产品的纯度检测和肽图分析[J];微生物学杂志;2004年05期
5 杨鹏云,程雅琴,袁汉成;应用胰蛋白酶裂解反相HPLC法分析rHuEPO肽图[J];中国生物制品学杂志;1997年04期
6 张翊,王军志,郭莹,饶春明;重组人GM-CSF的理化特性及其肽图的研究[J];中国肿瘤生物治疗杂志;1998年02期
7 纪宏,王军志,王旻;重组人纽表位肽12的胃蛋白酶切肽图分析方法的研究[J];药物生物技术;2004年05期
8 周伟,吴玉章;乙肝治疗性疏水肽胰蛋白酶消化肽图的LC-MS验证[J];第三军医大学学报;2002年10期
9 张慧;辛中帅;李晶;梁成罡;杨化新;;快速液相色谱在重组人胰岛素肽图分析中的应用[J];药物分析杂志;2008年04期
10 张占全,郭莹,饶春明,张丽娜;重组人白介素2梯度胶的肽图分析[J];中国肿瘤生物治疗杂志;1998年01期
11 饶春明,张翊,韩春梅,王军志;重组人白细胞介素-11的胰蛋白酶切肽图分析[J];药学学报;2000年05期
12 张建文,何俊,胡凝珠,郭仁;Ⅰ型脊髓灰质炎病毒壳蛋白肽图谱分析[J];病毒学报;1989年01期
13 杨国玲,吕绥生,胡晓愚,盛树力,郭春远,陈雁红;血管紧张素Ⅰ转换酶抑制剂的合成及生理活性研究[J];兰州大学学报(自然科学版);1991年04期
14 韩世杰;田军;;流行性出血热病毒结构蛋白的肽图分析[J];山东大学学报(医学版);1993年02期
15 余礼碧,张坐奎,张勤;脑蛋白水解物提取液—氨基酸及肽复合物的研究[J];西南国防医药;1998年01期
16 韩世杰,李瑞梅;腮腺炎病毒结构蛋白VP1—4肽图分析[J];山东大学学报(医学版);1988年01期
17 梁成罡;李晓东;张慧;杨化新;徐康森;;液质联用技术(LC-MS)在rh-PTH(1-34)肽图确定中的应用[J];药物分析杂志;2005年08期
18 史新昌;饶春明;杨英;刘兰;韩春梅;赵阳;张翊;王军志;;重组人酸性成纤维细胞生长因子C-末端测序[J];药物分析杂志;2006年01期
19 王广;吕高辉;沈新影;王英伟;;猪源、牛源肝水解肽的质量对比研究[J];中国生化药物杂志;2008年02期
20 杨英;饶春明;王威;韩春梅;王军志;;液质联用分析重组人白细胞介素-11的肽图[J];药学学报;2006年08期
中国重要会议论文全文数据库 前2条
1 陶磊;饶春明;王兰;韩春梅;李响;高凯;王军志;;人源化抗表皮生长因子受体抗体质控方法和质量标准研究[A];2011年中国药学大会暨第11届中国药师周论文集[C];2011年
2 周勇;王丽;于传飞;杨鹏云;王箐舟;侯继锋;王军志;;PEG化重组人促红素质量控制方法和标准研究[A];2011年中国药学大会暨第11届中国药师周论文集[C];2011年
中国博士学位论文全文数据库 前3条
1 梁婷婷;血清多肽图用于急性白血病诊断及疗效评价的研究[D];吉林大学;2011年
2 董玉莲;一种海产小杂鱼酶解物生理活性组分的分离纯化与表征[D];中国科学院研究生院(广州地球化学研究所);2002年
3 唐志红;镭普克(rAPC)关键工艺的建立及抗肿瘤活性的研究[D];中国科学院研究生院(海洋研究所);2004年
中国硕士学位论文全文数据库 前2条
1 冯一建;重组人角质细胞生长因子-I聚乙二醇修饰及体内外活性研究[D];重庆理工大学;2012年
2 张雪梅;聚乙二醇化重组人干扰素α_(2b)性质及冻干保护剂的研究[D];吉林大学;2005年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978