收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

多维液相色谱质谱组合分析在志贺菌蛋白组基因组学中的应用

赵丽娜  
【摘要】:随着全基因组测序分析技术的快速发展,大量生物体的全基因组序列分析工作相继完成。对这些基因组的精确注释是其它组学研究的源泉和基础。目前,尽管通过生物信息学方法预测蛋白编码基因的可靠性在提高,但是由于其局限性仍会引起不少注释错误和遗漏。近年来,利用蛋白质组学方法完善基因组注释成为国际上的一个研究热点。由此诞生了一门新兴学科—蛋白组基因组学(proteogenomics),通过将质谱鉴定出的肽段定位到相应的基因组骨架上,从而把蛋白质组学数据和基因组注释进行有机整合。发展快速高通量的蛋白组基因组学研究方法仍是一项具有挑战性的工作。研究表明二维液相色谱联用基质辅助激光解吸离子化飞行时间串联质谱(2-D LC-MALDI-TOF/TOF)和二维液相色谱联用电喷雾串联质谱(2-D LC-ESI-MS/MS)的多维液相色谱质谱的组合分析可以提高鉴定蛋白的覆盖率,但目前还未见这种技术方法在基因组注释中的应用。我们实验室率先在国际上完成了志贺菌所有四个血清群代表株的全基因组序列分析工作,这使其成为一个理想的蛋白组基因组学研究对象。 本研究拟构建2-D LC-MALDI-TOF/TOF和2-D LC-ESI-MS/MS的组合分析体系以期有效地完善福氏志贺菌的基因组注释。 首先根据溶解性的不同对福氏2a志贺菌301株(S.flexnri2a str.301, Sf301)的全蛋白样品进行预分离,顺序抽提胞浆蛋白和膜蛋白,经胰酶消化后通过离线的2-DLC-MALDI-TOF/TOF和在线的2-D LC-ESI-MS/MS的组合鉴定分析,所用检索数据库为福氏2a志贺菌301株的6个读码框数据库,搜索引擎分别为MASCOT和SEQUEST。最终结果如下: 从蛋白水平验证了1231个已注释基因的表达,其在等电点pI、分子量MW和疏水性GRAVY方面的分布趋势与福氏2a志贺菌301株基因组已注释的4443个蛋白产物的分布一致。同时鉴定的蛋白涵盖了蛋白质直系同源簇数据库(clusters oforthologous groups of proteins, COGs)22功能分类组中20个,提示组合鉴定能够较好的体现了所用生物样品的蛋白质组构成情况;确认了306个假定(hypothetical)基因的表达,占福氏2a志贺菌301株总假定基因的16%;借助独创的“N-末端延伸数据库”分析方法和RT-PCR的进一步验证,3个基因(yhdP、yebJ和smpA)的翻译起始位点得到修正;另外发现两个由于测序错误造成的注释错误:假基因zwf更正为“6-磷酸葡萄糖脱氢酶”的编码基因,fusA的3’末端往下游延伸240bp;完善基因组注释最突出的贡献是发现了34个未注释的新基因,其中包括5个在其他肠道杆菌有注释而在福氏2a志贺菌301株未注释的基因以及29个全新的基因。9个新基因得到了RT-PCR或Northern blot的进一步验证。这些新基因的功能值得进一步研究。 本研究还对2-D LC-MALDI-TOF/TOF和2-D LC-ESI-MS/MS组合体系本身进行了综合分析和比较。在对鉴定肽的性质比较中发现,MALDI更倾向于离子化偏短的、碱性的、胰酶消化后C末端为精氨酸的肽段;ESI更倾向于离子化偏长的、疏水性的、胰酶消化后C末端为赖氨酸的肽段。经过优化组合,该组合分析体系大大提高了鉴定蛋白质的“质”和“量”。 综上所述,我们首次将2-D LC-MALDI-TOF/TOF和2-D LC-ESI-MS/MS组合体系应用到完善基因组注释工作中。由于MALDI和ESI的互补性,这种组合分析体系无论在蛋白质鉴定数量上还是可信程度上都要优于单一的串联质谱鉴定,鉴定的蛋白能够较好的体现生物样品的蛋白质组构成情况。用这种方法能够有效地完善福氏志贺菌的基因组注释,如已注释基因的验证、假定基因的确认、错误翻译起始位点的修正和假基因的判定,尤其是新基因的发现。因此这种技术体系具有良好的发展前景,可以推广到生物体的常规基因组注释工作中。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 禹胄,李涛,蔡涛,赵进东,罗静初;微生物基因组注释系统MGAP[J];微生物学报;2003年06期
2 师红雯;黄原;;基因产物功能分类系统[J];生命的化学;2006年04期
3 姚杨;黄原;;动物线粒体基因组的转录物作图与应用[J];生命的化学;2010年03期
4 翁洋;朱允民;李校;张义正;;基于Dempster-Shafer证据理论的组合基因预测[J];四川大学学报(自然科学版);2006年04期
5 王行国;;基因功能注释——后基因组时代面临的挑战[J];世界科技研究与发展;2007年01期
6 郎显宇;王俊;迟学斌;;Tiling Array技术与应用研究进展[J];科学通报;2008年03期
7 ;中国人基因组序列图谱首发布定名“炎黄一号”[J];中小企业管理与科技(下旬刊);2008年10期
8 罗成伟;胡钢清;朱怀球;;致病性大肠杆菌UPEC CFT073全基因组分析及致病机制的新认识[J];生物物理学报;2009年04期
9 ;生物科学专业信息资源推介[J];中国生物工程杂志;2005年10期
10 刘利;李前忠;;用核糖体扫描模型预测翻译起始位点[J];内蒙古大学学报(自然科学版);2007年02期
11 卢杰;张珈敏;林美娟;曹旭;胡远扬;;RNA病毒翻译调控元件——内部核糖体进入位点(IRES)[J];中国生物化学与分子生物学报;2007年07期
12 赵文杰;曾嘉;柳建设;邱冠周;;嗜酸氧化亚铁硫杆菌基因组分泌蛋白的初步分析[J];现代生物医学进展;2008年01期
13 胡钢清;刘永初;郑晓斌;杨一帆;佘振苏;朱怀球;;原核基因翻译起始位点预测的新方法(英文)[J];生物化学与生物物理进展;2008年11期
14 苏辉昭;向志娇;彭方印;李瑞芳;安世琦;陆光涛;唐纪良;;十字花科黑腐病菌中影响致病相关基因XC3814表达的基因鉴定[J];遗传;2010年01期
15 张运陶;丁保淼;;RS-GA-SVM方法在真核生物DNA翻译起始位点识别中的应用[J];计算机与应用化学;2007年06期
16 许花;杨泽峰;顾世梁;;基因组水平上拟南芥和水稻mrs2基因家族的比较系统发生分析[J];中国农业科技导报;2007年06期
17 王传铭;尚喜雨;;mRNA5’端发卡结构与翻译的起始调控[J];生物信息学;2008年03期
18 钟智;李宏;;5′UTR中AUG的分布及其对翻译起始的影响[J];生物物理学报;2008年05期
19 许庆炜;;语义网技术在生物本体研究中的应用[J];湖北第二师范学院学报;2009年08期
20 詹泳,周艳红,卢正鼎;基于支持向量机识别真核生物DNA中的翻译起始位点[J];生物物理学报;2003年04期
中国重要会议论文全文数据库 前10条
1 胡钢清;朱怀球;;致病性大肠杆菌CFT073菌株基因组的再注释[A];中国生物医学工程进展——2007中国生物医学工程联合学术年会论文集(下册)[C];2007年
2 ;Shotgun Proteomic Analysis of Mulberry Dwarf Phytoplasma:Evidence for Phytoplasma Energy Metabolism and Virulence[A];中国蚕学会第六届青年学术研讨会论文集(2)[C];2009年
3 高世博;张运陶;;基于AdaBoost算法的拟南芥翻译起始位点识别[A];中国化学会第26届学术年会化学信息学与化学计量学分会场论文集[C];2008年
4 刘琼;姜亮;陈平;赵其波;彭珍;倪嘉缵;;家蚕硒蛋白组的生物信息学预测与基因克隆[A];第五届全国化学生物学学术会议论文摘要集[C];2007年
5 白雪;刘海量;吕雪梅;;家鸡胚胎性别分化前后的miRNA及其表达[A];中国遗传学会第八次代表大会暨学术讨论会论文摘要汇编(2004-2008)[C];2008年
6 刘彬;刘廷辉;董金皋;;植物病原细菌的三型蛋白泌出系统的致病岛比较分析[A];中国植物病理学会2006年学术年会论文集[C];2006年
7 丁忠涛;张锐;梁成真;孙豹;林发壮;郭三堆;;棉花抗逆相关新基因GhDr1的克隆及生物信息学分析[A];中国棉花学会2010年年会论文汇编[C];2010年
8 黄小兵;陈锋;胡光强;康宁;段举;刘东菊;洪星;李涛;肖宇翔;秦海鸥;王晶;刘松;董伟;杨焕明;;1%人类基因组数据库系统[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
9 赵文生;许欣然;李艳萍;黄金光;张玮;范军;张世宏;彭友良;;两个转录因子共同结合一个新的顺式元件调控水稻OsPinA基因的诱导表达[A];中国植物病理学会2010年学术年会论文集[C];2010年
10 丁乃峥;何梅;胡劲松;何成强;陈建国;;小鼠新基因P55启动子的克隆与分析[A];中国细胞生物学学会第八届会员代表大会暨学术大会论文摘要集[C];2003年
中国博士学位论文全文数据库 前10条
1 赵丽娜;多维液相色谱质谱组合分析在志贺菌蛋白组基因组学中的应用[D];北京协和医学院;2010年
2 叶葭;基因组水平生物信息学工具的开发和应用(从ReAS到WEGO)[D];浙江大学;2006年
3 李涛;肝脏质膜蛋白质表达谱的构建及功能研究[D];中国人民解放军军事医学科学院;2009年
4 黄建军;铜绿假单胞菌噬菌体PaP2生物学特性及其基因组学的研究[D];第三军医大学;2004年
5 郝沛;生命科学研究中生物信息学技术的开发和应用[D];复旦大学;2008年
6 李校;组合多重证据促进真核生物基因结构预测[D];四川大学;2007年
7 吴大强;根际来源铜绿假单胞菌生防株M18全基因组与温度依赖转录组的比较分析研究[D];上海交通大学;2012年
8 尉研;猪链球菌2型二元调控系统2148hk/rr的研究[D];中国人民解放军军事医学科学院;2011年
9 陈霞;具有益生功能的Bifidobacterium animalis subsp. lactis V9的安全性评估、生理功效及其全基因组学研究[D];内蒙古农业大学;2010年
10 李贵阳;两株鳗弧菌全基因组序列测定及转录组比较分析[D];中国科学院研究生院(海洋研究所);2011年
中国硕士学位论文全文数据库 前10条
1 高娜;植物致病菌基因组重新注释及数据库构建[D];山东理工大学;2009年
2 张志平;噬菌体KS461-2部分特性及全基因组分析[D];河北师范大学;2009年
3 井辉;基于EST全基因组定位的基因结构注释研究[D];华中科技大学;2007年
4 王佳;基因组结构注释数据WEB可视化系统构建[D];华中科技大学;2008年
5 马立芝;鼠疫耶尔森氏菌调控子Fis蛋白比较转录谱研究及其DNA结合活性分析[D];中国人民解放军军事医学科学院;2011年
6 葛元弘;个人基因组信息管理及可视化技术研究[D];哈尔滨工业大学;2011年
7 刘利;真核生物中翻译起始位点与剪接位点的识别[D];内蒙古大学;2007年
8 冯兆勇;原核生物基因翻译起始位点的识别[D];河北工业大学;2007年
9 马闯;基因结构预测软件的测评及翻译起始位点预测[D];华中科技大学;2007年
10 张静玲;黄连作用鼠疫耶尔森菌的分子机制研究[D];重庆医科大学;2011年
中国重要报纸全文数据库 前4条
1 北京世纪坛医院肿瘤研究室 王涛;前列腺癌与早老性痴呆有相同特异蛋白[N];健康报;2009年
2 衣晓峰 乔蕤琳;哈医大建立系列生物信息学研究方法[N];中国医药报;2010年
3 记者 黄颖;江西芦笋获欧盟有机认证[N];江西日报;2011年
4 通讯员 逄莎莎 记者 刘传书 瞿剑;我科学家主导完成白菜全基因组研究[N];科技日报;2011年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978