收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于梯度提升决策树的肽碎片离子强度建模

怀浩  
【摘要】:蛋白质的鉴定是蛋白质组学的一个重要分支,其目标主要是对生物体内的蛋白质数量与种类进行鉴定。基于串联质谱的质谱测序技术已经成为现阶段蛋白质序列鉴定的核心技术之一。在生物实验室中,每天都有大量的质谱数据产生,其数量远超出了人工处理数据的能力。目前基于串联质谱数据对蛋白质鉴定主要有三种方法,分别为数据库搜索方法、从头测序方法和肽序列标签查询方法。数据库搜索方法是最为常用的一种方法,其主要算法是基于串联质谱数据的肽谱匹配算法。串联质谱鉴定的目标是根据给定的质谱数据推算出氨基酸序列,进而推断出蛋白质,其中关键点是对理论图谱做出正确预测。由于对肽段断裂机理的定性认识不足以做出正确的预测,还需要定量分析断裂机理的影响因素,如断裂位点以及断裂位点的肽碎片属性等,以提高对理论图谱的准确预测,从而增加蛋白质鉴定的准确度。本文通过阅读文献总结出肽碎片离子特征,将总结的肽碎片离子特征转换为便于计算的实验数据,使用梯度提升决策树算法来构建离子强度预测模型并做出理论预测。首先,对原始串联质谱数据集做预处理,对处理后的数据使用蛋白质鉴定引擎pFind进行鉴定;其次,设定过滤条件对鉴定出的结果进行过滤操作,获得高可信的肽序列;第三,计算出肽序列中的离子质荷比与离子特征值,通过匹配质谱数据中离子的质荷比获取对应的离子强度信息,使用强度信息与离子特征值构建实验数据;第四,将实验数据划分为训练数据、验证数据与测试数据,使用梯度提升决策树算法在训练数据与验证数据上构建预测模型;最后,使用构建完成的预测模型对测试数据做离子强度理论预测。分析理论质谱肽序列的离子强度与实验质谱离子强度的相似度和及皮尔森相关系数,结果表明构建的预测模型有着较高的准确率,并且可以从预测树中总结出对强度值影响较大的离子特征。


知网文化
【相似文献】
中国期刊全文数据库 前16条
1 钱东斌;;纳秒激光诱导C_(60)分子碎裂实验中轻碎片离子C_n~+(n<30)的产生机制研究(英文)[J];IMP & HIRFL Annual Report;2007年00期
2 钱东斌;马新文;张大成;祖凯玲;刘惠萍;汶伟强;;纳秒激光诱导C_(60)分子碎裂中轻碎片离子C_n~+(n<30)的产生机理研究[J];物理学报;2008年09期
3 邱体孝;刘锡兰;;离子强度对配合物间电子转移反应速度的影响[J];四川师范学院学报(自然科学版);1989年01期
4 陈国华,杨林;恒离子强度下KCl+K_2SO_4+H_2O溶液中氯化钾活度系数的测定[J];山东海洋学院学报;1987年02期
5 周大炜;徐艳丽;吴俊丽;;6种罕见核苷糖电喷雾质谱裂解规律的初步研究[J];药学学报;2012年03期
6 蒋中英;张国梁;马晶;朱涛;;磷脂在膜结构间的交换:温度和离子强度的影响[J];物理学报;2013年01期
7 初明晨;梁春余;杨家振;关在汉;张丽明;孙永康;;多组分电解质溶液热力学 Ⅱ.HCl+CoCl_2+H_2O体系,298.15K[J];辽宁大学学报(自然科学版);1984年02期
8 初明晨;杨家振;梁春余;李秀萍;孙本山;;多组分电解质溶液热力学 Ⅲ.5—45℃ HCl+NiCl_2+H_2O体系中HCl的活度系数[J];辽宁大学学报(自然科学版);1984年02期
9 郑国和,王敖金,杨俭华,胡坤生,林书煌;菌紫质人工膜的光电压与离子强度的非线性关系[J];生物工程进展;1997年04期
10 朱正荣;高兰长;;电子计算机在配制缓冲溶液上的应用[J];曲阜师院学报(自然科学版);1984年01期
11 杨家振;梁春余;初明晨;袁宏冰;施琪;;多组分电解质溶液热力学 Ⅳ.5-45℃ HCl+CoCl_2+H_2O体系中HCl的活度系数[J];辽宁大学学报(自然科学版);1984年02期
12 梁春余;杨家振;初明晨;杨永珍;陈振东;李万余;;多组分电解质溶液热力学 Ⅰ.HCl+NiCl_2+H_2O体系的活度系数,298.15K[J];辽宁大学学报(自然科学版);1984年02期
13 蔡良婉;;人类DNA高重复顺序复性产物某些特性的研究[J];中国医学科学院学报;1983年01期
14 刘玉鹏;陈瑞爱;李超;施振旦;;猪卵泡抑素基因成熟肽序列的克隆及其在大肠杆菌中的表达[J];中国畜牧兽医;2013年11期
15 逯艳雪;刘维敏;;提取SOD的关键之一是控制离子强度[J];天然产物研究与开发;1993年03期
16 王保栋,张正斌,刘莲生,郑士淮;天然水体中悬浮颗粒物电泳性质的研究——Ⅰ.离子强度及pH对悬浮颗粒物电泳淌度的影响[J];海洋学报(中文版);1990年01期
中国重要会议论文全文数据库 前1条
1 刘洪涛;唐紫超;;强激光场下小分子的碎片离子强度和解离动能的精确测定[A];第九届全国化学动力学会议论文摘要集[C];2005年
中国博士学位论文全文数据库 前4条
1 鲁晶;不同尺度下纳米TiO_2在水中聚集和沉积特性研究[D];哈尔滨工业大学;2016年
2 毕言锋;基于高分辨质谱技术的β-受体激动剂在猪体内的代谢研究[D];中国农业大学;2014年
3 李艳;土壤腐殖酸与酶蛋白相互作用的机制[D];华中农业大学;2013年
4 唐小锋;阈值光电子—光离子符合速度成像及其应用研究[D];中国科学技术大学;2011年
中国硕士学位论文全文数据库 前8条
1 怀浩;基于梯度提升决策树的肽碎片离子强度建模[D];山东理工大学;2017年
2 徐秀姣;环丙沙星在多孔介质中的迁移及模拟研究[D];青岛大学;2015年
3 米娜;盐离子对牛血清蛋白在PVDF超滤膜面的吸附及解吸行为影响特征[D];西安建筑科技大学;2016年
4 徐仁杰;离子强度智能开关溶剂—有机物体系相平衡热力学研究[D];扬州大学;2017年
5 邓东旭;离子强度对不同电性蛋白质超滤膜污染行为的影响机制研究[D];西安建筑科技大学;2017年
6 李文艳;基于决策树的企业销售人员招聘模型的研究与实现[D];宁夏大学;2017年
7 展咪咪;短肽序列的合成及其糖识别性能的研究[D];武汉理工大学;2015年
8 刘学;基于深度信念网络的理论质谱预测[D];山东理工大学;2017年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978