收藏本站
《兰州大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

单点氨基酸多态性与疾病相关关系的预测及其机制研究

李书艳  
【摘要】:单点氨基酸多态性(Single Amino Acid Polymorphism, SAP)与人类遗传性疾病密切相关,在基因药理学领域扮演着重要角色。而对于致病性SAP位点的识别可以用于考察药物效率、毒性以及代谢等方面针对特定基因群体的效果,并有助于建立针对个体病人的最优治疗方法。因此,针对致病性SAP位点的预测研究已成为了解分子水平上的致病机理的一个关键性手段,也是当前全基因组范围内研究的热点领域之一。 本论文着眼于利用多种数学手段,以SAP与人类遗传疾病的相关关系作为主要研究对象,以探索致病性机理为主要研究目标,进行了一系列的生物信息学实验:首先,探索新型的序列描述符,并力图建立简洁、准确并可靠的SAP位点致病性预测模型,并将所建立的数学模型应用于实际工作当中,对全新SAP位点进行致病性预测,在节省实验成本和缩短实验周期的优势前提下,为实验验证提供强有力的理论支持和筛选后备样本集。而后,根据所建的数学模型和筛选的关键性描述符,在一定程度上提供解释SAP位点与疾病相关性机制的理论参考。接下来,我们从蛋白质翻译后修饰(Post-translational Modification, PTM)角度入手,统计分析因SAP破坏的PTM位点的致病性情况,进一步将致病机理解释深入到不同的PTM类型。最后,我们聚焦于棕榈酸化这一具体的PTM类型,考察分析棕榈酸化位点被SAP破坏以后的致病性情况,为SAP的致病性机制探讨提供了更为深入具体的参考资料。 论文的第一章概述了SAP研究的背景、意义和现有数据资源,以及针对SAP疾病相关性的预测原理和方法。然后,对本论文中采用的主要研究方法和步骤进行了具体介绍。 论文的第二章着眼于建立一个简洁高效的SAP与疾病相关性预测模型。我们本着要求输入简单、过程简洁、预测准确度高的原则,通过随机森林方法,建立了一个以疾病相关的氨基酸单点突变位点为识别目标的数学模型SubSeqPred。充分利用突变前后氨基酸的物理化学性质,仅利用44个蛋白序列描述符作为输入,避免了同源性和保守性等多种复杂计算,获取的模型达到了较为令人满意的效果。此后,将这一模型应用于SwissProt数据库中未分类的单点氨基酸突变位点中,为其进行了疾病相关性的注释。此外,我们根据此模型建立了全新的在线预测服务器(与模型同名为SubSeqPred),仅需输入蛋白序列和突变位点信息即可预测其疾病相关性。 论文的第三章以PTM为入手点考察疾病相关SAP位点的致病性机制。我们搜索了大量数据库中实验验证的PTM数据样本,将其分别与人类疾病相关的SAP位点、癌症体细胞SAP位点以及中性SAP位点进行匹配,并对相应位点的保守性以及氨基酸突变前后的性质变化作以统计。研究结果发现,在疾病相关SAP数据中约有4.5%的氨基酸替换会通过破坏翻译后修饰而影响蛋白功能。而另一方面,约有2%的中性替换也会影响到翻译后修饰功能。这一结果表明,翻译后修饰的破坏并非人类遗传疾病的罪魁祸首。尽管如此,我们仍发现了238个修饰位点的突变会确定性的引发人体疾病以及1289个修饰位点存在于遗传疾病相关的突变的邻域范围内,这些位点信息可作为进一步致病机理研究实验的备选目标。 论文的第四章在以上两个工作基础上,开展了针对棕榈酸化的破坏与SAP致病相关性的深入研究。首先我们利用蛋白序列描述符和随机森林方法建立了一个简洁有效的棕榈酸化位点识别模型,然后对所有的人类单点氨基酸突变位点进行预测识别,发现了若干疾病相关单点氨基酸突变位点被预测为棕榈酸化位点。通过查询文献,我们基本可以确认其中5个位点的致病性应与棕榈酸化的破坏有所关联,这一方面证明了我们所建模型的实用性,另一方面为这些SAP的致病机理解释提供了一个有效参考。 论文的第五章和第六章分别介绍了关于数学建模研究方面的两个生物信息学工作内容,即建立了T细胞表位的预测和识别的定性模型,以及蛋白质-药物分子配体的结合能力预测研究的定量模型。这两个工作均取得了准确且可靠的预测结果,为SAP建模研究分析打下了比较坚实的数学理论基础。
【学位授予单位】:

知网文化
【相似文献】
中国期刊全文数据库 前9条
1 汪伟;华琳;郑卫英;刘红;;基于独立成分分析和随机森林判别法的Microarray分析及在分子生物学中的应用[J];中国优生与遗传杂志;2009年08期
2 武晓岩;李康;;基因表达数据判别分析的随机森林方法[J];中国卫生统计;2006年06期
3 武晓岩;闫晓光;李康;;基因表达数据的随机森林逐步判别分析方法[J];中国卫生统计;2007年02期
4 李飞;高小榕;高上凯;;基于随机森林算法的高维脑电特征优选[J];北京生物医学工程;2007年04期
5 陈珊;李晓宁;梁逸曾;张志敏;刘朝霞;张启明;丁丽霞;叶菲;;拉曼光谱的荧光背景扣除及其用于药物聚类分析[J];光谱学与光谱分析;2010年08期
6 洪燕珠;周昌乐;张志枫;许家佗;;基于随机森林法的慢性疲劳证候要素特征症状的选择[J];中医杂志;2010年07期
7 马广立;赵筱萍;程翼宇;;基于随机森林与Chemistry Development Kit描述符的P-gp底物识别[J];高等学校化学学报;2007年10期
8 来海锋;韩斌;厉力华;陈岩;SUTPHEN Rebecca;祝磊;代琦;;一种基于有监督奇异值分解和随机森林的卵巢癌磷脂代谢物特征提取方法[J];中国生物医学工程学报;2010年02期
9 闫璐颖;华琳;闫岩;;随机森林滑动窗法探查类风湿疾病单核苷酸多态性及在上位显性交互研究中的应用[J];中国组织工程研究与临床康复;2011年17期
中国重要会议论文全文数据库 前6条
1 陈珊;李晓宁;梁逸曾;张志敏;;拉曼光谱的荧光背景扣除及其用于药物聚类分析[A];中国化学会第27届学术年会第09分会场摘要集[C];2010年
2 饶国强;冯辅周;江鹏程;靳莹;范结绪;;模糊识别在变速箱状态识别中的应用研究[A];2008年全国振动工程及应用学术会议暨第十一届全国设备故障诊断学术会议论文集[C];2008年
3 曹东升;许青松;梁逸曾;陈宪;李洪东;;组合树的集合体和后向消除策略去分类P-糖蛋白化合物[A];第十届全国计算(机)化学学术会议论文摘要集[C];2009年
4 刘雯;郭延芝;李梦龙;;随机森林用于激酶与底物蛋白的相互作用预测[A];中国化学会第28届学术年会第14分会场摘要集[C];2012年
5 相玉红;张卓勇;;组蛋白去乙酰化酶抑制剂的构效关系研究[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年
6 谢程利;王金桥;卢汉清;;核森林及其在目标检测中的应用[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 曹正凤;随机森林算法优化研究[D];首都经济贸易大学;2014年
2 魏松;人机对话系统中若干关键问题研究[D];北京邮电大学;2007年
3 庄进发;基于模式识别的流程工业生产在线故障诊断若干问题研究[D];厦门大学;2009年
4 郭颖;森林地上生物量的非参数化遥感估测方法优化[D];中国林业科学研究院;2011年
5 方文轩;非线性经济周期模型的随机稳定性与分岔研究[D];天津大学;2007年
6 岳明;基于随机森林和规则集成法的酒类市场预测与发展战略[D];天津大学;2008年
7 郝明;基于化学信息学方法的药物分子计算研究[D];大连理工大学;2012年
8 高碧霞;代谢综合征早期肾损害尿液多肽生物标志物的研究[D];北京协和医学院;2011年
9 张文彤;甲型流感病毒H3抗原进化及变异规律研究[D];复旦大学;2005年
10 马广立;口服药物吸收属性与人体药时曲线预测方法研究[D];浙江大学;2007年
中国硕士学位论文全文数据库 前10条
1 李贞贵;随机森林改进的若干研究[D];厦门大学;2013年
2 韩亮;基于随机森林的行人检测算法研究[D];北方工业大学;2014年
3 闫西章;近红外无创血糖检测的随机森林模型及实验系统的设计[D];吉林大学;2014年
4 肖声;基于随机森林算法的烟雾检测算法研究[D];西南交通大学;2014年
5 梁世磊;基于Hadoop平台的随机森林算法研究及图像分类系统实现[D];厦门大学;2014年
6 陈为宜;基于CUDA的霍夫森林目标跟踪算法研究[D];厦门大学;2014年
7 彭国兰;随机森林在企业信用评估中的应用[D];厦门大学;2007年
8 王驰;基于单目视觉的道路检测算法的研究[D];长春理工大学;2008年
9 邱一卉;随机森林在电信行业客户流失预测中的应用[D];厦门大学;2008年
10 孙烈;随机森林及其在色谱指纹中的应用研究[D];大连理工大学;2009年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978