收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

调控性SNP结构特征的生物信息学分析和分子动力学模拟研究

张志毅  
【摘要】:随着现代医学的发展和人民生活水平的提高,过去一些严重威胁人类健康的传染病、营养性疾病得到大幅控制,而遗传病则成为比较突出的问题。当前一些影响人类健康和寿命的主要疾病如高血压、糖尿病、癌症、精神疾病等都发现和遗传因素有不同程度的关联。因此,近年来寻找基因序列差异与常见疾病易患体质之间的相关性成为研究热点。对多种疾病开展的全基因组关联研究已给出很多与疾病相关的单核苷酸多态性(Single Nucleotide Polymorphism,SNP),其中多数位于非编码区。 当前非编码区的功能性SNP中受到关注的是调控性SNP(regulatory SNP,rSNP),即位于顺式作用元件(如启动子、增强子、沉默子、绝缘子等)上并能够改变基因表达水平的SNP。验证调控性SNP的实验方法成本高,效率低,因此非常需要理论预测作为补充和指导。但是,目前调控性SNP理论分析和预测中存在的一个重要问题是:很多预测和分析侧重于解决SNP的定位问题,对于同位于顺式作用元件上的SNP,则缺少有效的结构属性来加以识别。这主要是因为对调控性SNP形成的内在机制缺乏本质的理解。 本研究致力于在不同层次对调控性SNP的结构特征进行全面分析,以考察调控性SNP预测中结构属性的作用,深化对其机制本质的理解。主要工作如下: 首先运用机器学习算法对多个结构属性进行综合分析。通过文献调研和相关数据库,我们重新搜集了一批调控性SNP和对照SNP,又从文献得到与DNA片段结构或能量相关的未曾考察过的结构属性共11个,结合同类文献的数据集和属性集作比较分析。经过属性排序可知,新加入的结构属性中,DNA螺旋参数中的升高(Rise)改变和羟基自由基切割谱改变的重要性较为靠前;训练比较后发现采用朴素贝叶斯分类器性能最佳,比文献所用支持向量机预测性能提高6%,适当选取新加入的结构属性可使预测性能有小幅提高。这部分工作启示我们,调控性SNP的预测是一个较为复杂的问题,合理选用新的结构属性可提高调控性SNP预测性能。 而后,我们对位点矩阵法和羟基自由基切割法这两种重要方法分别进行深入分析。位点矩阵法的应用首先需要对多个相关数据库进行交叉筛选以得到所需的可靠数据,这些数据对于以后应用更多方法考察调控性SNP也具有重要意义。于是我们从收录转录因子结合位点最全的数据库TRANSFAC中提取了人属转录因子结合位点(Transcription Factor Binding Site,TFBS),进一步确定其在参考基因组中的准确位置,而后确定其中有183个上有SNP,它们中18个有调控性SNP,去掉重复位点后实际得到12个位点上的13个rSNP。183个位点上的SNP,位于位点矩阵内的只有32个,其中5个是调控性SNP。从数量可知,rSNP研究目前仍处于数据积累阶段,需要积累更多数据才能进行完善的统计学分析。对当前数据的统计表明,不论是SNP还是rSNP,其引起碱基频数百分比的改变从高到低都有分布。因此,认为在位点矩阵中调控性SNP所在位置的碱基保守性高的想法不能成立。据此,我们猜想很可能是因为同一转录因子与DNA结合有不止一种模式,而调控性SNP所在位置的碱基在不同模式中的作用有很大差异。其论证还需要更多细致而深入的调研和分析。 之后,我们又充分考察了羟基自由基切割法在识别调控性SNP中的作用。计算表明,当以正链序列为对象时,调控性SNP和对照SNP引起的羟基自由基切割谱变化的差异有统计学意义;而以负链序列为对象时,则无统计学意义。我们认为正负链计算结果不一致是原方法的一处疏漏,与作者沟通后提出了双链算法作为改进,消除了这一矛盾,且阳性数据与对照差异显著性也有所提高。 以上从综合及独立的不同角度,对调控性SNP的通用结构属性做了基于概率统计的分析。为了更深一步探究调控性SNP形成的本质,我们又运用分子动力学模拟方法从原子水平通过具体实例来分析调控性SNP的内在机制。首先从前面筛选出的有rSNP的转录因子结合位点中,在PDB数据库搜索转录因子序列,得到了有高同源性复合物结构文件的转录因子结合位点。又经核酸序列比对,进一步筛选出三个转录因子——垂体特异转录因子POU1F1、维他命D受体VDR和雄激素受体AR,以它们的DNA复合物作为模拟对象。由于时间关系,只对AR-DNA复合物的模拟结果作了全面分析。分析表明,结合态SNP的复合物中氢键总数和稳定氢键数量都明显高于非结合态复合物,且分布在整个核酸片段上。疏水作用分析发现结合态SNP中突变碱基T上的甲基导致附近的疏水作用大为增强;对两个识别螺旋相对运动的考察发现结合态复合物中两识别螺旋基本平行,而非结合态中的相对运动趋势与自由蛋白非常相似。故认为疏水作用是使该SNP成为调控性SNP的关键原因。这部分工作说明分子动力学模拟方法在合理应用的前提下,对rSNP的机制分析具有重要的参考价值。 最后我们还考察了同源二聚体转录因子的两个识别螺旋的平面内相对运动的现象,对今后分析相似类型的转录因子的构象运动进而理解蛋白质-DNA结合都提供重要启示。 本研究的创新点主要包括:重新综合考察了一些未用机器学习考察过的结构类属性对于识别rSNP的作用;较完整地挑选出人属TFBS上所有SNP和rSNP,为全面而深入的分析rSNP的功能机制提供了重要的数据平台;发现了羟基自由基切割法的一处疏漏并进行了改进,分析得出调控性SNP与羟基自由基切割谱改变具有相关性;将蛋白质-DNA特异性识别的研究结果应用到调控性SNP的结构机制分析中,体现了分子动力学模拟方法对rSNP的机制分析的重要参考价值;应用分子动力学模拟发现了同源二聚体转录因子的两个识别螺旋在平面内相对运动的现象,对其理论背景和适用范围作了更深入的分析。 目前,与调控性SNP结构特征相关的属性、方法仍在不断涌现和完善,随着新的有效属性的合理加入,识别rSNP的综合理论模型的预测性能一定会不断提高;同时随着结构蛋白质组学受到更为广泛的关注,新测定的蛋白质-DNA结构数量日益增多,可用来分析蛋白质-DNA识别机制及调控性SNP内在原因的实例也必然越来越多。当这些实例研究获得的知识积累到一定数量,通过归纳总结,其背后的规律必然会逐渐明晰。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张新宇,秦斌,史占军;外源性一氧化氮对骨肉瘤细胞株HOS生长能力的影响[J];中国矫形外科杂志;2000年11期
2 杨寒朔,田聆,魏于全;基因组学在血管病研究中的应用[J];国外医学.生理.病理科学与临床分册;2003年05期
3 程谟斌,邓博雅,张真榕,李巍,赵东,刘清利,丁梅,王保捷;中国4个群体VDR基因2号外显子的SNP基因座遗传多态性[J];中国法医学杂志;2002年04期
4 龚菁,Lantermann A,Hampe J,Schreiber S,龙村;6号染色体HLA区域的128个SNPs与肠炎相关性的研究[J];中国免疫学杂志;2003年08期
5 杨微,刘兰英;人类的致病基因[J];生命的化学;2002年05期
6 彭翠英,张佳,郭紫芬,陈琳玲,廖端芳;SNP敏感性分子开关对神经性耳聋GJB3中C→T突变点的识别[J];南华大学学报(医学版);2003年02期
7 徐小延;孙开来;;人类基因组单体型研究在疾病遗传学分析中的意义[J];国外医学.遗传学分册;2005年06期
8 郑卫英;华琳;刘红;李林;饶绍奇;;遗传规划在SNP高阶交互分析中的应用[J];中国优生与遗传杂志;2008年12期
9 仪军玲;李彩霞;胡兰;;单核苷酸多态性及其检测方法[J];证据科学;2008年06期
10 李晓晶;苏燕;;Ⅱ型糖尿病易感基因研究的进展[J];现代生物医学进展;2009年08期
11 高卓;田国萍;;沈阳地区汉族人群脑梗死患者ALOX5AP基因SNP分析[J];中风与神经疾病杂志;2010年11期
12 宋沁馨;周国华;;用Cy5-ddNTP结合修饰引物延伸测定人类3种SNP(英文)[J];中国药科大学学报;2006年06期
13 陈佩林;陈鑫;郑红霞;吴奇涵;;Cyclin H基因启动子区-1 SNP对转录活性的影响[J];基础医学与临床;2008年07期
14 张莉;王绿化;;单核苷酸多态性与放射性损伤[J];癌症进展;2008年02期
15 施晓东;王金凯;李易;罗雄剑;张卫;宿兵;;精神分裂症易感基因GULP1与中国人群大脑容量的相关性研究[J];动物学研究;2009年04期
16 景晶晶;李潭;;法医学相关SNP的分类[J];辽宁警专学报;2009年06期
17 文亮;毕敏;;三磷酸腺苷与硝普钠控制性降压对血流动力学影响的比较[J];临床麻醉学杂志;1992年04期
18 陈帆影;陈秉学;邓天忠;谭洁芳;;硝酸甘油、硝普钠、三磷酸腺苷三种药物用于控制性降压的临床比较[J];临床麻醉学杂志;1992年04期
19 王萍,惠汝太;单核苷酸多态性研究及其应用[J];中国分子心脏病学杂志;2005年05期
20 李东霞;苏秀兰;;人类基因组的新型遗传标记:STR和SNP[J];内蒙古医学院学报;2006年01期
中国重要会议论文全文数据库 前10条
1 刘齐元;朱腾义;程元强;范东东;;烟草atp6基因SNP的错配碱基法检测及其与CMS的相关性[A];2010中国作物学会学术年会论文摘要集[C];2010年
2 于清;李长贵;;hURAT1基因启动子区-87C/T SNP与原发性痛风的关联与功能研究[A];中华医学会第十次全国内分泌学学术会议论文汇编[C];2011年
3 陈磊;郭亦杰;周继鹏;李慕朋;王英;李元建;陈小平;;中国汉族人群DDAH1功能性SNP的研究及对ADMA代谢的影响[A];中国药理学会第十一次全国学术会议专刊[C];2011年
4 余爱荣;辛华雯;刘慧明;吴笑春;李罄;;中国肾移植患者钙蛋白酶10基因多态性与移植后糖尿病的相关性研究[A];2011年中国药学大会暨第11届中国药师周论文集[C];2011年
5 甘建伉;肖雄;黄剑平;罗庆斌;张细权;;鸡HspA9基因5′侧翼区SNP对耐热性状的影响[A];第十二次全国畜禽遗传标记研讨会论文集[C];2010年
6 张荣;谢亮;聂庆华;饶友生;张细权;;利用SNP分型芯片分析鸡基因组的拷贝数目变异[A];第十二次全国畜禽遗传标记研讨会论文集[C];2010年
7 孙玲;余少波;刘榜;;猪Nudt6基因克隆以及与眼肌面积性状相关SNP发现[A];第十二次全国畜禽遗传标记研讨会论文集[C];2010年
8 刘楚新;孙亚奇;刘榜;;猪sANK1基因SNP的筛查以及与经济性状的关联分析和表达谱分析[A];第十二次全国畜禽遗传标记研讨会论文集[C];2010年
9 张爱玲;刘晓静;姚志文;李兆能;何必宏;吴琳兰;高萍;李加琪;;不同猪种乳铁蛋白基因5'侧翼区SNP分析[A];第十二次全国畜禽遗传标记研讨会论文集[C];2010年
10 马洪雨;马群群;马春艳;马凌波;;拟穴青蟹功能基因来源SNP标记的开发与评价[A];渔业科技创新与发展方式转变——2011年中国水产学会学术年会论文摘要集[C];2011年
中国博士学位论文全文数据库 前10条
1 张志毅;调控性SNP结构特征的生物信息学分析和分子动力学模拟研究[D];中国人民解放军军事医学科学院;2011年
2 张建勇;中国对虾(Fenneropenaeus chinensis)基因组SNP标记的开发与应用[D];中国海洋大学;2011年
3 高汝飞;西方人群中蛋白质酪氨酸激酶JAK2~(V617F)突变体与邻近SNPs之间相关性的分析及JAK2~(V617F)检测新方法的建立[D];吉林大学;2011年
4 张洪伟;青虾ITS1序列SNP位点的筛选及其在杂交遗传分析中的应用[D];南京农业大学;2008年
5 王峻;单核苷酸多态性分析算法的研究与应用[D];哈尔滨工业大学;2010年
6 王峻;单核苷酸多态性分析算法的研究与应用[D];哈尔滨工业大学;2010年
7 杨铁林;利用人类全基因组拷贝数变异和SNP多态性揭示骨质疏松和肥胖症的遗传致病机理[D];西安交通大学;2009年
8 刘永峰;牛13个体尺性状相关基因的克隆表达、序列特征及遗传效应分析[D];西北农林科技大学;2010年
9 曾杰西;年龄相关性黄斑变性的遗传标记物和环境因素的易感性评估[D];中南大学;2012年
10 袁细国;基因组变异仿真与基因组模式鉴定[D];西安电子科技大学;2011年
中国硕士学位论文全文数据库 前10条
1 魏悦爽;从肌钙蛋白相关基因筛选举重运动员选材用分子标记[D];北京体育大学;2010年
2 毕煜;初探应用关联规则筛选与癌症有关联性的SNP[D];复旦大学;2010年
3 田小春;Klotho三个位点SNP及组合在重庆汉族老年人群分布及其与原发性骨质疏松症的关系[D];重庆医科大学;2011年
4 杨谷;荧光光谱分析鉴别SNP等位位点比例法产前诊断唐氏综合征方法的建立和应用[D];苏州大学;2010年
5 张素华;X染色体上STR与SNP标记的分型检测[D];苏州大学;2010年
6 汤栩宁;基于单体型的致病基因区域发现算法研究[D];吉林大学;2008年
7 靳鹏;不同地理种群黑线仓鼠FSHβ部分序列克隆与SNP分析[D];曲阜师范大学;2010年
8 刘璐;黑线仓鼠OB基因部分序列的克隆与SNP分析[D];曲阜师范大学;2010年
9 朱晖;中国安徽汉族地区人群TCF7L2基因常见SNP与2型糖尿病及糖调节受损关联性分析[D];安徽医科大学;2011年
10 叶雨;中国人群中单核苷酸多态性和前列腺癌的相关性研究[D];广西医科大学;2009年
中国重要报纸全文数据库 前10条
1 Marvin;测基因而知天命?[N];经济观察报;2009年
2 通讯员 王静思 记者 刘传书;中国基因组学研究居国际领先地位[N];科技日报;2010年
3 记者 常丽君;“人以群分”受基因构成影响[N];科技日报;2011年
4 王佑;中国石化或80亿美元洽购加油气公司Addax[N];第一财经日报;2009年
5 本报记者 刘笑一;上海组建地产“总龙头”[N];中国房地产报;2003年
6 许铁男;要拿金钱“赌”明天[N];医药经济报;2001年
7 早报记者 孙晓旭实行生 葛佳;5000点构筑阶段底部投资从“重估”转向“成长”[N];东方早报;2007年
8 长城证券研究所策略小组高凌智;矫枉不会过正 阶段性布局再逢时[N];上海证券报;2007年
9 记者 李雪墨;创新药研究存在三个瓶颈[N];中国高新技术产业导报;2001年
10 $$中国法学会WTO项目组负责人 于安 司法部律师公证工作指导司司长 贾午光 $$国家行政学院研究室主任、博士生导师 袁曙宏 $$国家工商局市场规范管理司司长 张经 海南大学副校长 谭世贵 $$全国人大代表、红桃开集团股份有限公司董事局主席 谢圣明 $$广西壮族自治 ;WTO与法[N];人民日报;2001年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978