玉米MYB转录因子靶基因的全基因组预测及验证
【摘要】:在植物抗逆反应体系中,通过转录因子调控功能基因的表达,是植物对生物胁迫和非生物胁迫逆境应答反应的关键环节。作为植物中最大的转录因子家族之一,MYB转录因子在植物抗逆胁迫过程中起着重要的作用。在玉米上,已克隆出P1、C1、 MYB-IF25等基因,但是有关MYB的靶基因及其参与的具体的信号调控途径,可供参考的文献和研究十分有限。迄今为止,rd22等为数不多的基因是经严格鉴定的与植物抗逆相关的MYB靶基因。在全基因组水平上预测MYB的靶基因,有助于了解MYB调控抗逆相关基因表达的具体情况,解析植物逆境应答的分子机制。
植物MYB具有一个保守的R2R3结构域,特异性地识别结合抗逆相关基因启动子序列上的MYB结合位点,激活下游靶基因的表达。拟南芥AtMYB2转录因子识别的核心序列为TAACTG。除核心序列而外,MYB转录因子对靶基因的调控,还与靶基因启动子序列其他诱导型和组成型转录因子的识别和结合位点有关,只有相关的转录因子都结合到相应的顺式作用元件,相互协同作用,才能启动靶基因的表达。因此,随着玉米基因组测序完成,我们可以根据MYB所识别的顺式作用元件的核心序列及其侧翼序列的保守性,并结合机器学习的生物信息学方法,在全基因范围内对MYB转录因子调控的靶基因进行预测。
本研究首先根据前人验证的MYB靶基因上游MYB识别的核心序列及其侧翼序列,用HexDIFF算法编码序列、支持向量机构建分类模型。然后,从Maizesequence数据库下载玉米自交系B73全基因组序列和WGS基因注释文件,通过PERL脚本程序截取所有注释基因转录起始位点上游3000bp的序列共136,770条,用PERL正则表达式搜索其中MYB识别的核心序列‘TAACTG",用前述支持向量机分类模型预测玉米注释基因上游的启动子序列。按此方法预测到了435个MYB预测结合位点,其下游424个基因判定为MYB靶基因。
基因本体(GO)是一个在生物信息学领域中广泛使用的位置、功能注释,具有跨物种、统一、规范化、便于查找等优点。它包括三个域:生物过程、分子功能和细胞组件。通过GrameneMart导出229个预测靶基因的1471条基因本体注释,利用AgriGO进行GO富集分析,有33个预测靶基因(14.4%)注释为参与逆境响应过程,预测靶基因40.6%定位于细胞内的细胞器中。由此表明,MYB转录因子靶基因编码的蛋白质,大多定位于细胞内,主要功能与植物对非生物逆境的应答有关。
为验证预测结果,我们首先将玉米MYB-IF25基因的cDNA序列进行密码子优化,体外化学合成MYB-IF25基因,构建原核表达载体并诱导表达,分离纯化了MYB-IF25蛋白。然后,从435个预测的MYB结合位点中随机挑取30个,合成并5’端生物素标记后作为探针,与MYB-IF25蛋白体外融合,进行凝胶阻滞迁移试验,验证MYB转录因子与预测序列体外结合的可能性。结果表明,全部30个预测序列中,有27个(90%)能与MYB-IF25蛋白体外融合。由此说明,我们开发的抗逆转录因子靶基因预测方法具有较高的可信性,可为玉米非生物逆境胁迫应答的分子机理研究提供参考。