植物基因相关SSR序列调控及位点多态性研究
【摘要】:
简单重复序列(Simple Sequence Repeat, SSR)作为一类短串联重复序列广泛分布于植物基因组。传统观点认为SSR序列倾向存在于植物基因组重复区域,但随着大量植物基因组及其表达序列的测定,发现SSR的分布情况比原先认识的要复杂得多,SSR序列在植物基因组中并非集中于基因组重复区域,而是更倾向分布在基因组单拷贝或低拷贝区域,尤其在基因上游调控区大量出现。出于对SSR序列属于基因组的“垃圾”DNA,并不具备重要生物学功能的片面认识,长时间以来SSR序列的生物学功能未引起重视,但SSR序列在植物基因调控区超乎寻常的积累应该具备环境适应优势。开展植物基因组调控区大量SSR序列的功能研究,对于突破SSR序列只作为一种优良分子标记的认识局限,加深理解SSR序列在植物基因组中的生物学功能具有重要意义。
分布于拟南芥基因组调控区的SSR序列主要由GA/CT和GAA/CTT重复类型组成,约占调控区SSR位点总数的60%。一些SSR位点作为重要的功能元件涉及基因调控,这些功能位点在进化过程中应该具有不同程度的序列保守性。本研究采用系统发生足迹技术对拟南芥基因组内同源基因调控区、拟南芥基因组与甘蓝基因组的同源基因调控区CT/GA和CTT/GAA重复类型的SSR序列进行保守性分析,试图发掘具有调控功能的非编码保守SSR序列或非编码保守微卫星序列(Conserved Noncoding Microsatellite Sequence, CNMS)。结果发现在拟南芥和甘蓝基因组分化过程中247个SSR位点呈现位点保守性,包括182个CT/GA和65个CTT/GAA重复序列位点。同样,分析拟南芥旁系同源基因,发现位于基因调控区的122个CNMS位点,包括78个CT/GA和44个CTT/GAA重复序列位点。总计491个CT/GA和CTT/GAA重复序列位于拟南芥基因组调控区存在保守性,占整个拟南芥基因组上游调控区500 bp区域同类型SSR序列的10.6%。比较分析3组不同类型随机数据,排除了CNMS位点出现在同源基因调控区的偶然性,进一步确认位于拟南芥同源基因调控区的部分SSR序列起源于同一祖先位点,在进化过程中具有很高的序列保守性。
为深入了解拟南芥CNMS的进化起源,本研究通过计算相关同源基因的同义替换率估算CNMS位点的进化关系。结果表明拟南芥-甘蓝直系CNMS位点在15百万年(Million years, Myr)前起源于同一祖先位点;大部分拟南芥旁系CNMS位点起源于28 Myr前拟南芥基因组大规模的重复事件,而少部分旁系CNMS位点则起源于42 Myr前十字花科的共同祖先序列。基于计算结果推测:一些古老的拟南芥旁系同源CNMS位点在甘蓝基因组中应该存在相应直系同源位点。进一步比较拟南芥-甘蓝和拟南芥-拟南芥调控区保守SSR序列,发现18个拟南芥旁系同源CNMS在甘蓝基因组中至少存在一个保守等位位点。这些同时出现在拟南芥-甘蓝直系同源和拟南芥-旁系同源基因调控区的Ultra-CNMS位点在其它进化关系较远的植物基因组中同样存在序列保守性。
根据Gene Ontology的功能注释,206个拟南芥-甘蓝CNMS相关基因以及194个拟南芥-拟南芥CNMS相关基因具有较为明确的功能。功能分析表明CNMS相关基因的功能与转录因子活性和转录调控显著相关。生物信息学预测显示CT/GA和CTT/GAA保守重复序列分别与响应光信号和水杨酸信号的已知功能顺式作用元件相似。本研究通过分析拟南芥CNMS (CTT)n/(GAA)n相关基因在水杨酸处理后的表达模式来验证计算机预测结果。根据拟南芥MPSS表达数据显示约70%-80%的拟南芥CNMS (CTT)n/(GAA)n相关基因在叶片中的表达丰度明显受水杨酸调控。采用半定量RT-PCR分析其中7个CNMS (CTT)n/(GAA)n相关基因的表达谱,目标基因在水杨酸处理后的表达模式与拟南芥MPSS数据所反映的基因表达谱基本一致。
为进一步研究CTT/GAA类型SSR序列与水杨酸诱导之间的联系,采用缺失方法对包含CTT重复位点且受水杨酸诱导的拟南芥AtHip1基因启动子进行水杨酸调控元件分析。4个不同缺失体与gus基因融合构建植物表达载体,利用农杆菌介导法转化拟南芥。转基因植株经报告基因gus蛋白活性测定及定量PCR分析,发现AtHip1启动子-399至-184的216 bp区域是启动子转录调控的核心区域,该区域缺失导致启动子水杨酸诱导功能丧失。生物信息学分析发现AtHip1启动子-399至-184的216 bp的序列除潜在响应水杨酸信号的CTT重复元件外,并未发现其它参与水杨酸信号应答的功能元件,说明存在于调控区域内的CTT重复序列为水杨酸信号应答的顺式作用元件。
来源于表达序列标签(Expressed Sequence Tag, EST)的SSR标记,不仅具备传统基因组来源的SSR标记所有优势,还反映出基因转录区的差异,其多态性可能与所在基因的功能直接相关,具有很高的实际应用价值。随着EST测序的快速发展,尤其是同一基因来自不同亚种或品种的EST序列的大量重复测定,使同一物种中许多基因的EST序列存在大量的冗余信息,其中一些冗余序列包含SSR位点长度多态性信息。本研究以此为基础发展了EST-SSR多态性位点大规模发掘的计算机方法。利用该方法对公共序列数据库中玉米、大豆、水稻、小麦、油菜、大麦、棉花、西红柿、马铃薯及高梁10个主要作物的EST序列进行分析,共检测到15,640个等位位点存在长度多态性的SSR位点。10种作物中,EST-SSR多态性位点占被检测SSR位点的比率介于0.7%至2.61%,其中玉米EST-SSR多态性比率最高,西红柿EST-SSR位点多态性最低。这些EST-SSR多态性位点主要集中于二、三核苷酸重复类型,约占所有发掘位点的84%。分析发掘的EST-SSR等位位点长度变异,发现EST-SSR因突变而导致重复单元增加的等位位点明显多于重复单元减少的等位位点,表明EST-SSR突变倾向于增加位点长度。
EST-SSR多态性位点来源于基因转录区,物种间存在很高通用性。对所发掘的15,640个具有长度多态性的EST-SSR进行通用性分析,EST-SSR多态性位点的通用性比率在14.1%至45.9%之间,高粱(45.9%)、小麦(39.1%)和大麦(38.2%)的EST-SSR多态性位点在相关作物间的通用性最高,油菜(14.1%)EST-SSR多态性位点在相关作物间的通用性较低。作物EST-SSR标记通用性表明:对于缺乏标记资源的作物,可利用其它作物已有的EST-SSR标记来开发相应的标记,不失为一种有效的替代方法。
根据Gene ontology的植物代表性GO slims,对14,084个具有EST-SSR多态性位点的基因进行功能分类,8,952基因序列涉及108,601个GO功能注释。对包含SSR多态性位点的相关植物基因按GO生物学过程(biological process)分类,主要涉及蛋白质代谢、转运、转录、逆境应激、发育、信号转导等过程;分子功能(molecularfunction)主要包括蛋白结合、DNA或RNA结合(包括转录调控活性、转录因子活性)、水解酶活性、转移酶活性等。
为方便查询相关EST-SSR多态性位点信息,以MySQL数据库管理系统构建了EST-SSR多态性位点数据库。EST-SSR多态性位点数据库包括重复单元、等位位点长度、品种来源、相关基因功能以及相关候选扩增引物等信息。用户通过网络游览器查看有关信息以及EST序列簇的详细拼接结果。用户还可以通过BLAST程序与包含SSR多态性位点的EST序列进行同源比较分析。网站同时提供相关数据下载服务。
|
|
|
|
1 |
乔玉山,章镇,沈志军,房经贵,郭洪;中国李简单重复序列(SSR)反应体系的建立[J];植物生理学通讯;2004年01期 |
2 |
郁永明;田丹青;潘晓韵;金亮;葛亚英;;基于红掌转录组序列的SSR标记分析与开发[J];分子植物育种;2015年06期 |
3 |
刘列钊,林呐;油菜简单重复序列SSR(simple sequence repeat)研究进展[J];生命科学;2004年03期 |
4 |
陈中苏直;田波;蔡传涛;;基于SSR分子标记的滇重楼遗传多样性研究[J];中草药;2017年09期 |
5 |
高志红,章镇,韩振海,沈志军;果梅SSR反应体系的优化[J];南京农业大学学报;2002年04期 |
6 |
徐建欣;王云月;姚春;刘云霞;汤淼;陆明兴;;利用SSR分子标记分析云南陆稻品种遗传多样性[J];中国水稻科学;2012年02期 |
7 |
刘福青;李栒;;油菜SSR标记开发与应用[J];作物研究;2007年S1期 |
8 |
黄琼林;何瑞;詹若挺;陈蔚文;;南药青天葵转录组SSR位点信息分析[J];北方园艺;2015年12期 |
9 |
易官美;黎建辉;王冬梅;童再康;卢泳全;;南方红豆杉SSR分布特征分析及分子标记的开发[J];园艺学报;2013年03期 |
10 |
宋双;黄银芝;董雷鸣;黄有军;曾燕如;吴智敏;;山核桃SSR标记的初步开发[J];浙江农林大学学报;2012年04期 |
11 |
李新军,黄敏仁,潘惠新,王明庥;林木基因组中的微卫星(SSR)及其应用[J];南京林业大学学报;1999年05期 |
12 |
代娇;时小东;顾雨熹;盛玉珍;徐莺;陈放;庄国庆;;厚朴转录组SSR标记的开发及功能分析[J];中草药;2017年13期 |
13 |
黄耀辉;张超;周莉花;赵宏波;;基于转录组序列的夏蜡梅SSR位点特征与引物开发[J];浙江农林大学学报;2017年04期 |
14 |
张亚楠;杨柏云;熊冬金;罗火林;;寒兰转录组SSR信息分析及其分子标记开发[J];南昌大学学报(理科版);2017年03期 |
|