利用QTL进行植物抗旱基因鉴定的生物信息方法和软件的设计与实现
【摘要】:
现阶段的植物遗传研究中,对控制复杂性状表达(如抗旱性状)基因的研究被认为是一项富有挑战,也十分重要的工作。作为一种研究基因组内的遗传变化和表型变异的有效的方法,数量性状位点(Quantitative trait locus,QTL)为控制复杂性状的研究提供了一种行之有效的方法。本项研究利用生物信息学方法,通过对文献发表的QTL相关的遗传信息进行整合,并在此基础上提出了一种基于QTL信息进行新基因发掘的策略。同时,构建了一套用于查询QTL区间内的遗传信息的数据库系统,以及一套可用于QTL分析的基因芯片数据分析软件,以期为植物数量性状相关基因的发掘与研究提供一种有效的方法和方便的信息查询平台。
QTL定位的研究为我们提供了丰富的QTL遗传信息。本研究首先收集了大量文献中已经发表的QTL信息(以抗逆性为例),构建了QTL数据库,并将这些QTL定位到整合的,基于遗传距离和物理距离的染色体图谱上,并以此为基础设计了一种利用EST和基因组信息对QTL相关候选基因进行电子克隆的方法。选取了水稻染色体1,2,4,8和9内定位到的QTL对上述方法进行验证,得到QTL相关的候选基因,结果经实验验证,证实了该方法的有效性。
为了进一步QTL相关的候选基因进行鉴定和功能分析,我们将抗逆QTL数据库及相关的候选基因发掘的方法进行了整合,并将其扩展到所有QTL相关性状的研究中。在此基础上我们构建了一个用于查询、注释QTL相关的基因表达信息的数据库查询系统——PlantQTL-GE。该数据库整合了大量的基因、基因芯片表达信息、EST(expressed sequence tags)和遗传标记数据,并通过一个统一的信息平台来对这些数据进行管理和查询。用于帮助研究者找到他们感兴趣的QTL内部的遗传信息,并利用这些信息来进行QTL相关的候选基因的筛选和功能分析。该数据库支持用户通过输入QTL两侧的遗传标记名称、QTL所对应的基因组物理位置两种方式进行检索,查询结果包括了QTL区间相关的已知功能的基因、基因芯片数据、EST信息,未知功能的候选基因以及其他物种内相似的候选基因。其中QTL内部的候选基因还进一步的利用EST、生物芯片数据和预测的调控位点信息进行了注释。该数据库目前可以查询的物种包括水稻和拟南芥,可以通过http://www.scbit.org/qt12gene/new/网页来访问。
生物芯片技术是90年代初才发展起来的一项新技术,已经在许多领域得到了广泛的应用,但应用在植物数量性状的研究中还鲜有报道,相关的理论和方法还比较匮乏。该项研究对利用芯片数据来进行QTL研究进行了探索,开发了一套利用生物芯片数据进行QTL研究的分析软件。该软件用于进行植物相关的芯片数据的生物信息学分析的软件系统,目的是帮助研究者利用自己的芯片数据来进行QTL相关的候选基因的发掘。该软件可以整合芯片数据和QTL数据,并进行综合分析,目前该软件可以用于进行水稻和拟南芥的相关研究。其功能包括:
1)将基因芯片差异基因和QTL信息整合到染色体物理图谱上。
2)利用BLAST工具对差异表达基因进行染色体定位。
3)对差异表达基因进行GO(gene ontology)分类。