基于Bayesian的基因调控网络的研究
【摘要】:
近些年来,大规模测定基因表达水平的基因芯片技术的出现和高性能计算机的使用,使得利用数学模型研究探索大规模基因表达调控成为可能。一些研究者已经开始绘制控制整个活细胞基因表达的调控网络,这种利用各种数学模型的方法预测网络结构已经成为目前研究的热点和重点。利用数学模型和人工智能技术,研究分析基因表达数据之间的关系,构建合适的基因调控网络模型来模拟生物系统的行为,从中发现生物学规律,进而认识生命现象的本质,成为了生物信息学研究的重要内容。
本文提出以动态贝叶斯网络理论为核心结合聚类分析方法构建基因调控网络,分析了国内外发展现状,介绍了建立基因调控网络的模型和方法,贝叶斯理论的内容和几种经典的构建基因调控网络的方法,并通过静态贝叶斯网络模型推导出构建调控网络的动态贝叶斯网络模型。现有动态贝叶斯网络模型程序构建基因调控网络运算模型,存在计算缓慢,内存消耗巨大等问题,针对这些缺点对模型进行优化。最后对实验数据进行处理,提出应用聚类分析处理大规模时序微阵列数据,达到优化数据,提高计算速度的目的,应用动态贝叶斯网络理论并结合聚类分析方法建立相应的基因调控网络,并利用现有的实验数据对得到的基因网络进行分析和比较。通过计算建立的基因调控网络,40%的基因对完全符合实验结果,60%的基因对处于未知待测。