收藏本站
《中国科学技术大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

基因网络分析的统计模型研究

张相华  
【摘要】:细胞的生物功能是通过基因及其产物之间相互作用,形成复杂的调控网络来实现的。理解生命系统中基因间的相互作用及其功能是系统生物学研究的核心内容。通过高通量生物技术,我们获取了大规模的组学数据,如基因表达数据、蛋白质—DNA结合数据、蛋白质相互作用数据以及基因型数据等。这些数据在不同方面提供了系统认识基因的复杂调控机制所需要的信息。尽管许多计算和统计方法已经利用这些数据来分析调控网络,以系统的了解生命活动在分子水平上的机制,但是由于转录调控机制的复杂性以及高通量数据内在的噪声,完全的理解基因调控网络仍然是一个尚待解决的问题。 本文以系统生物学中的一些实际问题为出发点,以基因表达数据为基础,建立统计模型,对基因网络的相关问题,如基因共表达网络的模块分析、基因调控网络的构建以及基因网络间的差异分析进行了深入的研究。本文的主要研究内容和创新点如下: 1.采用基因权重共表达网络对基因模块的生物学意义及产生机制进行分析。鉴于基因调控网络的复杂性,基因模块被用来简化对基因调控网络的描述。虽然已经对基因模块进行了大量的研究,但是基因模块的定义并不统一,而且对其生物学意义及产生机制缺乏必要的了解。本文采用基因共表达网络对基因模块进行分析,以了解基因模块的生物学意义及其形成的遗传学基础。GO功能信息、KEGG生物通路及转录因子目标基因的富集分析表明,基因模块具有明显的生物学属性,而在共表达网络中采用拓扑重合度量能比皮尔逊相关度量更有效的提取出基因模块。利用同种生物的不同条件下的基因表达数据集,得到的基因模块具有很高的一致性,表明基因网络的模块化是生命活动的固有属性。结合基因型数据与基因表达数据进行的表达数量性状座位分析显示,存在着调控模块中的基因共同表达的基因组区域,部分解释了基因模块产生的遗传学机制。基因模块为分析基因表达数据和增强对基因调控网络的了解提供了简单而有效的方法。 2.提出一种新的统计整合模型,能够有效的利用多种类型的干扰型基因表达数据来构建调控网络。基因调控网络在生命活动中发挥着重要的作用,调控网络的研究对认识细胞分化、新陈代谢、信号转导以及疾病产生的机制有着重要意义。随着全基因组表达数据的快速积累,已有很多方法被用来重构基因调控网络。由于涉及到许多基因间的复杂的相互作用,这些方法的精度相对较低,所以重构基因调控网络仍然是具有挑战性的课题。重构基因调控网络时,整合不同类型的基因表达数据,是提高预测精度的一个可能途径。本文提出一种新的统计整合模型,能够有效的利用多种类型的干扰型基因表达数据来构建调控网络。模型的核心思想是针对不同类型基因表达数据的特点分别建模,而后采用Fisher方法将各类型数据中得到的信息进行统计整合。仿真实验的测试结果表明,基因敲除数据是构建调控网络的最有效的信息来源,整合多种类型表达数据进行预测要优于使用单一类型的表达数据。将方法应用到DREAM4 in silico基因网络重构挑战赛,结果表明该模型具有较好的预测性能,在子挑战1中获得第2名。 3.构建了基因网络差异分析的贝叶斯层次模型,它能较好的检测出网络的拓扑变化,精度高于其它模型。微阵列基因表达数据的研究重心已经由差异表达基因的检测逐渐转移到基因网络的差异分析。基因调控网络具有动态性和条件特异性,在不同的时间空间条件下,基因的调控模式发生变化,并体现在调控网络的拓扑结构的改变上。检测特异性的基因关联,可以发现在不同条件下基因关联网络的差异,能够促进对细胞发育、疾病病理的了解,并有助于确定药物的靶点基因。针对单一条件下表达数据样本量不足,会导致检测精度不高的问题,本文将不同条件下的、性质各异的表达数据汇集在一起,在贝叶斯框架内建模,使不同条件下的数据能够互相分享信息,以提高检测具有条件特异性的基因关联的精度;模型使用了spike and slab先验分布来模拟基因关联网络的稀疏性,并对基因关联的特异性程度给出了后验概率度量。各种场景下的仿真实验中,该模型均能较好的检测出仿真网络的拓扑变化,其精度高于其它模型。将该模型应用到HapMap基因表达数据中,寻找不同人种间的关联网络的差异,得到了具有生物学意义的结果。 本文的研究工作得到了国家留学基金委“国家建设高水平大学公派研究生项目”(CSC:2008634012)和NIH grant GM59507的资助。
【学位授予单位】:中国科学技术大学
【学位级别】:博士
【学位授予年份】:2011
【分类号】:Q75

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 王锐;陈洪;张彦琦;郭波涛;易东;;信息熵在基因调控网络构建中的应用[J];激光杂志;2008年01期
2 艾对元;;基因组中重复序列的意义[J];生命的化学;2008年03期
3 王珏;吴垠;陈欢;;芯片数据分析进展[J];科技风;2009年12期
4 徐挺;尹大强;;小分子RNA及其在化学品毒理学中应用的展望[J];环境化学;2011年01期
5 应文豪;王士同;;使用稳态系统和粒群优化算法进行基因调控网络推断[J];计算机应用与软件;2009年03期
6 陈颖;汪旭升;许玲莉;沈勤;王晓冬;陆璐;;基因表达数量性状定位的研究进展[J];生命科学;2009年01期
7 徐挺;赵静;胡霞林;尹大强;;环境污染物发育毒性机制研究的系统生物学方法进展[J];生态毒理学报;2011年01期
8 崔光照,张勋才,曹祥红,董亚非,王延峰;基于动态贝叶斯网络的多时延基因调控网络构建[J];科学技术与工程;2005年17期
9 宋纯鹏;王鹏程;;基因芯片新技术及其在生物和医学领域的应用[J];河南大学学报(医学版);2006年02期
10 张家军;蔡传政;王翼飞;;基因调控网络中的延滞动力学[J];应用科学学报;2007年01期
中国重要会议论文全文数据库 前9条
1 王亚丽;周彤;;大规模基因调控网络因果关系的辨识[A];第二十九届中国控制会议论文集[C];2010年
2 蔡德培;;环境内分泌干扰物对垂体-性腺轴相关的基因调控网络的不良影响及其中药治疗的拮抗作用[A];中国生理学会消化内分泌生殖代谢生理专业委员会2011年消化内分泌生殖学术会议论文摘要汇编[C];2011年
3 杨仲南;;拟南芥绒毡层发育和功能基因调控网络[A];植物分子生物学与现代农业——全国植物生物学研讨会论文摘要集[C];2010年
4 熊江辉;李莹辉;;基因芯片数据分析的新方法与基因调控网络推理[A];全面建设小康社会:中国科技工作者的历史责任——中国科协2003年学术年会论文集(上)[C];2003年
5 齐金鹏;邵世煌;白慧;李豆豆;;基于DNA损伤的p53基因调控网络模型研究[A];2006全国复杂网络学术会议论文集[C];2006年
6 刘贝;李勇;孟繁疆;芦艳敏;;基因调控网络模型的研究[A];黑龙江省计算机学会2007年学术交流年会论文集[C];2007年
7 李奎;;小型猪2型糖尿病动物模型的建立及2型糖尿病相关关键基因调控网络的初步研究[A];中国遗传学会模式生物与人类健康研讨会会议论文集[C];2010年
8 侯睿;包振民;王师;王宸;李宁;王明玲;;中国沿海三种主要养殖扇贝的DNA甲基化分析[A];中国动物学会、中国海洋湖沼学会贝类学会分会第十四次学会研讨会论文摘要汇编[C];2009年
9 应康;;cDNA芯片在急性白血病中研究基因表达谱和拷贝数变化的应用[A];第九届全国实验血液学会议论文摘要汇编[C];2003年
中国重要报纸全文数据库 前10条
1 张建松 张学全;我国科学家揭示白血病治疗的基因调控网络[N];中国医药报;2000年
2 任海军;中国科学家发现稻米食用品质基因调控网络[N];粮油市场报;2009年
3 秦岭;我国科研人员发现决定稻米食用品质的基因调控网络[N];中国知识产权报;2009年
4 通讯员 戴世勇 记者 张孔生;稻米口味有望“调控”[N];扬州日报;2010年
5 记者 王宝琳;我首次采用基因组学技术研究中药[N];科技日报;2009年
6 新华;我国发现稻米品质控制基因调控网络[N];中国食品报;2009年
7 游雪晴 实习生 刘晓倩;寻找埋在“垃圾”中的财富[N];科技日报;2005年
8 ;春去花不落风静月长明[N];科技日报;2003年
9 记者 柳悦;“速效救心丸基因组”研究启动[N];天津日报;2009年
10 包含飞;中医学属于复杂性科学的6个理由[N];中国中医药报;2005年
中国博士学位论文全文数据库 前10条
1 张相华;基因网络分析的统计模型研究[D];中国科学技术大学;2011年
2 张律文;基因调控网络的数值研究[D];上海大学;2010年
3 徐红林;基因调控网络的建模及其结构分解方法研究[D];江南大学;2010年
4 王政霞;时滞基因调控网络的稳定性研究[D];重庆大学;2009年
5 周到;基因调控网络的构建及其动态性与稳定性研究[D];华中科技大学;2009年
6 张文兵;基因调控网络的随机动力学分析[D];东华大学;2012年
7 王镇岭;基于自适应滤波的基因调控网络研究[D];青岛大学;2013年
8 缑葵香;基于贝叶斯理论的基因调控网络建模研究[D];天津大学;2010年
9 张云俊;统计模型在基因调控网络结构学习和被动传感器目标定位中的应用[D];北京大学;2012年
10 贺勤斌;两个复杂系统中的相关问题研究[D];上海大学;2012年
中国硕士学位论文全文数据库 前10条
1 焦清局;拟南芥花药基因调控网络的构建[D];上海师范大学;2010年
2 郑明;用时滞微分方程模型重构基因调控网络[D];吉林大学;2010年
3 苏兰莹;基于递归神经网络构建基因调控网络的研究[D];吉林大学;2010年
4 张闻;隐马尔可夫模型在基因调控网络建模中的应用[D];西安理工大学;2010年
5 杨斌;微分方程系统在基因调控网络和代谢途径中的应用研究[D];济南大学;2010年
6 王雯;动静态基因调控网络构建方法研究与分析[D];电子科技大学;2010年
7 葛玲玲;基于动态贝叶斯模型的基因调控网络构建方法研究[D];合肥工业大学;2010年
8 潘为;基因调控网络的分析与控制[D];中国科学技术大学;2011年
9 张如贝;基于微分方程模型的基因调控网络稳定性分析[D];南京信息工程大学;2011年
10 扶凌云;基因调控网络鲁棒稳定性分析[D];中南大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026