生物网络的结构辨识与参数估计
【摘要】:
本研究采用工程学和系统科学方法,分别以离散一阶线性、离散二阶线性、离散非线性、连续非线性、连续-离散非线性状态空间模型框架对动态生物网络进行了描述,并对生物网络的结构辨识和参数估计方法进行了探索,这为环境和药物干扰下系统动态特性分析及其控制研究奠定了基础。具体内容如下:
(1)提出和发展了约束性扩展卡尔曼滤波。网络结构约束是基因网络的参数估计区别于工程技术中的参数估计的显著标志。在工程技术领域中,我们一般不考虑系统的结构,但是基因网络是有结构的。有的基因之间具有相互作用,有的基因之间没有相互作用。基因网络参数估计算法中必须包含网络结构性约束。
(2)与Hao Xiong和Yoonsuck(2008)合作独立提出了调控网络的二阶线性状态空间模型。发展了用扩展卡尔曼滤波估计基因网络的二阶线性状态空间模型。基于芯片表达数据的调控网络通常采用一阶线性状态空间模型。针对调控网络,Hao和Yoonsuck用EM算法估计二阶线性模型的参数,而我们用扩展卡尔曼滤波来估计同样模型的参数。
(3)把扩展卡尔曼滤波用于非线性代谢网络、信号转导网络的动力学方程的参数估计,发展了可用于一般非线性动态系统的扩展卡尔曼滤波参数估计方法。
(4)提出用Rao-blackwellised粒子滤波对非线性生物网络进行参数估计。
(5)生物网络一般为具有离散观测数据的连续动态系统。这种生物网络更适合用混合非线性状态空间模型来描述。我们尝试估计这类混合非线性模型的生物网络的参数,发展了连续-离散非线性状态空间模型参数估计算法,并将其应用于JAK-STAT信号转导通路。
(6)信号转导网络和基因调控网络的数据多数是多次实验的面板数据。目前还没有现成的针对面板数据的参数估计算法。本研究发展处理面板数据的参数估计方法,将采样数写入状态空间模型,并对扩展卡尔曼滤波算法和Rao-Blackwellised粒子滤波算法重新进行推导。
(7)发展了新的EKF_EM混合算法:以EKF方法同时估计状态和参数,同时采用EM算法估计系统噪音协方差矩阵和观测噪音协方差矩阵。算法精度得到一定程度的提高。
(8)首次采用分布估计算法搜索流行病数据的动态模型,并与遗传算法进行比较,发展了与遗传算法或分布估计算法结合的扩展卡尔曼滤波算法。