基于集群的代谢网络远程计算平台
【摘要】:
随着系统生物学的兴起,流平衡分析方法在发展以来的代谢网络模拟方法中表现出了明显的优势,它是在整合所有网络信息的基础上从系统的水平上来全面考察生物体,特别是它具有不依赖于生化反应的信息详细的优点。目前代谢网络的模拟都是在单机上执行的,然而代谢网络的规模一般都比较大,所需要的计算量也会比较大,仅靠在单机上运行是不可行的,所以需要有集群系统的支持,并且随着因特网的普及,人们对实时服务的需求也越来越大。因此,构建一个基于集群的代谢网络远程计算平台是很有意义的。
描述系统体系结构的发展历程,并总结历来的系统体系结构的特点,由此提出代谢网络远程计算平台的多层体系结构。根据系统的多层体系结构设计,采用多种技术来实现。在用户表示层,首先设计用户的工作流程和模拟界面,然后使用Applet技术实现通用的模拟界面以及利用数字签名技术实现Applet应用程序对本地资源的访问。在表示逻辑层,利用Servlet与Applet之间的通信技术实现远程数据交换和利用线程池技术处理多用户请求。在业务逻辑层,引入负载平衡机制控制计算任务在集群节点上的分配,以及使用JavaBean技术实现了对数据库操作的封装。在数据层,采用系统生物学描述语言来描述代谢网络模型,以文档的形式将代谢网络模型保存在数据库中,并使用JDBC技术来实现对数据库的连接。
以心肌细胞线粒体的能量代谢网络为例来测试该远程计算平台。在整合了相关生化反应信息的心肌细胞线粒体的能量代谢网络模型上,结合生物化学理论进行模拟实验,通过远程计算的方式可得到与已知知识相符合的可视化的模拟结果。该远程计算平台不仅便于升级和维护,而且具有平台无关性、强大的计算性能和对重负荷的支持能力。