疟原虫分子功能注释二级数据库的构建
【摘要】:目的:
(1)为了更好地对疟原虫分子机制研究过程中产生的实验数据进行分子功能注释分析,构建疟原虫分子功能注释数据库PlasmoFADB。
(2)开发一个数据注释结果界面友好直观,分析过程简便易行,相关数据库高度整合,平台扩展性较强的生物信息学分析平台,为疟原虫研究相关科研工作者提供良好的高通量数据分析工具和平台。
方法:
(1)数据整合:PlasmoFADB数据库整合多物种多类型数据。从GenBank、 Uniprot、 PubMed中下载整合物种的基本信息,作为基础数据库,从KEGG、BioCarta、 NCI-PID数据库中下载整合物种的通路信息,从Gene Ontology下载基因本体信息,从dbSNP、DGV数据库中下载整合物种的变异信息,从Agilent、Illumina、Affymetrix官网上下载探针信息,从JASPAR、ITFP数据库中下载转录因子信息,从EPD数据库中下载启动子信息,从HPRD、MINT数据库中下载蛋白质与蛋白质相互作用信息,从nirBase、microma、EBI-MicroCosm、TargetScan数据库中下载miRNA及靶基因信息,将以上下载的原始数据经程序处理导入MySQL数据库中,以用于构建平台。
(2)功能注释:在GO2Gene、Pathway2Gene方向进行注释时,调用Fisher's精确概率检验算法程序实现对注释结果的富集分析或显著性分析。在对蛋白质相互作用结果(PPI)进行图形化描述时,调用Graphviz工具。
(3)平台实现:以Windows XP SP3为服务器,MySQL为底层数据库,根据解析后的数据进行数据表设计,采用Navicat for MySQL对数据库进行可视化管理。以Apache为网络服务器,使用MyEclipse等软件,基于J2EE技术和MVC的三层体系架构,以Java、JSP、HTML、XML、JavaScript、Ajax、Jquery Hibernate等语言或技术进行编程开发疟原虫分子功能注释平台及相关插件。
结果:
(1)PlasmoFADB数据库设置多入口的分子注释类型,包括ProbeID、GenelD、 SwissProtID等。
(2)使GO以GOTree的注释形式展示,并对GO注释结果进行富集分析,用户可从中选出富集效果较好的数据进行下一步研究,支持注释结果的自由下载。
(3)图形化显示蛋白质与蛋白质相互作用结果,使其注释信息更加直观明了。
(4)注释分子在Pathway通路图上的快速定位及图形化显示,并对注释分子所影响的Pathway通路进行显著性分析,根据注释结果判断注释分子对通路的影响作用。
(5)PlasmoFADB数据库可对整合的部分物种进行启动子、转录因子、靶基因及变异信息注释。结论:
(1)通过整合多种疟原虫虫株及模式生物的注释信息,构建一个可对疟原虫高通量生物实验数据提供快速有效注释的二级数据库PlasmoFADB。
(2)为表达谱芯片数据分析提供了一个快速高效的注释平台,为深入挖掘和理解模式生物和疟原虫分子机制研究中高通量数据生物学意义提供了有力的分析工具。
(3)本平台对疟原虫研究和模式生物表达谱数据分析有很大实用价值,可有效促进疟原虫基因功能、表达调控、通路等分子机制以及模式生物基因功能研究,也可以对疟原虫表达谱芯片探针的设计起到一定的参考作用。
|
|
|
|
1 |
许三岗;庄永龙;郝志勇;单广良;杨啸林;王恒;;致病疟原虫分子功能注释二级数据库的构建[J];中国生物医学工程学报;2012年06期 |
2 |
;[J];;年期 |
3 |
;[J];;年期 |
4 |
;[J];;年期 |
5 |
;[J];;年期 |
6 |
;[J];;年期 |
7 |
;[J];;年期 |
8 |
;[J];;年期 |
9 |
;[J];;年期 |
10 |
;[J];;年期 |
11 |
;[J];;年期 |
12 |
;[J];;年期 |
13 |
;[J];;年期 |
14 |
;[J];;年期 |
15 |
;[J];;年期 |
16 |
;[J];;年期 |
17 |
;[J];;年期 |
18 |
;[J];;年期 |
19 |
;[J];;年期 |
20 |
;[J];;年期 |
|