收藏本站
《山东大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

肿瘤Biomarker的计算系统生物学研究及生物网络可视化软件的开发

郇天笑  
【摘要】: 背景和目的 近年来,大规模的生物分子相互作用数据,特别是利用高通量手段研究并整理的蛋白质相互作用(Protein-protein interaction,PPI)数据库和海量数据的发布,对于疾病,特别是肿瘤的研究着眼于在病理状态下整个分子系统网络的动态变化;同时,开始从系统、全局的角度出发,研究疾病临床综合症群和内在的生物分子网络之间的关系,进一步改进疾病的分类标准,重新对疾病进行更准确的定义。 肿瘤蛋白分子标记(Protein Biomarker)的应用对肿瘤的诊断、预后和靶向治疗有重要的作用;也为疾病的分类提供了有效依据。然而,由于肿瘤发生和发展过程中复杂病理机制,肿瘤Biomarker发掘的过程非常艰巨;到目前为止,只有9个肿瘤相关蛋白通过FDA认证,作为临床检测Biomarker用于癌症的诊断检测。在系统生物学蓬勃发展的背景下,作为候选的Biomarker应该从系统水平上进行研究,需要大规模收集数据,探讨肿瘤发生过程中关键的致病基因和其下游的效应基因,选择有效的诊断和治疗Biomarker,尽量避免Biomarker选择中高假阳性和假阴性等一系列问题。 本课题,我们从系统生物学角度,探讨了肿瘤蛋白Biomarker发掘的一系列问题。1)首次,从人类分子相互作用网络、基因组、蛋白质组学,以及癌症的疾病临床综合症群的宏观角度,分析1000多个经验型肿瘤蛋白Biomarker的性质,为肿瘤蛋白Biomarker发掘计算模型的构建,提供了生物学依据;2)探讨肿瘤蛋白Biomarker发掘的算法,利用人类全局PPI网络的信息和疾病表型关联网络的信息,进行模型构建,较传统的有效的计算方法,效率进一步提高;3)以原发性肝细胞癌(HCC)和其重要的蛋白Biomarker-甲胎蛋白(AFP)为例,深入探讨AFP在HCC发生和发展中的关系,比较AFP阳性、阴性HCC临床样本中基因表达差异并推断了相关的分子机制;4)设计和研发面向多级(Muti-scale)生物网络的可视化数据发掘工具——ProteoLens,通过兼容SQL语句,改进了传统可视化工具的兼容性差,不能方便、有效的处理多样的系统生物学数据的弱点;能够更加有效的建立包含丰富注解信息的和多级生物学网络,来理解复杂的生物学网络的结构,从中挖掘有效的信息。我们的研究,旨在沟通生物学基础研究和临床医学研究;并构架计算分析的平台,使计算生物学家也能够有效的参与肿瘤的诊断和治疗这一重大问题中来。 主要研究方法 1、数据的收集和整理 1)疾病基因,癌症基因,肿瘤蛋白Biomarker,必要基因,药物靶分子基因; 2)PPI网络,TF-基因调节网络,Pathway,基因共表达网络; 3)组织特异性数据,组织表达数据,Gene Ontology数据,健康人血浆蛋白肽的图谱数据; 4)分子ID映射,疾病术语,分子注解信息; 2、肿瘤蛋白Biomarker的性质分析 1)PPI网络中拓扑性质比较; 2)组织特异性比较; 3)表达范围比较; 4) Gene Ontology关键词比较; 5) Co-Pathway统计; 6)共表达统计; 3、癌症表型特异性分子网络的构建 1)PPI网络子网; 2)TF-基因调节子网; 4、肿瘤表型关联网络的定义与比较 1)肿瘤疾病基因定义的疾病表型关联网络; 2)肿瘤蛋白Biomarker定义的疾病表型关联网络; 3) GWAS疾病相关位点定义的疾病表型关联网络; 4)网络间通过构建相似性得分和邻接矩阵聚类进行比较; 5、SW-RWR算法设计和评估 1)覆盖率; 2)敏感性; 3)准确度; 6、AFP分子演化的分析 1)进化树构建; 2)结构域分析; 3)基因调节区序列分析; 7、AFP+/-原发性肝细胞癌临床样本的基因表达差异分析 1)肝细胞癌表达谱数据收集与整理; 2) Meta-analysis; 3)贝叶斯网络和PPI网络比较; 4)基因功能分析; 8、网络可视化软件ProteoLens的设计和实现 1)基础框架; 2)Java编程实现; 3)系统生物学研究示例。 研究结果 第一部分 肿瘤蛋白Biomarker的性质分析 为评估肿瘤蛋白Biomarker的特性,我们选择疾病基因、癌症基因、药物靶蛋白和必要基因作为参照。 1)各个功能集合之间的重叠的基因数目较少; 2)肿瘤Biomarker在PPI网络中的节点的平均度数小于癌症基因和必要基因在PPI网络中节点的平均度数,但高于疾病基因和药物靶蛋白的平均数; 3)肿瘤蛋白Biomarker包含较多的组织特异性基因; 4)肿瘤蛋白Biomarker中基因平均表达的组织数目甚至多于必要基因集合中的平均水平; 5)肿瘤蛋白Biomarker集中共有385个显著的GO术语,包括26个细胞模块术语,0个分子功能术语和359个生物过程术语; 6)肿瘤蛋白Biomarker在以疾病基因为种子扩张的PPI和PPI-TF-调节基因网络中的分布:当选择更加精确的的种子蛋白(接近癌症基因的时候)进行PPI和PPI-TF-调节基因网络构建,与肿瘤蛋白Biomarker的交集占总肿瘤蛋白Biomarker集的比率显著增大; 7)肿瘤蛋白Biomarker和相应表型的疾病基因易于共表达并参与同一Pathway。 构建基于肿瘤蛋白Biomarker疾病表型网络(DBN) 762个肿瘤蛋白Biomarker对应于59类不同的癌症表型中,包含820个“Biomarker-疾病表型”关联,平均两个癌症表型有8个相同的Biomarker;每个Biomarker出现在13个癌症表型中。所有59个结点,连接成一个联通图,没有孤立结点或子网。 比较DBN和基于疾病基因的疾病表型网络(DAN) 疾病基因和蛋白Biomarker描述的肿瘤表型之间关系具有等效性。 第二部分 SW-RWR算法 是在随机行走算法(Random Walks Ranking,RWR)的基础上,利用肿瘤表型关联网络的先验知识,指导PPI网络中随机行走策略。SW-RWR是为解决肿瘤蛋白Biomarker发掘的问题对RWR算法的改进。SW-RWR算法对白血病蛋白Biomarker的排序 1)从基于肿瘤Biomarker的表型关联网络中,依据相似性得分提取白血病相关的疾病表型; 2)分析白血病与选择的表型之间的相关性:与白血病相关联的这5个癌症表型,其疾病基因与白血病疾病基因之间通过蛋白质相互作用紧密关联; 3) SW-RWR选择的20个蛋白的生物学意义分析,显示出与白血病分子机制的强相关性; 4)通过敏感性和准确率(使用阳性预测值,PPV)评估对白血病蛋白Biomarker的预测效力:SW-RWR优于RWR。SW-RWR算法对肺癌蛋白Biomarker的排序 1)建立基于GWAS的疾病表型关联网络:分别创建了3个疾病相关网络(DAN),网络结点为疾病表型,网络关联分别定义为:疾病表型之间有相同的SNP位点(DAS)-DAN1,相同的DAS对应基因-DAN2,或相同的DAS对应的染色体区域-DAN3。共包含85个不同的节点,代表85个独立疾病表型。 2)DAN中抽取与肺癌关联的子网:确定5个肺癌相关的疾病表型,这5个疾病和肺癌在遗传学上有相同的异常基因;这些疾病基因之间通过直接或间接地PPI相互连接,表示了疾病之间的分子机制的内在关联;同时,在病理研究上,这5个疾病也有与肺癌关联紧密的证据。 3) SW-RWR选择的20个蛋白的生物学意义分析; 4)通过敏感性和准确率评估对肺癌蛋白Biomarker的预测效力:SW-RWR优于RWR。 第三部分 AFP以及类白蛋白家族分子演化分析 1)进化树显示,蛋白的进化与物种的进化是一致的,就AFP分支来看,鸡较人、狗、大鼠、小鼠同源性较低,而更相似于其旁系同源物——鸡ALB;大鼠与小鼠之间AFP同源性较高,人与狗之间AFP同源性较高。类白蛋白家族成员,在鱼类只存在一个,两栖类有两个,鸟类有三个,哺乳类有四个 2)结构域分析。在七鳃鳗中发现了具有多个结构域的白蛋白,由此可以推测,在原索动物或无脊椎动物中存在单个的类似白蛋白结构域的蛋白。来自于同一个蛋白的不同白蛋白结构域之间较与其直系同源蛋白对应的白蛋白结构域差别较大,可以推测,基因复制事件是以蛋白为单位的。类白蛋白家族成员,第一和第二结构域较第三结构域更为相似,可推断最初的加倍导致原始的蛋白具有两个结构域的形状,之后经历了第三次的部分复制。 3)基因调节区分析。从鸡、大鼠、小鼠、狗等物种中均找到与AFP增强子E1、E2、E3有较高相似性的原件。 AFP+/-原发性肝细胞癌临床样本基因表达谱差异 根据Meta-analysis共选择166个差异表达基因;使用MMHC构建贝叶斯网。这些基因构建成一个联通图,与AFP表达相关;关于这196个基因的平均PPI度数,相对于平均水平而言,要远远高于平均水平。 通过基因功能分类可见,AFP低表达的样本较高表达样本,免疫基因表达高的相关基因参与炎症反应、补体激活、抗原呈递、T细胞激活等多种免疫反应;而在AFP高表达的病例中,免疫相关基因表达相对较高的数目少;AFP高表达的病例中,表达相对高的基因功能类群为与细胞黏附和增殖相关的基因;部分基因是与Wnt、MAPK等信号通路中的关键基因;18个基因编码转录因子;此外,一些基因参与其他肿瘤发生过程。 第四部分 ProteoLens构架 ProteoLens使用Java语言编写,软件构架包含两个独立的功能层:前台的数据可视化层和后台的数据处理层,两个层之间通过数据关联引擎连接。数据处理层为提供了数据处理的能力,用户可以通过把ProteoLens和关系数据库(Oracle、PostgreSQL)相连接,利用数据库本身提供的SQL操作环境对数据表格进行操作。之后,通过创建数据关联连接数据可视化层,把已经处理好的数据表格构建网络可视化视图。这样的设计,方便和简化用户对数据处理和数据可视化的操作,不需要利用第三方软件。 ProteoLens主要功能和特点ProteoLens的核心功能:1)ProteoLens支持数据源类型有:以分隔符为标识 的文本文件、关系数据库、XML数据文件和GML文件;2)基于SQL的数据可视 化分析,完全支持SQL语句块编程;3)灵活的网络可视化注解方式;4)用户能 够在当前的生物网络中依据某种条件提取子网;5)丰富全面的自动网络布局。 ProteoLens可以用来解决的生物学问题示例1)利用ProteoLens建立人类癌症表型关联网络;2)利用ProteoLens建立复合物-药物靶蛋白相互作用网络;3)利用ProteoLens建立蛋白质-肽关系网络。 研究结论和创新性 1.通过计算系统生物学的方法,从系统网络的观点,对具有潜在应用价值的1000多个肿瘤蛋白Biomarker进行系统的性质分析和评估。肿瘤蛋白Biomarker相对疾病基因、药物靶分子和必要基因而言,具有独特的生物网络拓扑性质、表达特征和GO谱系特征;肿瘤蛋白Biomarker和疾病基因之间,有直接或间接的相互作用关联。 2.建立以肿瘤蛋白Biomarker为关联的疾病表型关联网络,量化了肿瘤蛋白Biomarker和疾病基因的内在联系,证实可以通过蛋白Biomarker联结癌症表型和基因型。 3.首次,将“人类疾病网络”的概念应用到肿瘤Biomarker挖掘中,设计了新的计算框架和算法——SW-RWR,对于肿瘤蛋白Biomarker的预测和排序的效率有了显著提高。 4.首次,使用将GWAS信息应用于疾病相关Biomarker的排序研究,证实GWAS信息的指导,可以显著提高肿瘤Biomarker的发现效率。同时,计算框架的提出有助于促进生物医学各方面研究的合作。 5.研究AFP(原发性肝癌的Biomarker)与原发性肝癌(HCC)发生发展的联系,筛选196个差异基因,差异基因多为PPI网络中的Hub基因;提示AFP+/-HCC临床病例中免疫应答、细胞黏附和增殖、WNT等信号通路存在差异。 6.设计研发ProteoLens软件。ProteoLens整合网络的创建、注解、分析和可视化于一体,是一个新型的面向多级生物学网络的软件分析平台。相对于传统的生物网络可视化软件,主要创新性有:1)全面支持关系数据库Oracle和PostgreSQL的连接,支持嵌入式SQL(Structure Query Language)语言;2)支持图、网络的标准建模语言—GML;3)数据可视化和数据注解设计为两个独立的模块,通过数据关联连结,网络注解设置方便。
【学位授予单位】:山东大学
【学位级别】:博士
【学位授予年份】:2010
【分类号】:TP391.41;R730

手机知网App
【引证文献】
中国期刊全文数据库 前1条
1 徐凉凉;邵文武;朱斐;;生物体间关系可视化系统设计与实现[J];微计算机信息;2012年07期
【共引文献】
中国期刊全文数据库 前10条
1 王修海,王培林;整合型HBV DNA前C区突变和p53基因突变与肝细胞癌发生的关系[J];癌症;2003年07期
2 张华;陈华;李永兴;项明洁;;原发性肝细胞癌患者外周血AFP mRNA的表达及其临床意义[J];标记免疫分析与临床;2008年06期
3 李鹏;刘珲;孙琳;范春蕾;李磊;董培玲;张斌;李宁;丁惠国;;血清甲胎蛋白对原发性肝细胞癌诊断价值的再评价[J];北京医学;2010年09期
4 何德琳;程勇;赵瑞莲;;基于MMHC算法的贝叶斯网络结构学习算法研究[J];北京工商大学学报(自然科学版);2008年03期
5 李家开,张金山;肝癌基因治疗研究进展与介入医学[J];放射学实践;2001年06期
6 ;Risk factors for early recurrence of small hepatocellular carcinoma after curative resection[J];Hepatobiliary & Pancreatic Diseases International;2010年01期
7 ;Oncofetal antigen glypican-3 as a promising early diagnostic marker for hepatocellular carcinoma[J];Hepatobiliary & Pancreatic Diseases International;2011年03期
8 黄竹英;李松;汪平帮;聂新民;;VEGF与MMP-9在原发性肝癌中的表达及意义[J];国际检验医学杂志;2010年12期
9 朱颖;袁耀宗;;TRAIL及其受体促凋亡机制与消化道肿瘤治疗的前景[J];国际消化病杂志;2008年02期
10 韩聚强;甲胎蛋白抗肝细胞癌研究进展[J];国外医学(肿瘤学分册);2001年05期
中国重要会议论文全文数据库 前1条
1 ;Heat Shock Protein 72 Associated with Alpha-fetoprotein in Human Hepatocellular Carcinomas[A];自主创新与持续增长第十一届中国科协年会论文集(1)[C];2009年
中国博士学位论文全文数据库 前10条
1 李维华;概率网的重构[D];云南大学;2010年
2 曾献辉;服饰智能适配系统的研究与应用[D];东华大学;2010年
3 王中锋;树型贝叶斯网络分类器鉴别式训练研究[D];北京交通大学;2011年
4 曾文胜;CS-PEG纳米载体介导Mcl-1 siRNA联合奥沙利铂治疗肝癌的实验研究[D];中南大学;2011年
5 房锋;MiR-188-5p靶向AAC11抑制肝细胞癌生长和侵袭转移的研究[D];中南大学;2011年
6 舒宏;乙肝病毒相关肝病血清分子标志物的筛选、验证和诊断价值[D];复旦大学;2011年
7 王体龙;光电侦察中目标快速识别算法研究[D];中国科学院研究生院(长春光学精密机械与物理研究所);2011年
8 王翔;混合蚁群算法及其在管理优化中的应用[D];东华大学;2012年
9 王成;YAP蛋白对肝细胞癌切除术后短期复发的影响[D];第三军医大学;2011年
10 涂炜;HBV编码蛋白HBx通过核基质结合蛋白SATB1诱导肝癌细胞失巢凋亡抵抗的作用机制研究[D];华中科技大学;2012年
中国硕士学位论文全文数据库 前10条
1 刘晓燕;AFP在糖皮质激素诱导的大鼠结肠提前发育中的作用[D];南京医科大学;2009年
2 李海霞;Jab1基因靶向RNA干扰对喉癌生长抑制的实验研究[D];郑州大学;2010年
3 任鹏飞;AHSG基因的原核表达及其在原发性肝癌诊断中的价值[D];郑州大学;2010年
4 叶茂毅;基于混合遗传算法的图像匹配研究[D];北京印刷学院;2011年
5 肖飞;肝癌相关抗原GCF2基因同源片段的原核表达及鉴定[D];广西医科大学;2011年
6 黄文锋;HJURP基因多态性与HBV相关性肝癌遗传易感性的关联研究[D];广西医科大学;2011年
7 季君;α-1,6岩藻糖基转移酶在原发性肝癌中的临床意义及功能研究[D];第二军医大学;2011年
8 赵金艳;代谢异常及N-糖基化在原发性肝细胞癌中的研究[D];第二军医大学;2011年
9 苌健;基于灵敏性分析的贝叶斯网络扰动学习方法研究[D];合肥工业大学;2011年
10 李圃;重组腺病毒Adv-AFPsiRNA的构建及其对卵巢癌生长抑制的实验研究[D];天津医科大学;2008年
【同被引文献】
中国期刊全文数据库 前1条
1 陈浩;朱斐;;一个面向汽车零配件管理的Web Service[J];微计算机信息;2010年15期
中国博士学位论文全文数据库 前1条
1 何胜;复杂生物网络可视化方法研究[D];江南大学;2010年
中国硕士学位论文全文数据库 前1条
1 王海沿;基于MVC架构的可重用基因组序列可视化软件[D];华中科技大学;2004年
【二级参考文献】
中国期刊全文数据库 前5条
1 余中逊,朱建新,张亚历,蔡俊杰,袁爱力;P53与C-myc基因产物在肝细胞癌中的表达[J];第一军医大学学报;1995年04期
2 白咸勇,贾秀红,成令忠,顾云娣,童蓓燕;大鼠肝癌发生过程中p53的突变和甲胎蛋白的表达[J];中国组织化学与细胞化学杂志;1997年02期
3 郑杰,武忠弼,阮幼冰,杨木兰,刘冰;癌基因蛋白ras p21、甲胎蛋白在实验性大鼠肛癌前病变中的表达[J];临床与实验病理学杂志;1995年02期
4 郑杰,武忠弼,阮幼冰,杨木兰;二乙基亚硝胺诱发大鼠肝癌变过程中三种基因的原位表达[J];中华病理学杂志;1995年05期
5 陈子华,吕新生,文继舫,沈明;原癌基因Jun/C-myc在原发性肝细胞癌中的表达及意义[J];中华实验外科杂志;1997年05期
【相似文献】
中国重要会议论文全文数据库 前10条
1 李波;;临床前安全性生物标志物(Biomarker)的研究进展[A];2010年全国药物毒理学学术会议论文集[C];2010年
2 ;Biomarker discovery and identification from non-small cell lung cancer sera using a differential proteomics approach[A];中华医学会第五届全国胸部肿瘤及内窥镜学术会议论文汇编[C];2011年
3 ;Using nano-magnetic-beads and MALDI-TOF MS technology to screen serum biomarker of lung cancer[A];中华医学会第五届全国胸部肿瘤及内窥镜学术会议论文汇编[C];2011年
4 李洪东;龙旭霞;张婉;许青松;梁逸曾;;变量互补信息网:一种新型的探寻Biomarker及其相互关联的方法[A];中国化学会第28届学术年会第14分会场摘要集[C];2012年
5 Richard Lalonde;;Improved Trial Designs and Drug Development Using Modeling and Simulation[A];第十二次全国临床药理学学术会议会议论文集[C];2010年
6 ;SELDI-TOF-MS as a method for biomarker discovery in the urine of minimal-changed nephrotic syndrome[A];中华医学会第九次全国检验医学学术会议暨中国医院协会临床检验管理专业委员会第六届全国临床检验实验室管理学术会议论文汇编[C];2011年
7 Shih-Hsin Lu;;High level of microRNA-31 in Serum as a potential biomarker for diagnosis and prognosis in patients with esophageal squamous cell carcinoma[A];2010’全国肿瘤分子标志及应用学术研讨会暨第五届中国中青年肿瘤专家论坛论文汇编[C];2010年
8 ;Salivary CRH as a biomarker to evaluate individual responses to hypoxia[A];中国生理学会第23届全国会员代表大会暨生理学学术大会论文摘要文集[C];2010年
9 ;Generation and Characterization of a Panel of Monoclonal Antibodies Against Distinct Epitopes of Human CD146[A];第十一次中国生物物理学术大会暨第九届全国会员代表大会摘要集[C];2009年
10 ;Circulating miR-519e * as a new biomarker of acute myocardial infarction[A];第十三次全国心血管病学术会议论文集[C];2011年
中国博士学位论文全文数据库 前8条
1 郇天笑;肿瘤Biomarker的计算系统生物学研究及生物网络可视化软件的开发[D];山东大学;2010年
2 于凤鸣;利迪链霉菌I型聚酮合成酶基因克隆及功能研究[D];天津大学;2006年
3 张炎;类风湿关节炎患者血清蛋白质组学研究[D];北京协和医学院;2009年
4 曾旭;MALDI-TOF-MS联合磁珠技术对乳腺癌肿瘤标记物的筛选和鉴定[D];北京协和医学院;2010年
5 柳金顺;肾细胞癌差异蛋白质发现与筛选的实验研究[D];北京协和医学院;2009年
6 周继红;应用表面增强激光解析电离飞行时间质谱技术筛选肺癌差异蛋白的研究[D];广西医科大学;2010年
7 杨柳松;不同1p杂合性缺失特征少枝胶质瘤的差异蛋白质组学研究[D];复旦大学;2010年
8 贾占奎;肾母细胞瘤血清标记物的筛选与鉴定[D];郑州大学;2012年
中国硕士学位论文全文数据库 前10条
1 韵雪雪;体外培养乳腺癌亚细胞差异蛋白筛选[D];重庆医科大学;2011年
2 杨义玲;应用血小板蛋白质组学方法筛选ITP患儿血小板蛋白标志物[D];泸州医学院;2012年
3 徐倩;急性淋巴细胞白血病患儿血小板蛋白质组学研究[D];泸州医学院;2013年
4 廖琳迪;血液及唾液蛋白指纹图谱在口腔颌面恶性肿瘤诊断中的应用研究[D];华中科技大学;2013年
5 易庆军;传染性单核细胞增多症患儿血清生物标志物的蛋白质组学研究[D];泸州医学院;2011年
6 董晓芬;绝经后骨质疏松症的血清蛋白质指纹图谱分析[D];山西医科大学;2011年
7 付海艳;应用SELDI-TOF-MS技术筛选原发性胆汁性肝硬化患者血清特异性标志物[D];昆明医学院;2011年
8 陈道光;非霍奇金淋巴瘤血清蛋白质谱差异性研究[D];福建医科大学;2010年
9 林艳;血清标志物和蛋白质谱联合检测非小细胞肺癌的临床意义[D];福建医科大学;2010年
10 李春伟;应用SELDI-TOF-MS技术筛选早期胃癌血清生物标志物研究[D];青岛大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026