收藏本站
《南京大学》 2012年
收藏 | 手机打开
二维码
手机客户端打开本文

CePa:一种识别显著基因集合的新方法及其在线数据分析平台的搭建

曹坤明  
【摘要】:基因芯片技术的出现使细胞生物学实验模式从传统的单个或少量基因研究跃变到全基因组的水平,是生物技术领域一次伟大的革新。为了找出隐藏在海量芯片数据中的客观规律,揭示生物体的奥秘,近年来人们尝试了多种数据分析方法来分析基因芯片数据,从传统的简单的排序到如今的人工智能。基因表达芯片数据分析作为基因芯片技术在实际应用中必不可少的步骤,是一个系统性的过程,其中每一步都需要详细的设计和谨慎的操作。基因表达芯片数据分析一般包括:芯片数据的预处理、寻找差异表达基因、聚类、基因集合分析、转录调控分析以及基因互作网络分析几个环节。其中,通过基因集合分析可以从芯片数据中直接提取反映生物体系功能变化的基因集合,对生物学研究和芯片检测技术的有效使用有重要意义。本文针对这个环节完成了两部分工作:(1)发展了一个基于基因网络拓扑结构中心性的基因集合显著性分析方法---CePa;(2)建立了一个实用的基因集合显著性分析平---CePa在线分析平台。 基于ORA的基因集合分析方法由于使用方便而被广泛应用于实验生物学研究,但分析结果的可靠性尚不令人满意。针对这一问题,本文引入网络结构因素,通过pathway水平统计量计算和网络中心性度量扩展了ORA方法,开发了一个新的基因集合分析方法CePa,用于寻找发生显著变化的生物途径。对实验芯片数据的分析显示,CePa比ORA方法能更有效地发现具有生物学意义的pathway。 本文还开发了一个在线的CePa基因表达芯片数据分析平台,CePa在线平台操作简单,只需进行简单的数据录入即可完成芯片数据的分析工作。CePa在线分析平台由客户端、网站服务器和计算服务器三大模块联合构建而成。客户端负责用户数据的输入和格式验证。网站服务器端负责用户数据的合理性验证以及将合理的数据以任务的形式提交给计算服务器。计算服务器通过队列的形式管理用户任务,利用队列先入先出的特性,对用户任务进行公平的排队计算。同时,计算服务器采用了并行运算的编程策略,通过多进程的形式对正在计算的任务进行多核同时运算,极大的提高了运算速度。R语言出色的绘图功能将用户结果绘制能形象直观的结果图,方便用户的查阅。
【学位授予单位】:南京大学
【学位级别】:硕士
【学位授予年份】:2012
【分类号】:Q78

手机知网App
【参考文献】
中国期刊全文数据库 前2条
1 涂晓芝;颜学峰;钱锋;;基于SOM网络的基因表达数据聚类分析[J];华东理工大学学报(自然科学版);2006年08期
2 吴斌;沈自尹;;基因表达谱芯片的数据分析[J];世界华人消化杂志;2006年01期
【共引文献】
中国期刊全文数据库 前10条
1 王勇;陈克平;姚勤;;系统发生分析软件PAUP和TreePuzzle使用方法介绍[J];安徽农业科学;2008年02期
2 王勇;陈克平;姚勤;;系统发生分析程序MrBayes 3.1使用方法介绍[J];安徽农业科学;2009年33期
3 王雯雯;武栓虎;;基于DNA双链特征的启动子预测方法[J];北京交通大学学报;2009年06期
4 秦洋;王立宏;武栓虎;宋宜斌;;基于拉普拉斯矩阵的DNA序列集相似性分析[J];北京交通大学学报;2009年06期
5 石鸥燕;杨文万;;生物信息数据库及其利用[J];包头医学院学报;2006年03期
6 向浏欣;谭军;;浅谈系统发生树构建方法[J];才智;2009年20期
7 曾彦达;石晓艳;马凤鸣;;甜菜亚硝酸还原酶(NiR)基因的克隆与分析[J];东北农业大学学报;2012年01期
8 詹青;王亚东;;基于平均交互信息量的DNA序列相似性分析[J];智能计算机与应用;2011年04期
9 张焕萍;王惠南;卢光明;钟元;张志强;;基于互信息的差异共表达致病基因挖掘方法[J];东南大学学报(自然科学版);2009年01期
10 刘玲;;基因表达谱数据分析技术[J];电脑与信息技术;2010年06期
中国重要会议论文全文数据库 前1条
1 胡扬;桂卫华;;人工代谢技术在医药领域中的应用研究[A];第二十九届中国控制会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 徐兆华;基因芯片数据统合分析方法的若干拓展[D];浙江大学;2010年
2 高翠芳;模糊聚类新算法及应用研究[D];江南大学;2011年
3 刘晨光;氧化还原电位调控的高浓度乙醇发酵及其机理研究[D];大连理工大学;2011年
4 刘念;三种蝗虫线粒体基因组测序与直翅目比较线粒体基因组学分析[D];陕西师范大学;2011年
5 李宝红;对应分析方法及其在肿瘤学中的应用研究[D];中南大学;2011年
6 赵建邦;基于代谢网络的功能模式发现及系统发生分析研究[D];西安电子科技大学;2011年
7 彭柳青;高维高噪声数据聚类中关键问题研究[D];西安电子科技大学;2011年
8 许爱清;茯砖茶的真菌菌群特性及其整肠功能研究[D];湖南农业大学;2011年
9 陈伟;群体智能算法及其在基因表达数据聚类中的应用[D];江南大学;2011年
10 缑葵香;基于贝叶斯理论的基因调控网络建模研究[D];天津大学;2010年
中国硕士学位论文全文数据库 前10条
1 张杰;基于支持向量机和蛋白质全序列的蛋白质—蛋白质相互作用预测[D];郑州大学;2010年
2 吕俊杰;真核基因剪接位点识别算法研究[D];哈尔滨工程大学;2010年
3 战晓文;基于完全基因组且无序列比对的用于亲缘分析的严格距离度量[D];湘潭大学;2010年
4 王若飞;基于机器学习的蛋白质折叠预测算法研究[D];湘潭大学;2010年
5 卓立;中国滨藜亚科的地理分布与分子系统学研究[D];新疆农业大学;2010年
6 赵丹;基于SVM分类机的DNA序列分类方法[D];南昌大学;2010年
7 张天红;网络钓鱼预警系统设计与分析[D];电子科技大学;2010年
8 林妙春;贪食迈阿密虫的生物学特性研究[D];福建师范大学;2010年
9 侯青敏;基于子图密度的序列模体发现算法研究[D];西安电子科技大学;2009年
10 郭丹丹;模体识别问题的优化遗传算法研究[D];西安电子科技大学;2010年
【二级参考文献】
中国期刊全文数据库 前9条
1 王莉,王正欧;TGSOM:一种用于数据聚类的动态自组织映射神经网络[J];电子与信息学报;2003年03期
2 王富刚,陈先农;基因芯片数据的聚类分析[J];国外医学(生物医学工程分册);2004年02期
3 曲建岭,王磊,杨建华,高峰;基于自组织特征映射网络的气体识别方法研究[J];测控技术;2000年03期
4 廖广兰,陈勇辉,史铁林;自组织映射网络的可视化研究[J];计算机工程与应用;2003年09期
5 宋云雪,史永胜;基于模糊自组织映射神经网络的故障诊断方法[J];计算机工程;2003年14期
6 张毓敏,谢康林;基于SOM算法实现的文本聚类[J];计算机工程;2004年01期
7 包雷,李泽,孙之荣;贝叶斯聚类在基因表达谱知识挖掘中的应用[J];生物物理学报;2002年01期
8 傅国康,赵荣椿;模糊自组织神经网络在语音识别中的应用[J];西北工业大学学报;1999年04期
9 颜学峰,陈德钊,胡上序;复杂模式保留拓扑的平面映射及其应用[J];浙江大学学报(工学版);2001年05期
【相似文献】
中国期刊全文数据库 前10条
1 桂乐;郭新;吴翔;;表达谱基因芯片筛选前体脂肪细胞分化相关基因的研究[J];南通大学学报(医学版);2008年06期
2 王蜀燕;孙朝晖;危敏;马文丽;;慢性髓细胞性白血病病人骨髓单个核细胞中差异表达基因的筛选[J];生物技术通讯;2011年02期
3 郭苗莉,朱江波,陈蓉芳,张天宝;应用基因芯片研究MNNG诱发小鼠胚胎畸形肢体基因的表达[J];环境与职业医学;2005年01期
4 严美娟;万明辉;李春鹏;夏春林;;两型星形胶质细胞基因表达谱差异的初步观察[J];南通大学学报(医学版);2007年01期
5 程金平;袁涛;冀秀玲;郑敏;王宇;王文华;张庆华;;基因芯片筛选氯化汞对大鼠脑神经毒性差异表达基因[J];环境科学;2006年04期
6 韩凤梅;张晓鸣;夏启松;王俊俊;陈勇;;五倍子小鼠肝脏毒性的基因表达谱分析(英文)[J];分子细胞生物学报;2009年02期
7 汪灏,李秋荣,马健,李幼生,李宁,黎介寿;二十二碳六烯酸对人树突状细胞基因表达谱的影响[J];肠外与肠内营养;2005年02期
8 余传定;许沈华;牟瀚舟;姜志明;朱赤红;刘祥麟;;胃癌差异表达基因在染色体上的定位及其功能分析(英文)[J];遗传学报;2006年05期
9 吴志国,肖波,杨晓苏,李国良,谢光洁;用cDNA表达阵列分析遗传性癫痫易感大鼠海马和大脑皮质的基因表达[J];生物化学与生物物理进展;2002年03期
10 吴斌;沈自尹;;基因芯片表达谱数据的预处理分析[J];中国生物化学与分子生物学报;2006年04期
中国重要会议论文全文数据库 前10条
1 王琦;李雪;刘彦;朱志兵;薛英威;傅松滨;;应用基因表达谱芯片研究胃癌基因表达谱[A];中国的遗传学研究——中国遗传学会第七次代表大会暨学术讨论会论文摘要汇编[C];2003年
2 于英男;洪源;李烨;成军;李燕;;刀豆素蛋白引起免疫性肝损伤小鼠肝脏基因表达谱变化[A];第十届全国生化与分子药理学术会议论文摘要汇编[C];2007年
3 皮斌;黄加权;严伟明;田德英;罗小平;宁琴;;重症乙型肝炎患者基因表达谱的研究[A];中华医学会全国第九次感染病学学术会议论文汇编[C];2006年
4 孙开来;郝冬梅;孙秀菊;郑志红;富伟能;;胃癌发生发展过程中基因表达谱检测[A];中国的遗传学研究——中国遗传学会第七次代表大会暨学术讨论会论文摘要汇编[C];2003年
5 许沈华;牟瀚舟;顾琳慧;朱赤红;刘祥麟;;高转移卵巢癌细胞差异表达基因在染色体定位及其功能[A];浙江省生理科学会2006年学术年会论文汇编[C];2006年
6 韩慧霞;刘巍;邓永健;;用cDNA基因芯片筛选鼻咽癌差异表达基因[A];中华医学会病理学分会2007年学术年会暨第九届全国病理大会论文汇编[C];2007年
7 姜玉章;熊化生;郭伟;胡传贤;金云;钱强;潘汉胤;;具家族史食管鳞癌及癌旁组织基因表达谱的初步研究[A];中国遗传学会功能基因组学研讨会论文集[C];2006年
8 王艺东;黎祥喷;彭英;施晓耕;黄如训;;大鼠脑梗死后期的基因表达谱的观察[A];第九次全国神经病学学术大会论文汇编[C];2006年
9 蔡彦宁;温玫;张愚;陈彪;;帕金森患者尾状核中基因表达谱研究[A];中华医学会第七次全国神经病学学术会议论文汇编[C];2004年
10 石文静;陈超;胡宝洋;龚红华;周国民;;新生小鼠视网膜病变的基因表达谱变化[A];2006(第三届)江浙沪儿科学术会议暨浙江省儿科学术年会论文汇编[C];2006年
中国重要报纸全文数据库 前10条
1 柯火娟;CEPA激活深港经贸[N];国际商报;2005年
2 经济视点报记者 李婷;再寻豫港合作“基点”CEPA河南进程更进一步[N];经济视点报;2009年
3 记者 罗兰;CEPA使港澳与内地经贸联系更紧密[N];人民日报海外版;2010年
4 记者 刘秋伟;善用CEPA助企业前海拓新领域[N];深圳特区报;2011年
5 记者 赵宇青 通讯员 杨权;把横琴打造成CEPA重要平台[N];珠海特区报;2011年
6 ;CEPA加速佛港金融大融合[N];国际商报;2011年
7 王旭 ;渣打借CEPA加速内地扩张[N];经济参考报;2004年
8 李钦 刘虹辰;抓住CEPA带给银行的机遇[N];深圳商报;2003年
9 记者 侯爱敏;郑港合作辟新通道[N];郑州日报;2009年
10 杜军玲;CEPA补充协议六:将深化粵港金融合作[N];人民政协报;2009年
中国博士学位论文全文数据库 前10条
1 李小玲;人鼻咽癌基因组生物信息学分析与基因差异表达谱的构建[D];中南大学;2008年
2 胡吉;垂体瘤组织基因表达谱及发病机制研究[D];复旦大学;2005年
3 姚实林;阳虚质理论及其外周血基因表达谱研究[D];北京中医药大学;2007年
4 黄志刚;应用肿瘤基因解剖工程数据库及RNA干扰技术检测大肠癌基因表达谱[D];复旦大学;2005年
5 马丽娟;利用激光捕获显微切割及基因芯片技术构建喉鳞状细胞癌基因组差异表达谱[D];中南大学;2008年
6 张舜欣;前列腺外腺癌与外腺增生组织的基因表达谱差异分析[D];中国人民解放军军医进修学院;2008年
7 周美启;针刺心经与小肠经干预急性心肌缺血大鼠心脏和下丘脑基因表达谱比较研究[D];广州中医药大学;2005年
8 田素礼;应用基因表达谱芯片探讨Oxaliplatin诱导人结肠癌细胞凋亡分子机制的实验研究[D];吉林大学;2005年
9 黄静;扶正增效方对非小细胞肺癌放射增敏的临床及基因表达谱研究[D];北京中医药大学;2006年
10 祝骥;人红白血病K562细胞基因表达谱芯片制作及应用研究[D];华南理工大学;2002年
中国硕士学位论文全文数据库 前10条
1 曹坤明;CePa:一种识别显著基因集合的新方法及其在线数据分析平台的搭建[D];南京大学;2012年
2 黄丽俊;应用基因芯片筛选植物激活蛋白处理水稻相关差异基因及其验证[D];重庆大学;2005年
3 张远婵;联用激光显微切割与基因芯片技术筛选肝细胞癌差异表达基因[D];广州医学院;2009年
4 范莉;应用基因芯片技术筛查人子宫内膜容受性相关基因[D];华中科技大学;2006年
5 胡小刚;1型神经纤维瘤病恶变中基因表达谱差异的比较研究[D];第二军医大学;2008年
6 杨明辉;HaCaT细胞与新生隐球菌体外作用前后基因表达谱研究[D];第二军医大学;2009年
7 牛力;模拟酸雨对拟南芥某些生理特性和基因表达谱的影响[D];厦门大学;2009年
8 高泓;一个糖尿病家系肾阴阳两虚证基因表达谱研究[D];成都中医药大学;2005年
9 孟伟;Velcade(bortezomib)诱导K562细胞凋亡的基因表达谱研究[D];南方医科大学;2007年
10 曹红艳;非酒精性脂肪性肝病大鼠肝脏基因表达谱分析[D];浙江大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026