收藏本站
《复旦大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

全基因组SNP芯片应用于CNV和L0H分析的软件比对与数据挖掘

张馨  
【摘要】:基因拷贝数变异(Copy Number Variations, CNVs)是指在人类基因组中广泛存在的,从1 kb到几Mb范围内的sub-microscopic基因组片断的缺失、重复和复杂多位点的变异。CNVs通过基因破坏和改变基因剂量来影响基因表达、表型差异和表型适应,从而引起疾病。因此,CNVs的突变活动可能是导致常见疾病和散在的先天性缺陷症的主要原因。已经存在许多成熟的并且被广泛使用的CNV分析软件,用来获取芯片数据中原始的CNV和LOH信息。然而到目前为止依然没有出现一个判定数据准确性的金标准,同时也没有对这些CNV分析软件进行过高通量以及多方面的性能评估。为了验证这些CNV分析软件的性能,我们用Birdsuite、CNAG、dChip PennCNV四种软件对同样的样本数据进行分析,并分别产生CNV的检出信息,导入预先架构的Mysql数据库。然后将这些结果与己经获得的同样样本的CGH芯片数据结果通过编程进行快速比对(金标准)。比对从数据的数量和质量两方面相关的几个属性进行,包括(i)CNV总体数量(ⅱ) CNV长度分布(ⅲ) CNV的Gain和Loss分布。然后以CGH结果为参考,从四种软件的检出CNV中分析各自的假阳性率和假阴性率,以统计检出CNV的质量,接着对特异性数据进行深入分析,研究SD序列的影响以及四种软件的互相验证以找到产生对CGH芯片的特异性部分的原因,最后检验软件的鲁棒性即对重复样本的一致性。从统计数据的各个方面来看,Birdsuite和PennCNV的综合能力最高且一致性最好,Birdsuite最保守而且假阳性率最低,但是假阴性率也最高而且与其他三种软件的一致性最差。dChip假阳性率最高,其他能力居中,但最有可能找出de novo的CNV。CNAG比较适合于做群体遗传学分析,Birdsuite和PennCNV更适合于做疾病相关分析,dChip适合于肿瘤相关分析和LOH分析。后续研究通过已经成熟的数据平台,在智力低下(MR)患者和正常人群分组CNV数据中,进行深入的数据挖掘,获得了与MR相关的LOH信息,定位得到了与疾病相关的染色体位置和基因, 随即进入下一步的实验验证。
【学位授予单位】:复旦大学
【学位级别】:博士
【学位授予年份】:2011
【分类号】:TP311.13;Q811.4

【参考文献】
中国期刊全文数据库 前10条
1 庄永龙,马飞,周敏,沈岩,李衍达;基于多Agent的生物信息数据整合系统-BioAgent1[J];电子学报;2005年01期
2 于春香;;数据挖掘技术简介[J];福建信息技术教育;2005年01期
3 赵钧慧;周垂贤;胡京蛟;王慧;;胶质母细胞瘤染色体1p36杂合性缺失的初步研究[J];潍坊医学院学报;2008年03期
4 曾庆国;陈艺燕;;微卫星位点筛选方法综述[J];生态科学;2005年04期
5 赵静;周韧;;单核苷酸多态性及其数据库的应用[J];国际病理科学与临床杂志;2006年02期
6 刘欣;王立刚;王立贤;;拷贝数变异及其研究进展[J];畜牧兽医学报;2010年08期
7 严卫丽;;复杂疾病全基因组关联研究进展——研究设计和遗传标记[J];遗传;2008年04期
8 陈勇军;唐启彬;王剑明;邹声泉;;肝外胆管癌染色体3p21.3区段微卫星不稳定和杂合性缺失分析[J];中国肿瘤临床;2006年20期
9 李升平,王辉云,张昌卿,冯启胜,余杏娟,陈敏山,黄丽惜,黄平,郭荣平,林小军,张亚奇,李锦清,李国辉,曾益新;原发性肝癌全基因组杂合性缺失的研究[J];中华医学杂志;2000年08期
10 陈佳英,陈孙敏,魏梅,王莉娟,何琳;上海市7岁以下儿童智力低下流行病学调查[J];中国优生与遗传杂志;2002年04期
中国博士学位论文全文数据库 前2条
1 王川;基因芯片数据管理及数据挖掘[D];中国科学院研究生院(上海生命科学研究院);2004年
2 林连捷;应用高密度单核苷酸多态性芯片分析人类胰腺癌基因组异常[D];中国医科大学;2007年
中国硕士学位论文全文数据库 前3条
1 张蕊;秦巴山区智力低下儿童病因分析及脆性X智力低下(FMR1)基因的甲基化和CGG位点多态性研究[D];西北大学;2003年
2 单文娟;基因芯片数据分析方法比较[D];南京林业大学;2008年
3 王麒;基于WEB的远程教育系统的开发和设计[D];贵州大学;2008年
【共引文献】
中国期刊全文数据库 前10条
1 王丽;管晓翔;陈龙邦;;全基因组关联分析在乳腺癌易感位点筛选中的应用[J];癌症进展;2011年03期
2 管延蒙;陈锦飞;;全基因组关联分析在消化道肿瘤中的研究进展[J];癌症进展;2012年01期
3 杜宁;庄永龙;胡瑾华;刘晓燕;岳小敬;王会;崔志飞;周渝霞;郝玉清;王慧芬;;肝衰竭临床数据库的建立及其应用价值[J];传染病信息;2009年05期
4 刘丽;张金智;梅丽;胡春根;姚家玲;;兼性无融合生殖龙须草SSR引物开发及杂交后代的检测[J];西北植物学报;2008年10期
5 关玲;黄金凤;刘金义;高志红;章镇;乔玉山;;基于苹果基因组开发梨的多态性SSR引物[J];西北植物学报;2012年01期
6 刘欣;;我院远程教育系统发展现状[J];电脑知识与技术;2011年03期
7 邹权;李旭斌;林子雨;江弋;林琛;;下一代测序技术数据中的选择性剪切计算识别方法研究[J];电子学报;2012年02期
8 王岩;;数据挖掘过程的研究[J];福建电脑;2007年03期
9 陈怀琼;隋春;魏建和;;植物SSR引物开发策略简述[J];分子植物育种;2009年04期
10 李莎莎;韩凌;肖雪;黎莉;王义明;罗国安;;全基因组关联研究进展及应用前景[J];广东医学;2011年05期
中国博士学位论文全文数据库 前10条
1 吴开松;IL-1基因多态性、吸烟、饮酒与非小细胞肺癌发生的相关性研究[D];武汉大学;2010年
2 滕晓英;肝硬变组织中变异肝细胞结节的检出及其遗传学改变[D];北京协和医学院;2009年
3 肖开银;家族聚集性肝癌染色体异常和遗传易感性的研究[D];广西医科大学;2005年
4 栾生;日本囊对虾基因组串联重复序列分析及微卫星标记的开发与应用[D];中国海洋大学;2006年
5 尤崇革;白细胞介素-1基因多态性及其单倍型与类风湿关节炎的关联性研究[D];兰州大学;2007年
6 张何;一维微流控微珠阵列芯片用于基因突变分析的研究[D];湖南大学;2008年
7 钮俊清;面向生化网络的计算技术研究[D];中国科学技术大学;2008年
8 杨成君;人参cDNA文库构建,EST与相关基因表达分析及EST-SSR标记建立[D];东北林业大学;2008年
9 武其文;基于家系和单体型的TIM-1及TIM-3基因多态性与变应性哮喘的关联研究[D];华中科技大学;2009年
10 赵军;3T氢质子磁共振波谱成像对新生儿缺血缺氧性脑损伤的临床应用研究[D];南方医科大学;2009年
中国硕士学位论文全文数据库 前10条
1 梁远征;英语远程教育系统的设计与实现[D];华东师范大学;2010年
2 周武华;肝细胞癌相关杂合性缺失及ArgBP2基因缺失和表达分析[D];浙江大学;2011年
3 王昱人;电子政务环境下的政府信息资源管理[D];山东师范大学;2011年
4 孙源;黄颡鱼(Pelteobagrus fulvidraco)群体遗传结构分析及性别特异性分子标记的筛选[D];东北林业大学;2011年
5 熊丽东;红花转录组测序分析及其油体蛋白全长的获得[D];吉林农业大学;2011年
6 赵鲁麟;负序列模式挖掘技术的研究[D];山东轻工业学院;2011年
7 彭艳辉;波纹唇鱼微卫星分子标记的开发及其遗传多样性分析[D];海南大学;2011年
8 李继荣;TBX21基因启动子rSNP功能鉴定及其与Th1/Th2分化关系的研究[D];第三军医大学;2011年
9 齐红;PLCE1和C20orf54基因多态性与贲门炎易感性关系[D];郑州大学;2011年
10 李莹莹;转化生长因子β1基因多态性与类风湿关节炎的相关研究[D];郑州大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 黄啸;;生物信息学在蛋白质组学上的应用[J];安徽农业科学;2006年23期
2 王辉云,关新元,方燕,元云飞,梁启万,夏建川,邵建永,李辉梅;肝癌染色体DNA拷贝数的变化及其与临床病理和预后的关系[J];癌症;1999年05期
3 杨文万;石鸥燕;张菊芳;;主成分分析在基因表达谱数据分析中的应用[J];包头医学院学报;2005年04期
4 刘秀珍;张如意;栾海云;李淑翠;;基因芯片技术及应用[J];滨州医学院学报;2007年01期
5 孙凯;王秀荣;刘丽玲;刘荻萩;王忠华;陈维多;;基因芯片技术及其应用[J];东北农业大学学报;2006年03期
6 顾侠强;关于我国远程教育的战略思考[J];中国远程教育;2002年02期
7 虞慧婷;吴骋;柳伟伟;付旭平;贺佳;;基因调控网络模型构建方法[J];第二军医大学学报;2006年07期
8 梁斌;INTERNET网教学中交互性的探讨[J];电化教育研究;2000年02期
9 刘洁;多媒体远程教育技术的发展现状及问题初探[J];电化教育研究;2000年08期
10 吉逸,金胜昔;基于Web的远程教学系统的设计与实现[J];东南大学学报;1998年02期
【相似文献】
中国期刊全文数据库 前10条
1 傅岚;在数据海洋中打捞信息数据挖掘[J];科技广场;2002年11期
2 黄宏涛,陈阳;数据挖掘在客户关系管理中的应用[J];中国西部科技;2005年07期
3 董大鸿,何海青;浅谈数据挖掘语言[J];江西科学;2005年03期
4 曾莹,陈晓柱;数据挖掘及算法浅谈[J];中国科技信息;2005年14期
5 谭建中;浅析实施数据挖掘项目需要考虑的问题[J];大众科技;2005年09期
6 石峰,周绍梅;数据挖掘语言及其标准化浅析[J];江西科学;2005年01期
7 周忠眉;数据挖掘课程大纲的建设[J];漳州师范学院学报(自然科学版);2005年01期
8 王秀丽;数据挖掘功能特性及其应用流程分析[J];科技创业月刊;2005年05期
9 刘晓华;;数据挖掘在银行中的应用[J];科技资讯;2006年32期
10 张敏;;数据挖掘在数字化校园建设中的应用分析[J];内江科技;2007年04期
中国重要会议论文全文数据库 前10条
1 史东辉;蔡庆生;张春阳;;一种新的数据挖掘多策略方法研究[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
2 张弦;;数据挖掘在农业中的应用[A];纪念中国农业工程学会成立30周年暨中国农业工程学会2009年学术年会(CSAE 2009)论文集[C];2009年
3 魏顺平;;教育数据挖掘:现状与趋势[A];信息化、工业化融合与服务创新——第十三届计算机模拟与信息技术学术会议论文集[C];2011年
4 关清平;沉培辉;;概率网络在数据挖掘上的应用[A];科技、工程与经济社会协调发展——中国科协第五届青年学术年会论文集[C];2004年
5 丁瑾;;基于Web数据挖掘的综述[A];山西省科学技术情报学会学术年会论文集[C];2004年
6 聂茹;田森平;;Web数据挖掘及其在电子商务中的应用[A];中南六省(区)自动化学会第24届学术年会会议论文集[C];2006年
7 李菊;王军;;数据挖掘在客户关系管理的应用[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
8 肖阳;李启贤;;数据挖掘在中国钢铁行业中的应用[A];中国计量协会冶金分会2012年会暨能源计量与节能降耗经验交流会论文集[C];2012年
9 杨磊;王贵成;汪勇;张占胜;;SQL Server 2005在数据挖掘中的应用[A];2009年中国智能自动化会议论文集(第二分册)[C];2009年
10 谢中;邱玉辉;;面向商务网站有效性的数据挖掘方法[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
中国重要报纸全文数据库 前10条
1 本报记者褚宁;数据挖掘如“挖金”[N];解放日报;2002年
2 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
3 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
4 《网络世界》记者 王莹;数据挖掘保险业的新蓝海[N];网络世界;2012年
5 刘俊丽;基于地理化的网络数据挖掘与分析提升投资有效性[N];人民邮电;2014年
6 本报记者 连晓东;数据挖掘:金融信息化新热点[N];中国电子报;2002年
7 本报记者 凤小华 朱仁康;“数字挖掘软件”引领中国信息化新浪潮[N];中国电子报;2003年
8 本报记者 史延廷;“成功企业数据挖掘暨数量化管理论坛”在京举办[N];中国旅游报;2002年
9 朱小宁;数据挖掘:信息化战争的基础工程[N];解放军报;2005年
10 本报记者 王小平;从“大集中”走向数据挖掘[N];金融时报;2002年
中国博士学位论文全文数据库 前10条
1 于自强;海量流数据挖掘相关问题研究[D];山东大学;2015年
2 张馨;全基因组SNP芯片应用于CNV和L0H分析的软件比对与数据挖掘[D];复旦大学;2011年
3 彭计红;基于数据挖掘的痴呆中医证的研究[D];南京中医药大学;2015年
4 李秋虹;基于MapReduce的大规模数据挖掘技术研究[D];复旦大学;2013年
5 李荣;生物信息数据挖掘若干关键问题研究与应用[D];复旦大学;2004年
6 李玉华;面向服务的数据挖掘关键技术研究[D];华中科技大学;2006年
7 吴少智;时间序列数据挖掘在生物医学中的应用研究[D];电子科技大学;2010年
8 王珊珊;知识指导下的数据挖掘在新闻和金融工具之间因果关系上的应用[D];中国科学技术大学;2009年
9 杨虎;序列数据挖掘的模型和算法研究[D];重庆大学;2003年
10 陈平;数据挖掘网格若干关键技术研究[D];北京邮电大学;2007年
中国硕士学位论文全文数据库 前10条
1 林仁红;基于数据挖掘的机遇识别与评价研究[D];首都经济贸易大学;2007年
2 张彦俊;游戏运营中的数据挖掘[D];复旦大学;2011年
3 焦亚召;基于多核函数FCM算法在数据挖掘聚类中的应用研究[D];昆明理工大学;2015年
4 王杰锋;物联网能耗数据智能分析及其应用平台设计[D];江南大学;2015年
5 刘学建;数据挖掘在电子商务推荐系统中的应用研究[D];昆明理工大学;2015年
6 戴阳阳;基于数据挖掘的金融时间序列预测研究与应用[D];江南大学;2015年
7 石思优;基于主题模型的医疗数据挖掘研究[D];广东技术师范学院;2015年
8 陈丹;移动互联网信令挖掘实现智慧营销的设计与实现应用研究[D];华南理工大学;2015年
9 陈思;基于数据挖掘的大学生客户识别模型的研究[D];昆明理工大学;2015年
10 位长帅;基于客户数据挖掘的电信客户关系管理研究[D];西南交通大学;2015年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026