收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基因表达谱分析若干关键技术研究

李杰  
【摘要】: 基因表达谱数据分析需要统计学、模式识别、人工智能、计算机和生物科学等方面的知识。基因表达谱的出现为以上学科在理论和应用上的发展提出了新的挑战。复杂疾病分类,差异表达基因识别和基因之间关系的研究是基因表达谱分析的三个主要任务。虽然有关这三个方面的研究已经取得很大进展,但目前仍有尚待深入研究的问题。本文就围绕这三个方面的问题,提出了新的分析方法。 在差异表达基因探测方面,提出了一种新的探测框架。该框架包括4部分:测试、评价、排序和选择。在测试上,联合多种统计测试方法初步探测差异表达的基因,克服单一统计测试方法探测差异表达基因的缺点;在评价上,根据每个基因偏离双线性回归模型的程度来评价差异表达的程度;在排序上,用残差的大小来排列基因,克服了基于P-值排序方法的缺点;在关键基因的选择上,根据一种统计门限选择一小组基因,为生物学家进一步的深入研究提供选择依据,克服了随机门限选择关键基因的缺点。每种统计测试方法都有自己的适用条件,它们可能漏识一些重要基因,针对这一问题,该方法在双线性回归模型的基础上对没有被其它方法选为差异表达的基因进行了重新测试。在4个公共癌症表达谱数据上的实验结果表明:该框架能够有效探测差异表达基因。探测方法的评价是一个具有挑战性的问题,本文提出了一种基于真实表达谱的仿真评价方法,客观评价和比较了本文框架和几种统计方法。生物分子试验和仿真结果表明本文方法的探测精度明显高于三种统计检验方法(KS-检验,t-检验和秩和检验)方法。 分类过程的可视化是生物学家所追求的目标,尽管目前大部分样本分类方法在基因表达谱样本分类上取得较高的分类精度,但基因表达谱是一种新的数据类型,生物学家不仅希望分类方法的精度高,而且希望分类过程透明,因为生物学家目前对各种复杂疾病的发病机理还不清楚,它们希望通过可视化的分类方法发现有意义的Marker基因、发现新的模式、结构、信息或样本之间的差异,以加深对疾病发病机理的了解和认识,帮助制定有效的治疗方案。目前来自模式识别领域的大部分分类方法难以满足生物学家的上述要求。因此目前急需发展分类过程透明的可视化分类方法,我们提出了一种基于特征基因分布差异的可视化分类方法以满足生物学家的要求。本文方法首先用信噪比方法选取特征基因,然后计算所选特征基因的平均表达值,最后绘出特征基因在两类样本中的分布图,并以该分布图为分类器,观察每个样本中特征基因的分布,如果样本的分布展示了正常样本的特点,则被分到正常样本,否则被分到疾病样本。用该方法分类几个公共表达谱数据,实验结果表明:该方法能够有效分类复杂疾病。该方法的优点是分类过程透明,与其它方法相比,它能够向生物学家展示更多信息,如通过对每个样本的分类生物学家能够发现样本之间的差异,通过该分类方法还能够发现疾病相关的基因。 分类规则在生物上的可解释性是生物学家所追求的目标。本文提出了一种基于基因对的分类方法。从该分类方法中抽取的分类规则简单、在生物、逻辑和统计上易于解释。该方法首先为每对基因建立一个基于线性回归模型的分类器;然后用分类精度评价分类器的性能;最后比较所有的基因对模型,选出具有最高分类精度的模型。最高分类精度模型的数量可能有多个,为了获得最佳的分类模型,多个最高分类精度模型用残差信噪比进一步排序,排在上面的模型选为最佳模型。当基因表达谱数据比较复杂时,单个最佳模型的分类精度可能比较低,为了进一步提高分类精度,本文用遗传算法联合多个分类模型分类复杂疾病。在多个表达谱数据上的试验结果表明:用单个最佳分类模型或联合多个分类模型能够获得100%的留一交叉验证精度。该方法具有多种应用:能够识别大量优秀MARKER基因对;能够识别一些不被其它方法识别的关键疾病基因;从分类模型中抽取的具有生物意义的分类规则能够帮助生物学家预测未知基因的功能;通过该方法生物学家能够发现发现新的模式,结构和信息。 本文还提出一种集成聚类技术、GO术语分析、统计分析和基因网络的方法来研究基因在不同样本中关系的变化。通过研究功能模块内部基因之间关系的变化识别出那些在不同样本中发生显著变化的功能模块和生物过程。将该方法应用到结肠癌数据上,成功地识出与癌症相关的功能模块和生物过程。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 吕莹丽;于梁梁;郭政;王栋;杨强;;cDNA芯片中重复检测值的处理方法对差异表达基因选择的影响[J];生物信息学;2008年03期
2 刘玲;;基因表达谱数据分析技术[J];电脑与信息技术;2010年06期
3 戴宏亮;;基于ITAFSVM的微阵列数据特征选择和分类[J];中山大学学报(自然科学版);2010年02期
4 刘全金,李颖新,阮晓钢;基于统计方法的肿瘤特征基因提取[J];北京工业大学学报;2005年02期
5 党春艳;周继鹏;王桂香;李茹柳;高小玲;陈蔚文;;慢性胃炎脾虚证差异表达基因识别研究[J];广西师范大学学报(自然科学版);2009年03期
6 徐建震,郭政,李霞,李永进,刘帅,屠康;结合基因功能分类体系筛选聚类特征基因[J];生物物理学报;2005年03期
7 张敏;朱晶;郭政;李霞;杨达;王磊;饶绍奇;;利用亚细胞位置特异的基因功能模块与表达调控网络识别疾病特征基因[J];科学通报;2006年13期
8 姚晨;张敏;邹金凤;李红东;王栋;朱晶;郭政;;可识别多种癌症的基因功能模块[J];中国科学(C辑:生命科学);2009年11期
9 方文道;章坚民;刘登涛;杨阳;;基于自适应遗传算法的特征基因选择[J];科技通报;2011年02期
10 时瀚;顾玉超;徐良;于文功;;α2,8-唾液酸转移酶Ⅵ过量表达影响小鼠乳腺癌细胞基因表达的研究[J];中国海洋大学学报(自然科学版);2010年01期
11 郝玉清;;空间数据挖掘技术理论及方法[J];科技创业月刊;2006年05期
12 郑杰;郭呈全;程俊荣;高利新;;基于基因表达谱的肿瘤识别与分类特征基因提取研究[J];数学的实践与认识;2011年14期
13 王蜀燕;孙朝晖;危敏;马文丽;;慢性髓细胞性白血病病人骨髓单个核细胞中差异表达基因的筛选[J];生物技术通讯;2011年02期
14 余传定;许沈华;牟瀚舟;姜志明;朱赤红;刘祥麟;;胃癌差异表达基因在染色体上的定位及其功能分析(英文)[J];遗传学报;2006年05期
15 桂乐;郭新;吴翔;;表达谱基因芯片筛选前体脂肪细胞分化相关基因的研究[J];南通大学学报(医学版);2008年06期
16 阮晓钢;王金莲;李辉;;一个基于基因表达谱的基因逻辑网络模型的建立与应用[J];生物化学与生物物理进展;2007年08期
17 汤玉瑜;陈永文;费蕾;吴玉章;;基因芯片筛选HepG2与HepG2.2.15细胞中的差异表达基因[J];免疫学杂志;2008年03期
18 赵丽娜;肖会;郝晓峰;李强;马国才;李崇前;钟国才;杨达;王晨光;郭政;;根据基因功能表达谱研究抑郁症模型及安佳欣胶囊的抗抑郁症机制[J];生物信息学;2008年02期
19 李泽,包雷,黄英武,孙之荣;基于基因表达谱的肿瘤分型和特征基因选取[J];生物物理学报;2002年04期
20 严美娟;万明辉;李春鹏;夏春林;;两型星形胶质细胞基因表达谱差异的初步观察[J];南通大学学报(医学版);2007年01期
中国重要会议论文全文数据库 前10条
1 许沈华;牟瀚舟;顾琳慧;朱赤红;刘祥麟;;高转移卵巢癌细胞差异表达基因在染色体定位及其功能[A];浙江省生理科学会2006年学术年会论文汇编[C];2006年
2 韩慧霞;刘巍;邓永健;;用cDNA基因芯片筛选鼻咽癌差异表达基因[A];中华医学会病理学分会2007年学术年会暨第九届全国病理大会论文汇编[C];2007年
3 杜方键;杨宏晖;;K均值聚类优化集成学习[A];2011'中国西部声学学术交流会论文集[C];2011年
4 赵晓龙;王宣春;董雪红;胡仁明;;采用cDNA微阵列杂交技术对糖尿病肝脏基因表达谱的研究[A];2006年中华医学会糖尿病分会第十次全国糖尿病学术会议论文集[C];2006年
5 李泽;孙之荣;;使用基因表达谱进行肿瘤分子分型和特征基因提取[A];第九次全国生物物理大会学术会议论文摘要集[C];2002年
6 杜雪梅;柳哓兰;崔玉芳;宋良文;孙启鸿;;基因表达谱芯片分析放射性肺损伤早期差异表达基因[A];第七届全军防原医学专业委员会第五届中国毒理学会放射毒理专业委员会学术会议论文汇编[C];2004年
7 许红民;王强;白雪娟;钟定荣;曹秀堂;张金萍;丁彦青;姚开泰;;大肠癌差异表达基因的筛查[A];中华医学会病理学分会2005年学术年会论文汇编[C];2005年
8 皮斌;黄加权;严伟明;田德英;罗小平;宁琴;;重症乙型肝炎患者基因表达谱的研究[A];中华医学会全国第九次感染病学学术会议论文汇编[C];2006年
9 王艺东;黎祥喷;彭英;施晓耕;黄如训;;大鼠脑梗死后期的基因表达谱的观察[A];第九次全国神经病学学术大会论文汇编[C];2006年
10 于英男;洪源;李烨;成军;李燕;;刀豆素蛋白引起免疫性肝损伤小鼠肝脏基因表达谱变化[A];第十届全国生化与分子药理学术会议论文摘要汇编[C];2007年
中国博士学位论文全文数据库 前10条
1 李杰;基因表达谱分析若干关键技术研究[D];哈尔滨工业大学;2007年
2 李小玲;人鼻咽癌基因组生物信息学分析与基因差异表达谱的构建[D];中南大学;2008年
3 胡吉;垂体瘤组织基因表达谱及发病机制研究[D];复旦大学;2005年
4 姚实林;阳虚质理论及其外周血基因表达谱研究[D];北京中医药大学;2007年
5 黄志刚;应用肿瘤基因解剖工程数据库及RNA干扰技术检测大肠癌基因表达谱[D];复旦大学;2005年
6 张舜欣;前列腺外腺癌与外腺增生组织的基因表达谱差异分析[D];中国人民解放军军医进修学院;2008年
7 马丽娟;利用激光捕获显微切割及基因芯片技术构建喉鳞状细胞癌基因组差异表达谱[D];中南大学;2008年
8 肖琳;转化生长因子β1刺激肝星状细胞差异表达基因研究[D];新疆医科大学;2006年
9 赵艳晖;妊娠期糖尿病患者外周血和胎盘组织差异表达基因的研究[D];吉林大学;2007年
10 张文玲;鼻咽癌发病不同阶段分子标志物的鉴定及差异表达基因相互作用网络的构建[D];中南大学;2009年
中国硕士学位论文全文数据库 前10条
1 黄丽俊;应用基因芯片筛选植物激活蛋白处理水稻相关差异基因及其验证[D];重庆大学;2005年
2 阳少林;基于神经网络的多类肿瘤亚型识别研究[D];湖南大学;2008年
3 张远婵;联用激光显微切割与基因芯片技术筛选肝细胞癌差异表达基因[D];广州医学院;2009年
4 谢文娟;泡球蚴感染小鼠肝脏基因表达谱的分析[D];新疆大学;2010年
5 王玉鹏;基于基因芯片的基因表达模式分析[D];厦门大学;2007年
6 牛力;模拟酸雨对拟南芥某些生理特性和基因表达谱的影响[D];厦门大学;2009年
7 丁林灿;涎腺腺样囊性癌细胞株ACC-2和ACC-M基因差异表达的初步研究[D];福建医科大学;2006年
8 范莉;应用基因芯片技术筛查人子宫内膜容受性相关基因[D];华中科技大学;2006年
9 杨明辉;HaCaT细胞与新生隐球菌体外作用前后基因表达谱研究[D];第二军医大学;2009年
10 孟伟;Velcade(bortezomib)诱导K562细胞凋亡的基因表达谱研究[D];南方医科大学;2007年
中国重要报纸全文数据库 前10条
1 ;肥胖将扰乱你的基因网络[N];健康报;2008年
2 马岭;基因网络之后的下一个关键词[N];建筑报;2000年
3 ;扰乱人体基因网络,暴饮暴食有百害[N];新华每日电讯;2008年
4 黄明;精子分类器决定生男生女[N];广东科技报;2000年
5 记者 衣晓峰 通讯员 李小莲;探寻“证”的基因表达谱[N];中国中医药报;2009年
6 ;鲑鱼鱼白DNA对小鼠胸腺作用的差异表达基因筛选[N];中国医药报;2003年
7 王云鹤 熊立;武汉电信直销中心剑指聚类市场[N];人民邮电;2009年
8 ;肾癌差异表达基因鉴定及功能研究[N];中国医药报;2002年
9 记者 肖卓;聚类市场:想挖金矿不容易[N];人民邮电;2009年
10 ;相关性统计方法 利于追踪基因网络[N];中国高新技术产业导报;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978