收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基因表达聚类分析方法研究

刘月明  
【摘要】: 目的:基因芯片(Gene ChiP or Microarrays)是最近分子生物学实验技 术的一个突破,利用该技术可以同时对成千上万个基因的表达进行平行分 析,产生了海量的有用数据,分析与整理这些数据成为利用这一技术的一 个主要瓶颈问题。聚类分析是有效的分析手段之一,且是后续研究的基础。 目前基因表达数据聚类分析还处于起步阶段,有许多问题有待解决,其中 比较突出的有以下两点:①算法及其参数的选择。现在已有不少的算法开 始应用于基因表达数据分析,而且不断有新的算法提出。但目前的聚类算 法选择合适的参数,在合适的数据上运行时能产生满意的结果,当这些条 件得不到满足时,聚类结果就很差。因此,在一个具体聚类问题,其主要 的挑战不是来自于如何执行聚类上,而是在于选择算法和相关的参数值 上。目前的方法经常依赖于非直观参数,甚至对于统计专家来说也难以对 其做出正确的选择②聚类结果的评判。由于目前还没有一个合适的聚类结 果评判方法,因此对于聚类算法的选择缺少客观依据,对于聚类结果的质 量也缺乏必要的检验手段。本研究的目的就是要探讨上述两个方面的问 题。 方法:①模糊C-均值法是广泛应用于基因表达数据聚类分析的方法 之一,但参数c要人为确定,我们通过建立一个PFS判别函数来解决参 数c的确定问题,称之为PFS模糊聚类法。②针对聚类结果评判的问题, 在FOM评判法的基础上,加入一个外部评判标准gain ratio,建立了一套 新的评判方法-Entropy评判法。 结果:①先用几组模拟数据对PFS函数进行试验,获得满意的结果。 然后用PFS模糊聚类法对一个真实数据集聚类,经过与该数据集已知的 功能分类进行比较,PFS模糊聚类的结果与数据集的功能分类呈现很好的 相关性,验证了PFS模糊聚类法的有效性。②利用我们建立的Elitropy评 判法,对 SOM法、模糊聚类法、K一均值聚类法和 3个分层聚类法在Lyer 和Ferea数据集上表现进行了评判。发现SOM法和模糊聚类法的聚类效 能高于其它4个聚类算法:而K一均值法和平均连锁算法又好于单连锁和 完全连锁算法。评判结果的同时还在一定程度上验证了Elltropy评判法的 价值。 结论:①PFS模糊聚类是有效的聚类方法,可以应用于基因表达数据 的聚类分析②EntroPy评判法是基于类的结构和数据集的外部信息两个方 面来对聚类结果进行评判的方法,对聚类结果的评判简单、直观。经Entropy 评判,认为SOM法和模糊聚类法适用于基因表达数据聚类分析。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 罗万春;易东;;胎儿小脑基因表达多尺度降噪的y~n曲线模型[J];计算机工程与应用;2011年07期
2 徐源;彭斌;邓宇;田考聪;;基于小波去噪的基因表达数据聚类集成算法的研究[J];重庆医科大学学报;2010年05期
3 王修竹;;基于SOM的聚类算法在抑郁症药物药效检测中的应用[J];西南科技大学学报;2011年02期
4 伍亚舟;张玲;罗万春;易东;;基因表达数据的多尺度特征提取与分类研究[J];计算机工程与应用;2009年13期
5 武晓岩;李康;;随机森林方法在基因表达数据分析中的应用及研究进展[J];中国卫生统计;2009年04期
6 贺宪民,贺佳;基因芯片数据的标准化及分析方法[J];中国卫生统计;2004年02期
7 李鹏,阮晓钢;基于自组织映射网络的多骨髓瘤预测模型的研究[J];中国生物医学工程学报;2005年04期
8 蔡显圣;杜芳;;非负矩阵分解算法在胃癌基因表达数据分类中的应用[J];中国医疗设备;2011年04期
9 周艳宏;张必成;曾朝阳;张文玲;范松青;李小玲;熊炜;曹利;李伟芳;李桂源;;利用GenMAPP筛查鼻咽癌差异表达基因[J];生物化学与生物物理进展;2005年12期
10 陈志宏;严壮志;刘书朋;;基于模糊自适应共振网络简化模型方法的乳腺肿瘤基因分类[J];上海大学学报(自然科学版);2006年04期
11 张玲;伍亚舟;陈军;易东;;小波-神经网络方法在基因表达数据分析中的应用研究[J];重庆医学;2010年17期
12 罗万春;易东;李辉智;龚利红;;基因芯片数据多尺度分析的y~n曲线模型[J];计算机工程;2011年02期
13 武振宇;李康;;支持向量机在基因表达数据分类中的应用研究[J];中国卫生统计;2007年01期
14 武晓岩;李康;;基因表达数据判别分析的随机森林方法[J];中国卫生统计;2006年06期
15 张月英;王兆朋;贾青;王朝霞;张维东;崔亚洲;;基于基因芯片蝎毒多肽提取物对H22肝癌抑制作用的研究[J];现代生物医学进展;2009年10期
16 谭远德;颜亨梅;;多重检验法在基因芯片研究中鉴定差异表达基因的统计功效(英文)[J];遗传学报;2006年12期
17 姜明宇;马文丽;郑文岭;;基于遗传算法的基因表达数据的K-均值聚类分析[J];上海生物医学工程;2006年03期
18 武晓岩;闫晓光;李康;;基因表达数据的随机森林逐步判别分析方法[J];中国卫生统计;2007年02期
19 单连峰;张惠丹;周宝森;;混合法用于基因芯片数据的分类分析[J];中国医科大学学报;2009年07期
20 邓建钢;潘丽敏;罗森林;张铁梅;韩怡文;;不同胰岛素敏感状态下大鼠基因数据处理[J];计算机工程与设计;2007年10期
中国重要会议论文全文数据库 前10条
1 魏昕路;洪志令;姜青山;;一种基于样本缩减策略的新窗口式聚类算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
2 王守强;朱大铭;史士英;;基于输入点集求解k-Means聚类算法[A];第二十六届中国控制会议论文集[C];2007年
3 任伟;闫桂英;;利用聚类算法来研究基因选择问题[A];中国运筹学会第八届学术交流会论文集[C];2006年
4 李政涛;夏树倩;王大玲;冯时;张一飞;;一种基于语义引力及密度分布的聚类算法[A];第六届全国信息检索学术会议论文集[C];2010年
5 吴继兵;李心科;;基于分治融合的混合属性数据聚类算法研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(下册)[C];2009年
6 李世峰;黄磊;刘昌平;;几种聚类方法的比较[A];第八届全国汉字识别学术会议论文集[C];2002年
7 刘洋;江志纲;丁增喜;王大玲;鲍玉斌;于戈;;一种基于图的聚类算法GB-Cluster[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
8 邓敏;刘启亮;李光强;程涛;;一种基于场模型的空间聚类算法[A];现代测量技术与地理信息系统科技创新及产业发展研讨会论文集[C];2009年
9 金旻;戚华兵;黄炜;王小凤;陈林;;基因芯片研究结合FGFR3的核心短肽对小鼠前软骨细胞的作用[A];中华医学会第六次全国骨质疏松和骨矿盐疾病学术会议暨中华医学会骨质疏松和骨矿盐疾病分会成立十周年论文汇编[C];2011年
10 逯波;王国仁;;一种有效的半监督视频镜头聚类算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
中国博士学位论文全文数据库 前10条
1 王广云;肿瘤基因芯片表达数据分析相关问题研究[D];国防科学技术大学;2009年
2 陈伟;群体智能算法及其在基因表达数据聚类中的应用[D];江南大学;2011年
3 程慧杰;基于模式识别方法的基因表达数据分析研究[D];哈尔滨工程大学;2012年
4 张焕萍;面向基因表达数据的致病基因挖掘方法研究[D];南京航空航天大学;2009年
5 陆慧娟;基于基因表达数据的肿瘤分类算法研究[D];中国矿业大学;2012年
6 吴飞珍;基因芯片数据的聚类功能评价算法和判别分析算法研究[D];上海大学;2009年
7 邱浪波;基因芯片表达数据分析相关问题研究[D];国防科学技术大学;2007年
8 蔡瑞初;基因表达数据挖掘若干关键技术研究[D];华南理工大学;2010年
9 杨林;猪瘟病毒基因芯片诊断技术的研究及应用[D];中国农业大学;2005年
10 刘雪强;乌头碱逆转耐药性人口腔上皮鳞状癌细胞分子机制研究[D];北京中医药大学;2005年
中国硕士学位论文全文数据库 前10条
1 刘月明;基因表达聚类分析方法研究[D];第三军医大学;2001年
2 孙航;基于生物学知识的聚类算法及其在基因表达数据中的应用[D];吉林大学;2010年
3 王勇;聚类方法在生物数据中的研究与应用[D];江南大学;2008年
4 陈佳妮;基因表达数据分析中IGA-FCM聚类算法研究与实现[D];东北林业大学;2010年
5 伍亚舟;基因芯片表达数据的标准化策略研究[D];第三军医大学;2004年
6 张彦琦;基因调控网络建立的数学模型研究[D];第三军医大学;2003年
7 邓庆山;聚类分析及其在基因表达数据中的应用研究[D];华中科技大学;2004年
8 张礼;寻找差异基因的概率方法研究[D];南京航空航天大学;2010年
9 周鹏;神经网络集成算法研究及在基因表达数据分析中的应用[D];华中科技大学;2004年
10 刘天飞;基于遗传算法的基因芯片数据聚类研究[D];四川农业大学;2008年
中国重要报纸全文数据库 前10条
1 记者 季明 徐寿松;基因芯片亮相上海[N];新华每日电讯;2002年
2 记者 刘熙;省一院基因芯片诊断技术获卫生部认证[N];云南日报;2010年
3 南方日报记者 陈枫 通讯员 宋忠雷 彭文斌;省二医应急大楼:全省首家“移动医院” 省妇幼番禺新院:有了地贫基因芯片[N];南方日报;2011年
4 周向东;基因芯片:神奇的医生[N];中国医药报;2001年
5 林海慧;共建全国最大基因芯片基地[N];证券时报;2000年
6 记者 季洪光;基因芯片可望大规模临床应用[N];科技日报;2003年
7 记者 郑晓强 通讯员 陈海峰;全国首个遗传病基因芯片开放式检测平台在厦建成[N];福建日报;2009年
8 吕建强;深圳积极创新基因芯片检测方法[N];中国食品报;2010年
9 《金周刊》记者 朱杰;基因芯片:窥见巨额利润[N];中国经营报;2001年
10 ;基因芯片——新世纪医学的“宠儿”[N];市场报;2001年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978