收藏本站
《天津大学》 2008年
收藏 | 手机打开
二维码
手机客户端打开本文

基于多源信息融合的基因表达数据聚类分析

朱建杰  
【摘要】: 基因表达数据是通过DNA微阵列技术获得的关于一组基因表达过程及其调控信息的定量描述。研究基因表达数据,获取有意义的基因簇,对于研究生物现象背后的本质、遗传性疾病的诊断等有着重要意义。然而,由于基因表达数据中样本数远远小于观测的基因个数的特性及其在采集过程中产生的噪音数据使得单一依靠该数据源进行的聚类分析往往缺乏稳定性、可靠性,从而影响了预测的准确性。 本文从多源信息融合的角度来研究基因表达数据的聚类分析技术,融合基因本体(GO),KEGG pathway等信息,以求获得稳定、可靠、共表达的基因类簇。其主要工作如下: 1.选择网上公用的YEAST基因组数据作为测试数据,采用潜在语义分析方法对YEAST基因组的基因表达数据进行降维和去噪处理,并用欧氏距离的方法对数据相似性进行了度量;我们采用语义相似性度量的方法计算基因本体数据的相似性,并用Bioconductor软件对基因本体数据的相似性进行了度量。 2.使用线性融合方法,从相似性度量的角度融合YEAST基因组的表达数据、本体数据,并用PAM(中心点划分)算法对基因表达数据,融合数据分别进行了聚类。结果表明线性融合算法可以大大提高基因表达数据的聚类效果。 3.针对线性融合方法无法确定融合系数的问题,提出一种新的基于排列的融合方法。该方法将基因表达、基因本体的相似性度量值按大小排列的顺序给定序号,将序号作为融合系数进行数据的融合。从而可以自动获得融合的系数,算法上更具操作性。 4.针对普通评价方法无法从功能上来评价基因表达数据聚类的有效性问题,提出用KEGG pathway数据从生物的生化功能上来评价聚类结果的有效性和意义。使用KEGG pathway方法进行评价时,证明半数以上的类别是可学习的。 本文从多源信息融合的角度对基因表达数据进行聚类分析和评价,获得了较好的实验结果。然而融合的策略相对来说,还是比较简单,对各部分数据源在聚类效果中所起的作用还缺乏系统的理论证明。所以下一步的工作是:一方面,通过实验的方法,对更多的基因组数据进行测试,来验证算法的有效性;另一方面,运用信息论的方法,研究多源信息证据在基因表达数据聚类中的作用,为实现更加有效的融合策略提供理论依据。
【学位授予单位】:天津大学
【学位级别】:硕士
【学位授予年份】:2008
【分类号】:TP399-C8

免费申请
【引证文献】
中国硕士学位论文全文数据库 前2条
1 刘楠楠;应用于基因表达数据的双聚类算法的研究[D];燕山大学;2011年
2 俞斌;改进K-MEANS聚类算法在银行CRM中的应用与研究[D];浙江工业大学;2011年
【参考文献】
中国期刊全文数据库 前6条
1 杨杰,胡英,全勇;结合数据融合和数据挖掘技术的信息智能处理平台[J];高技术通讯;2003年01期
2 谢勤岚;;基于EM算法的混合模型的参数估计[J];计算机与数字工程;2006年12期
3 陈志强,刘钊,张建辉;聚类分析中PAM算法的分析与实现[J];计算机与现代化;2003年09期
4 潘泉,于昕,程咏梅,张洪才;信息融合理论的基本方法与进展[J];自动化学报;2003年04期
5 邱声春;;数据挖掘和数据融合技术在天气预报和气象服务中的应用研究[J];山西气象;2007年02期
6 刘钦启;马玉祥;郝红侠;;基于数据融合和数据挖掘的网络故障管理系统[J];微电子学与计算机;2006年06期
【共引文献】
中国期刊全文数据库 前10条
1 高鲁,宋辉,高岩,赵明;军用包装信息规范化管理研究[J];包装工程;2005年03期
2 李鑫;单维峰;丰继林;李军;高方平;李忠;;一种基于聚类的异常检测方法[J];传感器与微系统;2011年01期
3 王媛彬;;多传感器信息融合概述及其应用[J];传感器世界;2010年12期
4 胡圣武;;空间数据融合的研究现状及其问题分析[J];测绘通报;2008年02期
5 吴义虎;喻丹;何霞;郭文莲;;一种基于信息融合的跟随驾驶行为协同仿真模型[J];交通科学与工程;2009年01期
6 景涛;;基于信息融合技术的故障诊断方法综述[J];四川兵工学报;2009年07期
7 万洪容;陈怀新;;基于多源信息融合的海上目标判证仿真系统[J];电讯技术;2007年03期
8 苏威积,赵海,苏羽;《周易》与信息融合一致性的研究[J];东北大学学报;2005年02期
9 苏威积;赵海;徐野;张昕;;传感器网络结点OS及其传输协议的设计与实现[J];东北大学学报;2006年06期
10 张皓;赵伟;;电磁测量领域中数学的地位与重要作用[J];电测与仪表;2007年01期
中国重要会议论文全文数据库 前10条
1 韩军伟;陆俊;;信息融合的边缘保持图像滤波方法[A];图像图形技术研究与应用(2010)[C];2010年
2 司刚全;曹晖;张彦斌;贾立新;;基于信息融合技术的双层优化控制策略在火电厂制粉系统中的应用[A];中国仪器仪表学会第九届青年学术会议论文集[C];2007年
3 司刚全;曹晖;张彦斌;马西奎;;基于多源信息融合技术的复杂工业过程监控系统[A];中国仪器仪表学会第九届青年学术会议论文集[C];2007年
4 马福恒;向衍;吴中如;;基于修正证据理论的土石坝渗流警兆辨识研究[A];水工渗流研究与应用进展——第五届全国水利工程渗流学术研讨会论文集[C];2006年
5 张鹏;李学仁;景博;杜军;张建业;;多源信息融合技术在航空发动机故障诊断中的应用研究[A];中国航空学会控制与应用第十二届学术年会论文集[C];2006年
6 朱京红;方帅;高明;方杰;;基于人工免疫模型的步态识别方法[A];第十四届全国图象图形学学术会议论文集[C];2008年
7 胡荣强;季玲莉;邱国廷;罗瑜;;多传感器数据的逻辑分析[A];第二届全国信息获取与处理学术会议论文集[C];2004年
8 刘群;梁冰;;信息特征级融合的范例产生式方法[A];中国造船工程学会电子技术学术委员会2006学术年会论文集(下册)[C];2006年
9 温华洋;徐光清;华连生;汪腊宝;胡雯;;“双套站”数据处理方法探索[A];第28届中国气象学会年会——S1第四届气象综合探测技术研讨会[C];2011年
10 韩盛;李书杰;陈宗海;;移动机器人导航的信息融合技术分析与展望[A];第13届中国系统仿真技术及其应用学术年会论文集[C];2011年
中国博士学位论文全文数据库 前10条
1 吕云飞;甚低频矢量水听器潜标探测系统关键技术研究[D];哈尔滨工程大学;2010年
2 何建民;面向网络社区聆听客户声音方法研究[D];合肥工业大学;2010年
3 蒋鼎国;无线传感器网络农业信息监控系统设计与数据融合研究[D];江南大学;2010年
4 鲁峰;航空发动机故障诊断的融合技术研究[D];南京航空航天大学;2009年
5 杨庆芳;先进的交通管理系统关键理论与方法研究[D];吉林大学;2004年
6 陈坚红;联合循环机组运行计划和负荷分配:建模、启发式遗传算法求解和数据处理[D];浙江大学;2004年
7 董亚非;若干DNA计算粘贴模型的研究[D];华中科技大学;2004年
8 林志贵;基于证据理论的信息融合研究及其在水质监测中的应用[D];河海大学;2005年
9 王承;基于神经网络的模拟电路故障诊断方法研究[D];电子科技大学;2005年
10 刘仁金;基于商空间的纹理图象分割研究[D];安徽大学;2005年
中国硕士学位论文全文数据库 前10条
1 焉杰;多传感器时滞系统信息融合及其仿真[D];山东科技大学;2010年
2 李朋勇;基于全矢高阶谱的故障诊断方法及其应用研究[D];郑州大学;2010年
3 王玉波;基于基本概率赋值调整的数据融合方法及应用[D];大连理工大学;2010年
4 付东飞;带乘性噪声广义系统多传感器信息融合状态估计算法研究[D];中国海洋大学;2010年
5 张祥明;基于信息融合的矿井提升机健康诊断研究[D];河南理工大学;2010年
6 乔哲峰;自适应情景感知中间件的情景数据预处理模型研究与实现[D];华东师范大学;2011年
7 程帅;应急通信监控系统中故障诊断系统间协同机制的研究[D];沈阳理工大学;2010年
8 王芝;基于概率假设密度函数(PHD)的多目标跟踪方法研究[D];杭州电子科技大学;2009年
9 郑雯雯;多分辨率图像融合及无线网络视频图像压缩研究[D];杭州电子科技大学;2009年
10 张士钰;基于MEMS惯性传感器的车辆组合导航研究[D];南京航空航天大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 曹露燕;叶书建;;聚类分析在高校教务系统中的应用研究[J];福建电脑;2010年03期
2 李东;;数据挖掘技术在优化电子商务网站设计中的应用[J];硅谷;2010年08期
3 孙秀杰;宋喜莲;;基于数据挖掘的电信行业分析型CRM系统研究[J];中国管理信息化;2010年03期
4 夏勇;金卫健;;基于工作流技术的客户关系管理系统研究[J];中国管理信息化;2010年03期
5 周晶平;;数据挖掘在银行分析型CRM系统应用中存在的问题与对策[J];湖北大学学报(自然科学版);2010年01期
6 范坤;何智文;;基于数据挖掘在物流管理决策中的应用[J];湖北广播电视大学学报;2008年10期
7 邵忍平;黄欣娜;胡军辉;;聚类分析的数据挖掘方法及其在机械传动故障诊断中的应用[J];航空动力学报;2008年10期
8 王森勋;陈旭东;付淑文;;数据挖掘技术在企业客户关系管理中的应用[J];湖南医科大学学报(社会科学版);2009年01期
9 逄玉俊;柳明;李元;;k均值聚类分析在过程改进中的应用[J];华中科技大学学报(自然科学版);2009年S1期
10 王士同;修宇;;基于模型的基因表达聚类分析技术研究进展[J];江南大学学报;2006年03期
中国硕士学位论文全文数据库 前6条
1 周群谊;客户关系管理在货运代理行业的应用与研究[D];上海交通大学;2008年
2 尚永伟;基于客户价值的客户关系管理研究[D];武汉理工大学;2008年
3 陆媛;基于聚类算法的基因微阵列数据分析[D];江南大学;2008年
4 易辉;基因表达数据聚类分析[D];南京航空航天大学;2007年
5 王保义;客户关系管理中客户细分的数据挖掘研究[D];西安电子科技大学;2009年
6 冯伟;聚类分析在金融数据分析中的应用研究[D];辽宁师范大学;2009年
【二级参考文献】
中国期刊全文数据库 前2条
1 郁文贤,雍少为,郭桂蓉;多传感器信息融合技术述评[J];国防科技大学学报;1994年03期
2 杨洋,马玉祥;基于关联规则的网管告警数据库知识发现[J];微电子学与计算机;2004年01期
【相似文献】
中国期刊全文数据库 前10条
1 朱娴;马卫;;一种基于层次聚类的双聚类算法[J];微计算机应用;2009年05期
2 何宏;谭永红;;基于计算智能的基因表达数据聚类分析研究进展[J];信息与控制;2009年06期
3 吕玉龙;沈青松;石铁流;王翼飞;;基于禁忌搜索和遗传算法的智能化双聚类方法[J];应用科学学报;2009年03期
4 张黎;逄涣利;王小虎;王佳;;一种共调控基因C均值模糊聚类算法[J];计算机工程与应用;2010年07期
5 程迪祥;陈洪;易东;;时间序列信号多尺度FCM聚类方法[J];自动化与仪器仪表;2010年02期
6 王新金;张华;曹祥红;崔光照;;小波包分解和模糊聚类下的基因表达数据分析[J];计算机工程与应用;2009年19期
7 颜文胜;;基于弹簧模型的基因表达数据可视化聚类[J];计算机工程;2011年05期
8 邓庆山;;聚类分析在基因表达数据上的应用研究[J];计算机工程与应用;2005年35期
9 季瑞瑞;刘丁;;支持向量数据描述的基因表达数据聚类方法[J];智能系统学报;2009年06期
10 陈春燕;张久彪;;双层结构的基因表达数据聚类算法[J];福建电脑;2009年04期
中国重要会议论文全文数据库 前10条
1 杨勰;刘群;吴渝;;基于聚类算法的粒子系统模拟实现[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
2 樊迪;刘振明;金宏威;张亮仁;张礼和;;基于配体结合模式的辅酶A结合蛋白的分类方法研究[A];第十届全国计算(机)化学学术会议论文摘要集[C];2009年
3 高冠东;贾克斌;肖珂;;一种新的基于特征点匹配的图像拼接方法[A];第十三届全国图象图形学学术会议论文集[C];2006年
4 马垣;张红云;李晓瑞;刘刚;张小平;马文胜;;关系数据库中基于拓扑空间的聚类方法[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
5 秦龙;吴义坚;王仁华;;基于HMM的说话人转换中MLLR回归矩阵绑定方法的研究[A];第八届全国人机语音通讯学术会议论文集[C];2005年
6 谢毓湘;栾悉道;吴玲达;文军;老松杨;;一种基于聚类的播音员镜头探测方法[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
7 赵晓煜;康锦江;;基于客户价值的客户聚类及特征分析方法[A];中国市场学会2006年年会暨第四次全国会员代表大会论文集[C];2006年
8 朱琳;周水庚;;基于聚类的文本分类属性加权[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
9 王云龙;李逊;;基于数据场的数据挖掘方法在入侵检测中的应用[A];第十九次全国计算机安全学术交流会论文集[C];2004年
10 李涵;;一种改进的聚类方法在异常检测中的应用[A];2010年全国开放式分布与并行计算机学术会议论文集[C];2010年
中国重要报纸全文数据库 前5条
1 本刊特稿 陈岩;鲁西南村名的文化解读[N];济宁日报;2007年
2 王国定 宋瑞卿 王永亮;山西上市公司综合实力谁强?[N];山西日报;2001年
3 王宇乔;减肥品男性消费群不容忽视[N];民营经济报;2005年
4 李海峰;优化无功管理 实现电网安全运行[N];国家电网报;2008年
5 本报实习生 庞仕影;权威榜单不能让数字牵着走[N];国际金融报;2004年
中国博士学位论文全文数据库 前10条
1 张焕萍;面向基因表达数据的致病基因挖掘方法研究[D];南京航空航天大学;2009年
2 王广云;肿瘤基因芯片表达数据分析相关问题研究[D];国防科学技术大学;2009年
3 蔡瑞初;基因表达数据挖掘若干关键技术研究[D];华南理工大学;2010年
4 陈伟;群体智能算法及其在基因表达数据聚类中的应用[D];江南大学;2011年
5 白天;生物医学数据聚类方法研究[D];吉林大学;2012年
6 王勇;基于流形学习的分类与聚类方法及其应用研究[D];国防科学技术大学;2011年
7 胡蓉;WEB日志和子空间聚类挖掘算法研究[D];华中科技大学;2008年
8 熊赟;生物序列模式挖掘与聚类研究[D];复旦大学;2007年
9 郝占刚;基于遗传算法等技术的数据与文本聚分类研究[D];天津大学;2006年
10 李敏;蛋白质网络中复合物和功能模块挖掘算法研究[D];中南大学;2008年
中国硕士学位论文全文数据库 前10条
1 朱建杰;基于多源信息融合的基因表达数据聚类分析[D];天津大学;2008年
2 邓庆山;聚类分析及其在基因表达数据中的应用研究[D];华中科技大学;2004年
3 陈佳妮;基因表达数据分析中IGA-FCM聚类算法研究与实现[D];东北林业大学;2010年
4 王勇;聚类方法在生物数据中的研究与应用[D];江南大学;2008年
5 闻凌云;用于遗传规划的HS-model及其在聚类分析中的应用研究[D];中国科学技术大学;2009年
6 刘月明;基因表达聚类分析方法研究[D];第三军医大学;2001年
7 周鹏;神经网络集成算法研究及在基因表达数据分析中的应用[D];华中科技大学;2004年
8 刘天飞;基于遗传算法的基因芯片数据聚类研究[D];四川农业大学;2008年
9 易辉;基因表达数据聚类分析[D];南京航空航天大学;2007年
10 李建飞;基因表达数据的聚类算法研究[D];燕山大学;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026