收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基因表达数据的相似性度量和特征提取研究

王文俊  
【摘要】:DNA微阵列技术能同时检测成千上万个基因甚至是全基因组的表达水平,为人类在分子水平进行疾病的诊断和治疗提供了全新的技术手段。利用海量的基因表达数据,进行基因功能分类和疾病诊断,已成为生物信息领域研究的热点问题。 聚类是实现基因功能划分的重要手段,其中相似性度量的选取至关重要;分类是实现疾病诊断的重要手段,针对基因表达数据的高维小样本特性,进行有效的降维和特征提取,就成为分类前的关键步骤。本论文针对基因聚类和样本分类,分别从基因相似性度量和特征提取两个方向展开研究。 方向一:针对基因聚类任务中基因相似性度量的选取问题,本论文透过基因表达水平,挖掘基因相似的深层次关系。从基因个体特征和基因关系特征两个不同角度挖掘基因的相似性,分别提出基于最短路的基因相似性度量和基于网络拓扑结构的基因相似性度量。对基因表达数据进行聚类分析的实验,验证了所提方法的有效性。 (1)从基因个体特征出发,提出了基于最短路的基因相似性度量。通过基因的表达相关性构建共表达基因网络,用求解网络最短路的方法获得基因个体特征的相似性,以最短路径长度作为基因的相似性度量。将该相似性度量和传统聚类方法相结合,对yeast数据进行基因聚类分析,与基于欧氏距离或皮尔森相关系数的聚类结果进行比较,结果表明,基于最短路的相似性度量能获得更好的聚类性能。 (2)从基因关系特征出发,提出了基于网络拓扑结构的基因相似性度量。通过阈值化基因表达相性来获得基因关系网络,用网络局部拓扑结构来表征基因的关系特征,以关系特征的某种相似性作为基因的相似性度量。基于该相似性度量,采用传统聚类方法对yeast数据进行基因聚类分析,验证了基于网络拓扑结构的基因相似性度量的可行性。 方向二:针对样本分类任务中传统特征提取方法在高维小样本基因表达数据上的应用局限性,提出一种基于样本空间的特征提取算法和一种新的鉴别特征提取方法。 (1)针对传统方法在进行基因表达数据的特征提取时,存在计算复杂度高或矩阵严重奇异的问题,提出一种基于样本空间的特征提取方法。把最优变换向量用样本的线性加权和表示,通过代数变换,把特征提取过程从高维的基因空间转换到低维的样本空间,从而有效降低了特征提取的计算复杂度和矩阵的奇异程度。对基因表达数据的特征提取实验验证了方法的有效性。 (2)针对fisher线性鉴别分析方法(LDA)最优子空间维数受样本类别数限制和计算协方差矩阵的复杂性问题,提出一种新的鉴别特征提取方法—类别保留投影(Class Preserving Projection,CPP)。把两两样本之间的类别关系作为权重系数,通过最小化类内两两样本的平均距离和最大化类间两两样本的平均距离,来构造目标函数,采用线性投影方法寻找最优鉴别特征。通过核技巧将CPP推广到非线性空间,提出核类别保留投影(Kernel Class Preserving Projection,KCPP),用于解决非线性鉴别特征提取问题。相比LDA,CPP最优子空间的维数不受样本类别数的限制,能找到更高维的最优子空间;且不需要计算协方差矩阵,降低了计算复杂度。对基因表达数据的线性和非线性特征提取实验分别验证了CPP和KCPP特征提取的可行性和有效性。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 余东良;刘金瑄;;基于内容的图像检索技术研究[J];电脑知识与技术;2009年28期
2 李超;熊璋;朱成军;;基于距离相关图的音频相似性度量方法[J];北京航空航天大学学报;2006年02期
3 许锐;;利用颜色和纹理特征的图像检索技术研究[J];贵州大学学报(自然科学版);2008年04期
4 孙印杰;陈智芳;王敏;;基于内容的图像检索技术探讨[J];内江科技;2007年02期
5 赖秀珍;胡溯帆;陆梅林;;景德镇陶瓷图像检索技术研究[J];中国陶瓷;2009年12期
6 毛红保;张凤鸣;冯卉;吕慧刚;;基于参数重要度的多元时间序列相似性查询[J];计算机工程;2009年24期
7 郭晓娟;炎士涛;成继福;;基于纹理特征的图像检索方法的研究与实现[J];电脑开发与应用;2010年08期
8 袁曼娜;;基于内容的医学图像检索技术概述[J];科技信息;2011年08期
9 黄国华;;基于相对高度的曲线特征提取算法[J];邵阳学院学报(自然科学版);2011年01期
10 王文俊;张军英;;基于核的类别非局保留投影[J];模式识别与人工智能;2009年05期
11 成晓翁;胡学龙;尹翔;;一种基于形状的图像检索系统[J];国外电子测量技术;2011年10期
12 李庆先;;基于内容的图像检索相关反馈算法的改进[J];计算技术与自动化;2007年02期
13 林丽惠;;一种改进的颜色直方图相似性度量算法[J];武夷学院学报;2009年02期
14 田越;张永梅;李波;;遥感图像的快速配准方法[J];北京航空航天大学学报;2008年11期
15 李小梅;郭红;吕暾;;一种采用新的相似性度量方法的共调控基因动态模糊聚类算法[J];福州大学学报(自然科学版);2011年02期
16 熊凌;;计算机视觉中的图像匹配综述[J];湖北工业大学学报;2006年03期
17 陈慧;;基于内容的图像检索技术研究[J];福建金融管理干部学院学报;2007年06期
18 李柳柏;;基于感知意象的图像检索技术[J];西南师范大学学报(自然科学版);2010年06期
19 董卫军,周明全,耿国华;基于综合特征图像检索技术研究[J];计算机应用与软件;2005年11期
20 林飞盈;何海钊;刘美珍;;基于内容的图像检索系统设计[J];民营科技;2009年10期
中国重要会议论文全文数据库 前10条
1 林土胜;赖声礼;;视网膜血管特征提取的拆支跟踪法[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
2 钱小聪;郑宝玉;穆明鑫;;神经网络联机手写签名验证[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
3 张羽;汪源源;王威琪;余建国;林继耕;;狭窄血管多普勒信号特征提取的实验研究[A];21世纪医学工程学术研讨会论文摘要汇编[C];2001年
4 柳林霞;陈杰;窦丽华;;不变矩理论及其在目标识别中的应用[A];2002中国控制与决策学术年会论文集[C];2002年
5 杨日杰;施建礼;林洪文;;一种雷达视频回波特征提取方法研究[A];中国航空学会信号与信息处理专业全国第八届学术会议论文集[C];2004年
6 代克杰;张红梅;盛赛斌;;基于BP网络的故障特征提取方法研究[A];2004中国控制与决策学术年会论文集[C];2004年
7 何新;史迎春;周献中;;一种基于独立分量分析的音频分类方法[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
8 朱晓霞;孙同景;陈桂友;;基于支持向量机理论的两级指纹分类实现方法[A];第16届中国过程控制学术年会暨第4届全国故障诊断与安全性学术会议论文集[C];2005年
9 刘喜平;万常选;;一种二维的树型文档结构相似性度量[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
10 范海宁;郭英;吴剑锋;陈志武;;基于小波包分解的声信号特征提取方法[A];信号与信息处理技术第三届信号与信息处理全国联合学术会议论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 王文俊;基因表达数据的相似性度量和特征提取研究[D];西安电子科技大学;2011年
2 权胜赫;基于形状特征三维模型检索的一些关键技术实现研究[D];吉林大学;2007年
3 白雪;聚类分析中的相似性度量及其应用研究[D];北京交通大学;2012年
4 张旗;基于属性的图像分类研究[D];大连海事大学;2005年
5 张立福;通用光谱模式分解算法及植被指数的建立[D];武汉大学;2005年
6 苏彩红;墙地砖质量自动检测技术的研究[D];华南理工大学;2004年
7 宋余庆;医学图像数据挖掘若干技术研究[D];东南大学;2005年
8 宋晴;基于液滴分析技术和液滴指纹图的液体识别方法的研究[D];天津大学;2005年
9 吴婷;自发脑电脑机接口模式识别关键技术与实验研究[D];上海交通大学;2008年
10 冯坤;基于内积变换的机械故障特征提取原理与早期识别方法研究[D];北京化工大学;2012年
中国硕士学位论文全文数据库 前10条
1 陈希;基于内容的图像检索技术及其应用研究[D];武汉理工大学;2008年
2 王芳;基于内容的图像检索技术研究[D];黑龙江大学;2005年
3 李朋杰;基于形状直方图的三维模型检索算法的研究[D];燕山大学;2009年
4 王海霞;基于纹理特征的图像检索技术研究[D];燕山大学;2006年
5 周斌;基于内容的图像检索[D];南京理工大学;2004年
6 贾艳翠;基于颜色特征的图像检索技术研究[D];吉林大学;2009年
7 郭竞;三维地形模型检索系统设计与实现[D];西北大学;2007年
8 曾红梅;情绪图片视觉诱发EEG特征提取与分析[D];天津大学;2012年
9 雷自力;基于Pro/E的三维零件参数化建模和特征提取研究[D];华中科技大学;2011年
10 林少波;中文文本分类特征提取方法的研究与实现[D];重庆大学;2011年
中国重要报纸全文数据库 前10条
1 燕海霞;王忆勤;李福凤;脉象信号研究日渐深入[N];中国医药报;2005年
2 沈占锋;遥感影像信息提取与分析[N];计算机世界;2006年
3 王竣;深入开发CAD系统对疾病诊断有重要意义[N];中国医药报;2007年
4 北京数码空间信息技术有限公司技术总监 刘斌;Web Mining:第二代网络信息处理技术[N];计算机世界;2000年
5 上海 高博;让电脑“听懂”人话[N];电脑报;2008年
6 记者 何腾江 通讯员 周汇成;验钞新技术通过鉴定[N];中山日报;2008年
7 孙哲南 谭铁牛;生物识别的十大关键技术[N];计算机世界;2007年
8 本报记者 刘洪宇;当机器听懂了我们的声音[N];辽宁日报;2008年
9 林木树;反垃圾邮件有待新突破[N];人民邮电;2004年
10 中科院自动化所 何鹏 陶建华 谭铁牛;看懂人的“脸色”[N];计算机世界;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978