收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于邻域互信息的肿瘤基因选择研究

高云鹏  
【摘要】:互信息是属性间相关度的度量,适用于特征选择问题,同时它与具体分类器相独立,能与多种分类器结合产生很好的分类效果。然而,互信息只适用于离散型数据,不能直接处理基因表达谱数据。针对基因表达谱高维度、低样本、不完备和连续型的特点,结合基因初选方法,将邻域互信息作为相关度度量,提出一些特征选择算法应用于肿瘤基因选择,并以理论及实验分析说明了这些算法的有效性。本文主要内容如下: 针对基于信息熵的基因选择分类精度较低与计算过于复杂的问题,提出基于邻域条件互信息的肿瘤分类基因选择算法。首先,将邻域概念引入信息熵理论,定义了邻域条件互信息,计算连续型属性对于肿瘤分类的重要性。其次,针对样本邻域的计算过于复杂的问题,通过近似度量公式进行简化处理,降低了算法的时间复杂度。然后,结合顺序前向搜索策略构建了一种快速肿瘤分类基因选择算法。 针对基因表达谱高维度、低样本的特点,提出基于邻域互信息的肿瘤基因聚类算法,将属性聚类成簇,从而发现了有意义的模式。首先分析了以往聚类方法在处理连续型属性时的不足,从而引入邻域互信息计算连续型属性的相关度。其次,提出一个属性聚类算法将属性聚类成簇。然后,将此方法应用于基因表达数据,发现了有意义的簇,从而得到了包含基因分类和识别能力的基因。 针对现有两种特征选择方法的各自优点及存在的不足,将特征选择的过程分为两个阶段:第一阶段采用过滤法,提出用邻域互信息计算每个属性与分类的相关度;第二阶段采用缠绕法,提出用粒子群优化算法检测已经标识的相关属性子集,选择出最优或者次优属性子集。最后,通过支持向量机与留一法交叉验证所选特征子集的有效性。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 何兰;范继红;;基因芯片数据特征选择法研究[J];医学信息学杂志;2012年10期
2 杨立才;李金亮;姚玉翠;吴晓晴;;基于F-score特征选择和支持向量机的P300识别算法[J];生物医学工程学杂志;2008年01期
3 邵欢;李国正;刘国萍;王忆勤;;多标记中医问诊数据的症状选择[J];中国科学:信息科学;2011年11期
4 吴红霞;吴悦;刘宗田;雷州;;基于Relief和SVM-RFE的组合式SNP特征选择[J];计算机应用研究;2012年06期
5 蔡立军;沈小乔;林亚平;蒋林波;;一种改进的基因表达数据分类方法[J];湖南大学学报(自然科学版);2007年03期
6 刘峤;王娟;陈伟;秦志光;;用于全基因组关联分析的一种基因自动选择算法研究[J];航天医学与医学工程;2010年04期
7 高智勇,龚健雅,秦前清,林家瑞;恶性肿瘤相关改变检测方法的研究进展[J];北京生物医学工程;2005年02期
8 周华英;张启蕊;罗漫;王鹤娴;;医药文本分类特征选择的研究[J];辽宁中医药大学学报;2011年06期
9 李昕;赵春;王惠惠;赵芳芳;;一种面向生物信息学数据的模式选择算法研究[J];生物医学工程学杂志;2011年05期
10 王翌;戴莹;郭峰;李绍滋;;一种基于灵敏度的中医亚健康诊断方法[J];厦门大学学报(自然科学版);2012年05期
11 ;[J];;年期
12 ;[J];;年期
13 ;[J];;年期
14 ;[J];;年期
15 ;[J];;年期
16 ;[J];;年期
17 ;[J];;年期
18 ;[J];;年期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 靖红芳;王斌;杨雅辉;;基于类别分布的特征选择框架[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
2 李长升;卢汉清;;排序学习模型中的特征选择[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
3 刘功申;李建华;李生红;;基于类信息的特征选择和加权方法[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
4 蒙新泛;王厚峰;;主客观识别中的上下文因素的研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
5 倪友平;王思臣;马桂珍;陈曾平;;分支界定算法在低分辨雷达飞机架次判别中的应用[A];第十三届全国信号处理学术年会(CCSP-2007)论文集[C];2007年
6 李泽辉;聂生东;陈兆学;;应用多类SVM分割MR脑图像特征选择与优化的实验研究[A];中国仪器仪表学会第九届青年学术会议论文集[C];2007年
7 万京;王建东;;一种基于新的差异性度量的ReliefF方法[A];2009年研究生学术交流会通信与信息技术论文集[C];2009年
8 范丽;许洁萍;;基于GMM的音乐信号音色模型研究[A];第四届和谐人机环境联合学术会议论文集[C];2008年
9 刘克彬;李芳;刘磊;韩颖;;基于特征选择和语义扩展的词序列核函数研究[A];第三届学生计算语言学研讨会论文集[C];2006年
10 陈友;戴磊;程学旗;;基于MRMHC-C4.5的IP流分类[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 王博;文本分类中特征选择技术的研究[D];国防科学技术大学;2009年
2 张明锦;基于特征选择的多变量数据分析方法及其在谱学研究中的应用[D];华东理工大学;2011年
3 张丽新;高维数据的特征选择及基于特征选择的集成学习研究[D];清华大学;2004年
4 高青斌;蛋白质亚细胞定位预测相关问题研究[D];国防科学技术大学;2006年
5 冯国忠;文本分类中的贝叶斯特征选择[D];东北师范大学;2011年
6 梁建宁;特征选择与图像匹配[D];复旦大学;2011年
7 耿耀君;高通量数据特征选择算法研究[D];西安电子科技大学;2013年
8 王瑞;针对类别不平衡和代价敏感分类问题的特征选择和分类算法[D];中国科学技术大学;2013年
9 王锋;基于粒化机理的粗糙特征选择高效算法研究[D];山西大学;2013年
10 刘波;组稀疏子空间的大间隔特征选择[D];重庆大学;2013年
中国硕士学位论文全文数据库 前10条
1 孙伟艳;模式分类中特征选择问题的研究[D];哈尔滨理工大学;2009年
2 郑莎;基于特征选择的量表条目筛选方法研究[D];北京交通大学;2008年
3 唐志煦;基于特征选择的入侵检测研究[D];中国科学技术大学;2011年
4 陈东;半监督特征选择和特征选择的稳定性研究[D];上海交通大学;2013年
5 宁永鹏;高维小样本数据的特征选择研究及其稳定性分析[D];厦门大学;2014年
6 黄莎莎;稳定的特征选择算法研究[D];南京邮电大学;2014年
7 邱玉祥;特征选择和集成学习及其在入侵检测中的应用[D];南京师范大学;2008年
8 侯大军;基于机器视觉的苹果特征选择和分类识别系统[D];江苏大学;2010年
9 王姝勤;肝脏CT辅助诊断系统中特征选择和提取研究[D];上海交通大学;2010年
10 范小丽;文本分类中特征选择的研究与实现[D];西北大学;2011年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978