收藏本站
《江西理工大学》 2018年
收藏 | 手机打开
二维码
手机客户端打开本文

基于图正则低秩表示的基因表达谱数据特征选择算法研究

康乐乐  
【摘要】:随着人类基因组计划的高速发展,DNA芯片技术被广泛地应用到生命科学的各个领域,利用得到的基因表达谱数据可以从微观世界描述出各个基因的表达状态,所以被成功用于癌症的诊断与治疗等研究领域,为人类的发展开启了新的大门,成为学术界一个热门的研究方向。然而,基因表达谱数据“高维小样本”等特点会降低癌症基因的识别准确率,所以必须采用适当的数据处理办法进行有效的降维,准确高效的挑选出与致病基因相关的特征基因子集就成为一项具有深远意义的研究工作。本文通过结合生物学知识和机器学习中的相关理论,对癌症基因进行特征选择,并对相应的实验结果进行有效性分析,完成的主要工作如下:1.提出了一种基于图正则低秩评分的基因表达谱特征选择算法。为了准确表达数据本质属性,考虑到低秩表示算法是从全局观点出发揭示数据样本的整体结构信息,但没有考虑数据的局部流形结构,在此基础上引入具有局部保持能力的流形正则约束项,构建一种图正则低秩表示模型。通过求解此模型得到系数矩阵,进一步构造出图权值矩阵,然后代替拉氏评分中的相似度矩阵,从而形成一种新的评分方式用于DNA表达数据的特征选择,称之为图正则低秩评分算法。最后在基因表达谱数据集上进行聚类实验,同传统的评分算法相比较,该算法取得更好的聚类效果。2.提出了一种基于图正则平滑低秩表示的基因表达谱特征选择算法。在低秩表示中,通过数据矩阵本身作为字典进行联合线性表示每个数据点,并且利用最小化核范数作为秩函数的凸包络来获得理想的低秩表示。但是在实际应用中,它的表现可能会偏离原始问题的最优解,因为核范数不是秩函数的凸松弛最优的选择。针对此问题,在构造目标函数时,利用对数行列式函数取代核范数更加准确的逼近秩函数,同时加上揭示数据局部近邻结构的图正则项,构建一种图正则平滑低秩表示模型,并且对得到的系数矩阵后处理之后再构造数据图结构。最后在基因表达谱数据集上进行聚类实验,与传统的特征选择算法相比较,该算法有更高的聚类准确率。
【学位授予单位】:江西理工大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:Q811.4;TP181

【参考文献】
中国期刊全文数据库 前2条
1 昂清;王卫东;王国静;彭福来;;基于信息学理论的基因数据挖掘研究[J];中国医疗器械杂志;2012年04期
2 王年;庄振华;唐俊;苏亮亮;;基于Fiedler向量的基因表达谱数据分类方法[J];中国生物工程杂志;2010年12期
中国硕士学位论文全文数据库 前10条
1 谢乃俊;低秩矩阵恢复在维数约简中的研究与应用[D];江西理工大学;2015年
2 田贝贝;基于流形学习和多任务学习的肿瘤基因表达数据分类方法研究[D];武汉科技大学;2015年
3 姚唐龙;基因表达谱数据挖掘的特征提取方法研究[D];安徽大学;2015年
4 刘金勇;基因表达谱数据特征选择与提取方法研究[D];中国计量学院;2014年
5 许露;基于SVM-RFE和粒子群算法的特征选择算法研究[D];湖南师范大学;2014年
6 贺予迪;基于流形学习和低秩表示的维数约减算法研究[D];西安电子科技大学;2014年
7 刘玉堂;基于互信息网络的疾病关键基因选取[D];中国海洋大学;2013年
8 葛芳;肿瘤基因表达谱数据聚类的谱方法研究[D];安徽大学;2013年
9 黄丹凤;基因微阵列数据特征选择与分类方法研究[D];江苏科技大学;2012年
10 王思漫;基于基因表达谱的肿瘤分类方法研究[D];南京理工大学;2012年
【共引文献】
中国期刊全文数据库 前1条
1 王进;丁凌;孙开伟;李钟浩;;过滤特征基因选择及演化硬件急性白血病分型[J];应用科学学报;2012年03期
中国硕士学位论文全文数据库 前10条
1 王燕飞;不确定数据离群点检测算法及在网络取证中的应用[D];山东师范大学;2018年
2 康乐乐;基于图正则低秩表示的基因表达谱数据特征选择算法研究[D];江西理工大学;2018年
3 孟亚洁;基于基因表达谱和DNA甲基化的癌症分类预测[D];湖南大学;2018年
4 师哲;基于基因表达谱和miRNA表达谱的癌症分类集成预测方法[D];湖南大学;2018年
5 李策;基于自适应粒子群算法的特征选择研究[D];南京邮电大学;2017年
6 赵伟卫;基于互信息和随机森林的混合特征选择算法研究[D];西安电子科技大学;2017年
7 余大龙;基于特征选择的数据降维算法研究[D];安徽大学;2017年
8 张力;矩阵恢复及其在三维重建中的应用[D];陕西师范大学;2017年
9 唐宁;基于芯片数据的拟南芥抗旱相关基因挖掘研究[D];湖南农业大学;2017年
10 高伟;乳腺癌REIS检测系统的临床实验研究[D];杭州电子科技大学;2017年
【二级参考文献】
中国期刊全文数据库 前1条
1 余国膺;;人类基因组测序草图完成十年[J];中国心脏起搏与心电生理杂志;2010年03期
中国硕士学位论文全文数据库 前9条
1 李晓岚;基于Relief特征选择算法的研究与应用[D];大连理工大学;2013年
2 王娜;基于遗传算法的混合特征选择方法研究[D];陕西师范大学;2012年
3 刘天舒;BP神经网络的改进研究及应用[D];东北农业大学;2011年
4 杨华;基于粒子群算法的特征基因选择方法研究[D];湖南大学;2010年
5 游伟;基于支持向量机的基因选择算法研究[D];湖南大学;2010年
6 姜百宁;机器学习中的特征选择算法研究[D];中国海洋大学;2009年
7 谭明奎;基因微阵列特征选择与分类方法研究[D];湖南大学;2009年
8 吴希贤;基于优化算法的基因选择与癌症分类[D];湖南大学;2008年
9 马煜;微阵列数据的聚类算法研究[D];西北大学;2006年
【相似文献】
中国期刊全文数据库 前10条
1 豆玉凤;张国成;孙新;刘颖悦;王楠;黄娜;;基因表达谱技术:贵亦需有道[J];医学争鸣;2010年04期
2 潘海燕,朱军,韩丹夫;分析基因表达谱数据的新方法(英文)[J];浙江大学学报(农业与生命科学版);2004年05期
3 吴斌,黄信勇,王米渠,李常度;运用基因芯片研究骨关节炎虚寒证的基因表达谱述要[J];中医药学刊;2004年11期
4 韩光明,陈顺乐,沈南,王元;聚类分析在自身免疫病基因表达谱研究中的初步应用[J];中华检验医学杂志;2003年08期
5 孙德利,舒琦瑾;基因表达谱在中医药研究中的意义[J];中国中医药信息杂志;2002年01期
6 张渝;刘玉洁;郭丹妮;李惠敏;秦新民;;基于高通量测序的数字基因表达谱技术研究进展[J];北方园艺;2015年10期
7 刘先锋;卢学春;范利;高燕;马聪;罗芸;;奥美拉唑对人脐静脉内皮细胞全基因表达谱的影响及机制分析[J];南方医科大学学报;2012年04期
8 徐持华;张国良;夏颖;李玲;毕勇毅;;聚类分析在苯中毒患者肿瘤相关基因表达谱研究中的应用[J];数理医药学杂志;2006年02期
9 ;我国发现Ⅰ型糖尿病的多基因表达谱,有助于该病的预测[J];生物学教学;2014年09期
10 姜琳颖;余东海;石鑫;;基于加权极限学习机的肿瘤基因表达谱数据分类[J];东北大学学报(自然科学版);2017年06期
中国重要会议论文全文数据库 前10条
1 刘艳;李康;傅松滨;;基于小波分析理论的基因表达谱数据分析方法的研究[A];中国的遗传学研究——中国遗传学会第七次代表大会暨学术讨论会论文摘要汇编[C];2003年
2 韦朝领;高香凤;江昌俊;;茶树对茶尺蠖取食诱导的基因表达谱差异初探[A];第四届海峡两岸茶业学术研讨会论文集[C];2006年
3 赵丽婷;郭长江;吴健全;杨继军;韦京豫;王宇平;高蔚娜;;槲皮素对大鼠肝脏基因表达谱的影响[A];中国营养学会特殊营养第七届学术会议会议资料汇编[C];2009年
4 张岩;张亮;周一鸣;安爽;果德安;周玉祥;曾令文;程京;;抗真菌物质与酵母细胞作用后全基因表达谱的聚类法分析[A];第九次全国生物物理大会学术会议论文摘要集[C];2002年
5 高瑞兰;陈小红;林筱洁;钱煦岱;徐卫红;吴超群;;三七皂苷诱导造血细胞基因表达谱的研究[A];第八届全国中西医结合血液病学术会议论文集[C];2007年
6 文志宁;张娟;张丽芳;蒋丽娜;李益洲;李梦龙;;癌症样本基因表达谱数据的解析与建模[A];第十一届全国计算(机)化学学术会议论文摘要集[C];2011年
7 高瑞兰;陈小红;林筱洁;钱煦岱;徐卫红;吴超群;;三七皂苷诱导造血细胞基因表达谱的研究[A];第三届海峡两岸中西医结合学术研讨会论文集[C];2005年
8 高瑞兰;陈小红;林筱洁;钱煦岱;徐卫红;吴超群;;三七皂苷诱导造血细胞基因表达谱的研究[A];2005年华东六省一市血液病学学术会议暨浙江省血液病学学术年会论文汇编[C];2005年
9 高瑞兰;陈小红;林筱洁;钱煦岱;徐卫红;吴超群;;三七皂苷诱导造血细胞基因表达谱的研究[A];全国中西医结合血液病学术研讨会、浙江省中西医结合学会血液病专业委员会成立大会首次学术年会暨继续教育学习班论文汇编[C];2006年
10 高瑞兰;陈小红;林筱洁;钱煦岱;徐卫红;吴超群;;三七皂苷诱导造血细胞基因表达谱的研究[A];2006年浙江省血液病学学术年会论文汇编[C];2006年
中国重要报纸全文数据库 前10条
1 记者 张晔 通讯员 周伟;我学者发现多基因表达谱[N];科技日报;2014年
2 余志平;寻找遗传学线索 提高化疗效果[N];中国医药报;2003年
3 记者 衣晓峰 通讯员 李小莲;探寻“证”的基因表达谱[N];中国中医药报;2009年
4 王雪飞 吴志军;我国建立大规模人胎肝基因表达谱[N];健康报;2006年
5 ;聚类分析在自身免疫病基因表达谱研究中的初步应用[N];中国医药报;2003年
6 赵绍华;给孩子减肥必须“饿一饿”[N];健康时报;2007年
7 小依;回首 只因骄傲[N];医药经济报;2001年
8 本报记者 耿挺;生物节律紊乱基因编辑猕猴克隆成功[N];上海科技报;2019年
9 周艳萍;寻求肿瘤个体化治疗方案[N];健康报;2006年
10 本报记者 解悦;南京专家破译肥胖遗传基因“密码”[N];南京日报;2008年
中国博士学位论文全文数据库 前10条
1 张菊红;自身免疫性内耳疾病相关的分子机制研究[D];山东大学;2018年
2 刘健;基于机器学习的肿瘤基因表达谱数据分析方法研究[D];中国矿业大学;2018年
3 杨希林;EMP1基因在头颈部鳞癌中的作用及机制研究[D];武汉大学;2016年
4 陈涛;基因表达谱的数据挖掘方法研究[D];西北工业大学;2016年
5 张宝刚;铜离子激发拟南芥免疫机制的研究[D];山东农业大学;2018年
6 王士奇;先天性肛门直肠畸形发病的基因网络调控机制研究[D];重庆医科大学;2016年
7 王全顺;白血病细胞WT1基因的表达机理[D];中国人民解放军军医进修学院;2004年
8 段瑞峰;Pten基因敲除小鼠转录上调新基因pdd87的功能研究及Pten缺失的胚胎成纤维细胞的蛋白质组分析[D];中国人民解放军军事医学科学院;2004年
9 张金强;两条新的肺癌转移相关基因的获取、鉴定与功能研究[D];中国人民解放军军事医学科学院;2004年
10 钱军;骨髓增生异常综合征患者的基因表达谱研究[D];苏州大学;2004年
中国硕士学位论文全文数据库 前10条
1 张学扶;基于基因表达谱和蛋白质互作网络的癌症分类预测模型研究[D];湖南大学;2018年
2 赵更;基于基因和基因间互作的通路活性推断方法研究[D];温州大学;2018年
3 张志辉;髓系肿瘤中基因SCIN表达及启动子甲基化的临床意义[D];江苏大学;2018年
4 郭园园;基于互信息的信息基因选择算法研究[D];湘潭大学;2018年
5 刘娜;家蚕茧丝性状相关性分析及部分基因的功能研究[D];江苏科技大学;2018年
6 姜露熙;灵芝细胞中参与灵芝酸生物合成细胞色素P450基因的筛选与分析[D];昆明理工大学;2018年
7 洪浩;基于度量学习的生物数据分析方法研究[D];国防科学技术大学;2017年
8 杜翠;基于基因表达谱的前列腺癌人种差异性的生物信息学研究[D];苏州大学;2018年
9 吴伟;基于基因表达谱数据的肿瘤分类研究[D];湖南大学;2016年
10 李耀;基于基因表达谱数据的癌症分类研究[D];湖南大学;2014年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026