收藏本站
《江西理工大学》 2018年
收藏 | 手机打开
二维码
手机客户端打开本文

基于图正则低秩表示的基因表达谱数据特征选择算法研究

康乐乐  
【摘要】:随着人类基因组计划的高速发展,DNA芯片技术被广泛地应用到生命科学的各个领域,利用得到的基因表达谱数据可以从微观世界描述出各个基因的表达状态,所以被成功用于癌症的诊断与治疗等研究领域,为人类的发展开启了新的大门,成为学术界一个热门的研究方向。然而,基因表达谱数据“高维小样本”等特点会降低癌症基因的识别准确率,所以必须采用适当的数据处理办法进行有效的降维,准确高效的挑选出与致病基因相关的特征基因子集就成为一项具有深远意义的研究工作。本文通过结合生物学知识和机器学习中的相关理论,对癌症基因进行特征选择,并对相应的实验结果进行有效性分析,完成的主要工作如下:1.提出了一种基于图正则低秩评分的基因表达谱特征选择算法。为了准确表达数据本质属性,考虑到低秩表示算法是从全局观点出发揭示数据样本的整体结构信息,但没有考虑数据的局部流形结构,在此基础上引入具有局部保持能力的流形正则约束项,构建一种图正则低秩表示模型。通过求解此模型得到系数矩阵,进一步构造出图权值矩阵,然后代替拉氏评分中的相似度矩阵,从而形成一种新的评分方式用于DNA表达数据的特征选择,称之为图正则低秩评分算法。最后在基因表达谱数据集上进行聚类实验,同传统的评分算法相比较,该算法取得更好的聚类效果。2.提出了一种基于图正则平滑低秩表示的基因表达谱特征选择算法。在低秩表示中,通过数据矩阵本身作为字典进行联合线性表示每个数据点,并且利用最小化核范数作为秩函数的凸包络来获得理想的低秩表示。但是在实际应用中,它的表现可能会偏离原始问题的最优解,因为核范数不是秩函数的凸松弛最优的选择。针对此问题,在构造目标函数时,利用对数行列式函数取代核范数更加准确的逼近秩函数,同时加上揭示数据局部近邻结构的图正则项,构建一种图正则平滑低秩表示模型,并且对得到的系数矩阵后处理之后再构造数据图结构。最后在基因表达谱数据集上进行聚类实验,与传统的特征选择算法相比较,该算法有更高的聚类准确率。
【学位授予单位】:江西理工大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:Q811.4;TP181

【相似文献】
中国期刊全文数据库 前10条
1 胡红柳;侯晓明;曲波;高学军;李庆章;;高通量基因表达谱的应用[J];中国乳品工业;2012年12期
2 汪伟;;基于数据库语言实现基因表达谱数据的单因素重复测量方差分析[J];中国医疗设备;2013年11期
3 刘玲;;基因表达谱数据分析技术[J];电脑与信息技术;2010年06期
4 黄宏斌;梁芳;熊炜;李小玲;曾朝阳;李桂源;;生物信息技术加速开发旧药新用途[J];生物化学与生物物理进展;2012年01期
5 张亮,张岩,周一鸣,安爽,果德安,周玉祥,曾令文,程京;用聚类法分析受抗真菌物质处理后的酵母细胞全基因表达谱[J];生物化学与生物物理进展;2002年04期
6 潘海燕,朱军,韩丹夫;分析基因表达谱数据的新方法(英文)[J];浙江大学学报(农业与生命科学版);2004年05期
7 葛世丽,吴德昌;基因表达系列分析及其应用[J];国外医学(放射医学核医学分册);1998年05期
8 葛芳;王年;郭秀丽;;一种改进的谱聚类算法及其在基因表达谱分析中的应用[J];安徽大学学报(自然科学版);2012年05期
9 曹文君;李运明;陈长生;;基因表达谱富集分析方法研究进展[J];生物技术通讯;2008年06期
10 阚海俊;唐俊;苏亮亮;;一种基于邻域不定性信息和记分准则相结合的肿瘤特征基因提取方法[J];安徽大学学报(自然科学版);2014年01期
中国重要会议论文全文数据库 前10条
1 刘艳;李康;傅松滨;;基于小波分析理论的基因表达谱数据分析方法的研究[A];中国的遗传学研究——中国遗传学会第七次代表大会暨学术讨论会论文摘要汇编[C];2003年
2 张岩;张亮;周一鸣;安爽;果德安;周玉祥;曾令文;程京;;抗真菌物质与酵母细胞作用后全基因表达谱的聚类法分析[A];第九次全国生物物理大会学术会议论文摘要集[C];2002年
3 朱明珠;高磊;李霞;;酵母基因表达相关性与蛋白质互作网络距离分析[A];中国生物医学工程进展——2007中国生物医学工程联合学术年会论文集(下册)[C];2007年
4 高瑞兰;陈小红;林筱洁;钱煦岱;徐卫红;吴超群;;三七皂苷诱导造血细胞基因表达谱的研究[A];中国细胞生物学学会2005年学术大会、青年学术研讨会论文摘要集[C];2005年
5 许沈华;牟瀚舟;顾琳慧;朱赤红;刘祥麟;;用基因芯片筛选高转移卵巢癌转移相关的基因[A];中国细胞生物学学会医学细胞生物学学术大会论文集[C];2006年
6 包雷;过涛;孙之荣;;挖掘基因与抗癌药物间可能的生物学关联[A];第九次全国生物物理大会学术会议论文摘要集[C];2002年
7 邱广斌;郝冬梅;宫立国;李云慧;;肿瘤相关新基因MTLC的克隆及在肿瘤中的表达研究[A];第十届全军检验医学学术会议论文汇编[C];2005年
8 高瑞兰;陈小红;林筱洁;钱煦岱;徐卫红;吴超群;;三七皂苷诱导造血细胞基因表达谱的研究[A];第八届全国中西医结合血液病学术会议论文集[C];2007年
9 张幸国;虞朝晖;文思远;;复方丹参注射液对血管内皮细胞基因表达谱的影响研究[A];2006年浙江省药品法规与临床药理学术研讨会论文汇编[C];2006年
10 高瑞兰;林筱洁;陈小红;徐卫红;钱煦岱;吴超群;;三七皂苷诱导造血细胞基因表达谱的研究[A];2007年浙江省血液病学术年会论文汇编[C];2007年
中国重要报纸全文数据库 前10条
1 记者 衣晓峰 通讯员 李小莲;探寻“证”的基因表达谱[N];中国中医药报;2009年
2 晓明;抑制一基因 “老”鼠换新肤[N];中国医药报;2007年
3 记者 张晔 通讯员 周伟;我学者发现多基因表达谱[N];科技日报;2014年
4 ;聚类分析在自身免疫病基因表达谱研究中的初步应用[N];中国医药报;2003年
5 吴煜 杨宇飞 杨焕明;抗肿瘤药研究新思路[N];中药报;2000年
6 周艳萍;寻求肿瘤个体化治疗方案[N];健康报;2006年
7 赵绍华;给孩子减肥必须“饿一饿”[N];健康时报;2007年
8 解放军总医院全军肾脏病研究所教授 吴镝王继荣 刘泉 整理;推进肾病科研的四大利器[N];健康报;2008年
9 江苏省中医院转化医学中心 赖仁胜;肿瘤基因组 突破在云端[N];健康报;2011年
10 记者 张学全 张建松;我人类功能基因研究获重要进展[N];新华每日电讯;2000年
中国博士学位论文全文数据库 前10条
1 王翔;小麦温光反应的分子生物学研究[D];中国农业科学院;2014年
2 牛月;NCA1在拟南芥感受钠盐胁迫过程中功能的研究[D];兰州大学;2012年
3 王作昭;长白山林蛙蛙卵Onconase基因的克隆表达及其抗人乳腺癌作用研究[D];吉林大学;2016年
4 周运;基于生物网络的大鼠再生肝细胞基因表达谱数据分析[D];河南师范大学;2016年
5 张文慧;白桦BPERF11基因响应高盐干旱胁迫的调控机理研究[D];东北林业大学;2016年
6 张伟溪;杨树抗逆转录因子基因遗传转化与功能验证[D];中国林业科学研究院;2014年
7 杨祖;皮肤组织特异性表达绵羊Wnt10b基因转基因小鼠和转基因绵羊研究[D];中国农业大学;2015年
8 卢智勇;小鼠卵巢生殖干细胞的建系及其基因编辑[D];华中科技大学;2016年
9 王士奇;先天性肛门直肠畸形发病的基因网络调控机制研究[D];重庆医科大学;2016年
10 王文辉;基于基因表达谱的结直肠癌的判别与分型[D];南方医科大学;2017年
中国硕士学位论文全文数据库 前10条
1 赵月敏;CMFT体外抑瘤活性及对肿瘤细胞基因表达谱的影响[D];河北大学;2015年
2 江月;家蚕TGF-β家族成员dpp和daw基因的功能研究[D];苏州大学;2015年
3 弓春玲;Hela细胞与人子宫内膜基质细胞中miRNA Let-7及其靶基因的关系研究[D];内蒙古大学;2015年
4 罗影涛;腺苷酸环化酶3基因敲除小鼠主要嗅觉表皮基因表达谱分析[D];河北大学;2015年
5 甘斌;基于稀疏性理论的肿瘤基因表达谱分类[D];曲阜师范大学;2015年
6 乔玲波;StOSM基因及其耐旱功能研究[D];宁夏大学;2015年
7 赵学军;家蝇CCTζ基因的cDNA克隆、表达及表达模式研究[D];贵阳医学院;2015年
8 文正勇;鳜鱼生长性状数字基因表达谱分析[D];华中农业大学;2015年
9 李晓宾;Fancd2os基因在小鼠不同组织中的表达谱分析及其真核表达载体的构建与鉴定[D];山西医科大学;2015年
10 陈辉;CIK诱导过程中TCR的表达变化及靶向TCR的基因编辑研究[D];广东药学院;2015年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026