收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

微阵列数据分析中的基因选择及样本分类方法研究

祁云嵩  
【摘要】:微阵列技术给生物学研究领域提供了极为丰富、详尽的基因表达信息。对微阵列数据的分析研究可以帮助人们理解生命现象的机理,并促进医学向更精确的诊疗方向发展。鉴于基因微阵列数据的高维小样本、高噪声等特点,迫切需要借助于先进的计算方法来分析和利用这些原始信息。 微阵列数据分析是生物信息学的重要研究课题,检测差异表达基因、最大化样本分类准确率是其中两大关键技术。本文从基因选择、基因约简、样本分类三方面展开研究,并取得如下研究成果: 首先研究了差异表达基因选择问题,提出了基因差异表达显著性阈值的计算方法。该方法通过构造一个优化的统计量,根据给定的错误率指标估算出统计量的阈值,使得统计量大于该阈值的基因可被认为是差异表达基因。仿真及真实微阵列数据上的实验结果验证了该方法的有效性。 在本论文中,差异表达基因被用作样本分类的特征基因。在确定基因是否差异表达的基础上,为了减少特征基因冗余对样本分类的影响,研究了多种基因约简方法。约简是基于粗糙集理论的知识发现过程。经典的粗糙集理论建立在等价关系基础上之上,其结果对数据噪声较为敏感。本论文提出了Spearman秩相关分析、近似分布约简、区间值分析等基因约简方法。实验结果表明,通过这些方法优化的特征基因集有效地提高了样本分类的准确率。 微阵列数据的小样本特性给现有的分类算法带来了新的挑战。本文提出了一个基于主曲线的微阵列数据分类方法。该方法首先在训练数据集上计算出每类样本的主曲线,然后根据测试样本与各类样本的主曲线间距离的期望方差来确定测试样本所属的类别。实验结果表明,该方法在处理样本数量偏少的数据集时,较之其他几种主流分类方法有一定的优势。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 段旭;;基于边缘分布模型的基因选择方法[J];计算机工程与设计;2011年11期
2 张映伟,于川,邢镇容;学习样本存在分类错误时的判据稳定性问题[J];计算机仿真;2003年06期
3 彭晓琳;韩华;朱洁;黄樟灿;;基于最小覆盖的样本分类判别方法应用研究[J];武汉理工大学学报(信息与管理工程版);2009年01期
4 王明怡,吴平,王德林;基于相关性分析的基因选择算法[J];浙江大学学报(工学版);2004年10期
5 何爱香;;基于遗传算法的结肠癌基因选择与样本分类[J];计算机工程与应用;2007年18期
6 王加阳;吴祖剑;;基于粗糙信息熵的基因分析与选择研究[J];计算机应用研究;2008年06期
7 蔡立军;蒋林波;易叶青;;基于蚁群优化算法的基因选择[J];计算机应用研究;2008年09期
8 叶奇明;罗飞;刘娟;;基于多目标EDA的特征基因选择[J];计算机应用研究;2009年08期
9 郭亚琴;王正群;;一种改进的支持向量机BS-SVM[J];微电子学与计算机;2010年06期
10 岑健;秦勇;邢镇容;;学习样本存在分类错误时的决策判据分析[J];茂名学院学报;2006年04期
11 杨帆;王华珍;米红;;面向局部特征的支持向量机递归特征消除[J];计算机工程与应用;2009年28期
12 李建更;李萍;阮晓钢;;基于一种混合法的胃癌基因表达谱分类特征基因选取[J];北京工业大学学报;2010年01期
13 李建中;杨昆;高宏;骆吉洲;郭政;;考虑样本不平衡的模型无关的基因选择方法[J];软件学报;2006年07期
14 韩敏;范迎南;;基于T-S模型的扩展型模糊神经网络及应用[J];系统工程学报;2007年05期
15 祁云嵩;孙怀江;宋余庆;谢军;;基于近似约简的基因选择方法[J];江苏科技大学学报(自然科学版);2009年01期
16 杨昆;徐静;张彦斌;;基因选择的0-1规划模型和算法[J];计算机工程与应用;2010年20期
17 李钧涛;贾英民;;PCD型自适应弹性网络在微阵列分类中的应用[J];智能系统学报;2010年03期
18 焦娜;苗夺谦;;基于相容关系的基因选择方法[J];计算机科学;2010年10期
19 姬翔;王安文;;一种基于SVM和相关性的基因选择方法[J];计算机应用与软件;2007年06期
20 胡煜;阳文辉;;基于偏最小二乘与极大间距准则的微阵列分类[J];中山大学学报(自然科学版);2008年04期
中国重要会议论文全文数据库 前10条
1 任伟;闫桂英;;利用聚类算法来研究基因选择问题[A];中国运筹学会第八届学术交流会论文集[C];2006年
2 马宁;张正国;;小样本基因芯片实验中基因选择算法评估[A];自主创新与持续增长第十一届中国科协年会论文集(3)[C];2009年
3 李泽;孙之荣;;使用基因表达谱进行肿瘤分子分型和特征基因提取[A];第九次全国生物物理大会学术会议论文摘要集[C];2002年
4 孙玺菁;司守奎;刘超;;支持向量机在缺失数据样本分类上的应用[A];第25届中国控制会议论文集(中册)[C];2006年
5 周丽佳;沈鹤柏;赵丽娜;朱龙章;贾能勤;;基于量子点对RNA干扰技术的初步研究[A];中国化学会第十一届胶体与界面化学会议论文摘要集[C];2007年
6 熊启星;钭金法;朱雄凯;;肠神经元发育不良的电镜特点[A];2007年浙江省儿科学、小儿外科学学术年会论文汇编[C];2007年
7 孙燕;任廷革;;SVM方法在《伤寒论》方分类识别中的应用[A];仲景医学求真(续二)——中华中医药学会第十六届仲景学说学术研讨会论文集[C];2008年
8 陆文凯;刘业新;李衍达;;用约束型自组织特征映射网络实现多井约束插值[A];1997年中国地球物理学会第十三届学术年会论文集[C];1997年
9 毛涛;田字彬;孔心涓;张民生;张翠萍;;抗乙型肝炎病毒C区基因的MlGS RNA核酶真核表达载体的构建和表达[A];中华医学会第七次全国消化病学术会议论文汇编(下册)[C];2007年
10 白俊艳;张勤;贾小平;;不同选择方法对标记辅助导入效率的影响[A];中国畜牧兽医学会2006学术年会论文集(上册)[C];2006年
中国博士学位论文全文数据库 前10条
1 祁云嵩;微阵列数据分析中的基因选择及样本分类方法研究[D];南京理工大学;2011年
2 王明怡;微阵列数据挖掘技术的研究[D];浙江大学;2004年
3 许文龙;基于基因表达数据的肿瘤亚型多类别分类与分析[D];中国科学技术大学;2008年
4 杨智明;面向不平衡数据的支持向量机分类方法研究[D];哈尔滨工业大学;2009年
5 蔡立军;基因分类及基因表达数据分析方法的研究[D];湖南大学;2007年
6 曹源;基于质谱血清多肽组谱图的管理分析系统构建与应用研究[D];中国人民解放军军事医学科学院;2009年
7 白俊艳;影响标记辅助导入效率的因素研究[D];中国农业大学;2005年
8 陈雨亭;用酵母双杂交体系研究与FMRP相互作用的蛋白[D];中国协和医科大学;1998年
9 胡文军;关于模式识别中大样本分类技术的几个关键问题研究[D];江南大学;2012年
10 李小波;数学建模及数据挖掘方法在结直肠癌转移机制研究中的应用[D];浙江大学;2012年
中国硕士学位论文全文数据库 前10条
1 周萍;基于频度与联合效应的基因选择[D];西安电子科技大学;2009年
2 姬翔;基于SVM的多病类诊断基因选择方法研究[D];西安电子科技大学;2005年
3 蒋林波;基于基因表达数据的样本分类研究[D];湖南大学;2008年
4 曹涛;基于聚类的混合基因选择方法研究[D];湖南大学;2011年
5 刘申岭;基于SVM的基因选择[D];西安电子科技大学;2004年
6 孔祥真;肿瘤基因芯片数据聚类分析算法研究[D];曲阜师范大学;2008年
7 陆燕;基于启发式聚类的混合特征基因选择方法研究[D];湖南大学;2010年
8 崔丕锁;神经网络在一类数据样本分类中的应用研究[D];大连理工大学;2005年
9 徐曜华;基于SNP特征的样本分类[D];西安电子科技大学;2010年
10 张娅;肿瘤特征基因提取方法研究[D];电子科技大学;2008年
中国重要报纸全文数据库 前10条
1 记者 郑晓春;人类到底能不能被“设计”?[N];科技日报;2000年
2 Peter Singer;“优生主义”的复辟[N];21世纪经济报道;2006年
3 谢明霞;能不能“设计”一个自己想要的“孩子”[N];科技日报;2003年
4 覃里雯;苏尔斯顿:追寻奇迹[N];经济观察报;2003年
5 本报记者 王心见;走向“超人”时代[N];科技日报;2006年
6 本报驻德国记者 顾钢;科学不能让贪婪绑架[N];科技日报;2009年
7 谭家义(作者单位:农行四川巴中分行);西方商业银行信用风险评估方法的启示[N];中国城乡金融报;2005年
8 深圳商报记者 贾少强 通讯员 王静思;华大的“核聚变”效应[N];深圳商报;2011年
9 姬建中(作者单位:天水日报社);无序竞争不利构建和谐社会[N];天水日报;2005年
10 记者 刘键蓝岸;全力支持华大基因在深发展[N];深圳特区报;2007年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978