收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

生物信息数据挖掘若干关键问题研究与应用

李荣  
【摘要】: 数据挖掘研究经过十余年的发展,涌现了众多的挖掘算法。这些算法各具特色,涉及了统计、人工智能、机器学习、数字信号处理等研究领域。近几年数据挖掘以其强大的分析能力向各行业渗透,研究方向也逐步转向应用。数据挖掘结合应用领域的特色而得到发展。 生命科学近年来获得突破性进展,随着信息技术在生物学研究中得到广泛应用,现代生物学的研究方法也而发生了深刻的变化,强有力的数据分析技术与工具成为现代生物学研究发展的关键。数据挖掘技术因其在大规模数据处理方面的卓越能力而在其中占据越来越重要的地位。但是生物信息学中的数据挖掘研究仍然处于起步阶段,有很多问题需要解决。 本文针对生物信息数据挖掘目前需要解决的若干关键问题进行研究,具体研究成果如下: 1).采用数据挖掘技术进行大规模基因表达谱分析,总结了基因表达谱芯片数据分析的主要分析需求,提出了基因表达相似性解释分析、特殊表达基因分析、基因表达副路径分析等六个分析模型,并对每个分析模型设计了具体的数据挖掘分析方法。实际应用表明,这些分析满足了表达谱分析的主要需求,分析结果具有指导意义。 2).针对生物信息数据挖掘软件统一架构问题,提出一个适于生物信息分析的数据挖掘应用平台四层架构BDMAPA。这四层包括:数据层、数据挖掘算法工具层、分析逻辑层和应用系统层。此构架实现了数据挖掘算法、分析模型、应用系统三者在逻辑上的隔离分层,使得数据挖掘算法和分析模型均成为可重用的单位,降低了数据挖掘系统设计与使用难度,实际的应用情况表明此构架十分适合生物信息分析。 3).研究生物信息集成与标准化存在的问题,提出了基因表达谱芯片数据库的设计框架,遵循最小信息内容要求的MIAME原则。在此基础上提供了灵活的与数据库模式无关的数据转换工具,设计了芯片数据库CBioDB及其管理系统。 4).设计并实现了基因表达谱芯片数据挖掘系统CBioMiner,该系统具有良好的伸缩性和实体独立性,使用方便,易于定制。提供了基因表达谱分析的完整流程和结果可视化,满足主要分析需要。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 邓建钢;潘丽敏;罗森林;张铁梅;韩怡文;;不同胰岛素敏感状态下大鼠基因数据处理[J];计算机工程与设计;2007年10期
2 刘维;陈崚;;基因表达数据的并行双向聚类算法[J];小型微型计算机系统;2009年04期
3 李冯;沈称意;王翼飞;;DC-CLUSTER软件的设计与开发[J];微计算机信息;2008年14期
4 周昉;何洁月;;生物信息学中基因芯片的特征选择技术综述[J];计算机科学;2007年12期
5 王鑫;蒋华;;基于改进Multi-Agent系统的基因表达数据的分析与研究[J];计算机工程与设计;2008年09期
6 王加阳;吴祖剑;;基于粗糙信息熵的基因分析与选择研究[J];计算机应用研究;2008年06期
7 李小梅;郭红;;基因表达数据的模糊聚类技术研究[J];信息系统工程;2010年11期
8 周晓彦;郑文明;;基于模糊核判别分析的基因表达数据分析方法[J];华中科技大学学报(自然科学版);2007年S1期
9 ;GeneSpy基因芯片数据分析系统[J];电脑与电信;2010年01期
10 ;GeneSpy基因芯片数据分析系统[J];电脑与电信;2009年06期
11 ;GeneSpy基因芯片数据分析系统[J];电脑与电信;2009年09期
12 杨晶;王兆月;田心;;乳腺癌基因芯片数据使用探讨[J];生物信息学;2007年01期
13 伍亚舟;张玲;罗万春;易东;;基因表达数据的多尺度特征提取与分类研究[J];计算机工程与应用;2009年13期
14 贺宪民,贺佳;基因芯片数据的标准化及分析方法[J];中国卫生统计;2004年02期
15 郭华章,殷缨,王文亮,蔡宏伟,王哲,闫庆国,樊荣,高东怀,杨安钢,李青,金伯泉;建立基于公开软件的校园生物信息学平台[J];第四军医大学学报;2004年08期
16 罗万春;易东;;胎儿小脑基因表达多尺度降噪的y~n曲线模型[J];计算机工程与应用;2011年07期
17 罗万春;易东;李辉智;龚利红;;基因芯片数据多尺度分析的y~n曲线模型[J];计算机工程;2011年02期
18 刘智珺;;数据挖掘在生物信息学中的应用[J];软件导刊;2009年07期
19 王亚君;陈甄;;应用数据挖掘技术的土建工程概算平台规划[J];信息技术;2010年04期
20 石金龙;骆志刚;;非负矩阵分解算法及其在生物信息学中的应用研究[J];计算机工程与科学;2010年08期
中国重要会议论文全文数据库 前10条
1 齐静;;生物信息学研究进展及其在医学中的应用前景[A];中华医学会第七次全国检验医学学术会议资料汇编[C];2008年
2 熊江辉;李莹辉;;基因芯片数据分析的新方法与基因调控网络推理[A];全面建设小康社会:中国科技工作者的历史责任——中国科协2003年学术年会论文集(上)[C];2003年
3 马宁;张正国;;基于信息变化量衡量主成份分析在基因芯片聚类中的作用[A];第十届中国科协年会论文集(三)[C];2008年
4 郑永良;李平;陈舒丽;刘德立;;生物信息学在环境微生物研究中的应用[A];湖北省生物工程学会2004年年会学术报告及论文摘要汇编[C];2004年
5 徐存拴;常翠芳;陈晓光;Salman Rahman;;大鼠基因组的肝再生相关基因鉴定及表达谱分析[A];中国细胞生物学学会第九次会员代表大会暨青年学术大会论文摘要集[C];2007年
6 孙啸;谢建明;陆祖宏;;高密度基因芯片设计和信息分析[A];第九次全国生物物理大会学术会议论文摘要集[C];2002年
7 金旻;戚华兵;黄炜;王小凤;陈林;;基因芯片研究结合FGFR3的核心短肽对小鼠前软骨细胞的作用[A];中华医学会第六次全国骨质疏松和骨矿盐疾病学术会议暨中华医学会骨质疏松和骨矿盐疾病分会成立十周年论文汇编[C];2011年
8 刘全海;;基因芯片和新药研制[A];中国药理学会第九届制药工业药理学术会议论文摘要汇编[C];2000年
9 卢学春;杨波;于力;朱宏丽;范辉;姚善谦;楼方定;;靶向上调ID4基因表达药物及其抗白血病作用的生物信息学预测、分析和验证[A];中国科协海峡两岸学术研讨会——2008血液肿瘤论坛会议会编[C];2008年
10 王文勇;黄晓峰;闫庆国;王伯澐;;激光捕获显微切割技术应用研究新进展[A];中华医学会病理学分会2009年学术年会论文汇编[C];2009年
中国博士学位论文全文数据库 前10条
1 李荣;生物信息数据挖掘若干关键问题研究与应用[D];复旦大学;2004年
2 王广云;肿瘤基因芯片表达数据分析相关问题研究[D];国防科学技术大学;2009年
3 胡延佳;口腔粘膜下纤维性变发病相关基因的筛选与初步鉴定[D];中南大学;2009年
4 吴飞珍;基因芯片数据的聚类功能评价算法和判别分析算法研究[D];上海大学;2009年
5 梁思泉;垂体腺瘤中miRNA基因的研究[D];天津医科大学;2006年
6 杜伟;机器学习及数据挖掘在生物信息学中的应用研究[D];吉林大学;2011年
7 胡冉;十三种化合物诱导的小鼠原代培养肝细胞基因表达谱的聚类分析[D];第三军医大学;2005年
8 杨锡南;基于基因芯片表达谱的癌症预后元分析方法研究[D];东南大学;2006年
9 张焕萍;面向基因表达数据的致病基因挖掘方法研究[D];南京航空航天大学;2009年
10 许文龙;基于基因表达数据的肿瘤亚型多类别分类与分析[D];中国科学技术大学;2008年
中国硕士学位论文全文数据库 前10条
1 王勇;聚类方法在生物数据中的研究与应用[D];江南大学;2008年
2 詹超;支持向量机在基因表达数据分类中的研究[D];武汉理工大学;2006年
3 李萍;基于基因表达数据的胃癌特征基因选取研究[D];北京工业大学;2009年
4 黄金;聚类和分类技术在生物信息学中的应用[D];黑龙江大学;2005年
5 郭雅宾;寡核苷酸芯片探针设计的方法设计与在线应用系统构建[D];清华大学;2008年
6 刘月明;基因表达聚类分析方法研究[D];第三军医大学;2001年
7 周鹏;神经网络集成算法研究及在基因表达数据分析中的应用[D];华中科技大学;2004年
8 伍亚舟;基因芯片表达数据的标准化策略研究[D];第三军医大学;2004年
9 张秋水;支持向量机在基因表达数据中的研究[D];厦门大学;2007年
10 孙茜;基因芯片中的聚类研究[D];中南大学;2008年
中国重要报纸全文数据库 前10条
1 田耕;新世纪的新学科 生物信息学[N];大众科技报;2000年
2 本报记者 李恩青;生物信息学:促动BT与IT双赢[N];中国高新技术产业导报;2001年
3 刘义;生物信息学产业浮出水面[N];中国高新技术产业导报;2000年
4 英潮;生物信息学演绎“变脸”[N];中药报;2002年
5 中科院院士 强伯勤;生物信息学蕴有巨大效益[N];光明日报;2002年
6 白毅;加强生物信息学建设推动人类基因组研究[N];中国医药报;2002年
7 周颖;李梢:生物信息学为证候研究提供新视角[N];中国中医药报;2006年
8 中国科学院院士 张春霆 郝柏林;生物信息学孕育大产业[N];经济日报;2000年
9 刘丽丽;高性能计算为生物信息学加速[N];计算机世界;2007年
10 严飞;生物信息学 新世纪的新科学[N];大众科技报;2002年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978