收藏本站
收藏 | 论文排版

面向生物数据的关联规则挖掘算法及其应用研究

马猛  
【摘要】: 随着基因组和蛋白质组研究的进展,以及现代生物技术的快速发展,由高通量技术产生了海量生物数据,这为揭开生命奥秘提供了数据基础。生物数据种类丰富,高通量,维数高,具有异构易变的特性,远远超出传统的分析方法的能力,生物数据的分析成为当今生物学研究的瓶颈,对其处理、挖掘、分析和理解的要求日益迫切。 目前生物数据分析中存在着一些问题,例如,数据分析采用的算法模型有越来越复杂的趋势,被用于数据分析的黑盒算法获得的分析结果难以作出生物解释等。而生物信息学研究的根本目的就是利用生物数据,解释生命现象,发掘生命规律。 关联规则是一种重要的数据挖掘技术,利用该技术从生物数据中挖掘获得的模式即具有生物学上的意义(重要性),又具有数学上的重要性(可发现性),且结构透明,具有良好的可解释性。本文主要对面向生物数据的关联规则挖掘算法及其应用进行了研究,其主要研究内容包括: (1)多相关关联规则挖掘算法及其应用研究 生物数据中蕴含着丰富的内涵,仅利用传统的关联规则挖掘,一些有意义的模式会被丢失而无法获得,为此,本文提出了一种新形式的关联规则一多相关关联规则,在给出多相关关联规则形式化定义的基础上,对有用多相关关联规则的挖掘准则进行了研究,并给出了一个挖掘算法,并且利用多相关关联规则对蛋白质结构数据进行了分析,从中得到了很多有用的规则,在其它两个数据集上也进行了实验,得到了一些新颖的知识。 (2)利用定量关联规则分析蛋白质结构数据的研究 1961年Anfinsen提出蛋白质分子的一级序列完全决定其空间结构的论断,对于这个假定,我们需要分析如下几个问题:不同的氨基酸对不同的蛋白质空间结构形成是否具有不同的倾向性?蛋白质的氨基酸序列是否是随机的?序列中是否存在着一些氨基酸共生模式?这些模式是否对不同空间结构的形成具有不同的倾向性?目前开展的大部分研究是基于氨基酸序列预测蛋白质各位点的空间结构,主要是定性研究,利用定量方法分析不同氨基酸对形成不同蛋白质结构的倾向性的研究却较少,本文提出利用定量关联规则分析蛋白质的氨基酸构成和蛋白质结构形成间的关联关系,获得了很多有用的规则,这些规则对人工合成蛋白质分子具有参考价值。 (3)聚类和关联规则挖掘在基因表达数据分析中的应用研究 由于基因表达数据具有高维低样本的特点,直接对基因表达数据进行关联规则挖掘,实际上是不可行的。为此,本文将聚类和关联规则挖掘相结合,首先对基因表达数据进行聚类分析,得到若干基因簇,实现了分析数据的降维,然后对每个基因簇中的表达数据进行离散化,将每个基因离散化为7个项目,然后进行关联规则挖掘,得到了大量的关联规则,得到的这些关联规则不仅提供了基因之间的调控方向,而且还提供了基因之间调控强度的信息。 (4)从肿瘤基因表达数据挖掘分类规则的研究 基于关联规则的分类研究是关联规则挖掘研究的一个热点,目前这方面也已经开展了大量的研究工作。由于肿瘤基因表达数据中的样本具有高维低样本的特点,所以很难直接应用传统的关联规则挖掘算法构建分类器,因此本文提出了一种直接从肿瘤基因表达数据挖掘分类规则的方法,这种方法首先从数据中抽取分类特征,然后基于分类特征产生分类规则,基于这些分类规则按照置信度最高的原则进行样本类别预测,实验表明,该方法不仅具有良好的预测精度,并且相对于黑盒算法来说,具有良好的可解释性。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 赵志坤;李义杰;;基于粗糙集的分类规则挖掘的研究[J];矿业研究与开发;2006年02期
2 陈俊清;朱文兴;;基于人工鱼群算法的分类规则发现[J];福州大学学报(自然科学版);2007年01期
3 李鹏;王自强;邝艳敏;;基于改进蚁群算法的分类规则挖掘[J];农业网络信息;2007年10期
4 黄宏本;李余琪;覃伟良;;一种基于遗传算法的分类规则挖掘算法[J];广西科学院学报;2010年02期
5 王俊艳;;浅析分类方法的发展[J];电脑知识与技术;2008年15期
6 王玉珍;;基于贝叶斯理论的分类模式挖掘方法研究[J];微计算机应用;2007年06期
7 闵华清;卢炎生;蒋晓宇;;基于共同进化计算的分类规则算法[J];华南理工大学学报(自然科学版);2006年06期
8 孙友友;郭晓燕;;决策树与聚类算法在数据挖掘中的研究及应用[J];科技创新导报;2007年34期
9 万红新,聂承启,尹红;数据挖掘中的模糊聚类实现技术[J];计算机与现代化;2003年11期
10 陆静;赵阳;;决策树技术在监狱数据挖掘中的应用[J];福建电脑;2006年12期
11 王善侠;王振华;王吉永;;基于决策树和聚类理论的XML文档数据挖掘的研究[J];科技信息(科学教研);2007年34期
12 钱宇;;数据聚类中基于浓度噪音消除的可视化参数选择方法(英文)[J];软件学报;2008年08期
13 蔡江辉,张继福;基于聚类的离群数据挖掘及应用[J];太原重型机械学院学报;2004年04期
14 王红霞;人才市场多媒体信息服务系统中的聚类模型解析方法[J];武汉理工大学学报(信息与管理工程版);2005年02期
15 彭玉楼,刘亚辉;利用决策树和聚类理论对XML文档数据挖掘的研究[J];株洲工学院学报;2005年04期
16 许亚梅;;粗糙集理论及其在数据挖掘中的应用[J];现代计算机;2006年03期
17 王刚;黄丽华;张成洪;夏洁;;数据挖掘分类算法研究综述[J];科技导报;2006年12期
18 徐春鸽;章登科;葛红;;人工免疫系统在数据挖掘中的应用[J];计算机技术与发展;2007年04期
19 史望聪;耿健;;数据挖掘中的一种数据预处理方法[J];科技资讯;2009年17期
20 武森;俞晓莉;倪宇;王瑞峰;;数据挖掘中的聚类技术在学生成绩分析中的应用[J];中国管理信息化;2009年15期
中国重要会议论文全文数据库 前10条
1 武森;金海燕;高学东;;数据挖掘中CABOSFV聚类算法的实现与应用[A];全国第八届工业工程与企业信息化学术会议论文集[C];2004年
2 朱强生;田英;周延泉;何华灿;;银行业中的客户数据挖掘[A];2006通信理论与技术新进展——第十一届全国青年通信学术会议论文集[C];2006年
3 刘建华;;一个智能搜索引擎的用户行为聚类分析[A];第一届全国Web信息系统及其应用会议(WISA2004)论文集[C];2004年
4 李天瑞;徐扬;;基于粗糙集的一种挖掘分类规则算法[A];2001年中国管理科学学术会议论文集[C];2001年
5 薛晓东;李海玲;;数据挖掘的客户关系管理应用[A];科技、工程与经济社会协调发展——河南省第四届青年学术年会论文集(下册)[C];2004年
6 于波;王宏鼎;唐世渭;童云海;;基于数据挖掘的数据质量分析研究[A];全国第16届计算机科学与技术应用(CACIS)学术会议论文集[C];2004年
7 肖诗松;张玉刚;周张兰;陈涛;;一种基于量子粒子群优化的分类规则提取算法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
8 温国锋;李宏艳;王广成;王永生;王成华;马立强;王敏;张巍巍;宁丰荣;岱云;;数据仓库与粗集数据挖掘在建筑管理决策中的应用研究[A];决策与管理研究(2007-2008)——山东省软科学计划优秀成果汇编(第七册·上)[C];2009年
9 郭学军;陈晓云;;粗集方法在数据挖掘中的应用[A];第十六届全国数据库学术会议论文集[C];1999年
10 陈楚湘;沈建京;陈冰;尚长兴;王运成;;运用粗糙集理论建立中老年肺炎中医症候诊断标准[A];第二十九届中国控制会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 马猛;面向生物数据的关联规则挖掘算法及其应用研究[D];中国科学技术大学;2008年
2 王明春;基于粗糙集的数据及文本挖掘方法研究[D];天津大学;2005年
3 孙丽;工艺知识管理及其若干关键技术研究[D];大连交通大学;2005年
4 胡志坤;复杂有色金属熔炼过程操作模式智能优化方法研究[D];中南大学;2005年
5 刘革平;基于数据挖掘的远程学习评价研究[D];西南师范大学;2005年
6 刘寨华;基于临床数据分析的病毒性心肌炎证候演变规律研究[D];黑龙江中医药大学;2006年
7 王川;基因芯片数据管理及数据挖掘[D];中国科学院研究生院(上海生命科学研究院);2004年
8 王涛;挖掘序列模式和结构化模式的精简集[D];华中科技大学;2006年
9 贺琳;基于数据挖掘的道路运行安全风险分析[D];大连海事大学;2012年
10 郭斯羽;动态数据中的数据挖掘研究[D];浙江大学;2002年
中国硕士学位论文全文数据库 前10条
1 黄金;聚类和分类技术在生物信息学中的应用[D];黑龙江大学;2005年
2 王维顺;蚁群算法在数据挖掘中的应用研究[D];山东大学;2006年
3 刘晓燕;基于聚类的入侵检测系统研究[D];青岛大学;2006年
4 赵亮;基于概念格的分类系统的研究与实现[D];吉林大学;2005年
5 何国建;基于粗糙集理论与遗传算法的分类算法研究[D];西南交通大学;2005年
6 丁悦;数据挖掘中判定树算法的研究与优化[D];上海师范大学;2008年
7 郑洪英;数据挖掘聚类算法的分析和应用研究[D];重庆大学;2002年
8 易珺;基于数据挖掘的酒店CRM客户获取的研究[D];广东工业大学;2005年
9 鲍洪庆;一种基于密度的动态参数单元聚类算法[D];山东大学;2005年
10 李晓利;基于核函数的聚类分析研究[D];大连理工大学;2006年
中国重要报纸全文数据库 前10条
1 创智集团副总裁 胡乐群博士;数据挖掘在CRM中的应用[N];中国计算机报;2002年
2 李开宇 黄建军 田长春;把“数据挖掘”作用发挥出来[N];中国国防报;2009年
3 华莱士;“数据挖掘”让银行赢利更多[N];国际金融报;2003年
4 记者 晏燕;数据挖掘让决策者告别“拍脑袋”[N];科技日报;2006年
5 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
6 张立明;数据挖掘之道[N];网络世界;2003年
7 中圣信息技术有限公司 李辉;数据挖掘在CRM中的作用[N];中国计算机报;2001年
8 田红生;数据挖掘在CRM中的应用[N];中国经济时报;2002年
9 王广宇;数据挖掘 加速银行CRM一体化[N];中国计算机报;2004年
10 王玮 蔡莲红;数据挖掘走入语音处理[N];计算机世界;2001年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978