收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于遗传算法的分类方法的探究

刘金星  
【摘要】: 破译世界上最巨量信息的“天书”——“人类DNA序列”是二十一世纪最重要的任务之一,对人类DNA序列进行分类又是这一任务中的重要组成部分。本文选择对人类DNA序列进行分类作为研究的内容,主要解决了以下三个问题: ①将遗传算法应用于分类系统中,构造出新的分类方法; ②对遗传算法进行改进,并将其应用于分类系统中,使分类系统的性能有了很大的改善; ③用实现的分类系统对DNA序列进行分类。 在分类方法中,分类的准确率是至关重要的。为了提高分类的准确率,本文从以下方面进行了深入的研究:首先利用遗传算法的优点,将遗传算法应用于分类系统中,得到了基于基本遗传算法的分类方法,提高了分类的准确率,使该分类方法具有很强的适应性和可扩充性。然后提出了对基本遗传算法的改进方案——优化遗传算法,并将其用于分类系统,得到了基于优化遗传算法的分类方法,进一步提高了分类的准确率。最后将两种分类方法用于“DNA序列的分类”。 下面是基于基本遗传算法的分类算法的基本思想: (1)编码方法,编码采用二进制编码,从位串空间转换到编码空间。 (2)分类器,是由一组特定形式的知识构成的。为了便于遗传算法操作,规则的条件部分按字符集{0,1,#)编码。 (3)遗传算子设计:遗传算子首先采用传统的算子,然后针对传统算子进行改进。 ①选择算子,采用按适应度比例的轮盘赌选择法,其中每个个体被选择的期望数量与其适应值和群体平均适应值的比例有关。首先计算每个个体的适应值,然后计算出此适应值在群体适应值总和中所占的比例,作为该个体在选择过程中被选中的概率。轮盘赌选择的具体实施过程为,将个体选择概率按由高到低排序,然后计算他们的累积 概率,并产生一个*,1]之间的随机数,当累积概率大于随机数时,就得 到了被选择的个体。②交叉算于,通常采用的方法包括一点交叉。两 点交叉、多点交叉、一致交叉等。③变异算于,通常在捌¥算法中, 按变异概率尸n;随机翻转某位等位基因的二进制字符值来实现变异算 子。 (4)群体设定,根据模式定理,群体规模对遗传算法的性能影l们 很大。若群体规模为n,则迷传算于可以从这n个个体中’*J8和检测 O扯)个模式。群体规模越大,群体中个体的多样性越高,算法陷入局 部解的危险就越小:但随着群体规模的增大,计算量也显著增加:若 群体规极太小,攸遗传算法的搜索空问受到限制,则川能)。‘l:木成热 收敛的现象。 (5)遗传算法迭代过程终_止方法一般有: ①设定最大代数;②根据群体的收敛程度来判断;③根抓算法的 立即性能和再现性能的变化进行判定;④在采用粘英保留选择策略的 情况下,按每代最佳个体的适应值的变化情况确定。 “)遗传算法执行的流程是:①初始化(包括遗传参数、分类器。 环境、信任分配参数、循环次数):②对生成的初始群体进行检测生成 初始的消息;③检查消息是否匹配分类器。若匹配,将其放入桶队列 中:④执行信仕分配算法;⑤对分类器执行遗传操作(选择、交叉。 变异);③判断是否符合结束条件。若是,结束:否则,转到第③步继 续执行。 为了进一步提高分类的准确率,本文提出的基于优化遗传算法的 分类方法,其卞耍策略如下: 首先让父个体进行交叉、变异操作,得到下一代个休(即子个休); 然后将于个体的适应值与其父个体的适应似进行比较,如人厂个休的 适应值大于父个体的适应值,则用子个体替代父个体作为下一代群休 中的个体;否则,保留父个体到下一代群体中,作为群体I。I。的个体。 对于选择算子,首先对群体中的各个个体按适应度进行排序(降 序),然后再进行选择。 7 对于变异算于,如果对染色体位串的等位基因按变异概审进行反 转,山于变异概率较小,变异操作很少发生,使得计算机的时问大量 浪费在这上面,遗传算法的效率很低。因此可以对个体进行判断是否 发生变异,若变异,则对该个体随机选择等位基因进行变异操作,这 样可以大大提高算法的效率。 最后本文将基于遗传算法的分类系统用于**A序列的分类中,什 对其分类效果进行分析。 基于基本遗传算法的分类算法应用于DNA序列的分类l-[I分类徘确 率为97.80%。而采用优化遗传算法的分类系统对**A序列进行分类, 分类准确率为:99.45%。另外,对改进后的算法的动态分析发现,其 动态性能非常好,随遗传代数的增加,分类准帆率会进一步提高,井 巨会接近于 100%。而基于基本遗传算法的分类系统,随分类次数的增 加,分类准确率一般会稳定在95%左右,出现局部收敛现象。 通过实验可以看出,本文提出的优化遗传算法能够在一定程度上 提高分类器的分类准确率,有一定的实用价值。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王坚强;;基于离差优化的信息不完全确定的多准则分类方法[J];控制与决策;2006年05期
2 丁蕊;董红斌;冯宪彬;;用于分类问题的粒子群优化遗传算法[J];计算机工程;2009年17期
3 徐庆伶;汪西莉;;一种基于支持向量机的半监督分类方法[J];计算机技术与发展;2010年10期
4 夏莹;;基于遗传自适应RBFN的歼击机故障分类方法[J];科学技术与工程;2009年10期
5 王一;杨俊安;刘辉;;一种基于遗传算法的SVM决策树多分类方法[J];信号处理;2010年10期
6 喻莹;杨扬;董才林;何秀玲;陈增照;;基于多分类器集成的手写体金融汉字识别[J];计算机工程与应用;2007年15期
7 吴谋硕;;基于遗传算法的文本分类技术[J];电脑知识与技术;2011年22期
8 胡选子;谢存禧;;一种条件概率与遗传算法相结合的分类方法[J];微电子学与计算机;2006年10期
9 刘海卫;倪恩志;周昌乐;;基于遗传算法的分类规则序列生成[J];厦门大学学报(自然科学版);2008年02期
10 王昕昕;;基于遗传算法的分类方法讨论[J];电脑知识与技术;2009年33期
11 陶晓玲;胡婷;;一种基于BP网络的流量分类方法[J];桂林理工大学学报;2010年03期
12 戴喜华;姚维;;改进的遗传算法在分类规则挖掘中的应用[J];微计算机信息;2010年33期
13 连可;黄建国;王厚军;龙兵;;一种基于遗传算法的SVM决策树多分类策略研究[J];电子学报;2008年08期
14 郭维维;韩萌;;基于最小描述长度和遗传算法的属性选择方法[J];大连民族学院学报;2009年01期
15 赵凤霞;谢福鼎;稽敏;;基于复杂网络理论和遗传算法的分类方法[J];计算机应用与软件;2010年02期
16 衣治安;姜丽丽;杜娟;;基于遗传算法的二叉树支持向量机分类方法[J];长春理工大学学报(自然科学版);2010年01期
17 武永成;蔡之华;;一种基于遗传算法的用于排序(Ranking)的分类方法[J];计算机与现代化;2006年10期
18 刘维来,干方建,张平,刘永斌,孔凡让;基于遗传算法的机器人装配顺序规划的研究[J];系统仿真学报;2005年09期
19 万狄飞;樊兴华;王国胤;;基于朴素贝叶斯和遗传算法的两类文本分类方法[J];计算机科学;2008年04期
20 吴降龙;周一民;;一种新型文本分类方法的研究[J];微型电脑应用;2008年08期
中国重要会议论文全文数据库 前10条
1 陈岑;王贵成;逄玉俊;;一种基于遗传算法的故障聚类新方法[A];2009全国虚拟仪器大会论文集(二)[C];2009年
2 胡选子;谢存禧;;一种条件概率与遗传算法相结合的分类方法[A];2006年全国开放式分布与并行计算学术会议论文集(二)[C];2006年
3 周海清;王恭先;陈正汉;;基于面向对象遗传算法的抗滑桩优化设计程序的研制[A];中国土木工程学会第九届土力学及岩土工程学术会议论文集(下册)[C];2003年
4 吴建生;金龙;;基于实数编码的遗传算法神经网络预报建模研究[A];推进气象科技创新加快气象事业发展——中国气象学会2004年年会论文集(下册)[C];2004年
5 申元霞;张翠芳;;GA-BP算法在系统辨识中的应用[A];中国自动化学会、中国仪器仪表学会2004年西南三省一市自动化与仪器仪表学术年会论文集[C];2004年
6 刘辙;彭亮;崔广才;吴学礼;;混合遗传算法在车间调度中的应用[A];中国自动化学会全国第九届自动化新技术学术交流会论文集[C];2004年
7 曹春红;李文辉;张永坚;;遗传蚂蚁算法在几何约束求解中的应用[A];中国仪器仪表学会第六届青年学术会议论文集[C];2004年
8 姜楠;张春森;;遗传算法在图像模板匹配中的应用[A];高精度几何量光电测量与校准技术研讨会论文集[C];2008年
9 朱秀娥;周宝焜;;振动筛设计的遗传算法[A];福建省科协第三届学术年会装备制造业专题学术年会论文集[C];2003年
10 何奉道;梁向阳;;基于遗传算法的机车周转图优化编制方法[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
中国博士学位论文全文数据库 前10条
1 张旭;具有拓扑结构布局优化的理论及算法[D];大连理工大学;2004年
2 廖平;基于遗传算法的形状误差计算研究[D];中南大学;2002年
3 周明;高新技术产业投资环境系统研究[D];西北工业大学;2006年
4 张需溥;小型化微带天线的设计与数值分析[D];上海大学;2004年
5 杨春成;空间数据挖掘中聚类分析算法的研究[D];解放军信息工程大学;2004年
6 方娟;基于移动代理的网格资源监控技术的研究[D];北京工业大学;2005年
7 崔晓芳;箱型结构焊接变形预测、控制及应用[D];大连交通大学;2005年
8 张材;薄带坯铸轧板形智能识别与控制系统研究[D];中南大学;2004年
9 田方;遗传算法的改进研究及其在压缩机性能分析与优化中的应用[D];东北大学;2006年
10 谷峰;柔性作业车间调度中的优化算法研究[D];中国科学技术大学;2006年
中国硕士学位论文全文数据库 前10条
1 朱奉梅;遗传算法在高校排课系统中的研究与应用[D];东北大学;2009年
2 孙晓丽;基于遗传算法的既有线平面及纵断面整正优化设计[D];中南大学;2010年
3 冯秋霞;解最小生成树问题的新的遗传算法[D];西安电子科技大学;2010年
4 郭佳;基于遗传算法的认知无线网络资源分配技术研究[D];西安电子科技大学;2010年
5 宋品;基于改进遗传算法的波束形成技术研究及其应用[D];西安电子科技大学;2010年
6 梁云静;基于遗传算法的主题爬虫搜索策略研究[D];湖北工业大学;2010年
7 高建兵;基于遗传算法的模糊推理控制系统的参数优化研究[D];辽宁工程技术大学;2011年
8 李振业;多向变异遗传算法及其优化神经网络的研究[D];华南理工大学;2011年
9 栾丽霞;遗传算法在潍坊商校排课系统的研究与应用[D];电子科技大学;2011年
10 王辉;基于改进遗传算法的物流配送路径优化研究[D];山东科技大学;2010年
中国重要报纸全文数据库 前10条
1 记者 陶艺音;因势利导 拓展空间[N];上海科技报;2006年
2 王跃庆;骨性关节炎需个体化治疗[N];家庭医生报;2006年
3 记者 汤璇 通讯员 廖启光 蒋明 王鹏翔;垃圾分类将有部颁标准[N];广东建设报;2004年
4 ;初步创伤评估 伤者分类方法[N];中国质量报;2001年
5 叶 建;轿车的分类方法令人困惑[N];中国汽车报;2003年
6 ;中药分类方法[N];云南科技报;2002年
7 王停;荆鲁;高学敏;中成药分类方法中存在的问题[N];中国医药报;2004年
8 林京;《神经网络和遗传算法在水科学领域的应用》将面市[N];中国水利报;2002年
9 王建平;软件产业统计和分类方法的断想[N];中国计算机报;2004年
10 新辑;中药分类逐个数[N];医药经济报;2003年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978