收藏本站
《闽南师范大学》 2016年
加入收藏

三种代价环境下的代价敏感属性择

牛军霞  
【摘要】:代价敏感学习是数据挖掘的研究热点,预算约束满足问题是人工智能和机器学习领域著名的问题之一。最近几年,研究最小测试代价下的属性选择问题一直是代价敏感学习中的重点。但在实际应用中,由于任何一样资源都是有限的,所以解决任何一个实际问题,都是在一定的预算约束下完成的。因此研究预算约束下的代价敏感属性选择问题在众多的应用领域有着重要的意义和广泛的应用。另外,当前代价敏感算法普遍采用静态的静态误分类代价,仅能满足实验和前瞻性的需要,不能适应同一类分布样本数量变化的数据集的分类模型的学习。针对静态误分类代价的不足,如何设计动态的误分类代价机制正受到越来越多学者的青睐。本文针对最小测试代价下的属性选择问题,预算约束下的属性选择问题和动态误分类代价下的属性选择问题进行了研究,主要取得了如下创新成果。首先,研究了最小代价下的代价敏感属性选择问题。这个最小代价只单纯考虑了测试代价这一种代价类型。本文提出了一个对数加权算法来求解最小测试代价下的代价敏感属性选择问题。实验结果表明,在大多数情况下,新算法的效果优于已有的算法。其次,研究了预算约束下的代价敏感属性选择问题。预算约束是指所能花费的最大测试代价大于最小测试代价但不大于总测试代价。这意味着,在预算约束的条件下,只能求解能够最大程度保留系统信息的属性子集。本文在预算约束的条件下,设计了一个模拟退火算法来求解代价敏感属性选择问题。实验结果表明,我们设计的算法能够在效果和效率方面获得良好的实验结果,实验结果优于已有的启发式算法和遗传算法。最后,研究了动态误分类代价机制下的代价敏感属性选择问题,并设计了四个最优误分类代价函数,四个函数可以根据少数类与多数类以及与测试代价之间的关系,形成客观的具有代表性的误分类代价空间,并对不同数据子集可以灵活地选择更合适的误分类代价,这样能更好的逼近数据集真实的误分类代价。
【关键词】:代价敏感学习 预算约束 属性选择 动态误分类代价
【学位授予单位】:闽南师范大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP18;TP311.13
【目录】:
  • 摘要5-6
  • Abstract6-11
  • 第1章 绪论11-17
  • 1.1 课题研究的背景及意义11-12
  • 1.2 国际国内研究现状分析12-15
  • 1.2.1 代价敏感学习研究现状12-13
  • 1.2.2 粗糙集研究现状13
  • 1.2.3 代价敏感粗糙集的研究现状13-14
  • 1.2.4 预算约束满足问题研究现状14-15
  • 1.3 本文研究内容15-16
  • 1.4 本文结构安排16-17
  • 第2章 背景知识17-27
  • 2.1 粗糙集的基本理论17-21
  • 2.2 代价敏感学习21-27
  • 第3章 最小测试代价下的代价敏感属性选择27-37
  • 3.1 最小测试代价属性选择问题27-29
  • 3.1.1 测试代价决策系统27-28
  • 3.1.2 最小测试代价的属性选择28-29
  • 3.2 最小测试代价属性选择的对数加权算法29-32
  • 3.2.1 构造测试代价属性选择的启发式函数29-31
  • 3.2.2 最小测试代价属性选择的对数加权算法31-32
  • 3.3 实验与结果分析32-36
  • 3.3.1 数据集的信息32
  • 3.3.2 算法评价指标32-33
  • 3.3.3 分析算法的效果与效率33-36
  • 3.4 本章小结36-37
  • 第4章 预算约束下的代价敏感属性选择37-59
  • 4.1 预算约束下的代价敏感属性选择问题37-42
  • 4.1.1 属性选择问题下的搜索方法37-38
  • 4.1.2 预算约束满足问题38-40
  • 4.1.3 预算约束下的属性选择问题40-42
  • 4.2 预算约束下的代价敏感属性选择模拟退火算法42-48
  • 4.2.1 预算约束下的模拟退火算法42-46
  • 4.2.2 算法的复杂性和收敛性分析46
  • 4.2.3 运行实例46-48
  • 4.3 实验与结果分析48-56
  • 4.3.1 数据集的信息49
  • 4.3.2 算法的评价指标49-51
  • 4.3.3 模拟退火算法的效果和效率51-56
  • 4.4 本章小结56-59
  • 第5章 动态误分类代价下的代价敏感属性选择59-81
  • 5.1 静态误分类代价59-61
  • 5.1.1 值静态的误分类代价机制60
  • 5.1.2 比例静态的误分类代价机制60-61
  • 5.2 对静态误分类代价的改进策略61-64
  • 5.2.1 误分类代价的动态性61
  • 5.2.2 误分类代价函数的构造61-64
  • 5.3 基于动态误分类代价下的代价敏感属性选择问题64-66
  • 5.4 动态误分类代价下的模拟退火算法66-70
  • 5.4.1 非启发式搜索算法66
  • 5.4.2 启发式的模拟退火搜索算法66-70
  • 5.5 实验分析70-79
  • 5.5.1 数据集的信息70-71
  • 5.5.2 实验的设置71-74
  • 5.5.3 动态误分类代价的效果74-77
  • 5.5.4 比较动态误分类代价和静态误分类代价77-79
  • 5.6 本章小结79-81
  • 第6章 总结与展望81-85
  • 6.1 总结81-82
  • 6.2 未来工作展望82-85
  • 参考文献85-93
  • 致谢93-95
  • 攻读学位期间取得的科研成果95

【相似文献】
中国期刊全文数据库 前10条
1 王淑侠;误分类原因分析[J];图书馆学刊;1994年02期
2 亢华爱,彭新光;一种降低误分类代价的权值分布优化算法[J];太原理工大学学报;2005年04期
3 龙军;殷建平;祝恩;赵文涛;;主动学习中一种基于委员会的误分类采样算法[J];计算机工程与科学;2008年04期
4 邹超;郑恩辉;任玉玲;张英;范玉刚;;嵌入误分类代价和拒识代价的二元分类算法[J];广西师范大学学报(自然科学版);2010年03期
5 安春霖;陆慧娟;郑恩辉;王明怡;陆羿;;嵌入误分类代价和拒识代价的极限学习机基因表达数据分类[J];山东大学学报(工学版);2013年04期
6 周生明;廖元秀;;Cost-Sensitive学习的一个新课题[J];广西师范大学学报(自然科学版);2007年04期
7 卫东;郑恩辉;杨敏;吴向阳;张英;陈乐;;基于支持向量机的误分类代价敏感模糊推理系统[J];控制与决策;2010年02期
8 徐晶;刘旭敏;关永;董睿;;基于条件误分类的决策树剪枝算法[J];计算机工程;2010年23期
9 卢致杰;;基于粒度变换的多范畴复杂信息分类方法[J];计算机与现代化;2014年03期
10 林姿琼;赵红;;代价敏感最优误差边界选择[J];计算机科学与探索;2013年12期
中国重要会议论文全文数据库 前1条
1 李春雨;盛昭瀚;;对学习样本无误分类的改进BP算法[A];1996年中国控制会议论文集[C];1996年
中国博士学位论文全文数据库 前4条
1 唐明珠;类别不平衡和误分类代价不等的数据集分类方法及应用[D];中南大学;2012年
2 陈晓林;基于动态代价敏感的机器学习研究[D];华中科技大学;2010年
3 郑恩辉;基于支持向量机的代价敏感数据挖掘研究与应用[D];浙江大学;2006年
4 付连艳;处理效应评估的统计方法[D];东北师范大学;2011年
中国硕士学位论文全文数据库 前4条
1 刘星星;基于任务的机组失误预测模型研究[D];中国民航大学;2013年
2 牛军霞;三种代价环境下的代价敏感属性择[D];闽南师范大学;2016年
3 孟斌;基于结构化模型的飞行人误分类分析系统开发[D];中国民用航空飞行学院;2015年
4 李海燕;中国民航签派人误分类分析系统的研究[D];中国民用航空飞行学院;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026