收藏本站
《中国海洋大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于专家委员会的主动学习算法研究

梁延峰  
【摘要】:随着机器学习理论在指纹识别、图像检索、信用分析、网页推荐等数据分析和数据挖掘领域中的广泛应用,主动学习已经成为模式识别和机器学习中的重要研究领域,并且在理论和实际应用研究中都已获得了长足的发展。 主动学习研究主要关注在标记样本较少时,如何利用大量未标记样本来改善学习器性能,它改变了传统的机器学习方式从已知样本集中进行被动学习的方法,而是根据学习进程,主动选择最佳的样本进行学习,解决了传统学习方法对少量标记样本进行学习泛化能力较差的问题。基于支持向量机的主动学习算法和基于专家委员会的主动学习算法是两种研究较多的主动学习算法,但目前仍然存在学习效率不是很高,训练样本标注代价过大,对不平衡数据学习能力较差等问题。 本文首先介绍了主动学习模型及其研究的内容,总结了主动学习与其他机器学习方法的区别与联系,对主动学习领域的国内外研究现状进行回顾,介绍了目前主动学习方法研究的几个思路。接着,本文详细介绍了我们在主动学习方法研究领域开展的工作: 1.讨论了基于不确定度缩减的主动学习方法,深入研究了该类方法中基于支持向量机的主动学习算法。针对SVM主动学习过程中,对不平衡数据集学习能力较差的问题,本文提出了一种基于SMOTE的支持向量机主动学习算法。该算法将处理小样本数据的SMOTE算法引入SVM主动学习过程中,解决了SVM主动学习在学习过程中,分类超平面偏向少数类的问题,提高了学习的速度和准确率。 2.深入研究了基于版本空间缩减的主动学习方法中最具有代表性的主动学习算法——基于专家委员会的主动学习算法。总结了该算法中委员会成员分歧度的度量方式。深入研究了基于专家委员会的主动学习算法中的委员会成员的构建方法和样本选择策略,并提出了一种改进的基于选择的专家委员会主动学习算法,算法的改进主要体现在三个方面:(1)将选择集成的思想引入到委员会成员的构建过程中,将生成的专家委员会中分类性能高,相互之间差异较大的委员会成员挑选出来重新构造一个新的专家委员会,利用新组建的专家委员会对无标注样本进行选择提交标注。(2)在选择集成的过程中,本算法并没有采用基于遗传算法的选择性集成方法,而是改用了另一种智能优化算法--粒子群优化算法,在委员会成员的权重优化过程中,粒子群算法比遗传算法精度更高、收敛速度更快,且在算法实现及操作方面更加容易。(3)在委员会对样本分歧度计算方面,我们采用了投票熵和KL-d分歧度相结合的方式,使委员会选择的未标注样本更加丰富多样。 3.深入研究了Decorate算法,对Active-Decorate主动学习算法中,人工虚拟样本的产生方法进行改进,改进后的算法,不仅仅使用带类别标注的训练样本数据计算均值和方差,而是使用带类别标注的和未带标注的样本集共同计算样本的均值和方差。这样产生的高斯分布函数才会更加接近真实的样本概率分布。并将改进后的Active-Decorate主动学习算法与选择集成学习方法相结合,组成基于选择性的Active-Decorate主动学习算法。
【学位授予单位】:中国海洋大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP181

知网文化
【引证文献】
中国硕士学位论文全文数据库 前1条
1 潘兴江;Hadoop平台下基于SVM主动学习的分类算法研究[D];华南理工大学;2011年
【参考文献】
中国期刊全文数据库 前10条
1 沈艳,郭兵,古天祥;粒子群优化算法及其与遗传算法的比较[J];电子科技大学学报;2005年05期
2 杨维,李歧强;粒子群优化算法综述[J];中国工程科学;2004年05期
3 田春娜;高新波;李洁;;基于嵌入式Bootstrap的主动学习示例选择方法[J];计算机研究与发展;2006年10期
4 龙军;殷建平;祝恩;蔡志平;;选取最大可能预测错误样例的主动学习算法[J];计算机研究与发展;2008年03期
5 龙军;殷建平;祝恩;赵文涛;;主动学习研究综述[J];计算机研究与发展;2008年S1期
6 韩光;赵春霞;胡雪蕾;;一种新的SVM主动学习算法及其在障碍物检测中的应用[J];计算机研究与发展;2009年11期
7 赵悦;穆志纯;;基于QBC的主动学习研究及其应用[J];计算机工程;2006年24期
8 龙军;殷建平;祝恩;赵文涛;;主动学习中一种基于委员会的误分类采样算法[J];计算机工程与科学;2008年04期
9 张健沛,徐华;支持向量机(SVM)主动学习方法研究与应用[J];计算机应用;2004年01期
10 王和勇;樊泓坤;姚正安;李成安;;不平衡数据集的分类方法研究[J];计算机应用研究;2008年05期
中国硕士学位论文全文数据库 前3条
1 刘晓坤;基于遗传算法的混合学习和集成学习研究[D];天津大学;2003年
2 易星;半监督学习若干问题的研究[D];清华大学;2004年
3 黄双福;基于支持向量机与主动学习的入侵检测[D];中国科学技术大学;2009年
【共引文献】
中国期刊全文数据库 前10条
1 王成华;高文梅;李成;;粒子群优化算法搜索土坡临界非圆弧滑动面[J];四川建筑科学研究;2007年05期
2 刘延明;陆克芬;方崇;;基于投影寻踪和粒子群优化算法的南宁市内河水质综合评价研究[J];安徽农业科学;2009年26期
3 赵英国;;应用粒子群优化算法设计多层微波吸收材料[J];安庆师范学院学报(自然科学版);2011年04期
4 梅胜全;梅小平;;应用免疫粒子群算法进行边坡稳定性分析[J];地下空间与工程学报;2009年06期
5 肖涛;黄冬梅;张宁;;粒子群算法求解基于广义Choquet-积分的多元非线性回归模型[J];保定学院学报;2008年04期
6 刘伟华;隋青美;;基于粒子群算法的FBG峰值波长检测技术[J];半导体光电;2007年06期
7 熊宇虹;温志渝;;基于粒子群算法的分段波长选择方法[J];半导体光电;2008年06期
8 黄祎;孙德宝;秦元庆;;基于粒子群算法的移动机器人路径规划[J];兵工自动化;2006年04期
9 张凯;赵国荣;姜静;;粒子群算法在武器装备保障资源优化中的应用[J];兵工自动化;2010年01期
10 金志勇,张奇志;独轮机器人的非完整运动规划研究[J];北京机械工业学院学报;2005年03期
中国重要会议论文全文数据库 前10条
1 范业坤;梁新荣;;基于粒子群优化的高速公路匝道PI控制器[A];第二十七届中国控制会议论文集[C];2008年
2 沈如松;杨雪榕;;基于粒子群算法的小推力同步轨道入轨优化[A];中国自动化学会控制理论专业委员会C卷[C];2011年
3 彭先涛;张凯举;;加热炉炉温优化与控制方法的研究现状及发展趋势[A];全国冶金自动化信息网2012年年会论文集[C];2012年
4 陈鑫;车万翔;刘挺;;基于主动学习的中文依存句法分析[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
5 居胜峰;王中卿;李寿山;周国栋;;情感分类中不同主动学习策略比较研究[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
6 白瑞林;王利峰;;一种基于共享法的改进型粒子群优化算法[A];2005中国控制与决策学术年会论文集(上)[C];2005年
7 高尚;杨静宇;;求解流水作业调度问题的混合粒子群优化算法[A];2006中国控制与决策学术年会论文集[C];2006年
8 张伟;李守智;高峰;刘振山;;几种智能最优化算法的比较研究[A];第二十四届中国控制会议论文集(下册)[C];2005年
9 周先东;马翠;;基于粒子群优化算法的复杂曲面最短路径求解[A];第九届中国青年信息与管理学者大会论文集[C];2007年
10 周先东;马翠;;最速降线问题的一种新解法[A];第一届中国智能计算大会论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 于化龙;基于DNA微阵列数据的癌症分类技术研究[D];哈尔滨工程大学;2010年
2 戴运桃;粒子群优化算法研究及其在船舶运动参数辨识中的应用[D];哈尔滨工程大学;2010年
3 谭佳琳;粒子群优化算法研究及其在海底地形辅助导航中的应用[D];哈尔滨工程大学;2010年
4 朱怡;潜艇航行训练模拟器模型简化与参数优化研究[D];哈尔滨工程大学;2009年
5 刘振宇;基于RFID与TD-SCDMA的家电生产过程信息追溯技术研究[D];中国海洋大学;2009年
6 刘卫红;垃圾邮件检测与过滤关键技术研究[D];华南理工大学;2010年
7 晁冰;基于支持向量机的软件可靠性模型分类及失效分析[D];武汉大学;2010年
8 单玉红;基于土地生态位和多主体的城市居住空间演化情景模型研究[D];武汉大学;2009年
9 杨雪榕;卫星跟飞编队控制问题研究[D];国防科学技术大学;2010年
10 蔡鹏;排序学习中的领域自适应研究[D];华东师范大学;2011年
中国硕士学位论文全文数据库 前10条
1 邵晓路;蚁群群体智能网络可视化试验平台研制[D];浙江理工大学;2010年
2 张娓娓;焦炭生产过程质量模型建模方法研究[D];郑州大学;2010年
3 平金玉;基于组合核与主动学习的蛋白质交互关系抽取[D];大连理工大学;2010年
4 闫兆法;基于多模态粒子群优化的社会网络分析研究[D];大连理工大学;2010年
5 张庆久;近邻法与多视角学习的理论与算法研究[D];华东师范大学;2011年
6 燕居伟;工程建设项目控制目标优化研究[D];河北工程大学;2010年
7 冯金超;基于RBF神经网络控制器设计与研究[D];哈尔滨理工大学;2010年
8 姜晓伟;粒子群算法在查询优化中的应用[D];哈尔滨理工大学;2010年
9 唐燕影;基于灰色理论的电力负荷预测模型研究及系统实现[D];南昌大学;2010年
10 任鹏;基于MATLAB板式换热器的粒子群算法的优化设计[D];华东理工大学;2010年
【同被引文献】
中国期刊全文数据库 前6条
1 宫秀军,孙建平,史忠植;主动贝叶斯网络分类器[J];计算机研究与发展;2002年05期
2 龙军;殷建平;祝恩;蔡志平;;选取最大可能预测错误样例的主动学习算法[J];计算机研究与发展;2008年03期
3 龙军;殷建平;祝恩;赵文涛;;主动学习研究综述[J];计算机研究与发展;2008年S1期
4 黄国宏,熊志化,邵惠鹤;一种新的基于构造型神经网络分类算法[J];计算机学报;2005年09期
5 徐海龙;王晓丹;廖勇;权文;;一种基于主动学习的SVM增量训练算法[J];控制与决策;2010年02期
6 刘宏伟;黄静;;基于朴素贝叶斯算法的垃圾邮件网关[J];微计算机信息;2006年18期
中国硕士学位论文全文数据库 前1条
1 周艳丽;基于主动学习SVM的智能车辆障碍物检测[D];南京理工大学;2008年
【二级引证文献】
中国期刊全文数据库 前1条
1 杨鹤标;黄文青;陈锦富;;基于MapReduce的SVM改进算法及在邮件过滤中的实现[J];无线通信技术;2013年02期
【二级参考文献】
中国期刊全文数据库 前10条
1 李茂军,童调生;单亲遗传算法编码方式的研究[J];长沙电力学院学报(自然科学版);2000年03期
2 王涛,李歧强;基于空间收缩的并行演化算法[J];中国工程科学;2003年03期
3 肖鹏,李茂军,张军平,叶涛;单亲遗传算法及其在物流配送系统中的应用[J];系统工程;2000年01期
4 李茂军,童调生,罗隆福;单亲遗传算法及其应用研究[J];湖南大学学报(自然科学版);1998年06期
5 何仁芳,王乘,杨文兵;基于混沌遗传算法的图像匹配[J];红外与激光工程;2003年01期
6 宫秀军,孙建平,史忠植;主动贝叶斯网络分类器[J];计算机研究与发展;2002年05期
7 武勃,黄畅,艾海舟,劳世竑;基于连续Adaboost算法的多视角人脸检测[J];计算机研究与发展;2005年09期
8 田春娜;高新波;李洁;;基于嵌入式Bootstrap的主动学习示例选择方法[J];计算机研究与发展;2006年10期
9 龙军;殷建平;祝恩;赵文涛;;主动学习研究综述[J];计算机研究与发展;2008年S1期
10 徐海,刘石,马勇,蓝鸿翔;基于改进粒子群游优化的模糊逻辑系统自学习算法[J];计算机工程与应用;2000年07期
【相似文献】
中国期刊全文数据库 前10条
1 杨冬梅,李杨刚,高炳学;分形艺术与算法构造的效果研究[J];计算机应用与软件;2004年11期
2 景小宁,李全通,南建国;B样条神经网络的算法设计及应用[J];计算机应用与软件;2005年07期
3 周丹;沈利迪;;C4.5决策树构造算法应用研究[J];中国高新技术企业;2008年04期
4 ;普里姆算法和迪克斯特拉算法的比较[J];计算机教育;2008年21期
5 甘宝宝;蒋红亮;孙晓寅;徐荣青;;一种改进的启发式P圈构造算法[J];计算机应用研究;2009年09期
6 褚亚飞;陈德城;宋一波;;LR(0)分析器的设计分析[J];现代商贸工业;2010年03期
7 李军,边学工,李德仁;构件式遥感图像处理系统原型研究[J];计算机工程与应用;1999年06期
8 唐若愚,黄启俊,何民才,于国萍;自适应内调制光纤比色测温仪的算法构造和软件实现[J];测控技术;2005年01期
9 刘文彬;李陶深;;一种最小代价组播树的快速算法[J];计算机应用与软件;2006年02期
10 许亮;夏银水;;低功耗XOR门的快速分解技术[J];宁波大学学报(理工版);2008年04期
中国重要会议论文全文数据库 前10条
1 徐蔚然;张洪刚;郭军;;基于语法、语义信息的银行票据二值化算法的构造[A];2001年中国智能自动化会议论文集(下册)[C];2001年
2 曹明;;基于遗传蚁群算法的S盒的构造[A];第一届中国高校通信类院系学术研讨会论文集[C];2007年
3 黄鸿;陈杰;崔立辉;张佳;;再励学习在Robocup中的应用[A];马斯特杯2003年中国机器人大赛及研讨会论文集[C];2003年
4 鲍志军;王先来;;基于正交序贯遗传算法的RBF神经网络[A];第二十二届中国控制会议论文集(下)[C];2003年
5 任婷婷;罗军;冯芒;张云龙;詹明生;;在核磁共振体系上实验实现Hitting-set问题的DNA分子算法[A];第十五届全国原子与分子物理学术会议论文摘要集[C];2009年
6 郝增荣;刘海军;柳征;姜文利;;一种基于神经网络增量学习的辐射源识别算法[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
7 李成邦;胡珂流;许春香;;一种构造前向安全公钥加密算法的一般方法[A];第十一届保密通信与信息安全现状研讨会论文集[C];2009年
8 王凌;郑大钟;;前向网络的两种混合训练策略[A];1997年中国控制会议论文集[C];1997年
9 张瑞民;袁震东;;基于小波变换和支持向量机的心电图分类[A];2004中国控制与决策学术年会论文集[C];2004年
10 秦颖;王小捷;;组合中文词义消歧[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 贾珂婷;CBC-MAC和Hash函数相关算法的安全性分析[D];山东大学;2010年
2 王旭东;基于图论的智能电网最优孤岛划分模型和算法[D];天津大学;2011年
3 陈霖;分层MIMO系统接收技术研究[D];西安电子科技大学;2009年
4 冯勇;无线传感器网络数据收集与生存算法研究[D];电子科技大学;2011年
5 张圆圆;指纹识别技术相关算法的研究[D];北京邮电大学;2012年
6 王体龙;光电侦察中目标快速识别算法研究[D];中国科学院研究生院(长春光学精密机械与物理研究所);2011年
7 赵楠楠;无线传感器网络拓扑控制算法研究[D];北京邮电大学;2011年
8 梁俊斌;无线传感网中低能耗数据收集协议研究[D];中南大学;2010年
9 刘德华;大边际分类模型中的快速算法与理论分析[D];浙江大学;2013年
10 尹建川;径向基函数神经网络及其在船舶运动控制中的应用研究[D];大连海事大学;2007年
中国硕士学位论文全文数据库 前10条
1 龙杰;基于二进制偏移载波调制的导航信号捕获跟踪算法研究[D];中国科学技术大学;2014年
2 周金虎;基于入侵杂草算法的数据挖掘聚类算法研究[D];兰州理工大学;2014年
3 倪春恩;Metaheuristics算法在分裂系搜索上的应用[D];上海交通大学;2011年
4 田勇强;复杂网络中局部优先的社交圈子检测算法研究与实现[D];西安电子科技大学;2014年
5 周永亮;非负矩阵分解问题算法的研究[D];西安电子科技大学;2011年
6 张忠威;多集合分裂可行问题的算法研究[D];南京邮电大学;2011年
7 王丹丹;星图网络并行最优路径寻找算法的研究与设计[D];广东工业大学;2011年
8 朱晓瑜;对LDPC码LLR BP算法的改进及硬件实现[D];烟台大学;2013年
9 周鹏;改进的H-K算法和α-LMS算法及其应用研究[D];南京航空航天大学;2005年
10 卢允伟;温湿度检测无线传感网的节能数据收集技术[D];浙江工业大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026