收藏本站
《山东大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

半监督学习方法及应用研究

刘伟涛  
【摘要】:传统的机器学习的研究中往往倾向于将有标签的数据和无标签的数据分开研究,但是在现实生活中,这两种情况往往是并存的。半监督学习便由此应运而生,在传统应用中往往将半监督作为一个聚类的改进方法,却没有将聚类的优势应用于半监督学习中,因此本文就此进行了深入探究。 半监督学习主要目的是在仅有少量标注数据集和大量未标注数据集的基础上获得一个良好的学习器。自训练算法便是半监督学习的重要算法,然而自训练过程中有两个问题需要解决:首先是如何从无标签数据集中选择合适的样本标记后加入到有标签样本中。其次,在无标签样本标记过程中会出现错标现象。 针对自训练的两个问题,在做了有效的研究后,我们提出了一个算法以解决两个问题。大体思想如下,在用分类器标记后,用聚类对新标记的无标签样本数据集进行处理,然后从聚类中选取有效的新数据更新训练集,然后采用数据编辑技术剔除错标的样本,这样就能避免分类器受到错标样本影响。 为了衡量该算法的效果,我们在标准数据集上对算法进行了测试,通过与其他算法的对比,结果表明在引入聚类时,算法要比对比算法的效果好,而且算法的收敛速度要比对比算法快的多。
【学位授予单位】:山东大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP181

【引证文献】
中国硕士学位论文全文数据库 前1条
1 盛英;半监督特征降维及其在天文光谱数据中的应用[D];太原科技大学;2012年
【参考文献】
中国期刊全文数据库 前2条
1 杨斌,聂在平,夏耀先,蒋荣生;基于改进共轭梯度法的前馈网络快速监督学习算法[J];电子学报;2002年12期
2 张洪刚,刘刚,郭军;FCM-VKNN聚类算法的研究[J];自动化学报;2002年04期
中国博士学位论文全文数据库 前2条
1 吴春国;广义染色体遗传算法与迭代式最小二乘支持向量机回归算法研究[D];吉林大学;2006年
2 高滢;多关系聚类分析方法研究[D];吉林大学;2008年
【共引文献】
中国期刊全文数据库 前10条
1 吕艳杰;包岩;杨德光;;人工神经网络在玉米气候适宜性评价中的应用[J];安徽农业科学;2009年35期
2 郇正军;赵国富;;基于土地利用的空间数据挖掘系统的设计与实现[J];安徽农业科学;2011年07期
3 王尔丹;人群运动与密度估计技术研究[J];安全;2005年03期
4 冯学军;;最小二乘支持向量机的研究与应用[J];安庆师范学院学报(自然科学版);2009年01期
5 汤丽华;;BP神经网络在花凉亭水库渗流监测中的应用[J];安徽水利水电职业技术学院学报;2012年02期
6 周德强;冯建中;;建筑物沉降预测的改进Verhulst模型研究[J];地下空间与工程学报;2011年01期
7 王立平;孔小梅;付梦印;王美玲;张甲文;姜明;;Temperature Drift Modeling of FOG Based on LS-WSVM[J];Journal of China Ordnance;2008年03期
8 王亮;胡静涛;;基于LS-SVM的光刻过程R2R预测控制方法[J];半导体技术;2012年06期
9 田盛丰;基于核函数的学习算法[J];北方交通大学学报;2003年02期
10 薛彦轶;刘晓东;;基于最小二乘支持向量机的航材备件需求建模[J];兵工自动化;2007年06期
中国重要会议论文全文数据库 前10条
1 冯羽;马凤山;魏爱华;赵海军;郭捷;;灰色系统与神经网络组合模型在地下水水位预测中的应用[A];中国科学院地质与地球物理研究所第11届(2011年度)学术年会论文集(中)[C];2012年
2 宋海鹰;桂卫华;阳春华;;基于核偏最小二乘的简约最小二乘支持向量机及其应用研究[A];第二十六届中国控制会议论文集[C];2007年
3 宋海鹰;桂卫华;阳春华;;基于最小二乘支持向量机的Hammerstein-Wiener模型辨识[A];第二十六届中国控制会议论文集[C];2007年
4 ;Inverse System Control of Nonlinear Systems Using LS-SVM[A];第二十六届中国控制会议论文集[C];2007年
5 ;A Novel Proximal Support Vector Machine and Its Application in Radar Target Recognition[A];第二十六届中国控制会议论文集[C];2007年
6 ;A CDMA Signal Receiver Based on LS-SVM[A];第二十六届中国控制会议论文集[C];2007年
7 ;LS-SVM Based Stable Generalized Predictive Control[A];第二十七届中国控制会议论文集[C];2008年
8 阎纲;梁昔明;龙祖强;李翔;;一种新的提前一步预测控制算法[A];第二十七届中国控制会议论文集[C];2008年
9 孙玉坤;王博;丁慎平;;基于模糊支持向量机的赖氨酸发酵软测量[A];第二十七届中国控制会议论文集[C];2008年
10 ;GA Based LS-SVM Classifier for Waste Water Treatment Process[A];第二十七届中国控制会议论文集[C];2008年
中国博士学位论文全文数据库 前10条
1 赵莹;半监督支持向量机学习算法研究[D];哈尔滨工程大学;2010年
2 孙明;基于小波和迟滞的混沌神经网络及其应用[D];哈尔滨工程大学;2010年
3 张泽宝;空间数据库的索引技术研究[D];哈尔滨工程大学;2009年
4 李书艳;单点氨基酸多态性与疾病相关关系的预测及其机制研究[D];兰州大学;2010年
5 张明;电能质量扰动相关问题研究[D];华中科技大学;2010年
6 陈文正;保险公司债券投资研究[D];南开大学;2010年
7 许伟;基于进化算法的复杂化工过程智能建模方法及其应用[D];华东理工大学;2011年
8 向国齐;支持向量回归机代理模型设计优化及应用研究[D];电子科技大学;2010年
9 桑永胜;空间数据分析的神经计算方法[D];电子科技大学;2010年
10 渠瑜;基于SVM的高不平衡分类技术研究及其在电信业的应用[D];浙江大学;2010年
中国硕士学位论文全文数据库 前10条
1 曾传华;基于颜色和纹理特征的竹条分级方法研究[D];华中农业大学;2010年
2 王永;消防单兵综合信息采集系统研究[D];山东科技大学;2010年
3 田文娟;基于支持向量机的人民币序列号识别方法的研究[D];山东科技大学;2010年
4 孟培培;基于3S的土地督察信息系统研究[D];山东科技大学;2010年
5 李安新;BP神经网络研究与硬件实现[D];山东科技大学;2010年
6 李海清;支持向量机在金融市场预测中的应用[D];辽宁师范大学;2010年
7 江达秀;基于HMAX模型的人脸表情识别研究[D];浙江理工大学;2010年
8 李朋勇;基于全矢高阶谱的故障诊断方法及其应用研究[D];郑州大学;2010年
9 王岩;混凝土受氯离子侵蚀劣化的ANFIS分析[D];郑州大学;2010年
10 李光远;基于在线聚类和最小二乘支持向量机的模糊建模方法研究[D];郑州大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 倪国强;沈渊婷;徐大琦;;一种基于小波PCA的高光谱图像特征提取新方法[J];北京理工大学学报;2007年07期
2 覃冬梅,胡占义,赵永恒;一种基于主分量分析的恒星光谱快速分类法[J];光谱学与光谱分析;2003年01期
3 张继福;蔡江辉;;面向LAMOST的天体光谱离群数据挖掘系统研究[J];光谱学与光谱分析;2007年03期
4 李乡儒;胡占义;赵永恒;;基于Fisher判别分析的有监督特征提取和星系光谱分类[J];光谱学与光谱分析;2007年09期
5 李乡儒;胡占义;赵永恒;李晓明;;RVM有监督特征提取与Seyfert光谱分类[J];光谱学与光谱分析;2009年06期
6 刘蓉;靳红梅;段福庆;;基于Bayes决策的光谱分类[J];光谱学与光谱分析;2010年03期
7 王瀛;郭雷;梁楠;;基于优选样本的KPCA高光谱图像降维方法[J];光子学报;2011年06期
8 赵武锋;沈海斌;严晓浪;;监督降维算法的计算和理论分析[J];浙江大学学报(理学版);2009年06期
9 朱艳;刘晓莉;杨哲海;;高光谱数据的降维及Tabu搜索算法的应用[J];测绘科学技术学报;2007年01期
10 吴晓婷;闫德勤;;改进的非线性数据降维方法及其应用[J];计算机工程与应用;2011年02期
中国博士学位论文全文数据库 前5条
1 常甜甜;支持向量机学习算法若干问题的研究[D];西安电子科技大学;2010年
2 杨风召;高维数据挖掘中若干关键问题的研究[D];复旦大学;2003年
3 谭璐;高维数据的降维理论及应用[D];国防科学技术大学;2005年
4 曹苏群;基于模糊Fisher准则的聚类与特征降维研究[D];江南大学;2009年
5 张田昊;数据降维算法研究及其应用[D];上海交通大学;2008年
中国硕士学位论文全文数据库 前10条
1 安文娟;Fisher和支持向量综合分类器[D];辽宁师范大学;2010年
2 余养强;半监督学习若干问题的研究[D];福建师范大学;2010年
3 易星;半监督学习若干问题的研究[D];清华大学;2004年
4 庄红波;函数变换法求经典Fisher方程的显示解[D];四川师范大学;2006年
5 王雨春;CCA在数字图像处理中的应用研究[D];武汉理工大学;2006年
6 杜世强;基于核Fisher判别的人脸识别方法研究[D];陕西师范大学;2007年
7 金骏;半监督的聚类和降维研究及应用[D];南京航空航天大学;2007年
8 赵玲玲;半监督降维和分类算法研究[D];西安电子科技大学;2009年
9 张乾坤;无监督与半监督降维算法研究[D];西安电子科技大学;2010年
10 黄移军;基于局部线性嵌入的高维数据降维研究[D];中南大学;2009年
【二级参考文献】
中国期刊全文数据库 前10条
1 薛万欣,刘大有,张弘;Bayesian网中概率参数学习方法[J];电子学报;2003年11期
2 李洁;高新波;焦李成;;基于特征加权的模糊聚类新算法[J];电子学报;2006年01期
3 赵亮,胡乃静,张守志;个性化推荐算法设计[J];计算机研究与发展;2002年08期
4 孙广玲,唐降龙;基于分层高斯混合模型的半监督学习算法[J];计算机研究与发展;2004年01期
5 周军锋,汤显,郭景峰;一种优化的协同过滤推荐算法[J];计算机研究与发展;2004年10期
6 杨剑;王珏;钟宁;;流形上的Laplacian半监督回归[J];计算机研究与发展;2007年07期
7 徐文龙;姚立红;潘理;倪佑生;;基于TSVM的网络入侵检测研究[J];计算机工程;2006年18期
8 王丽娟;关守义;王晓龙;王熙照;;基于属性权重的Fuzzy C Mean算法[J];计算机学报;2006年10期
9 沈新宇;许宏丽;官腾飞;;基于直推式支持向量机的图像分类算法[J];计算机应用;2007年06期
10 陶卿,曹进德,孙德敏;基于支持向量机分类的回归方法[J];软件学报;2002年05期
中国博士学位论文全文数据库 前1条
1 马笑潇;智能故障诊断中的机器学习新理论及其应用研究[D];重庆大学;2002年
【相似文献】
中国期刊全文数据库 前10条
1 李妍妍;李媛媛;叶世伟;;基于流形正则化的支持向量回归及应用[J];计算机应用;2007年08期
2 李永忠;王汝山;张念贵;王玉雷;;基于半监督模糊聚类的入侵检测技术[J];江苏科技大学学报(自然科学版);2010年04期
3 傅向华,冯博琴,马兆丰,何明;可在线增量自学习的聚焦爬行方法[J];西安交通大学学报;2004年06期
4 丁磊,钱云涛;不同程度的监督机制在自动文本分类中的应用[J];计算机应用与软件;2004年06期
5 张晨光;李玉鑑;;基于半监督学习的眉毛图像分割方法[J];计算机工程与应用;2009年21期
6 刘叶青;刘三阳;谷明涛;;一种多项式光滑的半监督支持向量机分类算法[J];计算机科学;2009年07期
7 杨绪兵;潘志松;陈松灿;;半监督型广义特征值最接近支持向量机[J];模式识别与人工智能;2009年03期
8 鲁珂,赵继东,叶娅兰,曾家智;一种用于图像检索的新型半监督学习算法[J];电子科技大学学报;2005年05期
9 罗进;周学君;;半监督学习中非标记数据的利用[J];湖北大学学报(自然科学版);2008年01期
10 曹慧;刘玉峰;;未标记样本在半监督学习中的应用方法研究[J];广西轻工业;2008年12期
中国重要会议论文全文数据库 前10条
1 谷方明;刘大有;王新颖;;基于半监督学习的加权支持向量域数据描述方法[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
2 杨源;马云龙;林鸿飞;;基于权重标准化SimRank与半监督学习的产品属性归类[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
3 朱松豪;梁志伟;;用半监督学习方法实现图像检索[A];第二十九届中国控制会议论文集[C];2010年
4 邱慧宁;黄剑;陈羽;赖剑煌;;基于UDP的半监督学习及其在人脸识别的应用[A];第十四届全国图象图形学学术会议论文集[C];2008年
5 毕锦烟;李巍华;;基于半监督模糊核聚类的齿轮箱早期故障检测方法[A];第九届全国振动理论及应用学术会议论文摘要集[C];2007年
6 柳斌;李之棠;涂浩;;一种基于半监督学习的应用层流量分类方法[A];2008年全国开放式分布与并行计算机学术会议论文集(下册)[C];2008年
7 张召;业宁;业巧林;;基于配对约束的核半监督非线性降维算法[A];第五届全国信息检索学术会议论文集[C];2009年
8 王倩影;冯国灿;汤鑫;;δ-距离及其在半监督增强中的应用[A];第十五届全国图象图形学学术会议论文集[C];2010年
9 冯瑞;宋春林;;一种基于局部学习的复杂系统建模方法[A];2007中国控制与决策学术年会论文集[C];2007年
10 何慧;陈博;郭军;;基于流形学习的半监督文本情感分类算法[A];第五届全国信息检索学术会议论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 孔怡青;半监督学习及其应用研究[D];江南大学;2009年
2 王娇;多视图的半监督学习研究[D];北京交通大学;2010年
3 兰远东;基于图的半监督学习理论、算法及应用研究[D];华南理工大学;2012年
4 徐雪;样本的几何信息在半监督学习中的应用研究[D];中国科学技术大学;2010年
5 朱岩;面向文本数据的半监督学习研究[D];北京交通大学;2012年
6 桂杰;基于图的半监督学习和维数约简方法及其应用研究[D];中国科学技术大学;2010年
7 潘俊;基于图的半监督学习及其应用研究[D];浙江大学;2011年
8 余国先;高维数据上的半监督学习研究[D];华南理工大学;2013年
9 赵志凯;半监督学习及其在煤矿瓦斯安全信息处理中的应用研究[D];中国矿业大学;2012年
10 任广波;基于半监督学习的遥感影像分类技术研究[D];中国海洋大学;2010年
中国硕士学位论文全文数据库 前10条
1 陈新勇;基于核策略的半监督学习方法研究[D];河北大学;2010年
2 黄明明;半监督学习方法研究及在警用平台中的应用[D];大连理工大学;2010年
3 冯元佶;基于图的半监督学习的改进研究[D];湘潭大学;2010年
4 余养强;半监督学习若干问题的研究[D];福建师范大学;2010年
5 刘伟涛;半监督学习方法及应用研究[D];山东大学;2011年
6 杨伟;半监督学习方法研究[D];国防科学技术大学;2011年
7 魏征丽;基于图半监督学习算法的研究及应用[D];西安电子科技大学;2012年
8 刘孝良;基于半监督学习的随机森林算法研究与应用[D];中国海洋大学;2013年
9 惠成峰;基于半监督学习的电子商务推荐方法[D];南京大学;2013年
10 王竞燕;基于半监督学习的桥梁结构健康分类模型的研究与应用[D];北京工商大学;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026