收藏本站
《吉林大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

半监督聚类算法的研究与应用

管仁初  
【摘要】: 本文主要针对半监督学习中的聚类算法展开研究: 1.提出了3-集合相似性度量,它是一种包含结构信息的非欧空间度量。在相似特征集、排斥特征集和仲裁特征集的基础上,提出了新的相似性度量和新的聚类算法:权吸引子传播算法。 2.提出了融合3-集合相似性度量、半监督学习策略和吸引子传播算法的种子吸引子传播算法。它降低了文本聚类算法复杂性,避免了随机初始化和陷入局部极小的缺陷,提高了准确率,并具有更好的鲁棒性。 3.提出了融合增量学习的增量吸引子传播半监督聚类算法。该算法将标记样本的先验信息嵌入到相似性矩阵中并运用增量学习策略将它们扩散开来。实验结果表明新算法具有更优良的性能。 4.分析了已标记样本数量对半监督聚类算法的影响。5种算法在3个数据集上的实验结果表明:已标记样本数目的增长能够帮助半监督聚类算法获得更好的性能。但当数目增长超过关键点位置时,这种改进将变得迟缓甚至停滞。 5.分析了未标记样本数量对半监督聚类算法的影响。4种新的半监督聚类算法在 3个数据集上的实验结果表明:在多数情况下,较少未标记样本的增量学习能够帮助半监督聚类算法得到更好的结果。但是,未标记样本规模增长超过关键点时,改进将减少甚至起反作用。
【学位授予单位】:吉林大学
【学位级别】:博士
【学位授予年份】:2010
【分类号】:TP181

【引证文献】
中国期刊全文数据库 前2条
1 郭新辰;宋琼;樊秀玲;;基于半监督分类方法的变压器故障诊断[J];高电压技术;2013年05期
2 李坤;黄开枝;鲁国英;;部分信道状态信息下簇规模均匀的基站群快速分簇方案[J];计算机应用;2012年07期
中国博士学位论文全文数据库 前1条
1 潘俊;基于图的半监督学习及其应用研究[D];浙江大学;2011年
中国硕士学位论文全文数据库 前10条
1 齐锦;基于仿射传播聚类算法的词汇树生成研究[D];西北大学;2011年
2 王桂亮;基于凸壳的半监督聚类算法研究[D];中国海洋大学;2011年
3 荆春伟;基于半监督模糊聚类的入侵防御技术研究[D];江苏科技大学;2011年
4 吴舜尧;融合实例层和属性层知识的半监督聚类及应用研究[D];青岛理工大学;2010年
5 郑丽清;协同基站群的动态分簇算法研究[D];解放军信息工程大学;2011年
6 黄菲菲;半监督层次协同文本聚类研究[D];西南交通大学;2012年
7 倪先华;半监督聚类集成模型研究[D];西南交通大学;2012年
8 徐磊;基于量子粒子群优化和半监督聚类的入侵防御技术研究[D];江苏科技大学;2012年
9 王凯;基于半监督学习的假警报过滤研究[D];江苏科技大学;2012年
10 张金元;半监督聚类集成研究[D];西南交通大学;2012年
【参考文献】
中国期刊全文数据库 前8条
1 杨斌,聂在平,夏耀先,蒋荣生;基于改进共轭梯度法的前馈网络快速监督学习算法[J];电子学报;2002年12期
2 刘涛,吴功宜,陈正;一种高效的用于文本聚类的无监督特征选择算法[J];计算机研究与发展;2005年03期
3 王开军;张军英;李丹;张新娜;郭涛;;自适应仿射传播聚类[J];自动化学报;2007年12期
4 李昆仑;曹铮;曹丽苹;张超;刘明;;半监督聚类的若干新进展[J];模式识别与人工智能;2009年05期
5 卜东波,白硕,李国杰;文本聚类中权重计算的对偶性策略[J];软件学报;2002年11期
6 王玲;薄列峰;焦李成;;密度敏感的半监督谱聚类[J];软件学报;2007年10期
7 肖宇;于剑;;基于近邻传播算法的半监督聚类[J];软件学报;2008年11期
8 高滢;刘大有;齐红;刘赫;;一种半监督K均值多关系数据聚类算法[J];软件学报;2008年11期
中国博士学位论文全文数据库 前1条
1 时小虎;Elman神经网络与进化算法的若干理论研究及应用[D];吉林大学;2006年
【共引文献】
中国期刊全文数据库 前10条
1 吕艳杰;包岩;杨德光;;人工神经网络在玉米气候适宜性评价中的应用[J];安徽农业科学;2009年35期
2 陈文;基于决策树的入侵检测的实现[J];安徽技术师范学院学报;2005年05期
3 王尔丹;人群运动与密度估计技术研究[J];安全;2005年03期
4 冯学军;;最小二乘支持向量机的研究与应用[J];安庆师范学院学报(自然科学版);2009年01期
5 彭莉芬;陈俊生;胡学钢;;基于粗糙集决策树算法的研究[J];安庆师范学院学报(自然科学版);2012年01期
6 汤丽华;;BP神经网络在花凉亭水库渗流监测中的应用[J];安徽水利水电职业技术学院学报;2012年02期
7 赵玉鹏;;论机器学习[J];安阳工学院学报;2011年04期
8 周德强;冯建中;;建筑物沉降预测的改进Verhulst模型研究[J];地下空间与工程学报;2011年01期
9 王立平;孔小梅;付梦印;王美玲;张甲文;姜明;;Temperature Drift Modeling of FOG Based on LS-WSVM[J];Journal of China Ordnance;2008年03期
10 王亮;胡静涛;;基于LS-SVM的光刻过程R2R预测控制方法[J];半导体技术;2012年06期
中国重要会议论文全文数据库 前10条
1 冯羽;马凤山;魏爱华;赵海军;郭捷;;灰色系统与神经网络组合模型在地下水水位预测中的应用[A];中国科学院地质与地球物理研究所第11届(2011年度)学术年会论文集(中)[C];2012年
2 宋海鹰;桂卫华;阳春华;;基于核偏最小二乘的简约最小二乘支持向量机及其应用研究[A];第二十六届中国控制会议论文集[C];2007年
3 宋海鹰;桂卫华;阳春华;;基于最小二乘支持向量机的Hammerstein-Wiener模型辨识[A];第二十六届中国控制会议论文集[C];2007年
4 ;Inverse System Control of Nonlinear Systems Using LS-SVM[A];第二十六届中国控制会议论文集[C];2007年
5 ;A Novel Proximal Support Vector Machine and Its Application in Radar Target Recognition[A];第二十六届中国控制会议论文集[C];2007年
6 ;A CDMA Signal Receiver Based on LS-SVM[A];第二十六届中国控制会议论文集[C];2007年
7 ;LS-SVM Based Stable Generalized Predictive Control[A];第二十七届中国控制会议论文集[C];2008年
8 阎纲;梁昔明;龙祖强;李翔;;一种新的提前一步预测控制算法[A];第二十七届中国控制会议论文集[C];2008年
9 孙玉坤;王博;丁慎平;;基于模糊支持向量机的赖氨酸发酵软测量[A];第二十七届中国控制会议论文集[C];2008年
10 ;GA Based LS-SVM Classifier for Waste Water Treatment Process[A];第二十七届中国控制会议论文集[C];2008年
中国博士学位论文全文数据库 前10条
1 赵莹;半监督支持向量机学习算法研究[D];哈尔滨工程大学;2010年
2 孙明;基于小波和迟滞的混沌神经网络及其应用[D];哈尔滨工程大学;2010年
3 徐森;文本聚类集成关键技术研究[D];哈尔滨工程大学;2010年
4 邬俊;基于交互式语义推理的图像检索算法研究[D];大连海事大学;2010年
5 李书艳;单点氨基酸多态性与疾病相关关系的预测及其机制研究[D];兰州大学;2010年
6 全惠敏;电能质量相关信号的S变换检测算法及应用研究[D];湖南大学;2010年
7 张明;电能质量扰动相关问题研究[D];华中科技大学;2010年
8 高山;蛋白质点突变效果预测与突变数据库研究[D];南开大学;2010年
9 陈文正;保险公司债券投资研究[D];南开大学;2010年
10 杨树忠;复杂网络中的社团检测问题研究[D];北京交通大学;2009年
中国硕士学位论文全文数据库 前10条
1 曾传华;基于颜色和纹理特征的竹条分级方法研究[D];华中农业大学;2010年
2 万成;动态环境下的元胞遗传算法研究[D];南昌航空大学;2010年
3 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
4 王永;消防单兵综合信息采集系统研究[D];山东科技大学;2010年
5 田文娟;基于支持向量机的人民币序列号识别方法的研究[D];山东科技大学;2010年
6 孟培培;基于3S的土地督察信息系统研究[D];山东科技大学;2010年
7 李安新;BP神经网络研究与硬件实现[D];山东科技大学;2010年
8 韩晓峰;高斯混合模型及在探测网络社区结构中的应用[D];山东科技大学;2010年
9 李海清;支持向量机在金融市场预测中的应用[D];辽宁师范大学;2010年
10 吴晓婷;基于流形学习的数据降维算法的研究[D];辽宁师范大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 金文华,何涛,唐卫清,唐荣锡;简单快速的平面散乱点集凸包算法[J];北京航空航天大学学报;1999年01期
2 周培德,周忠平,张欢;寻求中国货郎担问题最短回路的多项式时间算法[J];北京理工大学学报;2000年02期
3 周培德;求解货郎担问题的几何算法[J];北京理工大学学报;1995年01期
4 张平;Beyond 3G移动通信系统关键技术[J];北京邮电大学学报;2002年03期
5 董晓霞;吕廷杰;;云计算研究综述及未来发展[J];北京邮电大学学报(社会科学版);2010年05期
6 宋绍民;王耀南;孙炜;胡新晚;;基于免疫聚类算法的变压器DGA数据故障诊断方法[J];变压器;2008年08期
7 杜文霞;句希源;吕锋;;基于模糊聚类算法的变压器故障诊断研究[J];变压器;2009年08期
8 李霜;王朗珠;张为;张琢;;基于DGA的改进BP神经网络的变压器故障诊断方法[J];变压器;2010年12期
9 贾丙静;吴长勤;葛华;;Web文本聚类的研究与实现[J];长春师范学院学报;2011年06期
10 毋河海;凸壳原理在点群目标综合中的应用[J];测绘工程;1997年01期
中国重要会议论文全文数据库 前1条
1 闫耀辉;臧洌;黄同心;;基于协同训练的Co-Forest算法在入侵检测中的应用[A];2010通信理论与技术新发展——第十五届全国青年通信学术会议论文集(下册)[C];2010年
中国博士学位论文全文数据库 前5条
1 叶航军;面向大规模图像库的索引和检索机制研究[D];清华大学;2003年
2 曾智勇;基于内容图像数据库检索中的关键技术研究[D];西安电子科技大学;2006年
3 罗会兰;聚类集成关键技术研究[D];浙江大学;2007年
4 孔怡青;半监督学习及其应用研究[D];江南大学;2009年
5 曹健;基于局部特征的图像目标识别技术研究[D];北京理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 孙玉侠;数据挖掘中的谱聚类算法研究[D];中国海洋大学;2010年
2 卢加磊;半监督学习中协同训练与多视图方法的比较及改进[D];中国海洋大学;2010年
3 王桂亮;基于凸壳的半监督聚类算法研究[D];中国海洋大学;2011年
4 郑丽清;协同基站群的动态分簇算法研究[D];解放军信息工程大学;2011年
5 王晓峰;基于进化半监督式模糊聚类算法的入侵检测[D];西安电子科技大学;2005年
6 李嵬;基于度的半监督聚类算法及其在集装箱港口出口箱量短期预测中的应用[D];华东师范大学;2006年
7 于顺治;千兆网络入侵防御系统内容处理技术研究[D];北京邮电大学;2006年
8 蒋联源;凸壳算法及其应用研究[D];广西师范大学;2007年
9 张海芹;基于QPSO算法的入侵检测技术研究[D];江南大学;2007年
10 罗晓清;半监督聚类算法及应用的研究[D];江南大学;2007年
【二级引证文献】
中国期刊全文数据库 前3条
1 李坤;黄开枝;鲁国英;;部分信道状态信息下簇规模均匀的基站群快速分簇方案[J];计算机应用;2012年07期
2 冉晓旻;童珉;莫有权;;一种部分CSI下的近邻传播动态分簇算法[J];计算机应用研究;2013年04期
3 李坤;黄开枝;吉江;冯涛;靳彦青;;基于系统平均性能增益最大化的基站群协同分簇方案[J];通信学报;2012年11期
中国硕士学位论文全文数据库 前4条
1 唐洁;仿射传播聚类算法在图像检索中的应用研究[D];西北大学;2012年
2 谭静;基于半监督聚类的图像分割算法研究[D];中国海洋大学;2012年
3 马红梅;基于Curvelet冗余字典和免疫克隆优化的压缩感知重构[D];西安电子科技大学;2012年
4 孙成;聚类集成技术改进仿射传播算法的研究与应用[D];西北大学;2012年
【二级参考文献】
中国期刊全文数据库 前10条
1 谈英姿,沈炯,肖隽,宋兆龙,吕震中;人工免疫工程综述[J];东南大学学报(自然科学版);2002年04期
2 王磊,潘进,焦李成;免疫算法[J];电子学报;2000年07期
3 葛红;免疫算法综述[J];华南师范大学学报(自然科学版);2002年03期
4 于剑,程乾生;模糊聚类方法中的最佳聚类数的搜索范围[J];中国科学E辑:技术科学;2002年02期
5 陆玉昌,鲁明羽,李凡,周立柱;向量空间法中单词权重函数的分析和构造[J];计算机研究与发展;2002年10期
6 金骏;张道强;;半监督鲁棒联机聚类算法[J];计算机研究与发展;2008年03期
7 肖人彬,王磊;人工免疫系统:原理、模型、分析及展望[J];计算机学报;2002年12期
8 王强,邵惠鹤;遗传算法在甲醛生产过程优化中的应用[J];控制理论与应用;1996年04期
9 巩敦卫,孙晓燕,郭西进;一种新的优胜劣汰遗传算法[J];控制与决策;2002年06期
10 王玲;薄列峰;焦李成;;密度敏感的半监督谱聚类[J];软件学报;2007年10期
中国博士学位论文全文数据库 前1条
1 薛明志;进化计算与小波分析若干问题研究[D];西安电子科技大学;2004年
【相似文献】
中国期刊全文数据库 前10条
1 向培素;;一种基于近邻半监督聚类算法的图像检索系统研究[J];西南民族大学学报(自然科学版);2010年04期
2 许剑峰,林嘉宜,黎绍发;一种基于中心对称性的聚类算法[J];计算机工程与设计;2003年05期
3 李晓莉,陈雪;基于模式识别聚类思想的PON ODN规划设计[J];光通信技术;2003年12期
4 张彩虹,王春才,颜雁;医保决策支持系统中的聚类算法[J];长春理工大学学报;2004年04期
5 史兴键,李伟华,王文奇;基于优化聚类算法的安全审计模型[J];计算机工程与应用;2005年17期
6 周如旗;个性化数据聚类的属性坐标分析法[J];电脑与信息技术;2005年03期
7 潘磊,吴小俊,尤媛媛;基于聚类的视频镜头分割和关键帧提取[J];红外与激光工程;2005年03期
8 张永梅,韩焱,张建华;一种有效聚类算法的研究和实现[J];计算机应用;2005年07期
9 叶菲,罗景青;一种基于BFSN聚类的多参数综合分选算法[J];雷达与对抗;2005年02期
10 严馨,周丽华,陈克平,徐广义;一种改进的带障碍的基于密度和网格的聚类算法[J];计算机应用;2005年08期
中国重要会议论文全文数据库 前10条
1 魏昕路;洪志令;姜青山;;一种基于样本缩减策略的新窗口式聚类算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
2 王守强;朱大铭;史士英;;基于输入点集求解k-Means聚类算法[A];第二十六届中国控制会议论文集[C];2007年
3 李政涛;夏树倩;王大玲;冯时;张一飞;;一种基于语义引力及密度分布的聚类算法[A];第六届全国信息检索学术会议论文集[C];2010年
4 吴继兵;李心科;;基于分治融合的混合属性数据聚类算法研究[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(下册)[C];2009年
5 李世峰;黄磊;刘昌平;;几种聚类方法的比较[A];第八届全国汉字识别学术会议论文集[C];2002年
6 刘洋;江志纲;丁增喜;王大玲;鲍玉斌;于戈;;一种基于图的聚类算法GB-Cluster[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
7 邓敏;刘启亮;李光强;程涛;;一种基于场模型的空间聚类算法[A];现代测量技术与地理信息系统科技创新及产业发展研讨会论文集[C];2009年
8 逯波;王国仁;;一种有效的半监督视频镜头聚类算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
9 刘强;林世平;;基于蚁群聚类算法的中文本体学习[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
10 余琳;邓玲;;常见聚类算法的比较以及DSS系统中的应用[A];湖北省通信学会、武汉通信学会2009年学术年会论文集[C];2009年
中国重要报纸全文数据库 前3条
1 ;视频数据中挖“宝”[N];计算机世界;2002年
2 本报记者 赵凤华 通讯员 戴世勇 陶春明;本科生登上全国学术会议讲坛[N];科技日报;2008年
3 本报记者 于翔;多元管理防范金融风险[N];网络世界;2010年
中国博士学位论文全文数据库 前10条
1 管仁初;半监督聚类算法的研究与应用[D];吉林大学;2010年
2 万淼;基于群智能和随机索引的网络聚类算法研究[D];北京邮电大学;2011年
3 刘位龙;面向不确定性数据的聚类算法研究[D];山东师范大学;2011年
4 叶镇清;自适应聚类算法挖掘网络模块结构及其在酵母蛋白作用网络中的应用[D];浙江大学;2008年
5 张鸿雁;基于DNA计算的聚类算法研究[D];山东师范大学;2011年
6 孙鹏岗;聚类算法研究及其在网络模块性分析中的应用[D];西安电子科技大学;2011年
7 曹付元;面向分类数据的聚类算法研究[D];山西大学;2010年
8 梅娟;复杂生物网络聚类分析方法[D];江南大学;2010年
9 潘鸿飞;形状特征描述及聚类算法研究[D];安徽大学;2011年
10 李强;动点聚类算法及其量子化研究[D];浙江大学;2009年
中国硕士学位论文全文数据库 前10条
1 卜德云;自适应谱聚类算法的研究与应用[D];南京航空航天大学;2010年
2 石洪竺;量子进化聚类算法研究[D];西安电子科技大学;2010年
3 温程;并行聚类算法在MapReduce上的实现[D];浙江大学;2011年
4 张珠玉;聚类算法及其在日志数据处理中的应用研究[D];山东师范大学;2011年
5 叶冲轶;高维海量数据联合聚类算法的研究与应用[D];浙江工商大学;2010年
6 姚毓凯;一种有效的自适应网格密度聚类算法研究[D];兰州大学;2011年
7 王帆;基于优化目标可调控的免疫聚类算法的研究[D];太原理工大学;2010年
8 李长进;基于蚁群算法的混合聚类算法研究[D];中国石油大学;2010年
9 武彩丽;基于规范切和分水岭的聚类算法研究[D];西安电子科技大学;2010年
10 张立;基于新闻评论数据的K-means聚类算法的研究[D];太原理工大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026