收藏本站
《长春工业大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于密度的聚类算法研究

杨建红  
【摘要】:随着互联网等现代信息技术的飞速发展,人们必须面对海量的数据和信息,如何对这些信息进行整理、分类和挖掘成为人们日益关心的话题。在数据挖掘领域中,聚类分析是一项重要的研究课题。聚类分析技术作为一种信息处理手段近年来一直受到人们的关注,聚类分析在机器学习、模式识别、数据挖掘、信息检索等很多领域得到了广泛的研究和应用。 聚类算法主要分为基于划分的聚类算法、基于层次的聚类算法、基于密度的聚类算法、基于网格的聚类算法和基于模型的聚类算法。其中基于密度的聚类的主要优点是可以发现任意形状的簇,而且对噪音数据不敏感。但不管是DBSCAN算法,还是其改进算法都要求用户输入参数,对输入参数敏感是这类算法的主要缺点之一。由于决定密度阈值的参数是全局唯一的,所以缺点之二是难以发现密度相差较大的簇。但实际上,数据对象本身属于哪个类是由它自身的属性决定的,不会因为输入参数的不同而有所不同,所以希望能有一种方法可以根据数据本身实现参数的确定。 数据对象的属性直接反映在与其他对象之间的距离尤其是最近距离上,因此把这些最近距离收集起来,分析这些最近距离的频率,可以从频率形成的直方图中分析到一些有用的参数信息。图像分割理论可以对图像的灰度直方图进行阈值分割,应用到最小距离直方图中就可以对其进行阈值分割。有了这些阈值,我们就可以根据分析到的阈值对数据对象进行分别聚类,这就是本文提出的基于阈值分割和密度的聚类算法。 本文的主要工作有: 1、介绍了几种基于密度的聚类算法及其改进算法,并分析了当前基于密度的聚类算法存在的问题。 2、对图像分割理论进行了简单介绍并详细介绍了图像处理中图像分割基本技术,尤其是基于灰度直方图的阈值分割技术。 3、论述最小距离直方图的生成,并结合图像处理中的阈值分割技术对最小距离直方图进行分割,再将分割直方图用的阈值用于基于密度的聚类算法,对数据对象分别聚类、分情况聚类。
【学位授予单位】:长春工业大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP311.13

【引证文献】
中国硕士学位论文全文数据库 前6条
1 李文强;基于深度学习的室内点云场景语义理解研究[D];哈尔滨工业大学;2018年
2 鲍超;需求约简下一种基于DBSCAN算法的测试用例优化方法研究[D];浙江理工大学;2018年
3 刘如辉;半监督约束快速密度峰值聚类算法研究及其在空调控制上的应用[D];浙江大学;2018年
4 祖国强;基于工况识别的双驱纯电动汽车能量管理策略研究[D];重庆大学;2017年
5 孙杰;细胞型膜系统在聚类算法中的研究[D];山东师范大学;2014年
6 任巍英;基于属性扩展图的K-means聚类算法的研究[D];中北大学;2012年
【参考文献】
中国期刊全文数据库 前8条
1 刘勘,周晓峥,周洞汝;一种基于排序子空间的高维聚类算法及其可视化研究[J];计算机研究与发展;2003年10期
2 马帅,王腾蛟,唐世渭,杨冬青,高军;一种基于参考点和密度的快速聚类算法[J];软件学报;2003年06期
3 苏中,马少平,杨强,张宏江;基于Web-Log Mining的Web文档聚类[J];软件学报;2002年01期
4 陈宁,陈安,周龙骧;基于密度的增量式网格聚类算法(英文)[J];软件学报;2002年01期
5 周傲英,周水庚,曹晶,范晔,胡运发;Approaches for Scaling DBSCAN Algorithm to Large Spatial Databases[J];Journal of Computer Science and Technology;2000年06期
6 周水庚,范晔,周傲英;基于数据取样的DBSCAN算法[J];小型微型计算机系统;2000年12期
7 周水庚,周傲英,曹晶,胡运发;一种基于密度的快速聚类算法[J];计算机研究与发展;2000年11期
8 周水庚,周傲英,曹晶;基于数据分区的DBSCAN算法[J];计算机研究与发展;2000年10期
中国硕士学位论文全文数据库 前1条
1 曾东海;基于网格密度和空间划分树的聚类算法研究[D];厦门大学;2006年
【共引文献】
中国期刊全文数据库 前10条
1 冯利容;彭艳兵;杨美珍;;临近基站建议模型在基站位置校正中的应用[J];计算机与现代化;2015年11期
2 赖丽萍;聂瑞华;汪疆平;黄家鸿;;基于MapReduce的改进DBSCAN算法[J];计算机科学;2015年S2期
3 李纪华;刘建玲;肖瑞;;基于信令数据的交通出行分布异常检测[J];移动通信;2015年21期
4 郑羽洁;李茜;;基于大数据混沌特性的分区域异常数据挖掘[J];河池学院学报;2015年05期
5 鲜晓东;吕建中;樊宇星;;基于密度与距离参数的CHMM声学模型初值估计[J];计算机工程;2015年10期
6 刘清堂;吴林静;黄焕;;网络资源聚合研究综述[J];情报科学;2015年10期
7 尹路修;;XML文档的聚类研究[J];湖南师范大学自然科学学报;2015年05期
8 朱晔;冯万兴;郭钧天;李雪皎;刘娟;;一种改进的k-中心点聚类算法及在雷暴聚类中的应用[J];武汉大学学报(理学版);2015年05期
9 李若童;申威;;基于手机端的道路病害管理系统设计与实现[J];科技视界;2015年24期
10 张晓;张媛媛;高阳;周新民;;一种基于密度的快速聚类方法[J];数据采集与处理;2015年04期
中国硕士学位论文全文数据库 前9条
1 潘春燕;基于大数据的密度偏差抽样算法及应用研究[D];贵州民族大学;2017年
2 吴非;基于模糊聚类的数据库空值估计研究[D];南京航空航天大学;2016年
3 陈政;基于分层贝叶斯模型的智能视频监控中的异常检测[D];西南大学;2015年
4 赵卓真;一种基于密度与网格的聚类方法[D];中山大学;2012年
5 姚毓凯;一种有效的自适应网格密度聚类算法研究[D];兰州大学;2011年
6 康海源;基于密度和网格相结合的聚类算法及其在图像分割中的应用[D];中北大学;2011年
7 张艳丽;基于综合度量的划分聚类研究[D];安徽大学;2011年
8 陈毅;基于网格的并行聚类算法及数据流聚类算法研究[D];兰州大学;2010年
9 杨建红;基于密度的聚类算法研究[D];长春工业大学;2010年
【同被引文献】
中国硕士学位论文全文数据库 前10条
1 庞滔;双驱纯电动汽车驱动控制及性能优化仿真[D];重庆大学;2017年
2 李健彰;双驱纯电动汽车动力传动系统设计与仿真[D];重庆大学;2016年
3 罗少华;基于工况识别的混联式混合动力汽车能量管理策略研究[D];重庆大学;2016年
4 白琴;插电式混合动力汽车能量管理控制策略研究[D];重庆大学;2016年
5 曹旦;中央空调系统仿真与节能优化[D];东华大学;2016年
6 潘登;混合动力汽车城市循环工况构建及运行工况多尺度预测[D];北京理工大学;2015年
7 赵春阳;基于行驶工况辨识的混合动力客车控制策略研究[D];吉林大学;2015年
8 冯希龙;基于RGB-D图像的室内场景语义分割方法[D];南京邮电大学;2015年
9 曾剑峰;新型双电机耦合驱动系统驱动控制策略研究[D];重庆大学;2015年
10 李宗林;基于DBSCAN的自适应聚类算法研究[D];长沙理工大学;2015年
【二级引证文献】
中国硕士学位论文全文数据库 前4条
1 侯彩萍;基于组织型P系统的DNA-GA算法研究及其在聚类中的应用[D];山东师范大学;2017年
2 赵丹;基于膜系统的多关系聚类算法的研究与应用[D];山东师范大学;2017年
3 韦栩;基于膜系统的微粒群优化算法研究及应用[D];山东师范大学;2016年
4 毕伟;脉冲神经膜系统在聚类问题中的研究与应用[D];山东师范大学;2016年
【相似文献】
中国期刊全文数据库 前10条
1 石陆魁,何丕廉;一种基于密度的高效聚类算法[J];计算机应用;2005年08期
2 陈燕;;对两个经典聚类算法的分析[J];现代电子技术;2007年17期
3 刘青宝;邓苏;张维明;;基于相对密度的聚类算法[J];计算机科学;2007年02期
4 王永乐;王希军;;一种改进的聚类和孤立点检测算法[J];许昌学院学报;2014年05期
5 梅梦;;聚类算法的分析与研究[J];科技广场;2007年11期
6 田银磊;王亚利;;一种改进的聚类和孤立点检测算法[J];科学技术与工程;2010年22期
7 胡庆林;叶念渝;朱明富;;数据挖掘中聚类算法的综述[J];计算机与数字工程;2007年02期
8 赵慧;刘希玉;崔海青;;网格聚类算法[J];计算机技术与发展;2010年09期
9 钱江波,董逸生;一种基于广度优先搜索邻居的聚类算法[J];东南大学学报(自然科学版);2004年01期
10 项冰冰;钱光超;;聚类算法研究综述[J];电脑知识与技术(学术交流);2007年12期
中国重要会议论文全文数据库 前10条
1 赖桃桃;冯少荣;张东站;;一种基于划分和密度的快速聚类算法[A];第二十五届中国数据库学术会议论文集(一)[C];2008年
2 杨欣斌;黄道;;一种新的聚类算法[A];2003年中国智能自动化会议论文集(下册)[C];2003年
3 郝芸;田野;康辉;;分布式聚类算法的研究[A];第九届中国通信学会学术年会论文集[C];2012年
4 于健;陈子军;李霞;李炜;;一种新的多密度聚类算法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
5 任伟;闫桂英;;利用聚类算法来研究基因选择问题[A];中国运筹学会第八届学术交流会论文集[C];2006年
6 葛鹏程;李建中;张兆功;何震瀛;;一种基于势能的快速聚类算法[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
7 陈德华;解维;李悦;;面向大规模图数据的分布式并行聚类算法研究[A];第29届中国数据库学术会议论文集(B辑)(NDBC2012)[C];2012年
8 魏昕路;洪志令;姜青山;;一种基于样本缩减策略的新窗口式聚类算法[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
9 刘彤;孙永香;张振洪;;一种有效的基于密度和层次的聚类算法[A];2007'仪表,自动化及先进集成技术大会论文集(一)[C];2007年
10 宫蕊;舒红平;郭远远;;基于DBSCAN的密度聚类算法的研究[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
中国重要报纸全文数据库 前10条
1 眉间尺;比算法推荐更重要的是确认眼神[N];科技日报;2018年
2 陈航辉;切勿陷入算法迷信[N];解放军报;2019年
3 西南政法大学行政法学院 邬蕾;算法与法秩序的重塑[N];中国社会科学报;2019年
4 沈东坡;致命的“算法”[N];滨海时报;2017年
5 刘振;“成于算法”当警惕“败于算法”[N];安徽日报;2018年
6 中国信息通信研究院产业与规划研究所 李曼 谢智刚;算法升级加快数字经济发展步伐[N];人民邮电;2018年
7 孙益武;算法也应接受法律的审视[N];民主与法制时报;2018年
8 刘文龙;“算法”只是工具 可以运用但别依赖[N];解放日报;2018年
9 小鱼 乐舒 苏晓 晓龙 良辰;算法:干了这杯“酒”,从此推荐内容是好友[N];人民邮电;2018年
10 本报记者 倪弋;网络时代,应如何规范“算法”[N];人民日报;2018年
中国博士学位论文全文数据库 前10条
1 万淼;基于群智能和随机索引的网络聚类算法研究[D];北京邮电大学;2011年
2 王振佳;基于基因表达数据的双聚类算法研究[D];山东大学;2016年
3 王佐;基于粗糙集的聚类算法研究[D];吉林大学;2013年
4 许玉杰;云计算环境下海量数据的并行聚类算法研究[D];大连海事大学;2014年
5 冀进朝;针对多维混合属性数据的聚类算法研究[D];吉林大学;2013年
6 魏立梅;聚类分析新方法的研究与应用[D];西安电子科技大学;1998年
7 张强;聚类算法的维度分析[D];天津大学;2007年
8 姜磊;混合演化聚类算法研究及其应用[D];武汉大学;2012年
9 王贵参;重叠社区发现中的边聚类算法研究[D];吉林大学;2016年
10 管仁初;半监督聚类算法的研究与应用[D];吉林大学;2010年
中国硕士学位论文全文数据库 前10条
1 杨建红;基于密度的聚类算法研究[D];长春工业大学;2010年
2 方杰;聚类算法及其在页面聚类中的应用研究[D];合肥工业大学;2009年
3 于智航;改进的密度聚类算法研究[D];大连理工大学;2007年
4 刘俊岭;聚类与孤立点检测算法的研究和实现[D];中国科学院研究生院(沈阳计算技术研究所);2006年
5 单玉双;聚类算法在学生成绩分析中的应用研究[D];辽宁工程技术大学;2009年
6 周末;基于蚁群算法的数据流聚类算法[D];东北大学;2009年
7 贾瑷玮;基于粒计算的聚类算法研究[D];陕西师范大学;2014年
8 高倩倩;基因表达数据的聚类算法研究及其实现[D];江南大学;2009年
9 孙长江;基于图论的聚类算法及其在基因数据处理中的应用[D];吉林大学;2007年
10 李文俊;面向离散时间序列的聚类算法研究[D];南京师范大学;2012年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026