收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于图形处理器的K均值算法研究

赵新萌  
【摘要】:数据挖掘是通过分析海量的数据,从中找出潜在的、新颖的、有价值的信息的技术在很多领域都有重要的应用。对于如此海量的数据,首要任务是对其进行合理的分类。聚类分析是将数据集合分组为由类似的对象组成的多个类的分析过程,每个簇中的对象具有很大的相似性。因而聚类分析在数据挖掘中具有关键作用。K均值算法是经典的基于划分的聚类方法,特点是算法简单,能够快速聚类。并行计算是解决海量计算难题的有效的途径之一。图形处理器的发展和CUDA语言的不断完善为开发人员提供良好的并行运算平台。本文首先分析了目前聚类分析的现状和串行K均值算法的不足。根据串行K均值算 法的特点,提出一种基于图形处理器的并行执行的K均值算法。本文将算法分为三个部分,将计算量最大的第二部分放到图形处理器中进行运算,以达到快速聚类的目的。进一步根据图形处理器的存储器模型和CUDA代码优化的原则,对并行K均值算法进行了优化,将重点放在合并访问和共享存储器方面。首先使用模拟数据对平台的性能进行测试,得出本实验平台的加速性能。然后采用真实应用数据对本文提出的并行K均值算法和经过优化的算法进行了对比实验,实验结果表明优化后的算法能够提高将近4倍的性能。最后使用优化后的并行K均值聚类算法同其他并行K均值算法进行了对比,实验结果表明同其它的K均值算法相比,本文算法能够获得更高的加速性能。本文研究结果表明,基于图形处理器的并行K均值算法能够快速的对海量数据进行聚类,是提高聚类分析运算速度的有效的途径。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 ;谁在掌控游戏灵魂?手机图形芯片的秘密[J];电脑爱好者;2011年02期
2 ;炫彩APU轻巧新秀 索尼VAIO YB15笔记本[J];电脑爱好者;2011年09期
3 ;Apple发布全新iMac[J];现代电视技术;2011年06期
4 刘进锋;郭雷;;CPU与GPU上几种矩阵乘法的比较与分析[J];计算机工程与应用;2011年19期
5 李海峰;;基于GPU的闭合频繁项集挖掘方法[J];计算机工程;2011年14期
6 王朔;刘俊;李润平;;金融领域中的数据挖掘应用探索[J];福建电脑;2011年07期
7 张祥;石广田;;基于聚类优化的支持QOS语义web服务发现框架研究[J];硅谷;2011年17期
8 冯娜;;基于GPU的档案数据库应用研究[J];武汉理工大学学报;2011年06期
9 吴谋硕;;基于用户信息的信息检索效果提高策略[J];电脑知识与技术;2011年21期
10 ;AMD将为Win 8平板电脑推出耗电量2瓦Hondo芯片[J];中国集成电路;2011年08期
11 颜子夜;陆耀;李建武;马跃;;一种基于核主成分分析的图像超分辨率算法[J];山东大学学报(工学版);2011年04期
12 畅春华;赵汗青;秦博;;基于激光雷达的移动机器人实时位姿估计算法[J];装甲兵工程学院学报;2011年04期
13 潘鸿飞;梁栋;陈军宁;唐俊;王年;杨海蓉;;基于谱图理论的形状聚类仿真(英文)[J];系统仿真学报;2011年07期
14 李优;;Web搜索结果组织与展示的一种机制[J];信息安全与技术;2011年06期
15 戴菲;;数据挖掘技术在电子商务中的应用[J];电脑知识与技术;2011年21期
16 杨东风;;基于多兴趣度的图书借阅推荐系统研究与设计[J];信息技术;2011年07期
17 刘衍民;牛奔;赵庆祯;;基于均匀设计的聚类多目标粒子群优化算法[J];计算机工程;2011年14期
18 汪荣峰;廖学军;;大尺度空间场景可视化中浮点精度问题研究[J];计算机工程;2011年16期
19 孙达辰;孙迎燕;周广群;;基于边缘算子的有效子序列分割方法[J];计算机与现代化;2011年07期
20 赵相坤;李凤霞;战守义;;基于GPU的面向SPH流体模拟的邻居查找算法[J];华南理工大学学报(自然科学版);2011年07期
中国重要会议论文全文数据库 前10条
1 武森;金海燕;高学东;;数据挖掘中CABOSFV聚类算法的实现与应用[A];全国第八届工业工程与企业信息化学术会议论文集[C];2004年
2 杜方键;杨宏晖;;K均值聚类优化集成学习[A];2011'中国西部声学学术交流会论文集[C];2011年
3 穆向禹;浦剑涛;张树武;徐波;;基于状态子空间聚类的多层MLLR自适应算法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
4 饶鲜;李斌;杨绍全;;用核聚类法进行异常检测[A];信号与信息处理技术第三届信号与信息处理全国联合学术会议论文集[C];2004年
5 杨广林;赵云峰;王书理;;Gabor滤波器及其在图像特征提取方面的优化算法[A];2005年中国智能自动化会议论文集[C];2005年
6 冯又层;蔡勖;;基于自组织特征映射的证券市场聚类[A];第二届全国复杂动态网络学术论坛论文集[C];2005年
7 张刚;刘悦;;基于查询空间的分布式文档集合划分算法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
8 文健;李舟军;;基于聚类语言模型的生物文献检索技术研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
9 高阳;赵瑞娜;赵志强;阿杉;;基于自组织特征映射网络的全国地级市城市地价区域分类研究[A];地理学与生态文明建设——中国地理学会2008年学术年会论文摘要集[C];2008年
10 刘哲;唐雁;陈强;;三维模型有意义分割技术现状及应用[A];2008年计算机应用技术交流会论文集[C];2008年
中国博士学位论文全文数据库 前10条
1 陈毅恒;文本检索结果聚类及类别标签抽取技术研究[D];哈尔滨工业大学;2010年
2 朱玥;Tile-Based图形处理方法及高质量图形算法设计[D];中国科学技术大学;2012年
3 马赓宇;基于HMM的时间序列聚类与识别[D];清华大学;2004年
4 蔡维玲;基于聚类的图像分割和分类器设计的研究[D];南京航空航天大学;2008年
5 张伟;基于WWW的聚类引擎研究[D];重庆大学;2003年
6 雷景生;神经网络的分类、聚类功能及其规则抽取研究[D];新疆大学;2003年
7 夏健明;基于图形处理器的大规模结构计算研究[D];华南理工大学;2009年
8 钱晓东;基于神经网络等技术的数据与文本聚分类研究[D];天津大学;2005年
9 王明春;基于粗糙集的数据及文本挖掘方法研究[D];天津大学;2005年
10 曹锋;数据流聚类分析算法[D];复旦大学;2006年
中国硕士学位论文全文数据库 前10条
1 赵新萌;基于图形处理器的K均值算法研究[D];吉林大学;2012年
2 王斌;双层数据流聚类框架的设计与实现[D];吉林大学;2004年
3 蔡博文;高维数据集中离群数据挖掘方法的研究[D];合肥工业大学;2006年
4 刘晓燕;基于聚类的入侵检测系统研究[D];青岛大学;2006年
5 于世东;多维数据可视化技术的研究及应用[D];沈阳工业大学;2006年
6 戴金;改进K-MEANS算法及在Ⅰ型糖尿病血糖值的聚类应用[D];北京交通大学;2011年
7 孙会岭;移动环境中基于聚类的个性化推荐算法研究[D];燕山大学;2011年
8 郑国荣;基于电信CRM系统的客户消费模式研究[D];重庆大学;2005年
9 王清江;基于力学的聚类算法[D];大连理工大学;2006年
10 张锦;关于一种混合式入侵检测系统的研究与设计[D];沈阳工业大学;2006年
中国重要报纸全文数据库 前10条
1 ;NEC图形处理器每秒运行50.2G条指令[N];计算机世界;2003年
2 乐山 乐水;图形处理技术的全球专利布局形势[N];中国知识产权报;2010年
3 游讯;图形处理器GPU[N];人民邮电;2011年
4 王云鹤 熊立;武汉电信直销中心剑指聚类市场[N];人民邮电;2009年
5 记者 肖卓;聚类市场:想挖金矿不容易[N];人民邮电;2009年
6 张秋;突破聚类市场的信息化盲区[N];中国计算机报;2007年
7 乐天 编译;混合CPU更节能[N];计算机世界;2009年
8 谢征;苹果新款iMac采用NVIDIA技术[N];中国计算机报;2002年
9 本报记者 霍光;DX11助推GPU进一步革新[N];中国计算机报;2009年
10 本报记者 张学琦;CPU+GPU引领未来HPC架构[N];中国电子报;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978