收藏本站
《河海大学》 2006年
收藏 | 手机打开
二维码
手机客户端打开本文

基于模式相似的子空间聚类算法研究

王煜  
【摘要】:聚类分析是数据挖掘研究中最活跃的领域之一,用于将数据对象分组为多个类或簇,使得簇内对象尽可能相似而簇间对象尽可能相异。广泛用在模式识别、数据分折、图象处理、推荐系统以及电子商务等领域中。 本文首先对聚类算法进行了分类、综述和对比。传统聚类算法在低维空间中能够有效地进行聚类,但在高维数据集中,由于其数据的稀疏性,距离的相似性以及存在大量孤立点,使得传统聚类处理的效率和效果都不理想。对高维数据,一般采用特征转换(维度简约)和子空间聚类(维度选择)来解决这个问题。本文第二章对目前提出的子空间聚类算法作出了系统阐述,并分析比较它们各自的优缺点。 基于模式相似的聚类算法pCluster是子空间聚类的一种,与基于距离的聚类模型不同的是,在pCluster模型中,如果两个对象的属性在属性的某个子集上的趋势(模式)表现出一致性,则可判定这两个对象也相似。pCluster算法的主要目的就是发现对象之间这种模式上的相似性。本文第三章分析和实现了该算法,并针对其局限性提出了改进算法。改进算法采用对象块上的MCAS(最大相关属性集,Maximum Coherent Attribute Sets)剪枝代替原算法中的对称MCAS剪枝,合并对象产生聚类时,枚举各前缀树分枝上的属性对,并计算它们在对象集上MCOS(最大相关对象集,Maximum Coherent Object Sets)的交集。实验表明,改进算法的效率和空间开销都较原算法稍优,结果也更加准确。 本文设计了一个基于pCluster改进算法的推荐原型系统,同时验证了算法的可行性。
【学位授予单位】:河海大学
【学位级别】:硕士
【学位授予年份】:2006
【分类号】:TP311.13

手机知网App
【共引文献】
中国期刊全文数据库 前10条
1 秦洪英;数据挖掘在网络业务流设计中的实现过程[J];阿坝师范高等专科学校学报;2005年03期
2 谢涛,蒋泽中;边坡系统稳定性多模型综合评价[J];四川建筑科学研究;2004年02期
3 黄晓晖,周旭;高校档案工作者思想政治素质评价体系[J];安徽电气工程职业技术学院学报;2005年01期
4 华文立;胡学刚;;平衡决策树分类精度与规则简易性研究[J];安徽电子信息职业技术学院学报;2006年04期
5 孙全玲;基于粗集和神经网络的建模方法研究[J];安徽建筑工业学院学报(自然科学版);2005年02期
6 孙虹;方敏;;基于Rough集和RBF网络的车牌字符识别方法[J];安徽建筑工业学院学报(自然科学版);2006年04期
7 方惠敏;张守涛;丁文珂;;基于BP神经网络的玉米区试产量预测研究[J];安徽农业科学;2007年34期
8 吴金华;戴淼;尹剑;;基于遗传神经网络的陕西省土地利用结构模型研究[J];安徽农业科学;2008年36期
9 陈绘画;朱寿燕;周泽华;;基于遗传神经网络混合模型预测马尾松毛虫发生量的研究[J];安徽农业科学;2009年12期
10 孔维华;;基于粗集的土地定级因素权重确定方法研究[J];安徽农业科学;2009年15期
中国重要会议论文全文数据库 前10条
1 赵金帅;;基于遗传算法和L滤波的混合噪声滤波算法[A];第三届全国压电和声波理论及器件技术研讨会论文集[C];2008年
2 李石华;金宝轩;;基于Matlab的自组织神经网络在地形复杂区遥感图像分类中的应用研究[A];第二届“测绘科学前沿技术论坛”论文精选[C];2008年
3 刘扬;曹惠玲;梁大敏;;关联规则挖掘在航空发动机QAR数据中的应用[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
4 胡海洋;绪梅;;基于FPGA的遗传算法在核爆监测中的应用[A];第十四届全国核电子学与核探测技术学术年会论文集(下册)[C];2008年
5 张敏;陆向艳;周敏;潘林琳;农冬冬;王彬彬;陈晓江;;数据挖掘在智能题库系统中的应用[A];广西计算机学会2004年学术年会论文集[C];2004年
6 舒辉;文劲宇;曹一家;罗春风;王大光;宋福海;;基于改进遗传算法的发电机励磁系统参数辨识[A];湖北省电工技术学会2004年学术年会论文集[C];2004年
7 胡海洋;绪梅;;基于FPGA的遗传算法在核爆监测中的应用[A];第十四届全国核电子学与核探测技术学术年会论文集(2)[C];2008年
8 刘维东;陈德春;王志平;;基本遗传算法在围海规划中的应用研究[A];第十二届中国海岸工程学术讨论会论文集[C];2005年
9 潘登;郑应平;;铁路客运座席复用技术与销售策略的研究[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
10 郑日荣;毛宗源;谭洪舟;;基于欧氏距离和精英交叉的免疫算法参数研究[A];第二十四届中国控制会议论文集(下册)[C];2005年
中国博士学位论文全文数据库 前10条
1 张杏莉;几何约束求解关键问题研究[D];山东科技大学;2010年
2 樊建聪;分布估计学习算法研究[D];山东科技大学;2010年
3 戴运桃;粒子群优化算法研究及其在船舶运动参数辨识中的应用[D];哈尔滨工程大学;2010年
4 冯麟涵;舰船系统抗冲击性能全局优化方法研究[D];哈尔滨工程大学;2009年
5 时长江;豆科类杂草种子图像识别系统研究[D];中国海洋大学;2009年
6 段志东;基于广义模块化设计的快锻液压机机架力学特性研究[D];兰州大学;2010年
7 何英;干旱区典型流域水资源优化配置研究[D];新疆农业大学;2010年
8 杨红;污水生化处理的智能建模与优化控制策略应用研究[D];华南理工大学;2010年
9 孔令启;基于内外圈协同优化策略的间歇化工过程不确定性调度研究[D];华南理工大学;2010年
10 高山;蛋白质点突变效果预测与突变数据库研究[D];南开大学;2010年
中国硕士学位论文全文数据库 前10条
1 王浩锋;基于BP神经网络的航段安全评估研究[D];中国工程物理研究院;2010年
2 代宏伟;布里渊散射水下探测目标的自动识别[D];南昌航空大学;2010年
3 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
4 吴香庭;基于遗传算法的K-means聚类方法的研究[D];山东科技大学;2010年
5 滕景忠;智能瓦斯传感器的研制[D];山东科技大学;2010年
6 陈少华;基于Hopfield神经网络控制系统的研究[D];山东科技大学;2010年
7 韩晓峰;高斯混合模型及在探测网络社区结构中的应用[D];山东科技大学;2010年
8 徐小任;基于BP神经网络的城镇网络地价评估模型研究[D];广西师范学院;2010年
9 程慧;基于神经网络的两类问题研究[D];广西师范学院;2010年
10 杨勇;基于SOA的浙江永康某小家电企业应用系统集成平台开发与应用[D];浙江理工大学;2010年
【相似文献】
中国期刊全文数据库 前10条
1 尹鹏飞;张晓丹;;一种基于简单遗传算法的K-Means改进算法[J];吉首大学学报(自然科学版);2009年06期
2 柴旭光;;基于层次迭代思想的聚类算法的研究[J];邢台职业技术学院学报;2011年01期
3 周晓刚;洪春勇;;蚁群聚类算法在客户分类中的应用[J];计算机与现代化;2007年05期
4 张建萍;刘希玉;;聚类分析在儿童发育时期分析中的应用[J];信息技术与信息化;2005年06期
5 袁宝兰;张万军;张智丰;;随机分类算法的实现及与普通遗传算法的比较[J];杭州电子科技大学学报;2007年02期
6 张恒;刘波;陈颖红;于静;;基于SAS聚类分析的用户类型划分[J];科学咨询(决策管理);2010年04期
7 刘放;叶菲;;改进的聚类分析算法在高校人力资源管理中的应用[J];皖西学院学报;2011年02期
8 彭宏玉;柴旭光;陈晓纪;;基于层次迭代思想的聚类算法的研究[J];唐山学院学报;2011年03期
9 魏丽;;数据挖掘中聚类算法比较研究[J];电脑知识与技术(学术交流);2007年21期
10 罗建平;苏志同;;聚类分析在铝电解槽况判断中的应用[J];现代计算机(专业版);2008年01期
中国重要会议论文全文数据库 前10条
1 楚红涛;寒枫;张燕;王婷;;基于数据流的挖掘研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
2 于健;陈子军;李霞;李炜;;一种新的多密度聚类算法[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
3 潘玉奇;石冰;周劲;袁宁;;基于多维数据模型的聚类分析的研究[A];山东省计算机学会2005年信息技术与信息化研讨会论文集(一)[C];2005年
4 田小丽;郑康锋;钮心忻;;一种基于改进K-Medoids算法的网络攻击检测技术[A];2009通信理论与技术新发展——第十四届全国青年通信学术会议论文集[C];2009年
5 王静;汪晓刚;;一种新的保护原始数据隐私性的聚类算法[A];第十届中国科协年会论文集(三)[C];2008年
6 张昕;彭宏;郑启伦;;基于微粒群算法的聚类分析[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年
7 薛鲁华;张楠;;聚类分析在Web数据挖掘中的应用[A];北京市第十三次统计科学讨论会论文选编[C];2006年
8 刘剑;;基于数据挖掘聚类的节理统计分析方法[A];中国水力发电工程学会第四届地质及勘探专业委员会第一次学术交流会论文集[C];2008年
9 郭学军;陈晓云;;粗集方法在数据挖掘中的应用[A];第十六届全国数据库学术会议论文集[C];1999年
10 岑琴;赵建民;朱信忠;;基于Multi-Agent与数据挖掘的电子商务系统[A];2006年全国理论计算机科学学术年会论文集[C];2006年
中国重要报纸全文数据库 前10条
1 李开宇 黄建军 田长春;把“数据挖掘”作用发挥出来[N];中国国防报;2009年
2 华莱士;“数据挖掘”让银行赢利更多[N];国际金融报;2003年
3 记者 晏燕;数据挖掘让决策者告别“拍脑袋”[N];科技日报;2006年
4 □中国电信股份有限公司北京研究院 张舒博 □北京邮电大学计算机科学与技术学院 牛琨;走出数据挖掘的误区[N];人民邮电;2006年
5 张立明;数据挖掘之道[N];网络世界;2003年
6 中圣信息技术有限公司 李辉;数据挖掘在CRM中的作用[N];中国计算机报;2001年
7 田红生;数据挖掘在CRM中的应用[N];中国经济时报;2002年
8 王广宇;数据挖掘 加速银行CRM一体化[N];中国计算机报;2004年
9 周蓉蓉;数据挖掘需要点想像力[N];计算机世界;2004年
10 张舒博;数据挖掘 提升品牌的好帮手[N];首都建设报;2009年
中国博士学位论文全文数据库 前10条
1 杨小兵;聚类分析中若干关键技术的研究[D];浙江大学;2005年
2 张瑀;基于实验数据挖掘与细胞自动机的结构分析方法[D];哈尔滨工业大学;2010年
3 王川;基因芯片数据管理及数据挖掘[D];中国科学院研究生院(上海生命科学研究院);2004年
4 孙丽;工艺知识管理及其若干关键技术研究[D];大连交通大学;2005年
5 胡志坤;复杂有色金属熔炼过程操作模式智能优化方法研究[D];中南大学;2005年
6 刘革平;基于数据挖掘的远程学习评价研究[D];西南师范大学;2005年
7 刘寨华;基于临床数据分析的病毒性心肌炎证候演变规律研究[D];黑龙江中医药大学;2006年
8 王涛;挖掘序列模式和结构化模式的精简集[D];华中科技大学;2006年
9 郭斯羽;动态数据中的数据挖掘研究[D];浙江大学;2002年
10 李旭升;贝叶斯网络分类模型研究及其在信用评估中的应用[D];西南交通大学;2007年
中国硕士学位论文全文数据库 前10条
1 王煜;基于模式相似的子空间聚类算法研究[D];河海大学;2006年
2 闫妍;子空间聚类改进方法研究[D];大连理工大学;2008年
3 王天真;基于神经网络的智能数据挖掘方法及应用研究[D];上海海事大学;2003年
4 于泓漪;道路交通事故原因的聚类分析[D];吉林大学;2005年
5 侯雪波;关联规则挖掘技术在电力市场营销分析中的应用[D];天津大学;2005年
6 武兆慧;基于遗传算法的聚类方法研究[D];山东师范大学;2006年
7 张兆中;WEB文本挖掘的聚类分析[D];山东科技大学;2005年
8 唐艺军;基于蚁群算法的数据挖掘应用研究[D];辽宁工程技术大学;2007年
9 罗贤缙;聚类分析在电力营销中的应用研究[D];华北电力大学(河北);2005年
10 王石;进化神经网络聚类技术及其在数据挖掘中的应用[D];山东大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026