收藏本站
《扬州大学》 2008年
收藏 | 手机打开
二维码
手机客户端打开本文

基于聚类的用户特征分析

何堃  
【摘要】: 在信息时代,传统的管理思想已经显得力不从心,企业的宗旨正在经历着由“以产品为中心”向“以客户为中心”的转变。通过用户特征分析,企业可以更好地理解用户,发现用户的行为规律。基于这些理解和规律,市场专家可以制定相应的市场策略,同时还可以针对不同用户组进行交叉分析,帮助企业发现用户群体间的变化规律。用户特征分析背后的思想是找到一组和某一个特定的用户在很多方面都相似的用户群。基于这种思想,可以利用数据挖掘中的聚类分析技术来实现用户特征分析。聚类分析是一种重要的人类行为,已经广泛地应用在许多领域中,包括模式识别、数据分析、图像处理,以及市场研究。另一个方面,随着web2.0的兴起和迅速发展,又出现了大量新兴的网络应用技术,如社会化标签。利用这些新的技术,可以很好地辅助聚类分析技术,从而对网络用户的特征进行挖掘和分析。本文以用户特征分析为目的,以聚类分析技术为手段,以社会化标签为辅助,对基于聚类的用户特征分析展开了研究。 本文的具体工作包括以下几个方面: (1)基于状态信息的蚁群聚类算法。根据已有的蚁群聚类算法存在的空间和时间上的一些缺点,提出了一种新的基于状态信息的蚁群聚类算法SI-ACC,通过引入蚂蚁的状态信息,以及蚂蚁的行为模式和感觉阈限等概念,改善了算法的质量和自适应程度。 (2)基于蚁群聚类的用户特征分析。利用SI-ACC算法对真实的申请银行信用卡的客户数据进行了聚类分析。算法成功地将客户聚成了不同的几个类,通过进一步的分析得出了每一类客户的特征,为银行发放信用卡和对客户进行价值和风险评估提供了决策支持。 (3)基于社会化标签的单个用户的兴趣特征分析。针对web2.0中用户的兴趣属性,提出了一种基于标签组的用户兴趣标签图的建立和更新算法TC-Graph,该算法综合了质朴的方法和共存的方法各自的优点,并在计算图中结点和边的权重方面进行了改进和创新。通过该算法,较好地以兴趣标签图和有序标签组的形式反映了单个用户的兴趣特征。 (4)基于社会化标签的群体用户的兴趣特征分析。为了计算用户之间兴趣的相似性,在用户兴趣标签图的基础上,提出了一种基于用户兴趣标签图的距离计算方法TC-G-D。该算法把用户的有序的兴趣标签组作为一种新的混合型数据来考虑,提出了对应距离和交叉距离的概念,并把两者综合起来衡量用户间的兴趣相似度,然后运用已有的基于距离的聚类算法对用户进行聚类分析。
【学位授予单位】:扬州大学
【学位级别】:硕士
【学位授予年份】:2008
【分类号】:TP399-C2

手机知网App
【引证文献】
中国硕士学位论文全文数据库 前5条
1 付双胜;基于聚类算法的异常入侵检测方法的研究[D];长春工业大学;2011年
2 李滨;移动2.0下的电信产业链变革研究[D];北京邮电大学;2009年
3 王红磊;基于社会性标签的相似学习伙伴推荐系统设计与开发[D];华东师范大学;2010年
4 廖康丽;面向概率数据流的聚类技术研究[D];宁波大学;2012年
5 许明;基于负荷特性分析的错峰方案研究[D];华南理工大学;2012年
【参考文献】
中国期刊全文数据库 前10条
1 覃正,陈昆玉;管理行为中的距离难题及距离管理思维[J];管理工程学报;2004年03期
2 张建华;赵东东;江贺;张宪超;;一种基于信息素的蚁群聚类算法[J];计算机工程与应用;2006年20期
3 陈栋;刘兵;徐洁磐;;KDD研究现状及发展[J];计算机科学;1996年06期
4 吴斌,郑毅,傅伟鹏,史忠植;一种基于群体智能的客户行为分析算法[J];计算机学报;2003年08期
5 翁怀荣,张洪伟,钟响,陈维静;基于改进蚁群算法的聚类分析及其在HRM中的应用[J];计算机应用;2005年08期
6 王知津;宋正凯;;Web 2.0的特色及其对网络信息交流的影响[J];新世纪图书馆;2006年03期
7 周燕,蔡之华;CRM中数据挖掘技术应用概述[J];计算机与现代化;2003年07期
8 周宇,张森,蔡霞;面向E-CRM的数据挖掘技术应用[J];控制工程;2003年03期
9 李斌,郭剑毅;聚类分析在客户关系管理中的研究与应用[J];计算机工程与设计;2005年02期
10 吴志鸿;数据挖掘技术在CRM中的应用[J];现代情报;2003年07期
【共引文献】
中国期刊全文数据库 前10条
1 宁丹;刘鸿雁;;基于模糊聚类的物流数据字典动态分级方法[J];鞍山科技大学学报;2007年03期
2 张红云,马垣;数据挖掘与决策支持系统的关系[J];鞍山师范学院学报;2001年03期
3 王思昌;冀亚林;;基于数据仓库的装备采购管理信息系统[J];兵工自动化;2005年05期
4 孙勇;李妮;龚光红;韩亮;;基于知识库的动态蚁群算法[J];北京工业大学学报;2012年03期
5 陈云飞,刘玉树,钱越英,赵基海;一种基于密度的启发性群体智能聚类算法[J];北京理工大学学报;2005年01期
6 李静;刘春茂;;基于Web2.0的高校图书馆学术信息服务模式的探索[J];图书与情报;2007年05期
7 林蓓,李春梅,李秉智;七号信令集中监测系统中的数据管理系统[J];重庆邮电学院学报(自然科学版);2003年04期
8 李泽海,孙吉贵,赵君;商业智能技术及行业应用分析[J];吉林大学学报(信息科学版);2003年01期
9 王乐乐;;决策树在网上销售中的挖掘研究[J];长春大学学报;2009年04期
10 张彩虹,王春才,颜雁;医保决策支持系统中的聚类算法[J];长春理工大学学报;2004年04期
中国重要会议论文全文数据库 前6条
1 付森;;数据仓库技术在财务综合指标分析中的应用研究[A];全国第九届企业信息化与工业工程学术会议论文集[C];2005年
2 刘心报;叶强;;基于模块设计的蚁群算法研究综述[A];'2008系统仿真技术及其应用学术会议论文集[C];2008年
3 张思源;;Web2.0环境下网络信息资源配置初探[A];信息资源配置理论与模型研究——2009信息化与信息资源管理学术研讨会专集[C];2009年
4 叶晓曦;;多态蚁群聚类算法[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
5 刘伟宏;李晋晋;徐洁磐;;通用数据库知识发现系统KNIGHT[A];第十五届全国数据库学术会议论文集[C];1998年
6 王春才;陈宏升;张彩虹;;规划免疫决策支持系统中的算法研究[A];增强自主创新能力促进吉林经济发展——启明杯·吉林省第四届科学技术学术年会论文集(上册)[C];2006年
中国博士学位论文全文数据库 前10条
1 曲建华;基于群体智能的聚类分析[D];山东师范大学;2010年
2 沈巍;建立股指波动预测模型的方法研究及应用[D];华北电力大学(北京);2011年
3 周海燕;网络经济的信息空间理论分析[D];中国科学技术大学;2011年
4 任炳昱;高拱坝施工实时控制理论与关键技术研究[D];天津大学;2010年
5 方兆宝;基于空间数据挖掘的MCSs时空演变规律研究[D];中国矿业大学(北京);2004年
6 陈晓冬;基于交通流理论的高速公路安全预警系统关键技术研究[D];吉林大学;2011年
7 王翔;混合蚁群算法及其在管理优化中的应用[D];东华大学;2012年
8 柴毅;智能化汽车主动安全系统研究[D];重庆大学;2001年
9 张小刚;关联规则挖掘及其在复杂工业过程控制中的应用研究[D];湖南大学;2002年
10 戴超凡;数据仓库中数据志跟踪的理论与方法研究[D];中国人民解放军国防科学技术大学;2002年
中国硕士学位论文全文数据库 前10条
1 齐静;数据挖掘在煤炭企业人力资源管理系统中的应用[D];山东科技大学;2010年
2 周霞;基于粗糙集的电子商务交易知识获取研究[D];哈尔滨工程大学;2010年
3 王琳;支持向量机及相关理论研究[D];辽宁师范大学;2010年
4 李森森;高校图书馆学科化联合信息服务体系研究[D];辽宁师范大学;2010年
5 刘芳;改进的蚁群聚类算法在森林火灾预测中的应用研究[D];辽宁工程技术大学;2009年
6 司蕊;多目标优化问题的改进蚁群算法研究[D];辽宁工程技术大学;2009年
7 肖晴;基于数据仓库的高速公路信息管理系统的研究[D];长沙理工大学;2010年
8 黄学辉;数据挖掘分类技术在企业人才招聘中的应用研究[D];中国海洋大学;2010年
9 刘亚军;基于DFL的人力资源评估模型及其应用[D];苏州大学;2010年
10 张峰;基于数据挖掘技术的教学管理应用研究[D];合肥工业大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 蒋国俊,蒋明新;产业链理论及其稳定机制研究[J];重庆大学学报(社会科学版);2004年01期
2 张鸿;韩黛娜;李娟;;电信产业价值链演变路径研究[J];财经论丛;2008年01期
3 钟焯荣;曾鸣;何斌斌;徐春笙;李涛;张波;;互联网模式WEB2.0的分析与研究[J];重庆科技学院学报(自然科学版);2007年01期
4 廖向旗;李欣然;李培强;李村晓;胡剑宇;;基于灰色关联聚类的负荷特性分类[J];电力科学与技术学报;2007年02期
5 芮明杰;刘明宇;;产业链整合理论述评[J];产业经济研究;2006年03期
6 陈亚红,穆钢,段方丽;短期电力负荷预报中几种异常数据的处理[J];东北电力学院学报;2002年02期
7 潘成云;解读产业价值链——兼析我国新兴产业价值链基本特征[J];当代财经;2001年09期
8 王萍;;基于自由分类法的elearning标签研究[J];中国远程教育;2008年10期
9 李俭,孙才新,陈伟根,陈国庆,崔雪梅;基于灰色聚类分析的充油电力变压器绝缘故障诊断的研究[J];电工技术学报;2002年04期
10 李心芹,李仕明,兰永;产业链结构类型研究[J];电子科技大学学报(社科版);2004年04期
中国博士学位论文全文数据库 前1条
1 刘贵富;产业链基本理论研究[D];吉林大学;2006年
中国硕士学位论文全文数据库 前10条
1 冯晓蒲;基于实际负荷曲线的电力用户分类技术研究[D];华北电力大学;2011年
2 赵慧敏;基于粗集理论的模糊规则自动生成方法研究[D];大连铁道学院;2002年
3 戴琦;电力系统分行业负荷构成建模研究[D];河海大学;2005年
4 孙晓霞;聚类分析在客户细分领域的应用研究[D];西北大学;2006年
5 郭志英;基于电信移动增值业务产业链的CP与SP战略竞合发展研究[D];吉林大学;2006年
6 陈衡岳;聚类分析及聚类结果评估算法研究[D];东北大学;2006年
7 丁继承;基于聚类分析的电信客户细分系统研究与设计[D];哈尔滨工业大学;2006年
8 王飞;基于聚类算法的入侵检测的研究[D];南京理工大学;2006年
9 李建国;基于数据挖掘技术的混合入侵检测技术研究[D];合肥工业大学;2006年
10 李娜;基于聚类的网络入侵检测方法研究[D];广西大学;2007年
【二级引证文献】
中国重要会议论文全文数据库 前1条
1 戴蕾;舒华英;;中国物联网产业链浅析[A];两化融合与物联网发展学术研讨会论文集[C];2010年
中国硕士学位论文全文数据库 前2条
1 王金星;中国移动手机现场支付业务优化研究[D];吉林大学;2010年
2 王博;基于顾客满意的电信产业链共赢机制研究[D];电子科技大学;2012年
【二级参考文献】
中国期刊全文数据库 前10条
1 郝先臣,张德干,高光来,赵海;数据挖掘工具和应用中的问题[J];东北大学学报;2001年02期
2 张素兵,吕国英,刘泽民,周正;基于蚂蚁算法的QoS路由调度方法[J];电路与系统学报;2000年01期
3 刘会霞;数据挖掘在CRM中的核心作用[J];互联网周刊;2002年05期
4 吴庆洪,张纪会,徐心和;具有变异特征的蚁群算法[J];计算机研究与发展;1999年10期
5 周傲英;邱越峰;田增平;施伯乐;;数据库技术:回顾与展望[J];计算机科学;1999年04期
6 唐林燕;数据仓库和数据挖掘技术在ERP中的应用[J];计算机工程;2002年06期
7 吴斌,史忠植;一种基于蚁群算法的TSP问题分段求解算法[J];计算机学报;2001年12期
8 吴斌,郑毅,傅伟鹏,史忠植;一种基于群体智能的客户行为分析算法[J];计算机学报;2003年08期
9 梁剑,李晓,刘红铄,胡彬华;智能化数据挖掘系统的设计与实现[J];计算机应用研究;2002年05期
10 张纪会,高齐圣,徐心和;自适应蚁群算法[J];控制理论与应用;2000年01期
【相似文献】
中国期刊全文数据库 前10条
1 张迎春;陈洁;张晨希;万忠;张燕平;;聚类在股票研究中的应用[J];计算机技术与发展;2006年04期
2 邹翔;岳振军;贾永兴;闵刚;;基于一乘准则的LMR在声音转换中的应用[J];军事通信技术;2008年01期
3 巩玉玺;罗容;;基于deep web数据库的个性化推荐系统[J];煤炭技术;2009年08期
4 朱嵬鹏;王士同;;基于空间模式聚类的彩色图像分割[J];计算机工程与应用;2009年34期
5 欧卫华;;基于重叠度增量的模糊聚类有效性函数[J];计算技术与自动化;2009年04期
6 周世兵;徐振源;唐旭清;;K-means算法最佳聚类数确定方法[J];计算机应用;2010年08期
7 刘燕驰;高学东;国宏伟;武森;;聚类有效性的组合评价方法[J];计算机工程与应用;2011年19期
8 耿新青;王正欧;;TGFCM:基于模糊聚类的中文文本挖掘的新方法[J];计算机工程;2006年05期
9 唐西西;;一种新的混合遗传聚类算法[J];广西工学院学报;2006年03期
10 肖小玲;李腊元;张翔;;提高支持向量机训练速度的CM-SVM方法[J];计算机工程与设计;2006年22期
中国重要会议论文全文数据库 前10条
1 高翠芳;吴小俊;;基于二阶差分的聚类数自动确定方法[A];江苏省系统工程学会第十一届学术年会论文集[C];2009年
2 杨青;刘晔;张东旭;刘畅;;快速查找最优初始聚类数K的改进K-means算法[A];中国自动化学会控制理论专业委员会A卷[C];2011年
3 于剑;;聚类有效性与聚类算法的稳定性[A];2003年中国智能自动化会议论文集(下册)[C];2003年
4 左旺孟;朱颢;李乃民;李剑峰;张宏志;;基于流形学习的舌色分析与聚类研究[A];第四次全国中西医结合诊断学术研讨会论文集[C];2010年
5 蔡军;袁华鹏;陈金海;施伯乐;;一种基于相似性分析的聚类新算法:PDS算法[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
6 饶金通;董槐林;姜青山;;基于孤立因子的层次聚类算法与应用[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
7 孙长银;李林峰;;基于模糊聚类方法的T-S模糊系统[A];2006中国控制与决策学术年会论文集[C];2006年
8 张勇斌;梁荣华;马杰;马玉书;;神经网络数据挖掘聚类优化算法[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
9 付振中;赵合计;董玉振;;基于HSL颜色空间的模糊C均值彩色图像分割方法[A];第三届和谐人机环境联合学术会议(HHME2007)论文集[C];2007年
10 刘洋;江志纲;丁增喜;王大玲;鲍玉斌;于戈;;一种基于图的聚类算法GB-Cluster[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
中国博士学位论文全文数据库 前10条
1 宗瑜;聚类质量改进方法的研究[D];大连理工大学;2010年
2 王纵虎;聚类分析优化关键技术研究[D];西安电子科技大学;2012年
3 曲建华;基于群体智能的聚类分析[D];山东师范大学;2010年
4 于秀娟;加工过程的质量异常预测与诊断方法研究[D];吉林大学;2011年
5 邱浪波;基因芯片表达数据分析相关问题研究[D];国防科学技术大学;2007年
6 延皓;基于流量监测的网络用户行为分析[D];北京邮电大学;2011年
7 延皓;基于流量监测的网络用户行为分析[D];北京邮电大学;2011年
8 李艳灵;基于聚类的图像分割算法研究[D];华中科技大学;2009年
9 陈伟;群体智能算法及其在基因表达数据聚类中的应用[D];江南大学;2011年
10 覃桂敏;复杂网络模式挖掘算法研究[D];西安电子科技大学;2012年
中国硕士学位论文全文数据库 前10条
1 陈奇明;基于投票策略聚类融合算法的研究和实现[D];安徽工业大学;2010年
2 张丽;基于智能算法的DNA聚类研究及应用[D];山东师范大学;2010年
3 张雪;可能性聚类有效性评价研究[D];哈尔滨理工大学;2014年
4 乐华;谱方法和信息熵在聚类中的应用[D];浙江大学;2014年
5 赵兴旺;基于信息熵的聚类个数确定方法研究[D];山西大学;2011年
6 王斐;云搜索中的搜索结果聚类技术研究[D];北京邮电大学;2013年
7 查丰;引力聚类及其应用研究[D];安徽大学;2011年
8 杨凌;聚类分析中聚类数的确定问题[D];武汉科技大学;2001年
9 吴爽;基于群智能机理的PPI网络功能模块聚类[D];陕西师范大学;2012年
10 陈爱平;基于Hadoop的聚类算法并行化分析及应用研究[D];电子科技大学;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026