收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于WEB日志的用户画像及可视化分析

王菊艳  
【摘要】:随着互联网产业的蓬勃发展,用户对网站建设提出了更高的要求.然而,经常因为网站设计给用户操作带来不便,致使用户体验变差,最终铮致客户流失,软件生命周期变短。若要设计出高质量使用户满意的软件,就需要根据用户的真实行为反馈,了解用户的行为习惯,有针对性的对网站进行优化设计。本文以教育统计平台为研究背景,针对网站设计中存在的功能展示不明确、组织结构混乱等问题,提出了构雄用户画像的方法。根据画像结果为设计者提供建议,解决网站设计中存在的问题,优化设计,提高用户体验。主要研究如下:(1)用户行为的建模。本文使用序列模式挖掘方法中的PrefixSpan算法对用户的行为轨迹进行挖掘。由于该算法在构造投影数据库时要占用大量的时间和空间,因此本文针对以上缺陷设计了PW算法,该算法增加了支持度和页面权重的双重过滤。经实验验证,PW算法在时间效率和精确率上优于PrefixSpan算法。(2)标签权重的计算。在序列模式算法挖掘出用户行为后,将实验结果保存到文本中作为标签权重算法的输入。本文对计算标签权重的TF-IDF和BM25算法的精确率、召回率和F1值进行对比分析,实验结果表明,BM25算法的综合性能优于TF-IDF算法。(3)多维度用户画像标签体系的构建,本文从用户基本属性、设备属性、地理属性、行为属性、隐含属性五个维度来刻画用户画像。其中,基本属性、设备属性、地理属性是对原始数据的统计分析得到的事实标签:行为属性是对用户行为建模井计算行为标签权重得到的模型标签;隐含属性是对用户上线情况进行分析得到的预测标签。(4)用户画像应用系统的搭建。设计系统的数据库和功能:该系统分为用户基本属性画像、活跃信息画像、用户行为画像、地理分布画像四个主要功能模块:将教育统计平台的用户画像结果在该应用系统上进行可视化展示。本文将用户画像技术引用到网站优化中,从多个维度构建了教育统计平台用户画像的标签体系,切实反映出了用户的真实行为习惯。将用户画像结果应用于教育统袄计平台网站的优化设计中,可以准确地为设计者传达用户的真实需求,对提高网站的质量具有重大意义。


知网文化
【相似文献】
中国期刊全文数据库 前15条
1 满欣;陈华辉;;序列模式中的生成序列模式挖掘综述[J];无线通信技术;2018年04期
2 仝瑶;;增量序列模式挖掘研究进展[J];网络安全技术与应用;2017年01期
3 苗雪连;;间隙约束序列模式挖掘的对比研究[J];网络安全技术与应用;2017年02期
4 张亮;赵娜;;序列模式挖掘两种典型算法的研究[J];信息技术;2016年11期
5 谢飞;强继朋;;满足非重叠条件的带有通配符序列模式挖掘[J];小型微型计算机系统;2017年05期
6 陈湘涛;肖碧文;;基于位置信息的显露序列模式挖掘研究[J];计算机科学;2017年07期
7 林颖;;负序列模式挖掘研究[J];廊坊师范学院学报(自然科学版);2015年03期
8 邹妍;刘燕;;多维序列模式挖掘算法分析[J];赤峰学院学报(自然科学版);2014年07期
9 陈春颖;熊拥军;;基于序列模式挖掘的读者借阅行为分析[J];图书情报知识;2011年04期
10 陈卓;杨炳儒;宋威;宋泽锋;;序列模式挖掘综述[J];计算机应用研究;2008年07期
11 赵华;宋顺林;;改进的序列模式挖掘算法在交叉营销中的应用[J];计算机工程与设计;2007年05期
12 姜晚云;胡学钢;;序列模式挖掘及其算法的研究[J];科技经济市场;2006年01期
13 端义锋,胡谷雨,丁力;序列模式挖掘在网络告警分析中的应用[J];北京邮电大学学报;2004年S2期
14 周斌,吴泉源;序列模式挖掘的一种渐进算法[J];计算机学报;1999年08期
15 李涛;张帅弛;张灿;;一种最有趣的序列模式挖掘算法[J];计算机仿真;2019年04期
中国重要会议论文全文数据库 前10条
1 朱辉生;李存华;;序列模式挖掘的研究与实现[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
2 程银波;司菁菁;;带有间隔约束的序列模式挖掘算法[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
3 李晟;姜青山;郭顺;王备战;;一种优化的蛋白质序列模式挖掘方法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
4 端义锋;胡谷雨;丁力;;序列模式挖掘在网络告警分析中的应用[A];2004年全国通信软件学术会议论文集[C];2004年
5 姚伟力;王锡禄;宋俊德;;基于序列模式挖掘的告警相关性分析算法[A];2005年信息与通信领域博士后学术会议论文集[C];2005年
6 李润恒;贾焰;金鑫;;一种面向网络安全的序列模式挖掘方法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
7 张锐;熊赟;陈越;朱扬勇;;MS-BioSM:一个基于多支持度生物序列模式挖掘算法[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
8 任家东;解玉洁;何海涛;张爱国;;基于改进前缀树PStree的最大序列模式挖掘[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
9 赵桦;曲飞;;序列模式挖掘算法在Web挖掘上的应用[A];全国第十届企业信息化与工业工程学术年会论文集[C];2006年
10 赵畅;杨冬青;唐世渭;郭迎春;;Web日志序列模式挖掘工具SPMiner的设计[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
中国博士学位论文全文数据库 前10条
1 付宇;面向移动互联网的网络管理若干关键技术的研究[D];北京邮电大学;2015年
2 陆介平;描述性规则挖掘若干关键技术研究[D];东南大学;2006年
3 徐前方;基于数据挖掘的网络故障告警相关性研究[D];北京邮电大学;2007年
4 金阳;基于概念格模型的序列模式挖掘算法研究[D];吉林大学;2007年
5 熊赟;生物序列模式挖掘与聚类研究[D];复旦大学;2007年
6 刘维;生物序列模式挖掘与识别算法的研究[D];南京航空航天大学;2010年
7 贾哲;分布式环境中信息挖掘与隐私保护相关技术研究[D];北京邮电大学;2012年
8 叶红云;面向金融营销问题的个性化推荐方法研究[D];合肥工业大学;2011年
9 谢飞;带有通配符的序列模式挖掘研究[D];合肥工业大学;2011年
10 陈静玉;面向不确定数据流的聚类和模式挖掘技术研究[D];西安电子科技大学;2014年
中国硕士学位论文全文数据库 前10条
1 王菊艳;基于WEB日志的用户画像及可视化分析[D];西安理工大学;2019年
2 郭景怡;iOS应用场景API序列模式挖掘技术的研究与实现[D];北京邮电大学;2019年
3 荣柯柯;基于MapReduce的高效用序列模式挖掘算法研究[D];北方工业大学;2019年
4 肖碧文;带有位置信息的显露序列模式挖掘算法研究[D];湖南大学;2016年
5 张杰雄;高效用序列模式挖掘技术的研究[D];哈尔滨工业大学;2018年
6 张朝阳;面向群组服务的替换方法研究[D];南京邮电大学;2018年
7 仝瑶;无重叠条件下的间隙约束序列模式挖掘[D];河北工业大学;2016年
8 苗雪连;间隙约束序列模式挖掘的对比研究[D];河北工业大学;2016年
9 吴思尧;基于Spark的GSP算法并行化研究[D];华中科技大学;2017年
10 孙慧;Web日志攻击序列模式挖掘的研究[D];湖南大学;2016年
中国重要报纸全文数据库 前1条
1 首都师范大学政法学院 史红;大数据促进美学研究发展[N];中国社会科学报;2018年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978