收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于文本挖掘的用户画像系统的设计与实现

刘星辰  
【摘要】:随着互联网技术的不断发展和普及,网络所产生的信息也在不断激增。海量数据信息的堆积导致有效信息被淹没,不仅让用户难以触达有效信息,也导致企业平台中的价值用户的转化率降低,企业盈利受到影响。因此,构建出能够帮助企业了解用户,定位用户,挖掘用户特征的用户画像系统显得尤为重要。本论文的核心目标是设计并实现一个能够深入挖掘用户兴趣特征,帮助企业定位用户群体的用户画像系统。针对这一目标,本文的主要工作包括:调研当前用户画像的构建方法,了解文本挖掘相关技术的工作原理和实现方法,提出一种针对内容社区平台的用户画像构建方法,设计并实现一个基于文本挖掘的用户画像系统。本文以豆瓣同城网站为数据源,通过分词技术和特征选择等方法完成用户数据的文本预处理;使用LDA主题模型挖掘平台的主题兴趣;结合领域本体方法构建全面细致的分级用户画像标签系统;利用KNN算法,结合多重特征因素,设计并实现为用户匹配标签的方法;使用K-means算法,发现平台中具有相似兴趣特征的用户群体。本文构建的用户画像系统基于Spring MVC和MyBatis的后端框架,实现了业务开发过程的便捷和解耦,前端使用Bootstrap框架和Echarts组件库形成直观简洁的用户画像可视化效果,最终实现了一个能够对用户兴趣进行多方面定位且具有一定准确性的用户画像系统。同时,完成寻找相似兴趣用户的拓展功能,并利用实验验证系统为用户匹配标签的准确性效果。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 陶洁;;文本挖掘领域研究现状与趋势分析[J];武汉船舶职业技术学院学报;2018年02期
2 郭瑞华;崔雷;;文本挖掘在药物靶位研究中的应用[J];中华医学图书情报杂志;2017年03期
3 王继钢;;文本挖掘重点技术研究[J];漯河职业技术学院学报;2015年05期
4 陈莹玉;;让标点符号教学“厚实”起来[J];福建基础教育研究;2016年12期
5 鹿鹏;庄敏;龙刚;林宋伟;;文本特征提取研究现状分析与展望[J];科技创新与品牌;2017年04期
6 杨明智;张召浦;;基于文本挖掘的商学院数字创新课程研究[J];当代教研论丛;2017年04期
7 汪顺玉;赵晴;;基于文本挖掘的不同层次大学生英语作文的词汇和主题特征分析[J];英语研究;2017年01期
8 陈皓琰;;基于文本挖掘的电子商务市场表现研究[J];科学中国人;2017年12期
9 徐浙君;;基于云计算的海量文本挖掘关键技术研究[J];信息与电脑(理论版);2014年08期
10 Cade Metz;文本挖掘[J];个人电脑;2003年08期
11 李纲;毛进;;文本图表示模型及其在文本挖掘中的应用[J];情报学报;2013年12期
12 刘艳茹;盛舒涵;郭海彧;;基于文本挖掘的社会资本与大学生就业质量的关联性研究[J];社会保障研究;2018年04期
13 邢鸿飞;;文本挖掘口角升温[J];世界科学;2013年05期
14 常青;文本挖掘 挖掘知识[J];中国计算机用户;2004年24期
15 王丽坤;王宏;陆玉昌;;文本挖掘及其关键技术与方法[J];计算机科学;2002年12期
16 吴柳;程恺;胡琪;;基于文本挖掘的论坛热点问题时变分析[J];软件;2017年04期
17 刘建华;张智雄;徐健;许雁冬;;自动术语识别——对科技文献进行文本挖掘的重要技术方法[J];现代图书情报技术;2008年08期
18 白杨;;大数据环境下的文本挖掘教学内容探讨[J];无线互联科技;2018年09期
19 李燊;夏晨曦;马敬东;;主题模型在临床文本挖掘中的应用现状[J];医学信息学杂志;2018年05期
20 冷伏海;王林;王立学;;基于文本挖掘的形态分析方法的关键问题[J];图书情报工作;2012年04期
中国重要会议论文全文数据库 前10条
1 潘若愚;姚浩浩;朱克毓;;基于词频统计分析国内外文本挖掘的研究热点[A];第十二届(2017)中国管理学年会论文集[C];2017年
2 朱强生;田英;周延泉;何华灿;;基于非负因子分析的模糊文本挖掘[A];2006通信理论与技术新进展——第十一届全国青年通信学术会议论文集[C];2006年
3 高飞;荆继武;向继;;文本挖掘系统的可视化方法研究[A];全国网络与信息安全技术研讨会论文集(上册)[C];2007年
4 钱程扬;龙毅;徐震;孙昊;;基于Web文本挖掘的地理位置信息重建技术[A];中国地理学会2007年学术年会论文摘要集[C];2007年
5 陈宇;王强;;聚类算法在Web文本挖掘中的应用研究[A];2009全国计算机网络与通信学术会议论文集[C];2009年
6 武洪萍;周国祥;;Web文本挖掘研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
7 吴威;;基于Web文本挖掘算法预防现实危害的研究[A];第31次全国计算机安全学术交流会论文集[C];2016年
8 ;TRS搜索引擎和文本挖掘系统[A];中国中文信息学会第六次全国会员代表大会暨成立二十五周年学术会议中文信息处理重大成果汇报展资料汇编[C];2006年
9 胡小磊;刘坤;;基于文本挖掘的电力企业抢修人员综合评价研究[A];2017年“电子技术应用”智能电网会议论文集[C];2017年
10 周亮;易东;;基于文本挖掘方法的关联研究——突发事件与医学救援装备的探索性分析[A];2017年中国卫生统计学学术年会论文集[C];2017年
中国博士学位论文全文数据库 前10条
1 周雪忠;文本挖掘在中医药中的若干应用研究[D];浙江大学;2004年
2 陈晓云;文本挖掘若干关键技术研究[D];复旦大学;2005年
3 王明春;基于粗糙集的数据及文本挖掘方法研究[D];天津大学;2005年
4 卜东波;聚类/分类理论研究及其在文本挖掘中的应用[D];中国科学院研究生院(计算技术研究所);2000年
5 孙道军;文本挖掘预处理相关基础技术分析与应用研究[D];北京邮电大学;2008年
6 檀敬东;文本挖掘的若干关键算法研究[D];中国科学技术大学;2010年
7 文翰;面向信息检索的Web文本挖掘方法研究[D];华南理工大学;2012年
8 宣照国;文本挖掘算法及其在知识管理中的应用研究[D];大连理工大学;2008年
9 袁锋;中医医案文本挖掘的若干关键技术研究[D];山东师范大学;2016年
10 李彦鹏;特征耦合泛化及其在文体挖掘中的应用[D];大连理工大学;2011年
中国硕士学位论文全文数据库 前10条
1 杨郁琪;基于文本挖掘的用户满意度影响因素研究[D];中北大学;2018年
2 龚言浩;基于文本挖掘的智慧城市建设的热点与城市差异研究[D];南京大学;2018年
3 崔苹;基于文本挖掘的个性化推荐系统研究[D];上海师范大学;2018年
4 冯忠强;基于文本挖掘的医用加速器核心部件FMECA分析[D];电子科技大学;2018年
5 陈冬冬;基于专利的技术趋势分析系统的设计与实现[D];北京邮电大学;2018年
6 刘星辰;基于文本挖掘的用户画像系统的设计与实现[D];北京邮电大学;2018年
7 丁诗晴;基于在线网站评论的中文文本挖掘[D];华中科技大学;2016年
8 荣黎明;文本挖掘在电商评论分析中的应用[D];华中科技大学;2016年
9 李旭东;面向解决方案的中文文本挖掘平台研究[D];大连理工大学;2017年
10 邹振华;基于文本挖掘的量化投资系统[D];华南理工大学;2013年
中国重要报纸全文数据库 前7条
1 本报记者 施鹏;非结构信息和文本挖掘[N];21世纪经济报道;2009年
2 周青 编译;文本挖掘工具实现非结构化数据价值[N];计算机世界;2004年
3 整理 中国出版传媒商报记者 龚牟利;技术手段推动出版科技化[N];中国出版传媒商报;2015年
4 ;SAS公司收购Teragram 强化BI领域地位[N];计算机世界;2008年
5 本报记者 张晶;怎样挖掘专家的活的经验和智慧[N];科技日报;2011年
6 记者 贺建业 侯利红;拓尔思拟发行3000万股[N];上海证券报;2011年
7 记者 吴正懿;全面布局大数据时代 拓尔思舆情监测业务爆发[N];上海证券报;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978