收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于社交媒体的热点主题挖掘及主题演化分析

王晶  
【摘要】:互联网与web2.0技术的飞速发展促使社交媒体(如微博,论坛等)逐渐成为人们进行信息交互的重要平台,并且已有逐渐取代传统媒体的趋势。另外,随着移动社交媒体平台的开发和广泛应用,人们越来越倾向于在社交媒体平台上创建及分享各类信息。据统计,社交网络上每日产生的数据量已达到TB级,其中不乏大量有价值的内容。通过挖掘和分析这些信息可以很好地了解公众的需求和关注热点,进行舆情监测,同时对公众舆论进行正确引导也具有重要的意义。80%以上的社交媒体信息都为文本数据类型,因此文本挖掘成为近年来针对社交媒体内容挖掘的研究热点,而主题模型已经被证明是文本挖掘的一种非常有效的方式。主题分析的宗旨主要是借助于适当的主题模型来挖掘出“文档-主题”,以及“主题-词汇”的关系。合适的主题模型不仅可以成功挖掘出有意义的主题信息,而且还可以进一步应用于文档分类、热点主题挖掘以及信息组织等领域。传统的主题模型如PLSA(概率潜在语义分析)、LDA(潜在狄利克雷分布)虽然在常规类型的文本挖掘方面已经取得了一定的成功,但是对于社交媒体文本这种具有长度短、文本稀疏、用语不规范等特征的特殊文本类型而言已经变得不再适用。这就给面向社交媒体的文本挖掘带来了一定的困难和挑战。针对传统主题模型存在的不足以及结合社交媒体文本的特殊性,近年来已经有众多学者对传统主题模型尝试了不同的改进方法。其中,大多数研究以微博为数据分析基础,并以LDA为基础进行改进。本文同样以微博为分析案例,并尝试利用微博消息中的一些属性信息(如标签,时间等属性信息)来改进和扩展LDA模型,并重点进行了针对社交媒体主题建模的两个应用研究:(1)基于社交媒体的热点主题挖掘;(2)基于社交媒体的主题演化分析。在热点主题挖掘研究方面,本文提出了一个新的主题模型MA-LDA(Multi-Attribute Latent Dirichlet Allocation)。该模型先后利用微博的转发/评论数、时间和标签属性来分别进行非热点话题的消息过滤、热点与普通话题的区分以及主题表达性的提高,以此来提高热点话题识别的准确率。最终,实验结果证明了该模型在提高热点话题识别的准确率方面以及提高主题表达性方面均具有一定有效性。针对主题演化的分析,本文在进行时间建模的同时也考虑了提高主题表达性的问题。标签信息作为能联系上下文信息的关键词,毫无疑问也被合并进LDA中。但是,与MA-LDA不同,在主题演化分析的建模中,标签词汇与微博正文的普通词汇被区别对待。因此主题演化模型不仅可以分析出“主题-词汇”的分布关系,还可以分析出“主题-标签”的分布。另外根据标签信息的使用方法不同,本文提出了两种主题演化模型,即hg-TOT(hashtag-generated Topic Over Time)模型和hs-TOT(hashtag-supervised Topic Over Time)模型。在hg-TOT模型中,标签被看作一篇文档的组成部分,而在hs-TOT模型中,标签则被看作文档在主题抽样过程中的弱监督化信息。最终实验结果表明,相较于已有工作TOT模型而言,本文提出的两个主题演化模型在主题表达性以及主题演化分析方面都具有一定的优势。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 ;怎样看待社交媒体[J];中国经济和信息化;2011年12期
2 马尔科姆;;被高估的社交媒体[J];当代传播;2011年03期
3 ;未来社交媒体10大趋势[J];中国传媒科技;2011年07期
4 启程;;社交媒体之“湿”与社会之痛[J];检察风云;2011年17期
5 曹博林;;社交媒体:概念、发展历程、特征与未来——兼谈当下对社交媒体认识的模糊之处[J];湖南广播电视大学学报;2011年03期
6 ;国外媒体对记者使用社交媒体的规定[J];新闻记者;2011年12期
7 马小娟;;论社交媒体对公民政治参与的影响[J];中国出版;2011年24期
8 冯岩;;人文城市发展中的社交媒体管理[J];城市发展研究;2012年03期
9 文卫华;刘嘉丽;王雅萱;;试析社交媒体在新闻传播中的运用与边界[J];中国报业;2012年08期
10 翟菁;张莉钥;;谱写2011年社交媒体研究“五部曲”[J];今传媒;2012年07期
11 ;伦敦奥运,社交媒体奥运[J];新闻记者;2012年09期
12 郭之恩;;社交媒体时代下的真相[J];新闻与写作;2012年09期
13 马新莉;石丹;;社交媒体价值几何?[J];商学院;2012年08期
14 ;2012年社交媒体全球总收入接近170亿美元[J];青年记者;2012年25期
15 Jikyeong Kang;;社交媒体市场化的应用[J];沪港经济;2012年12期
16 格雷克·萨特尔;沈建苗;;社交媒体营销真相[J];IT经理世界;2012年22期
17 邹广萍;;从“杂音”中发现“好声音”——西方社交媒体通讯化后的新闻应用[J];中国记者;2013年01期
18 ;德国“社交媒体经理”走俏[J];青年记者;2013年10期
19 赵瑞云;;社交媒体客服,重在构建交互方式[J];通信世界;2013年07期
20 朱文馨;;社交媒体盛行下的大学生寒暄文化发展的研究[J];中国传媒科技;2013年08期
中国重要会议论文全文数据库 前3条
1 袁靖华;;微博的理想与现实——兼论社交媒体建构公共空间的三大困扰因素[A];数字未来与媒介社会2[C];2010年
2 洪婧茹;;社交媒体与上海大学生的环保参与:从线上关注到线下行动[A];中华新闻传播学术联盟第六届研究生学术研讨会论文集[C];2014年
3 王斌;郑满宁;;扭转“逆差”:社交媒体时代国人形象传播机制及策略[A];新闻学论集(第30辑)[C];2014年
中国博士学位论文全文数据库 前5条
1 张雪;复杂网络链路分析与社交媒体预测[D];国防科学技术大学;2013年
2 罗准辰;社交媒体中的信息检索与传播分析[D];国防科学技术大学;2013年
3 丹尼尔;社交媒体在企业传播中的使用:可口可乐中国和可口可乐加纳案例研究[D];复旦大学;2014年
4 唐李洋;基于社交媒体大数据的Twitter营销策略研究[D];合肥工业大学;2015年
5 朱星玮;社交媒体信息结构化组织及其应用研究[D];清华大学;2015年
中国硕士学位论文全文数据库 前10条
1 李雪絮;社交媒体广告的表现策略研究[D];浙江理工大学;2013年
2 吕蒙;网络社交媒体关系网络与品牌传播[D];辽宁大学;2013年
3 吴祖宏;大学生手机社交媒体依赖的问卷编制及特点研究[D];西南大学;2014年
4 张茜茹;大学生社交媒体依赖的测量及其与主观幸福感的关系[D];山西师范大学;2015年
5 徐蕾;政务社交媒体用户使用意愿研究[D];南京大学;2015年
6 巩丽;社交媒体对电视节目受众观看行为的影响研究[D];复旦大学;2014年
7 邹姝玉;社交媒体自我表达研究[D];四川师范大学;2015年
8 秦晶晶;大学生社交媒体的使用情况、社会支持与社交焦虑的关系及其情绪启动效应研究[D];闽南师范大学;2015年
9 蒋胜;基于社交媒体网络的消费者网购决策及商品推荐研究[D];安徽工程大学;2015年
10 任雁;“文化迁徙”背景下中国留学社交媒体使用的“两栖”性研究[D];山东大学;2015年
中国重要报纸全文数据库 前10条
1 韩军 编译;社交媒体营销助推器还是新航向?[N];中国民航报;2010年
2 本报记者 陈晓平;社交媒体重构商业?[N];21世纪经济报道;2011年
3 一鸣;出版商介入社交媒体的危险[N];中国图书商报;2011年
4 Chris Nerney;社交媒体带来的5大安全威胁[N];网络世界;2011年
5 李鑫源;社交媒体影响不容小窥[N];科技日报;2011年
6 陈晓平;社交媒体的“葫芦论”[N];21世纪经济报道;2011年
7 肖明超(新生代市场监测机构副总经理);社交媒体引发营销裂变[N];中国图书商报;2011年
8 文化学者 常江;社交媒体的“情绪化”[N];新华每日电讯;2012年
9 朱永磊 贝恩大中华区电信、媒体与高科技业务主管;如何成为社交媒体的长期赢家[N];通信产业报;2012年
10 记者 赵中文;东南亚企业倾向利用社交媒体经商[N];中华工商时报;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978