收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于微博内容的热点话题趋势预测设计与实现

曹勇  
【摘要】:微博作为一个新型社交平台,由于用户可以随时随地发布信息,并且可以通过点赞、评论、转发等形式来实现信息分享,使得微博已经发展成为当今最为流行的在线社交网络平台之一。在日益发展的路程中,微博每天数据流量已经达到上亿次,而挖掘微博数据的价值就显得尤为重要。如何有效的对数据获取与分析,并通过结果预测当前热门话题的走势,已经成为一个重要的研究方向。本文采用新浪微博数据,分析了新浪微博的组成结构和传播方式。在研究微博数据的过程中发现,对数据的处理异常困难,其难点在于微博信息的发布过程中具有随时随意性,用户可以在任意时间点发布信息,而且发布微博信息的内容字数较短,失去了文章的完整性,导致碎片化严重。其次是传播速度极快,一条备受关注的信息,会在几分钟之内就会传遍整个网络,很难预测信息的传播走向,及时发掘可用信息是个技术难题。如何有效分析信息的传播方式和关键用户影响力大小,对能否提高整个系统的预测效果有很大影响。针对以上难题,本文分析了微博的组成结构和信息在微博平台上的传播模式,设计和实现了针对微博内容的热点话题预测系统。该系统以爬取新浪微博信息数据为支撑,以大V和名人微博数据爬取为突破口,以此来研究信息在传播过程中的关键数据节点。通过数据过滤算法筛选出有效数据,利用贝叶斯算法进行数据分类,经过TF-IDF提取数据特征,分析用户影响力关系,计算这些事件和词汇的传播趋势,结合传播趋势预测话题走势,实验表明该系统的有效性和准确性达到了设计要求。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 陈湘辉;;基于朴素贝叶斯算法的社交网络数据挖掘技术研究[J];计算机测量与控制;2017年06期
2 王宁宁;杨瑜;杨姗姗;;基于贝叶斯算法的网络广告监督管理[J];电子商务;2016年08期
3 季永炜;闻宏强;赵浩强;周华;;利用朴素贝叶斯算法实现软件评测项目的自动分类[J];电脑编程技巧与维护;2014年06期
4 陈凯星;陈建英;;一种改进的基于朴素贝叶斯算法的垃圾短信过滤技术[J];福建电脑;2014年03期
5 张增伟;吴萍;;基于朴素贝叶斯算法的改进遗传算法分类研究[J];计算机工程与设计;2012年02期
6 皮靖;邵雄凯;肖雅夫;;基于朴素贝叶斯算法的主题爬虫的研究[J];计算机与数字工程;2012年06期
7 曹锐;;一种改进的朴素贝叶斯算法在入侵检测中的应用[J];电脑开发与应用;2009年09期
8 何培舟;何鹏;温向明;;基于贝叶斯算法的垃圾邮件过滤研究[J];微计算机应用;2008年08期
9 李翔鹰;叶枫;;一种基于多贝叶斯算法的垃圾邮件过滤方法[J];计算机工程与应用;2006年31期
10 邹晓辉;;朴素贝叶斯算法在文本分类中的应用[J];数字技术与应用;2017年12期
11 张颖江;库凯琳;;一种用于微信信息分类的改进贝叶斯算法[J];湖北工业大学学报;2017年04期
12 王友华;张建秋;;联合稀疏信号恢复的贪婪增强贝叶斯算法[J];电子学报;2016年04期
13 赵文涛;孟令军;赵好好;韩炳权;成亚飞;;分布式朴素贝叶斯算法在文本分类中的应用[J];测控技术;2016年06期
14 张华忠;;贝叶斯算法研究[J];数字技术与应用;2013年11期
15 王红玲;;基于贝叶斯算法的垃圾邮件过滤系统的研究[J];信息与电脑(理论版);2013年04期
16 张东亮;董礼;;基于改进的朴素贝叶斯算法在垃圾短信过滤中的研究[J];计算机测量与控制;2012年02期
17 汪明;张征;;SQL Server 2008 R2贝叶斯算法研究[J];河北软件职业技术学院学报;2011年03期
18 李欣;;一种对贝叶斯算法的改进算法分析[J];山东省农业管理干部学院学报;2011年05期
19 文桥;王卫平;;基于改进贝叶斯算法的入侵检测方法[J];计算机工程;2006年12期
20 赵文涛;孟令军;赵好好;王春春;;朴素贝叶斯算法的改进与应用[J];测控技术;2016年02期
中国重要会议论文全文数据库 前10条
1 彭小明;辛阳;;基于增量贝叶斯算法的主题爬虫的设计与实现[A];第九届中国通信学会学术年会论文集[C];2012年
2 潘文锋;王斌;谭松波;;贝叶斯垃圾邮件过滤研究[A];全国网络与信息安全技术研讨会’2004论文集[C];2004年
3 朱晓宁;孙斌;朱春鸽;;基于朴素贝叶斯算法的iVCE资源评价模型[A];2016年全国通信软件学术会议程序册与交流文集[C];2016年
4 许小林;唐文忠;;基于贝叶斯算法的垃圾邮件检测中数据预处理技术的研究[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年
5 马永立;寿国础;胡怡红;钱宗珏;区海平;;新型网络流量识别分析系统及其性能评估[A];第六届全国信息获取与处理学术会议论文集(2)[C];2008年
6 王天佐;胡华平;刘波;陈新;肖枫涛;;反垃圾邮件技术研究[A];中国电子学会第十五届信息论学术年会暨第一届全国网络编码学术年会论文集(上册)[C];2008年
7 徐峻;;药物分子设计方法学基本原理[A];中国化学会第30届学术年会摘要集-第二十五分会:化学信息学与化学计量学[C];2016年
8 滕大祝;程明;;基于网格技术的反垃圾邮件系统的设计[A];2006通信理论与技术新进展——第十一届全国青年通信学术会议论文集[C];2006年
9 赖英旭;李征;;未知病毒检测技术的研究[A];2006年全国理论计算机科学学术年会论文集[C];2006年
10 张波云;殷建平;唐文胜;嵩敬波;;基于Elman网络的未知恶意代码检测系统研究与实现[A];2005年全国理论计算机科学学术年会论文集[C];2005年
中国博士学位论文全文数据库 前3条
1 华俊豪;分布式变分贝叶斯算法及其应用[D];浙江大学;2018年
2 陈鹏;无线通信中相位噪声和载波频偏的估计与消除[D];北京邮电大学;2012年
3 王珊珊;知识指导下的数据挖掘在新闻和金融工具之间因果关系上的应用[D];中国科学技术大学;2009年
中国硕士学位论文全文数据库 前10条
1 曹勇;基于微博内容的热点话题趋势预测设计与实现[D];新疆大学;2018年
2 陈珂馨;基于贝叶斯算法的民航机票预测系统研究[D];湖南大学;2017年
3 马刚;朴素贝叶斯算法的改进与应用[D];安徽大学;2018年
4 杨忠强;基于属性加权和归约的朴素贝叶斯算法研究[D];广西大学;2013年
5 游天捷;改进贝叶斯算法及其在入侵检测的应用[D];华中科技大学;2016年
6 次曲(Tse Qu);基于朴素贝叶斯算法的藏文垃圾邮件过滤关键技术研究[D];电子科技大学;2013年
7 董喜双;基于小生境遗传算法的增量贝叶斯算法[D];哈尔滨工程大学;2008年
8 李琼阳;一种改进的朴素贝叶斯算法在垃圾短信用户识别中的应用[D];华南理工大学;2017年
9 王红玉;基于朴素贝叶斯算法的差异性分类教学研究[D];河北师范大学;2017年
10 张云;贝叶斯算法在垃圾邮件过滤中的应用研究[D];云南大学;2012年
中国重要报纸全文数据库 前1条
1 记者 韩勉;藏大11项课题获国家自然科学基金资助[N];西藏日报(汉);2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978