收藏本站
《西安电子科技大学》 2017年
收藏 | 手机打开
二维码
手机客户端打开本文

微博舆情热点发现及趋势预测研究

胡悦  
【摘要】:随着网络设施的不断完善,移动应用等技术的快速发展,微博已经从最初满足公众社交需求的信息传播平台逐渐演变成大众化的舆论平台。微博舆情的突发性和裂变式信息传播的特性使其成为社会舆论快速的反映形式,并在一定程度上引导着舆论事件的走向。微博舆情对社会各领域的影响与日俱增,但由于其文本的特殊性以及受众多因素影响呈现出非线性复杂的变化。因此,如何高效、准确的从微博数据中发现并提取有意义的热点话题并对其发展趋势进行快速、准确的预测是一个很有价值的研究课题。本文对微博舆情的热点发现和话题发展趋势的预测问题进行研究,提出了一种基于词对主题模型(Biterm Topic Model,BTM)的微博舆情热点发现方法。首先,对微博文本采用BTM建模,改进TF-IDF(Term Frequency-Inverse Document Frequency)特征权重算法,以适应微博短文本的特征。并将BTM建模结果与改进的TF-IDF加权算法结合对微博文本进行向量表示,在考虑文档概率分布的同时融合了文档语义分布特征。有效解决了传统模型在文本建模中所面临的高维度和稀疏性问题,然后采用K-means聚类方法发现热点话题。在话题发展趋势预测方面,本文采用微博话题的博文总数作为衡量话题发展趋势的指标。考虑话题发展的复杂性和非线性的特点,采用模糊神经网络来预测微博话题的发展趋势。并以改进的粒子群优化算法(Particle Swarm Optimization,PSO)对模糊神经网络的参数进行优化。PSO算法在全局寻优和快速收敛方面具有良好的性能。模糊神经网络在处理非线性、模糊性等复杂问题上有很大的优越性,通过与改进的PSO算法的融合能够更好的发挥模糊神经网络的性能,有效解决微博舆情趋势预测中遇到的算法收敛速度慢、易陷入局部最优的问题。通过对新浪微博数据集的对比实验验证了本文所提方法在微博舆情热点发现和趋势预测中的有效性。本方法能够有效解决传统模型在文本建模中所面临的高维度和稀疏性问题,显著改善热点话题的发现质量。有效解决了微博舆情趋势预测中遇到的模型参数复杂、易陷入局部最优的问题,提高了微博舆情发展趋势预测的准确性。
【学位授予单位】:西安电子科技大学
【学位级别】:硕士
【学位授予年份】:2017
【分类号】:G206

手机知网App
【参考文献】
中国期刊全文数据库 前10条
1 王睿;张恩普;李婷;;基于微博的突发事件网络舆情对策研究[J];情报科学;2016年04期
2 徐敏捷;;基于指数平滑法的微博舆情预测模型研究[J];中国公共安全(学术版);2016年01期
3 野雪莲;杨孔雨;;舆情趋势预测中神经网络的优化算法[J];网络新媒体技术;2016年01期
4 吴青林;周天宏;;基于话题聚类及情感强度的中文微博舆情分析[J];情报理论与实践;2016年01期
5 李镇君;周竹荣;;基于Document Triage的TF-IDF算法的改进[J];计算机应用;2015年12期
6 李超雄;黄发良;温肖谦;李璇;元昌安;;基于动态主题情感混合模型的微博主题情感演化分析方法[J];计算机应用;2015年10期
7 李志清;;基于LDA主题特征的微博转发预测[J];情报杂志;2015年09期
8 黄贤英;陈红阳;刘英涛;熊李媛;;一种新的微博短文本特征词选择算法[J];计算机工程与科学;2015年09期
9 王新猛;;基于马尔可夫链的政府负面网络舆情热度趋势分析——以新浪微博为例[J];情报杂志;2015年07期
10 刘少鹏;印鉴;欧阳佳;黄云;杨晓颖;;基于MB-HDP模型的微博主题挖掘[J];计算机学报;2015年07期
中国博士学位论文全文数据库 前1条
1 程辉;网络用户偏好分析及话题趋势预测方法研究[D];北京交通大学;2013年
中国硕士学位论文全文数据库 前5条
1 金镇晟;基于改进的TF-IDF算法的中文微博话题检测与研究[D];北京理工大学;2015年
2 张华;基于优化BP神经网络的微博舆情预测模型研究[D];华中师范大学;2014年
3 何伟;模糊神经网络在交通流量预测中的应用研究[D];兰州交通大学;2012年
4 邬智慧;中文微博的语体特征研究[D];华中师范大学;2012年
5 何星星;基于模糊神经网络的时间序列预测模型[D];辽宁师范大学;2008年
【共引文献】
中国期刊全文数据库 前10条
1 廖天星;王玲;;融合项目标签相似性的协同过滤推荐算法[J];计算机应用;2018年04期
2 黄星;刘樑;;突发事件网络舆情风险评价方法及应用[J];情报科学;2018年04期
3 史伟;;基于内容分析的微博转发行为研究[J];情报科学;2018年04期
4 席运江;赵燕;廖晓;刘晚军;;基于LDA的企业微博主题传播超网络建模及分析方法[J];管理学报;2018年03期
5 刘培磊;唐晋韬;王挺;谢松县;岳大鹏;刘海池;;基于词向量语义聚类的微博热点挖掘方法[J];计算机工程与科学;2018年02期
6 何伟林;谢红玲;奉国和;;潜在狄利克雷分布模型研究综述[J];信息资源管理学报;2018年01期
7 曾子明;周知;;面向数字人文的图像语义描述模型研究[J];情报理论与实践;2018年01期
8 孙玲芳;尹培培;;基于大数据技术的网络舆情情感强度研究[J];计算机与数字工程;2018年01期
9 郑磊;王莉;段跃兴;;基于马尔科夫模型的用户兴趣转移建模[J];计算机工程与设计;2018年01期
10 秦锋;陈增;郑啸;童琨;;基于情绪和兴趣的用户访问行为预测[J];计算机系统应用;2018年01期
中国博士学位论文全文数据库 前2条
1 赵丹;基于信息生态理论的移动环境下微博舆情传播研究[D];吉林大学;2017年
2 胡庆平;面向移动互联网信息服务的用户行为研究[D];北京邮电大学;2017年
中国硕士学位论文全文数据库 前10条
1 贺安伟;滚筒式采煤机故障诊断研究[D];西北农林科技大学;2017年
2 陈鹏飞;基于影响力和兴趣特征的微博转发预测实现方法[D];北京交通大学;2017年
3 杨艳;网络热点话题趋势分析及预测研究[D];哈尔滨工业大学;2017年
4 胡悦;微博舆情热点发现及趋势预测研究[D];西安电子科技大学;2017年
5 陈俊刚;基于梯度提升决策树的交通流量预测方法研究[D];重庆邮电大学;2017年
6 王婷;基于文本倾向性分析的民航事件舆情趋势预测方法研究[D];中国民航大学;2017年
7 崔诚;基于多目标优化的城市公交越站调度研究[D];东南大学;2017年
8 高友芝;湖北政务微博语言研究[D];吉林大学;2017年
9 孙亮;基于LS-DYNA和BP神经网络的修枝机跌落冲击响应研究[D];中北大学;2017年
10 吕苏娜;基于ARIMA-DBN的水质参数预测模型研究[D];上海海洋大学;2017年
【二级参考文献】
中国期刊全文数据库 前10条
1 李敬;印鉴;刘少鹏;潘雅丽;;基于话题标签的微博主题挖掘[J];计算机工程;2015年04期
2 刘海燕;;网络舆论的产生机制、传播模式与引导策略[J];安徽行政学院学报;2014年06期
3 张玢玢;李兵;李岳欣;;基于特征选择的企业微博转发机制研究[J];情报杂志;2014年12期
4 孙玲芳;周加波;林伟健;候志鲁;许锋;;基于BP神经网络和遗传算法的网络舆情危机预警研究[J];情报杂志;2014年11期
5 孙晓;叶嘉麒;龙润田;任福继;;基于情感语义词典与PAD模型的中文微博情感分析[J];山西大学学报(自然科学版);2014年04期
6 韩忠明;张慧;张梦;黄今慧;;大规模短文本的快速话题发现方法与评价研究[J];计算机应用研究;2015年03期
7 缪建红;冯俊文;夏子然;周鎏鎏;;基于BP神经网络的高校声誉危机预警研究[J];技术经济与管理研究;2014年09期
8 邓福成;尹武松;陆和建;;近10年我国基于网络舆情分析的政府决策机制研究综述[J];图书馆学研究;2014年16期
9 屈启兴;齐佳音;;基于微博的企业网络舆情热度趋势分析[J];情报杂志;2014年06期
10 李健行;余忠亚;;突发事件网络舆情预测模型研究[J];中国公共安全(学术版);2014年02期
中国硕士学位论文全文数据库 前10条
1 魏凯;改进遗传算法在软时间窗车辆路径问题中的应用[D];安徽工业大学;2013年
2 艾静;基于GA-Elman预测模型的网络舆情研究[D];华中师范大学;2013年
3 邱晨子;微博网络舆情热点生长分析模型研究[D];大连海事大学;2013年
4 李炤;基于微博情感分析的网络舆情热点发现模型研究[D];兰州大学;2013年
5 谢乾龙;微博舆情分析系统关键技术研究[D];北京邮电大学;2013年
6 刘佳;面向微博的热点话题发现及跟踪[D];华南理工大学;2012年
7 吴伟;基于改进遗传算法的神经网络结构优化研究[D];苏州大学;2012年
8 陈澎;基于热点话题自动发现的网站搜索引擎优化[D];复旦大学;2012年
9 张岚岚;新浪微博的网络舆情分析研究[D];华东师范大学;2011年
10 辛红;政府对互联网舆情监控的研究[D];北京邮电大学;2010年
【相似文献】
中国期刊全文数据库 前10条
1 宋义刚;吴泽彬;韦志辉;孙乐;刘建军;;稀疏性高光谱解混方法研究[J];南京理工大学学报;2013年04期
2 曾小波;魏祖宽;金在弘;;协同过滤系统的矩阵稀疏性问题的研究[J];计算机应用;2010年04期
3 刘旭东;;一种缓解数据稀疏性的协同过滤推荐系统[J];烟台职业学院学报;2011年04期
4 邓自立;L算法及其在稀疏性计算中的应用[J];华南工学院学报;1985年01期
5 高磊;陈曾平;;基于代理函数优化的稀疏性字典学习[J];电子学报;2011年12期
6 席俊红;;基于案例推理:一种用来改善稀疏性问题的方法[J];微型电脑应用;2005年12期
7 张玉芳;代金龙;熊忠阳;;分步填充缓解数据稀疏性的协同过滤算法[J];计算机应用研究;2013年09期
8 林星;冯斌;孙俊;;基于边界变异的量子粒子群优化算法[J];计算机工程;2008年12期
9 蒙正中;;一种改进的混合粒子群优化算法[J];桂林工学院学报;2009年03期
10 吴昌友;王福林;马力;;一种新的改进粒子群优化算法[J];控制工程;2010年03期
中国重要会议论文全文数据库 前10条
1 张妍;张晓光;王永钢;;几种改进型的粒子群优化算法[A];第一届中国高校通信类院系学术研讨会论文集[C];2007年
2 孙红光;潘毓学;;基于运动目标路径的粒子群优化算法研究[A];第二届全国信息获取与处理学术会议论文集[C];2004年
3 韩毅;唐加福;郭伟宏;刘阳;;混合粒子群优化算法求解多层批量问题(英文)[A];中国运筹学会第八届学术交流会论文集[C];2006年
4 金一粟;梁逸曾;;空间自适应粒子群优化算法的应用研究[A];第九届全国计算(机)化学学术会议论文摘要集[C];2007年
5 汪荣贵;李守毅;孙见青;;一种新的自适应粒子群优化算法及应用[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
6 黄双欢;程良伦;;一种基于粒子群优化的快速图像倾斜角度检测算法[A];中国自动化学会中南六省(区)2010年第28届年会·论文集[C];2010年
7 侯志荣;吕振肃;;基于退火策略的粒子群优化算法[A];2003年中国智能自动化会议论文集(下册)[C];2003年
8 徐俊杰;忻展红;;基于增强型参考位置的粒子群优化模型[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
9 王亚;于永光;耿玲玲;;一类改进的自适应粒子群优化算法对混沌系统未知参数的估计[A];中国力学大会——2013论文摘要集[C];2013年
10 崔静;邓方;方浩;;基于改进粒子群优化算法的弹道求解方法[A];2013年中国智能自动化学术会议论文集(第三分册)[C];2013年
中国博士学位论文全文数据库 前10条
1 刘海峰;电子商务中基于信任关系的商品推荐方法[D];大连理工大学;2015年
2 王丽艳;断层图像稀疏性重建模型与算法研究[D];南京理工大学;2012年
3 刘昊;多样性增强的粒子群优化算法及其应用研究[D];北京理工大学;2015年
4 姜毅;动态环境下粒子群优化算法的研究[D];武汉大学;2013年
5 Shafiullah Khan;粒子群优化算法及其在电磁设计中的应用[D];浙江大学;2017年
6 易云飞;基于伊藤随机过程的粒子群优化算法及其应用研究[D];武汉大学;2015年
7 刘华蓥;粒子群优化算法的改进研究及在石油工程中的应用[D];东北石油大学;2012年
8 刘波;粒子群优化算法及其在机电设备中的应用研究[D];中北大学;2011年
9 熊勇;粒子群优化算法的行为分析与应用实例[D];浙江大学;2005年
10 唐贤伦;混沌粒子群优化算法理论及应用研究[D];重庆大学;2007年
中国硕士学位论文全文数据库 前10条
1 胡悦;微博舆情热点发现及趋势预测研究[D];西安电子科技大学;2017年
2 夏勇;基于深度学习的自然场景文本检测与识别算法研究[D];西安电子科技大学;2017年
3 刘子玉;视频中文本的定位与提取[D];天津大学;2016年
4 陈志鹏;基于词分布的文本表示研究[D];苏州大学;2017年
5 薛文静;研读声乐文本对歌唱学习的重要性[D];华中师范大学;2017年
6 张婉;信息、象征与传说语言景观功能视域下昆明市博物馆文物文本的英译研究[D];云南师范大学;2017年
7 彭杰;基于对话内容的交互型文本会话主题挖掘[D];南昌大学;2017年
8 高猛;基于社交网络的推荐系统数据稀疏性问题的研究[D];内蒙古大学;2015年
9 李文昊;基于分数低阶统计量稀疏性的DOA估计[D];大连海事大学;2015年
10 王欣;基于迁移学习的跨领域推荐的方法研究[D];杭州电子科技大学;2015年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026