收藏本站
收藏 | 论文排版

社交媒体数据流谣言实时检测方法的研究

秦雨萌  
【摘要】:随着互联网技术的高速发展,社交媒体已经从一个基于用户关系的通讯工具,逐渐演变成了人们获取新闻信息的主要渠道。社交媒体中的新闻传播主体呈多元化,人人都是新闻的制造者、传播者与接收者。社交媒体打破了传统新闻传播的边界,使得新闻传播可以跨越国界、产业、社群等得到全方位的发展。社交媒体的用户群体多样化、产生数据量大、消息文本碎片化等特征明显区别于相对数据流量较小的网络新闻媒体。研究网络新闻媒体与社交媒体的新闻传播行为也成为了西方学者们竞相研究的一个方向。但在中国,学者们对该课题的研究却尚处萌芽状态。中国汉字的复杂性和民族的多样性,以及汉字使用群体的庞大,导致中国的社交媒体平台和传媒渠道更具有中国特色。随着中国国际地位的日益提升,研究中国传媒的话题性与西方传媒话题性之间的相互覆盖率和区别也显得十分重要。社交媒体在革新了新闻传播方式,便利了人与人之间的即时信息交流之余,也成为了网络谣言产生与传播的温床。社交媒体的谣言检测方法也成为了目前比较热门的一个研究方向,但谣言检测并不容易,目前最准确的谣言检测系统需要进行回溯型运算,严重影响了检测的效率。检测的延时导致了我们无法在谣言发布的同一时间就进行监控,使其有机会得到扩散,给人们生活和社会带来了严重的负面影响。此外,随着社交媒体的普及、用户的不断增加,社交媒体每天所产生的数据量之大也变得越来越难以估量。本研究发现随着处理数据量的增大,新话题检测系统的性能和准确率也面临着严峻的挑战。目前该领域的学者们都致力于提升新话题检测算法的性能使其能更好地适应对数据流的处理,却忽略了随着存储历史信息的空间饱和度的不断上升,系统计算出来的累计平均新颖度分数也呈新出持续衰变的趋势。而新颖度分数的偏差给新话题检测系统的准确率也带来了一定程度的负面影响。综上所述,本文将研究的重点主要集中在以下三个方面:第一,本文探索中西方传媒在内容和时间特性上的异同,揭示了中国网络新闻媒体在重大事件的新闻报道时间上的领先性,以及中西传媒在报道内容上的主观偏向性。本项研究主要通过话题检测与跟踪算法以及基于向量空间的近似度算法,对中西网络新闻媒体和社交媒体的四个数据流进行话题及重合度检测,并对检测出的数据进行定性和定量的分析。实验结果揭示了中西传媒在话题内容上的自中国向西方的兴趣偏向性,即中国媒体对西方话题的覆盖率明显高于西方媒体对中国话题的覆盖率,且该偏向性在涉及到与名人相关的新闻报道与讨论时表现的最为明显;第二,本文主要研究社交媒体数据流中的实时谣言检测方法。本研究证实现有谣言检测方法并不能胜任对社交媒体数据流中谣言的实时检测。利用本文提出的基于记忆的文字蕴涵Kterm Entailment算法与访问外部数据相结合的方法可从真正意义上实现社交媒体数据流中的实时谣言检测。为了弥补在早期谣言检测过程中基于回溯运算的谣言特征缺失,本文利用Kterm Entailment算法访问外部数据(如新闻报道)以检验消息是否被可信源所证实(即蕴涵度计算),提出以蕴涵度分数为代表的实时谣言检测特征集。本文还提出辅助检测的伪反馈特征,该类特征利用了重复信号的概念,能够自动计算消息文本与已判定为谣言的内容相似度。本文通过特征分析、检测性能、扩展性检验等多个实验证实了基于蕴涵度与伪反馈特征的实时谣言检测方法相较于其他各种检测方法具有更加优秀的实时检测性能;第三,本文还探索了处理数据流对新话题检测系统性能的影响,指出新话题检测系统中存在的新颖度衰变问题,在此基础上提出新颖度衰变经验模型,并通过实验验证了应用该模型对新话题检测系统准确率的提升。本文通过研究三个不同类型的新话题检测系统在数据流处理中的性能来探索数据规模对系统性能的影响,揭示了新话题检测系统的新颖度分数衰变现象。在此基础上,本文还探索衰变现象和空间饱和程度之间的关系,并揭示衰变对检测准确率的负面影响。通过对实验数据的拟合,本文提出了衰变修正模型,利用该模型可以为检测出的新颖度分数进行一个预期衰变值的补偿。经验证,实验结果表明采用衰变模型对新颖度分数进行补偿,可以显著提升检测性能。本文所研究的社交媒体谣言的实时检测方法,是一利用最新的大数据处理技术与传统的应用机器学习技术进行谣言检测的方法相结合的创新思路与方法,在实时谣言检测领域具有一定的前沿性,对于及时捕捉谣言,减少谣言传播的危害以及实时舆情检测与监控具有深远的意义。此外,本文在新话题检测系统的研究中所发现的新颖度衰变问题是该领域研究的一项重大发现,本文在该方向上的研究成果对于如何在数据爆炸的时代进行高效的话题检测与跟踪产生了积极的影响,促进了舆情分析的发展。


知网文化
【相似文献】
中国期刊全文数据库 前19条
1 卢宏亮;廉宏达;田国双;;感知价值视角下社交媒体氛围与客户对媒体使用的选择——替代者吸引力的调节效应[J];商业研究;2020年11期
2 张玲;;“社交媒体倦怠”之成因探究[J];文化产业;2020年32期
3 陈默;杨卓睿;;从受众到用户:社交媒体的平台式转变[J];青年记者;2020年36期
4 林堃;魏丹;;使用与满足理论视阈下用户社交媒体焦虑研究[J];齐齐哈尔大学学报(哲学社会科学版);2020年12期
5 张昉;;碰瓷营销在社交媒体平台收割“免费流量”的策略运用——以周杰伦打榜事件为例[J];新闻传播;2020年24期
6 龙强;李艳红;;从宣传到霸权:社交媒体时代“新党媒”的传播模式[J];国际新闻界;2017年02期
7 付玥;黄恭瑶;李澳;赵红梅;尹永奎;李莹;;移动社交媒体使用对大学生社交能力发展的研究[J];中国市场;2021年04期
8 张彬;隋雨佳;;社交媒体平台不良信息治理主体策略选择——基于三方演化博弈的视角[J];北京邮电大学学报(社会科学版);2020年06期
9 赵新利;;社交媒体环境下媒体融合探析——以迪士尼集团的实践为例[J];电视研究;2020年10期
10 刘焕;宋苗;;国外政务社交媒体:研究现状、热点与演进趋势[J];知识管理论坛;2020年06期
11 蒲信竹;王宇;刘彦廷;;社交媒体使用与大学生科学素养——以科学自我效能为中介变量的实证研究[J];科技传播;2020年24期
12 李岭涛;李扬;;社交媒体主播和播音主持艺术的互动分析[J];中国电视;2021年01期
13 刘国亮;张汇川;刘子嘉;;移动社交媒体用户不持续使用意愿研究——整合错失焦虑与社交媒体倦怠双重视角[J];情报科学;2020年12期
14 袁向玲;牛静;;社交媒体隐私政策与用户自我表露的实证研究:一个被调节的中介模型[J];信息资源管理学报;2021年01期
15 梅凯;;社交媒体平台抽奖活动的生成路径探析[J];新闻前哨;2021年02期
16 张毅;;众包物流平台企业内部社交媒体与员工绩效关系研究——基于目的链模型[J];创新科技;2021年01期
17 刘嘉琪;齐佳音;朱舸;;在线社交媒体中企业生成内容沟通研究:以电影院线行业为例[J];管理评论;2021年01期
18 孙信茹;;社交媒体在地化:一种进入整体情境的方法论[J];南京社会科学;2021年03期
19 张志君;;推特等社交媒体平台关停特朗普的社交媒体账号可能引发的影响及相关启示与建议[J];教育传媒研究;2021年02期
中国重要会议论文全文数据库 前20条
1 Mary Blankenship;Carol Graham;;错误的信息如何在社交媒体上传播——以Twitter为例[A];清研智库系列研究报告(2020年第4期)[C];2020年
2 任胜楠;;我国社交媒体消极使用行为的影响因素及实证研究——以微信为例[A];第十五届(2020)中国管理学年会论文集[C];2020年
3 孙佳;严定友;;社交媒体时代出版社知识服务的范式转向[A];分享七十年出版业荣光 共创新时代编辑界辉煌——中国编辑学会第20届年会获奖论文(2019)[C];2019年
4 郇晓艳;;社交媒体背景下体育迷与体育赛事传播的互动研究——以2018年俄罗斯世界杯为例[A];第十一届全国体育科学大会论文摘要汇编[C];2019年
5 ;推特外交:值得赞许,但需谨慎[A];2011-2018年察哈尔圆桌论坛资料合集[C];2019年
6 闵杰;;影响社交媒体态度的研究[A];2020年南国博览学术研讨会论文集(二)[C];2020年
7 ;疫情下的中国社交媒体社会价值研究报告 2020年[A];艾瑞咨询系列研究报告(2020年第6期)[C];2020年
8 刘东;;社交媒体研究的十年回顾:2007-2017[A];第二十届全国心理学学术会议--心理学与国民心理健康摘要集[C];2017年
9 ;社交媒体正在成为科学的挑战?——美国反氟化物危机带来的启示[A];科学媒介中心2015年推送文章合集(上)[C];2016年
10 杨婉悌;;社交媒体时代下档案信息与文化的传播应用[A];创新:档案与文化强国建设——2014年全国档案工作者年会优秀论文集[C];2014年
11 乔诗绮;马静;刘康昱;王明辉;;社交媒体使用行为对员工工作绩效的影响[A];第二十一届全国心理学学术会议摘要集[C];2018年
12 刘宇初;周庆山;;图博档等公共服务机构社交媒体服务融合模式的构建[A];中国图书馆学会年会论文集(2016年卷)[C];2016年
13 施蓓琦;王丽鲲;田冬迪;王冕;;基于社交媒体地理数据挖掘的游客时空行为特征分析[A];卫星导航定位与北斗系统应用2017——深化北斗应用 开创中国导航新局面[C];2017年
14 梁君健;;营销与秩序:社交媒体时代的电影言论规范[A];影博·影响(2016年第07期 2016年合订本下 总第103期)[C];2016年
15 "基于社交媒体的科普轻游戏设计开发"课题组;郝倩倩;;基于社交媒体的科普轻游戏设计开发研究报告[A];科技馆研究报告集(2006-2015)下册[C];2017年
16 刘传江;覃艳丽;李雪;;网络社交媒体使用、社会资本积累与新时代农业转移人口的城市融合——基于六市1409个样本的调查[A];中国经济发展:改革开放40年与新时代——第十二届中华发展经济学年会会议论文摘要集[C];2018年
17 边钰涵;;社交媒体环境下极端气候信息的传播路径分析——以川蜀地区极端暴雨天气为例[A];“何微新闻奖”优秀文选第二辑[C];2018年
18 王熠;史铭;;海外社交媒体新闻传播分析系统的原理与实践[A];中国新闻技术工作者联合会2017年学术年会论文集(学术论文篇)[C];2017年
19 代宝;罗蕊;;企业基于社交媒体的品牌传播对消费者的影响分析[A];第十四届(2019)中国管理学年会论文集[C];2019年
20 代玉菲;;社交媒体时代电视舆论的传播模式[A];首届意识形态与舆论研究高峰论坛论文集[C];2018年
中国博士学位论文全文数据库 前20条
1 孙莹;社交媒体营销下的消费者绿色购买影响机制研究[D];中国科学技术大学;2020年
2 白丽娟;社交媒体参与对企业绩效的影响研究[D];哈尔滨工业大学;2020年
3 薄涛;基于社交媒体的地震灾情数据挖掘与烈度快速评估应用[D];中国地震局工程力学研究所;2018年
4 熊蜀峰;面向社交媒体的观点分析技术研究[D];武汉大学;2016年
5 刘予飞;社交媒体中用户影响力挖掘[D];南京航空航天大学;2018年
6 程晓涛;面向社交媒体的网络表示学习关键技术研究[D];战略支援部队信息工程大学;2019年
7 王志波;社交媒体大数据背景下面向社会阶层的情感分析研究[D];武汉大学;2017年
8 王凯;社交媒体用户交互行为建模与推荐应用研究[D];武汉大学;2019年
9 漆舒汉;社交媒体中品牌实体信息检索方法研究[D];哈尔滨工业大学;2018年
10 刘培磊;社交媒体热点检测与追踪技术研究[D];国防科学技术大学;2016年
11 王静;基于社交媒体评论的客户需求分析[D];哈尔滨工业大学;2017年
12 朱江;社交媒体的实时分享对消费者就餐体验和品牌评价的影响及内在机制研究[D];中国科学技术大学;2018年
13 张婧;面向中文社交媒体语料的词法分析研究[D];大连理工大学;2018年
14 王亚坤;基于机器学习的社交媒体文本分析方法研究[D];北京邮电大学;2019年
15 丁冠琪;企业社交媒体、知识分享和员工创造力[D];中国科学技术大学;2019年
16 吴艳;社交媒体信息可信度研究[D];武汉大学;2015年
17 李舒辰;社交媒体中的个性化推荐关键技术研究[D];北京邮电大学;2018年
18 何兴盛;突发事件下社交媒体用户的协同行为研究[D];中国科学技术大学;2018年
19 郑博雯;社交媒体情境重叠及其对消费者口碑传播的影响[D];中国科学技术大学;2018年
20 秦雨萌;社交媒体数据流谣言实时检测方法的研究[D];武汉大学;2017年
中国硕士学位论文全文数据库 前20条
1 施思嘉;社交媒体视阈下人际交往中的“静默在场”研究[D];新疆财经大学;2019年
2 沈海艳;消极自由主义视角下社交媒体用户倦怠行为研究[D];南昌大学;2020年
3 方阵;社交媒体使用对中国大学生情绪的影响[D];上海外国语大学;2020年
4 孟灏飞;感知过载对社交媒体消极使用的影响研究[D];华侨大学;2020年
5 谭天籼;广场舞群体的社交媒体使用与个体孤独感[D];西南大学;2020年
6 李柯;移动社交媒体环境下用户信息焦虑研究[D];郑州大学;2020年
7 陈礼珍;社交媒体使用对青年群体主观幸福感的影响研究[D];暨南大学;2019年
8 刘国欣;企业社交媒体使用对员工工作绩效的影响研究[D];山东科技大学;2020年
9 曾萨;我国社交媒体文件存档元数据研究[D];西北大学;2020年
10 夏新朋;社交媒体倦怠因素研究[D];上海师范大学;2021年
11 李丹阳;企业社交媒体能力对企业创新的影响机制研究[D];西南财经大学;2019年
12 潘莹;互联网社交媒体与股价崩盘风险[D];西南财经大学;2019年
13 杜璇;社交媒体使用、文化适应与心理健康的关系检验[D];厦门大学;2019年
14 王佳玉;青少年社交媒体依赖、问题及对策研究[D];吉林大学;2020年
15 温祺;基于代际差异视角下的社交媒体倦怠影响因素研究[D];厦门大学;2019年
16 鲁欢;企业社交媒体的使用对员工社会资本的影响[D];厦门大学;2019年
17 李亚伦;社交媒体在湖北省潜江市广华农业区推广信息服务的应用[D];中南民族大学;2019年
18 阮诗斯;基于社交媒体的灾情范围探测与演变过程分析[D];武汉大学;2019年
19 欧婉华;社交媒体的意愿促进:HPV疫苗微信传播效果研究[D];深圳大学;2019年
20 刘亭亭;实名制对社交媒体持续使用意愿的影响研究[D];中南财经政法大学;2019年
中国重要报纸全文数据库 前20条
1 蕊睐 编译;一名社交媒体编辑的“生意经”[N];中国青年报;2012年
2 北京大学新闻与传播学院教授 胡泳;在社交媒体上,你不过是在化身活动[N];经济观察报;2021年
3 王逸;拜登:社交媒体“正在杀人”[N];环球时报;2021年
4 邬金涛;新人如何在社交媒体大展拳脚?[N];中国出版传媒商报;2021年
5 王俊美 编译;提高博士候选人社交媒体素养[N];中国社会科学报;2020年
6 本报驻埃及特派记者 黄培昭 本报特约记者 柳玉鹏;多国用户转投本土社交媒体[N];环球时报;2021年
7 陈立希;英国拟立法严管社交媒体[N];新华每日电讯;2019年
8 厦门大学经济学院教授 韩乾;社交媒体影响投资行为需关注[N];经济日报;2021年
9 王俊美 编译;遏制虚假信息传播[N];中国社会科学报;2021年
10 谢沁露 西北政法大学新闻传播学院;社交媒体时代的新“人地关系”思考[N];中国社会科学报;2021年
11 王俊美 编译;避免过度依赖社交媒体获取信息[N];中国社会科学报;2021年
12 中国人民大学新闻学院 胡宏超;社交媒体虚假信息的生产语境分析[N];中国社会科学报;2021年
13 中国科学技术大学教授 熊卫民;被社交媒体“控制”的人[N];中国科学报;2021年
14 编译 王悠然;科学界定社交媒体成瘾[N];中国社会科学报;2021年
15 本报特约记者 吕克;英足坛本周末抵制社交媒体[N];环球时报;2021年
16 李亚男;何为社交媒体倦怠?[N];财会信报;2021年
17 编译 闫勇;从哲学层面分析社交媒体“点赞”行为[N];中国社会科学报;2021年
18 Iris Deng 丁雨晴 译;科学家,社交媒体新明星[N];环球时报;2021年
19 斯图亚特·坎宁安 大卫·克雷格 合编 王悠然 编译;《创造者文化:全球社交媒体娱乐介绍》[N];中国社会科学报;2021年
20 王逸 译;美政治文化借社交媒体强势输出[N];环球时报;2021年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978