收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

面向舆情监控的热点人物及事件分析技术

孙振龙  
【摘要】:随着Internet在全球范围内的广泛普及,互联网已经成为社会舆论的放大器和思想文化信息的集散地。舆情信息反映了民众思想状况,在Web2.0的强大传播力之下,对舆情信息的研究显得极其重要。面对每天更新的海量的信息,高效准确的挖掘出热点新闻和舆论走势已经成为亟待解决的问题。一般情况下,事件的发生和发展都与人物有关,很多热点事件都是围绕着人在进行。在这种背景下,本文以分析热点人物为切入点,找到并分析发生在他们身上的事件,进而把握网络舆情。围绕着热点人物及事件分析技术,本文的研究主要涉及以下几个方面: (1)提出了融合多种词法分析工具识别人名的方法和基于Lingo聚类策略的人名消歧方法。首先利用现有的分词及标注工具中人名标注功能初步识别人名,并根据最长原则融合几种人名识别方法的结果。同时,尝试了几种噪声人名的去除方法,并基于Lingo聚类算法进行人名消歧。实验表明,融合策略在不降低人名识别正确率的前提下提高了人名识别的召回率,人名去噪及消歧方法能够很好的满足应用需求。 (2)研究了有监督的人物分类技术,提出一种基于SVM的人物分类方法。首先从包含人物的文本中抽取能够描述人物的一定长度的文本片段,然后利用信息增益提取出代表人物的有用属性特征,最后用SVM算法对人物进行分类。实验表明,这种方式能有效的预测人物的所属领域。 (3)研究了基于信息熵和情感词典相结合的特征提取技术,并用其进行热点人物事件的倾向性分析。信息熵计算特征的区分能力,而情感词典解决覆盖率问题。本文提取的特征分为从训练集中提取的特征和从情感词典中提取的特征。训练集中提取的特征是与语料相关的,或者说与领域相关的。而情感词典具有通用性,其中含有训练集提取的特征集中没有的特征。实验结果显示,将两种特征融合到一起能够有效地提高事件倾向性分析的性能。同时,本文尝试了用同义词词林将候选特征集合进行聚合,即将同义的两个特征映射到一个特征上,这样做既降低了空间向量的维数,又不丢失语义信息,达到了两者兼顾的效果,而且提高了语义相似度计算的精度。在特征聚类过程中将特征的同义词也加入,从而达到扩展重要特征的效果,提高了事件倾向性分析过程的特征识别能力。 (4)提出了一种面向舆情监控的热点人物排序模型。该模型综合考虑人物的曝光率、热度趋势变化和所属领域的权重这些因素来计算分数,然后根据分数生成热点人物排行榜。其中人物曝光率就是人物一天内在新闻和评论中出现的次数;热度趋势变化程度由KL距离的变形来衡量;人物所属领域的权重根据该领域人物信息在舆情监控中的重要程度来设置,而人物的所属领域由人物自动分类技术实现。实验结果表明热点人物排序模型能够将舆情监控中的重要人物放到排行榜前段。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 ;地方应对网络舆情能力榜:山西疫苗应对失当[J];新闻实践;2010年05期
2 郝英杰;马海红;彭军林;;高校网络舆情形成规律分析[J];北京教育(德育);2010年06期
3 程曼丽;;网络舆情研判——政府面临的新课题[J];新闻与写作;2010年11期
4 ;2010:企业舆情危机井喷年[J];新闻记者;2011年02期
5 沈昕;凌宏彬;;试论舆情的权变管理[J];国际新闻界;2011年04期
6 ;典型示范 热点疏导 为企业改革攻坚提供舆情支持[J];新闻战线;1999年02期
7 王威;;创新新媒体时代的舆情管理体系[J];新闻爱好者(理论版);2008年12期
8 ;人大工作应重视网络舆情[J];上海人大月刊;2009年01期
9 曾润喜;陈强;赵峰;;网络舆情在服务型政府建设中的影响与作用[J];图书情报工作;2010年13期
10 贾孟飞;;基层网络舆情监测工作的实践与思考[J];银行家;2010年12期
11 包巍;;从民主的视角看网络舆情与政府管理[J];新闻爱好者;2011年02期
12 杨波;;传媒开展舆情传播之浅见[J];新闻传播;2011年08期
13 侯文昌;;传媒新角色—舆情分析师的专业素养 “朝阳职业”四年成长史[J];中国记者;2011年09期
14 王通文;;“遥望”专业舆情第三方[J];中国记者;2011年09期
15 周胜林,马颖;市场经济与记者的调查研究[J];新闻界;1995年01期
16 孟琳;宋晓民;;舆情是新闻的组成部分——浅谈舆情类稿件的写作[J];记者摇篮;2003年12期
17 徐晓日;;网络舆情事件的应急处理研究[J];华北电力大学学报(社会科学版);2007年01期
18 王荟;魏学宏;;浅析信息社会中舆情、信息、舆情信息、微观经济行为之耦合联系[J];济源职业技术学院学报;2008年02期
19 都云程;王海洋;王洪俊;;TRS网络舆情监控解决方案[J];信息网络安全;2008年06期
20 高红玲;张中全;;网络环境下的舆情监控对象研究[J];新闻界;2009年05期
中国重要会议论文全文数据库 前10条
1 李丽;孙甲申;王小捷;李江;宋占江;;基于属性信息的中文人名消歧[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 时迎超;王会珍;肖桐;胡明涵;;面向人名消歧任务的人名识别系统[A];第六届全国信息检索学术会议论文集[C];2010年
3 孙慧;关毅;董喜双;;中文情感词倾向消歧[A];第六届全国信息检索学术会议论文集[C];2010年
4 李正华;车万翔;刘挺;;基于XML的语言技术平台[A];第五届全国青年计算语言学研讨会论文集[C];2010年
5 周晓;李超;胡明涵;王会珍;;基于人物互斥属性的中文人名消歧[A];第六届全国信息检索学术会议论文集[C];2010年
6 诺明花;张立强;刘汇丹;吴健;丁治明;;汉藏短语抽取[A];第五届全国青年计算语言学研讨会论文集[C];2010年
7 丁海波;肖桐;朱靖波;;基于多阶段的中文人名消歧聚类技术的研究[A];第六届全国信息检索学术会议论文集[C];2010年
8 郝文江;马晓明;武捷;;网络舆情现状分析与引导机制研究[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
9 耿骞;刘颖;;网络舆情的形成、传播及监测方法[A];科学发展:文化软实力与民族复兴——纪念中华人民共和国成立60周年论文集(下卷)[C];2009年
10 任铭;陈俊鑫;;我国网络舆情及管理策略研究[A];2011年全国通信安全学术会议论文集[C];2011年
中国博士学位论文全文数据库 前10条
1 王根生;面向群体极化的网络舆情演化研究[D];江西财经大学;2011年
2 万源;基于语义统计分析的网络舆情挖掘技术研究[D];武汉理工大学;2012年
3 梁金宝;藏语历史文献词汇统计研究[D];中国社会科学院研究生院;2013年
4 潘新;基于复杂网络的舆情传播模型研究[D];大连理工大学;2010年
5 张旭洁;事件本体构建中几个关键问题的研究[D];上海大学;2013年
6 刘玉国;基于内容的互联网舆情信息挖掘关键技术研究[D];山东大学;2011年
7 黄建年;农业古籍的计算机断句标点与分词标引研究[D];南京农业大学;2009年
8 孙晓;中文词法分析的研究及其应用[D];大连理工大学;2010年
9 曹鲁慧;Web个人信息集成问题研究[D];山东大学;2012年
10 周而重;博客舆情热点发现与分析[D];北京工业大学;2013年
中国硕士学位论文全文数据库 前10条
1 孙振龙;面向舆情监控的热点人物及事件分析技术[D];哈尔滨工业大学;2012年
2 巨慧慧;针对网络舆情的情感倾向性研究[D];哈尔滨工业大学;2010年
3 张岚岚;新浪微博的网络舆情分析研究[D];华东师范大学;2011年
4 高晔;高校网络舆情管理对策研究[D];上海交通大学;2010年
5 项斌;网络舆情监测系统设计与实现[D];电子科技大学;2010年
6 赵若尘;高校校园网络舆情引导研究[D];西南大学;2010年
7 殷婷;网络舆情逆转研究[D];河北大学;2010年
8 陈华;危机管理视角下的公安网络舆情应对研究[D];复旦大学;2010年
9 罗引;互联网舆情发现与观点挖掘技术研究[D];电子科技大学;2010年
10 林艳;网络舆情突发事件的应急管理研究[D];郑州大学;2010年
中国重要报纸全文数据库 前10条
1 孙愫、媛媛;中宣部舆情局领导来我市参观考察[N];唐山劳动日报;2010年
2 临县宣传部 李玉峰;浅谈舆情信息写作[N];吕梁日报;2011年
3 记者 邹雄;研究网络舆情的调查回应工作[N];柴达木日报;2011年
4 记者 李高阳;国企承受负面舆情压力大[N];第一财经日报;2011年
5 记者 郝勇;妇女舆情信息直报点制年内建[N];四川日报;2011年
6 郑言;人民网副总裁陈智霞:资本市场舆情监测已成朝阳行业[N];证券时报;2011年
7 南方日报记者 赵新星;舆情和微博问政报告 舆情汹涌,政府怎么办?[N];南方日报;2011年
8 陈婕;《环保舆情》成有力助手[N];中国环境报;2011年
9 兰州大学图书馆馆长、教授 沙勇忠;重视网络舆情的监测与导控[N];民主协商报;2011年
10 本报记者 唐琳;以自信和坦诚的态度看待网络舆情[N];人民公安报;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978