收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

网络舆情热点发现与话题跟踪技术研究

韩威  
【摘要】:随着互联网的快速发展,网络已经成为人们表达情绪和态度的重要“场所”,不论是正面的、还是负面的网络舆情都对社会的稳定产生重要的影响。因此,国家相关部门对网络舆情的重视与日俱增,相应的互联网舆情监测系统也应运而生。它实时地采集互联网信息,智能地分析信息的内容,为相关部门监测网络舆情,引导正向舆情,处理舆情危机提供了良好的支持。 本文对构建网络舆情监测系统相关技术,如自然语言处理技术、信息挖掘技术进行了研究,同时对目前已有的舆情监测系统进行研究,在此基础上构建舆情监测系统。 本文重点对网络舆情监测系统的关键技术——热点话题发现与跟踪进行研究分析,在已有的技术手段上对其进行改进以适应现实监测环境。本文的贡献主要体现在以下3个方面: 1.提出一种改进的Single-Pass增量聚类方法应用于热点话题发现。本文研究了热点话题发现的具体流程,将文本聚类作为其实现的关键技术之一。通过分析几种已有的文本聚类算法的原理及步骤,从五个方面对比分析了各算法的优缺点,最终选取Single-Pass增量聚类作为话题发现的实现方法。但是,Single-Pass算法存在对文本输入顺序敏感等缺点,在对该算法进行分析的基础上本文对其进行了改进,在算法精度、响应时间上有所提高,使其能适应大规模文本聚类。最后,经过对比实验证明,本文提出的算法具有良好的实际应用效果。 2.提出一种改进的SVM算法应用于话题跟踪。本文研究了话题跟踪的具体流程,将文本分类作为其实现的关键步骤。通过分析文本分类方法和实验对比,选择了SVM算法作为其具体实现。但SVM算法比较适合二值分类问题,因此本文对其进行了改进,使其适应现实中多分类的要求,最终通过实验证明其有较好的实际应用效果。 3.在对相关技术研究的基础上,本文设计了网络舆情监测系统的物理构建框架与逻辑实现框架,详细介绍了舆情监测系统各个模块的实现及功能,最终实现部署该系统。通过系统的实际运行,证明本文所提出的设计方案具有功能全面、速度较快、性能稳定等特点,为用户对网络舆情的监测与分析提供了有效的支持。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 刘海娟;张佳骥;陈勇;;语言模型在话题跟踪中的应用[J];无线电工程;2008年09期
2 陈学昌;韩佳珍;魏桂英;;话题识别与跟踪技术发展研究[J];中国管理信息化;2011年09期
3 刘海娟;张佳骥;陈勇;;基于改进权重计算的话题跟踪[J];无线电工程;2008年04期
4 焦健;瞿有利;;知网的话题更新与跟踪算法研究[J];北京交通大学学报;2009年05期
5 赵华;赵铁军;于浩;郑德权;;基于查询向量的英语话题跟踪研究[J];计算机研究与发展;2007年08期
6 丁杰;徐俊刚;;IPSMS:一个网络舆情监控系统的设计与实现[J];计算机应用与软件;2010年04期
7 陶兰,申军霞;文本信息自动分类系统ITC98(Ⅰ)──ITC98总体结构与编码子系统[J];中国农业大学学报;1999年04期
8 陈勤,张国煊,王小华;基于模糊综合评判的文本自动分类算法[J];计算机应用与软件;2001年09期
9 李钝,梁吉业;利用聚类和粗糙集进行文本分类研究[J];计算机工程与应用;2003年07期
10 韩家新,何华灿;SVMDT分类器及其在文本分类中的应用研究[J];计算机应用研究;2004年01期
11 王天江,叶卫国,卢正鼎,李永平;LSI和kNN相结合的文本分类模型研究[J];华中科技大学学报(自然科学版);2004年04期
12 许增福,梁静国,田晓宇;基于FVSM和自组织映射网络的Web文本自动分类方法[J];哈尔滨工业大学学报;2004年09期
13 郑海,林鸿飞;基于段落匹配的文本分类机制[J];计算机工程与应用;2004年28期
14 卢娇丽,郑家恒;基于粗糙集的文本分类方法研究[J];中文信息学报;2005年02期
15 陈文亮,朱慕华,朱靖波,姚天顺;基于Bootstrapping的文本分类模型[J];中文信息学报;2005年02期
16 王丁,运海红,张辉;文本自动分类系统的研究与实现[J];信息技术;2005年03期
17 王冠,裘正定;结合中文网页自动分类系统的AIP平台[J];微机发展;2005年03期
18 包学超 ,孙强 ,李生红;隐性语义的SVM文本分类模型[J];信息安全与通信保密;2005年05期
19 谢世朋,胡茂林;对特定区域搜索引擎的自动分类系统的研究[J];微机发展;2005年09期
20 李小兵,杨一平,刘曙光;基于概念网络的文本分类研究[J];微型机与应用;2005年07期
中国重要会议论文全文数据库 前10条
1 宋丹;吴晨;薛德军;师庆辉;;基于KNN的科技主题跟踪[A];第五届全国信息检索学术会议论文集[C];2009年
2 林鸿飞;宋丹;杨志豪;;基于语义框架的话题跟踪方法[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
3 郑伟;张宇;邹博伟;洪宇;刘挺;;基于相关性模型的中文话题跟踪研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
4 陈克利;宗成庆;王霞;;基于大规模真实文本的平衡语料分析与文本分类方法[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
5 杜长海;吉根林;;模糊聚类的最大树法在文本分类中的应用研究[A];第二十二届中国数据库学术会议论文集(研究报告篇)[C];2005年
6 刘秉权;李博;孙林;王宝勋;刘远超;;标签特征和正文特征融合的SVM博客文本分类算法研究[A];第六届全国信息检索学术会议论文集[C];2010年
7 商炳章;白清源;;基于特征项权重改进的关联文本分类[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
8 海丽且木·艾沙;维尼拉·木沙江;;Web文本分类及其维、哈、柯多文种信息检索中的应用研究[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
9 胡俊;黄厚宽;;一种基于SVM的可视化文本分类的方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
10 朱慕华;陈文亮;朱靖波;;词聚类在文本分类中的应用[A];第二届全国学生计算语言学研讨会论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 陆前;英、汉跨语言话题检测与跟踪技术研究[D];中央民族大学;2013年
2 万源;基于语义统计分析的网络舆情挖掘技术研究[D];武汉理工大学;2012年
3 章舜仲;文本分类中词共现关系的研究及其应用[D];南京理工大学;2010年
4 郑文斌;基于正则化线性统计模型的文本分类研究[D];浙江大学;2012年
5 廖一星;文本分类及其特征降维研究[D];浙江大学;2012年
6 孟佳娜;迁移学习在文本分类中的应用研究[D];大连理工大学;2011年
7 刘伍颖;面向垃圾信息过滤的主动多域学习文本分类方法研究[D];国防科学技术大学;2011年
8 李智星;用于文本分类的简明语义分析技术研究[D];重庆大学;2011年
9 李自强;大规模文本分类的若干问题研究[D];电子科技大学;2013年
10 王博;文本分类中特征选择技术的研究[D];国防科学技术大学;2009年
中国硕士学位论文全文数据库 前10条
1 韩威;网络舆情热点发现与话题跟踪技术研究[D];哈尔滨工业大学;2012年
2 廖秀玲;基于文本的网络舆情话题跟踪的研究[D];昆明理工大学;2012年
3 肖海岭;动态社会网络中的话题跟踪算法研究[D];华中科技大学;2012年
4 毛文娟;话题跟踪和可视化技术在涉农网络舆情系统中的应用研究[D];南京农业大学;2012年
5 武军娜;自适应话题跟踪技术研究[D];华北电力大学;2013年
6 陈智敏;中文报道关系识别与话题跟踪研究[D];广西大学;2013年
7 虞玲玲;基于文本分类的话题跟踪及其一元语法模型的应用[D];南京理工大学;2005年
8 宋阳;食品安全话题发现与跟踪研究[D];北京邮电大学;2012年
9 王洁;基于确定话题的网络舆情分析系统的设计与构建[D];南京邮电大学;2013年
10 袁野;基于Vague集的网络舆情研究[D];西安电子科技大学;2010年
中国重要报纸全文数据库 前10条
1 记者 许兵 通讯员 马勇;灌云科学处置举报类网络舆情[N];连云港日报;2010年
2 孙愫、媛媛;中宣部舆情局领导来我市参观考察[N];唐山劳动日报;2010年
3 记者 吴汉松;提升引导网络舆情能力[N];石狮日报;2010年
4 国防科技大学 刘朝;增强领导干部科学应对网络舆情的能力[N];长沙晚报;2010年
5 记者 姜澎;提前预警比事后“灭火”更重要[N];文汇报;2010年
6 戴建明 林婧;加强新形势下舆情信息工作的几点思考[N];三明日报;2010年
7 山西省委党校信息网络教研部 吕淑芳;地方政府如何应对网络舆情[N];山西科技报;2010年
8 镇原县政法委 慕瑶;如何妥善处置网络舆情之我见[N];陇东报;2010年
9 临县宣传部 李玉峰;浅谈舆情信息写作[N];吕梁日报;2011年
10 记者 郭青剑 金涛;全国文联文艺舆情信息工作会在东莞召开[N];中国艺术报;2011年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978