收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于内容的互联网舆情信息挖掘关键技术研究

刘玉国  
【摘要】:日益丰富的网络信息和民众日益复杂的网络行为,使网络准确反映和记录着现实社会的各种舆情动态。加强网络管理,组织力量开展网络舆情信息的挖掘,将话题检测、倾向性分析、敏感信息监控等技术应用于检测互联网上民众关注的热点话题、分析民众对事件的态度倾向、监测对相关部门造成威胁的负面信息、过滤网络不良信息等,对维护社会稳定、社会公共安全、构建和谐社会具有重要的现实意义。 由于舆情信息的动态性、随意性、表现方式的多样性等特征,使得舆情信息挖掘在网络话题检测、舆情信息倾向性分析、网络舆情信息监控等方面存在一些挑战性的问题:(1)现有话题检测算法无法同时满足准确性、实时性、话题层次结构聚类的舆情热点检测要求;(2)现有文本情感表示方法存在语义信息大量丢失的问题,降低了倾向性判别的精度;(3)现有敏感信息监控模板更新优化困难及现有被过滤信息权重计算方法存在忽略文档特性的问题。 本文针对话题检测、倾向性分析、敏感信息监控等舆情信息挖掘关键技术中存在的以上问题展开研究,本论文的贡献主要包括以下三个方面: (1)针对现有网络热点话题检测算法无法同时满足舆情热点检测准确性、实时性、话题层次性聚类的问题,提出基于改进single pass增量聚类算法的层次话题检测方法,并利用舆情评价指标分析话题热度,实现网络热点话题的及时、准确检测并呈现其话题的层次性结构。 本文提出的层次话题检测方法利用重构后的舆情信息文本结构特征改进single pass增量聚类算法,有效克服现有话题检测方法不能同时满足舆情热点检测准确性、实时性、话题层次聚类的问题。此外,本文利用浏览量、回复量等舆情信息评价指标构建话题热度分析方法,有效地识别网络中的热点话题。实验结果表明,该方法能及时、准确的发现互联网中的热点话题并展现话题的层次性结构。 (2)针对网络舆情信息倾向性分析中语义信息大量丢失的问题,提出基于词序列核的舆情信息倾向性分析方法,提高了倾向性判别精度。 本文提出了基于改进词序列核的舆情信息倾向性分析方法。该方法利用文本情感特征的统计信息和顺序结构信息,对文本情感语义信息进行深层次的挖掘,构建了基于后缀树的文本情感表示模型,并利用词序列核直接对后缀树情感表示模型进行计算,得到在特征空间中的相似度,从而完成后缀树表示模型与支持向量机分类模型的融合,生成基于词序列核的支持向量机分类器。该方法克服了当前文本情感表示模型中语义信息缺失的问题。实验表明,该方法能够更精确的完成舆情信息倾向性分析。 (3)在基于内容的敏感信息监控中,针对过滤类别模板固定而且难以优化的问题,提出了一种基于动态遗传算法的模板生成方法;针对被过滤信息在长度、包含的语义等方面存在较大差异的现象,提出了一种基于文档特性的权重计算方法,提高了敏感信息监控效率。 本文提出的基于动态遗传算法的敏感信息过滤方法,通过自动优化克服了传统过滤方式中模板一旦生成就很难改变的问题,提高了过滤精度。该方法首先将经过挖掘处理的网络舆情信息文本进行切词、权重计算等预处理,形成特征项及其权重组成的向量;然后将经过预处理的文本形成遗传算法的基因串并进行选择、交叉以及变异等遗传操作,最终选出优化的文本向量;由于实验过程中发现遗传算法存在随意性,使得操作过程容易陷入局部最优,因此引入遗传算法参数的动态调整策略,动态调整遗传算子,寻找遗传算法最优解;同时在匹配阶段还对被过滤信息提出了结合文档权重、位置权重等文档特性的权重计算方法。实验表明,基于动态遗传算法的敏感信息监控方法能够得到更好的处置模板,提高敏感信息监控效果。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 赵慧娟;王汝传;;基于遗传算法的P2P资源发现算法[J];南京邮电大学学报(自然科学版);2007年04期
2 李建华;程嫣;刘明生;;遗传算法优化多MPEG-7特征的检索算法[J];计算机工程与应用;2007年27期
3 刘明生;李建华;;遗传算法优化多MPEG-7特征的检索算法[J];邯郸学院学报;2008年03期
4 陈琴;梁家荣;;基于遗传算法和发送行为的垃圾邮件检测模型[J];广西大学学报(自然科学版);2010年06期
5 解英杰;朱振方;;一种基于模糊遗传算法的最优特征子集优化方法研究[J];信息技术与信息化;2008年06期
6 刘国靖;康丽;罗长寿;;基于遗传算法的主题爬虫策略[J];计算机应用;2007年S2期
7 王洪峰;乔蕊;;基于J2EE的P2P资源发现算法的设计与实现[J];周口师范学院学报;2008年05期
8 王洪峰;乔蕊;;基于J2EE的P2P资源发现算法的实现框架[J];电脑学习;2008年05期
9 于广生,刘广声;试论“导向正确引导有效”[J];当代传播;1997年06期
10 ;地方应对网络舆情能力榜:山西疫苗应对失当[J];新闻实践;2010年05期
11 郝英杰;马海红;彭军林;;高校网络舆情形成规律分析[J];北京教育(德育);2010年06期
12 程曼丽;;网络舆情研判——政府面临的新课题[J];新闻与写作;2010年11期
13 ;2010:企业舆情危机井喷年[J];新闻记者;2011年02期
14 沈昕;凌宏彬;;试论舆情的权变管理[J];国际新闻界;2011年04期
15 欧阳恺;张明;;基于遗传算法和信息熵的图像检索方法[J];信息化纵横;2009年14期
16 ;典型示范 热点疏导 为企业改革攻坚提供舆情支持[J];新闻战线;1999年02期
17 王威;;创新新媒体时代的舆情管理体系[J];新闻爱好者(理论版);2008年12期
18 ;人大工作应重视网络舆情[J];上海人大月刊;2009年01期
19 曾广朴;范会联;;基于遗传算法的聚焦爬虫搜索策略[J];计算机工程;2010年11期
20 曾润喜;陈强;赵峰;;网络舆情在服务型政府建设中的影响与作用[J];图书情报工作;2010年13期
中国重要会议论文全文数据库 前10条
1 周海清;王恭先;陈正汉;;基于面向对象遗传算法的抗滑桩优化设计程序的研制[A];中国土木工程学会第九届土力学及岩土工程学术会议论文集(下册)[C];2003年
2 吴建生;金龙;;基于实数编码的遗传算法神经网络预报建模研究[A];推进气象科技创新加快气象事业发展——中国气象学会2004年年会论文集(下册)[C];2004年
3 申元霞;张翠芳;;GA-BP算法在系统辨识中的应用[A];中国自动化学会、中国仪器仪表学会2004年西南三省一市自动化与仪器仪表学术年会论文集[C];2004年
4 刘辙;彭亮;崔广才;吴学礼;;混合遗传算法在车间调度中的应用[A];中国自动化学会全国第九届自动化新技术学术交流会论文集[C];2004年
5 曹春红;李文辉;张永坚;;遗传蚂蚁算法在几何约束求解中的应用[A];中国仪器仪表学会第六届青年学术会议论文集[C];2004年
6 姜楠;张春森;;遗传算法在图像模板匹配中的应用[A];高精度几何量光电测量与校准技术研讨会论文集[C];2008年
7 朱秀娥;周宝焜;;振动筛设计的遗传算法[A];福建省科协第三届学术年会装备制造业专题学术年会论文集[C];2003年
8 何奉道;梁向阳;;基于遗传算法的机车周转图优化编制方法[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
9 刘忠凯;薛正辉;任武;李伟明;高本庆;;用遗传算法优化八木天线[A];2005'全国微波毫米波会议论文集(第二册)[C];2006年
10 汝勇;杨树强;;遗传算法在历史性约束组合优化问题中的应用[A];2010通信理论与技术新发展——第十五届全国青年通信学术会议论文集(上册)[C];2010年
中国博士学位论文全文数据库 前10条
1 刘玉国;基于内容的互联网舆情信息挖掘关键技术研究[D];山东大学;2011年
2 张旭;具有拓扑结构布局优化的理论及算法[D];大连理工大学;2004年
3 廖平;基于遗传算法的形状误差计算研究[D];中南大学;2002年
4 周明;高新技术产业投资环境系统研究[D];西北工业大学;2006年
5 张需溥;小型化微带天线的设计与数值分析[D];上海大学;2004年
6 杨春成;空间数据挖掘中聚类分析算法的研究[D];解放军信息工程大学;2004年
7 方娟;基于移动代理的网格资源监控技术的研究[D];北京工业大学;2005年
8 崔晓芳;箱型结构焊接变形预测、控制及应用[D];大连交通大学;2005年
9 张材;薄带坯铸轧板形智能识别与控制系统研究[D];中南大学;2004年
10 田方;遗传算法的改进研究及其在压缩机性能分析与优化中的应用[D];东北大学;2006年
中国硕士学位论文全文数据库 前10条
1 高晔;高校网络舆情管理对策研究[D];上海交通大学;2010年
2 巨慧慧;针对网络舆情的情感倾向性研究[D];哈尔滨工业大学;2010年
3 项斌;网络舆情监测系统设计与实现[D];电子科技大学;2010年
4 赵若尘;高校校园网络舆情引导研究[D];西南大学;2010年
5 殷婷;网络舆情逆转研究[D];河北大学;2010年
6 陈华;危机管理视角下的公安网络舆情应对研究[D];复旦大学;2010年
7 罗引;互联网舆情发现与观点挖掘技术研究[D];电子科技大学;2010年
8 林艳;网络舆情突发事件的应急管理研究[D];郑州大学;2010年
9 王培顺;互联网教育舆情监测系统的设计与实现[D];华中师范大学;2011年
10 张岚岚;新浪微博的网络舆情分析研究[D];华东师范大学;2011年
中国重要报纸全文数据库 前10条
1 孙愫、媛媛;中宣部舆情局领导来我市参观考察[N];唐山劳动日报;2010年
2 临县宣传部 李玉峰;浅谈舆情信息写作[N];吕梁日报;2011年
3 记者 邹雄;研究网络舆情的调查回应工作[N];柴达木日报;2011年
4 记者 李高阳;国企承受负面舆情压力大[N];第一财经日报;2011年
5 记者 郝勇;妇女舆情信息直报点制年内建[N];四川日报;2011年
6 郑言;人民网副总裁陈智霞:资本市场舆情监测已成朝阳行业[N];证券时报;2011年
7 南方日报记者 赵新星;舆情和微博问政报告 舆情汹涌,政府怎么办?[N];南方日报;2011年
8 陈婕;《环保舆情》成有力助手[N];中国环境报;2011年
9 兰州大学图书馆馆长、教授 沙勇忠;重视网络舆情的监测与导控[N];民主协商报;2011年
10 本报记者 唐琳;以自信和坦诚的态度看待网络舆情[N];人民公安报;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978