收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于内容的互联网舆情信息挖掘关键技术研究

刘玉国  
【摘要】:日益丰富的网络信息和民众日益复杂的网络行为,使网络准确反映和记录着现实社会的各种舆情动态。加强网络管理,组织力量开展网络舆情信息的挖掘,将话题检测、倾向性分析、敏感信息监控等技术应用于检测互联网上民众关注的热点话题、分析民众对事件的态度倾向、监测对相关部门造成威胁的负面信息、过滤网络不良信息等,对维护社会稳定、社会公共安全、构建和谐社会具有重要的现实意义。 由于舆情信息的动态性、随意性、表现方式的多样性等特征,使得舆情信息挖掘在网络话题检测、舆情信息倾向性分析、网络舆情信息监控等方面存在一些挑战性的问题:(1)现有话题检测算法无法同时满足准确性、实时性、话题层次结构聚类的舆情热点检测要求;(2)现有文本情感表示方法存在语义信息大量丢失的问题,降低了倾向性判别的精度;(3)现有敏感信息监控模板更新优化困难及现有被过滤信息权重计算方法存在忽略文档特性的问题。 本文针对话题检测、倾向性分析、敏感信息监控等舆情信息挖掘关键技术中存在的以上问题展开研究,本论文的贡献主要包括以下三个方面: (1)针对现有网络热点话题检测算法无法同时满足舆情热点检测准确性、实时性、话题层次性聚类的问题,提出基于改进single pass增量聚类算法的层次话题检测方法,并利用舆情评价指标分析话题热度,实现网络热点话题的及时、准确检测并呈现其话题的层次性结构。 本文提出的层次话题检测方法利用重构后的舆情信息文本结构特征改进single pass增量聚类算法,有效克服现有话题检测方法不能同时满足舆情热点检测准确性、实时性、话题层次聚类的问题。此外,本文利用浏览量、回复量等舆情信息评价指标构建话题热度分析方法,有效地识别网络中的热点话题。实验结果表明,该方法能及时、准确的发现互联网中的热点话题并展现话题的层次性结构。 (2)针对网络舆情信息倾向性分析中语义信息大量丢失的问题,提出基于词序列核的舆情信息倾向性分析方法,提高了倾向性判别精度。 本文提出了基于改进词序列核的舆情信息倾向性分析方法。该方法利用文本情感特征的统计信息和顺序结构信息,对文本情感语义信息进行深层次的挖掘,构建了基于后缀树的文本情感表示模型,并利用词序列核直接对后缀树情感表示模型进行计算,得到在特征空间中的相似度,从而完成后缀树表示模型与支持向量机分类模型的融合,生成基于词序列核的支持向量机分类器。该方法克服了当前文本情感表示模型中语义信息缺失的问题。实验表明,该方法能够更精确的完成舆情信息倾向性分析。 (3)在基于内容的敏感信息监控中,针对过滤类别模板固定而且难以优化的问题,提出了一种基于动态遗传算法的模板生成方法;针对被过滤信息在长度、包含的语义等方面存在较大差异的现象,提出了一种基于文档特性的权重计算方法,提高了敏感信息监控效率。 本文提出的基于动态遗传算法的敏感信息过滤方法,通过自动优化克服了传统过滤方式中模板一旦生成就很难改变的问题,提高了过滤精度。该方法首先将经过挖掘处理的网络舆情信息文本进行切词、权重计算等预处理,形成特征项及其权重组成的向量;然后将经过预处理的文本形成遗传算法的基因串并进行选择、交叉以及变异等遗传操作,最终选出优化的文本向量;由于实验过程中发现遗传算法存在随意性,使得操作过程容易陷入局部最优,因此引入遗传算法参数的动态调整策略,动态调整遗传算子,寻找遗传算法最优解;同时在匹配阶段还对被过滤信息提出了结合文档权重、位置权重等文档特性的权重计算方法。实验表明,基于动态遗传算法的敏感信息监控方法能够得到更好的处置模板,提高敏感信息监控效果。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 刘健庄,谢维信,高新波;一种图象中基元检测的新方法[J];电子与信息学报;1997年02期
2 金耀初;蒋静坪;;基于遗传算法的模糊控制器分析[J];模式识别与人工智能;1997年01期
3 曹先彬;庄镇泉;;一种基于遗传算法的模糊规则生成方法[J];模式识别与人工智能;1997年02期
4 夏文,王华芝;遗传算法在多波束赋形天线优化中的研究[J];北京邮电大学学报;1998年04期
5 龙甫荟,郑南宁,张晓缋;基于多层感知遗传算法的图象分割新方法[J];控制理论与应用;1998年02期
6 刘莹,王宝树,马建峰,杨耆董;模糊聚合及遗传算法在多传感器数据融合中的应用[J];电子科技;1998年01期
7 黄海贇,戚飞虎;一种精确标定摄像机的遗传算法方案(英文)[J];红外与毫米波学报;2000年01期
8 徐小力,许宝杰,殷健;采用遗传算法的旋转机组状态趋势预测之探讨[J];机械科学与技术;2000年05期
9 陈勇,邓先灿;基于遗传算法的微波电路优化方法[J];微波学报;2000年S1期
10 于海斌,王浩波,徐心和;两代竞争遗传算法及其应用研究[J];信息与控制;2000年04期
11 涂承媛,涂承宇,冯占英;基于仿生进化的自动控制系统[J];北京联合大学学报;2000年03期
12 刘渤,左演声;遗传算法应用于多弧离子镀膜工艺优化设计[J];电子工艺技术;2000年03期
13 顾毅,刘新国;基于遗传算法的PID控制器的研究[J];信息技术;2000年08期
14 石玉,陈小平,于盛林;利用排序对遗传算法的改进和自适应交叉概率[J];数据采集与处理;2000年02期
15 陈洪亮,沈琳琳;基于遗传算法的矢量化方法研究[J];微型电脑应用;2000年12期
16 冯钢;候义斌;;关于遗传算法的CDT研究[J];模式识别与人工智能;2000年01期
17 郭观七,喻寿益;遗传算法收敛性分析的统一方法(英文)[J];控制理论与应用;2001年03期
18 王晓哲,顾树生,吴成东,张伟宏;基于一种新的基因操作策略的改进遗传算法[J];控制与决策;2001年S1期
19 金聪;模糊自适应遗传算法及其性能分析[J];小型微型计算机系统;2001年09期
20 魏平,熊伟清,赵杰煜;遗传算法的早熟现象[J];合肥工业大学学报(自然科学版);2001年06期
中国重要会议论文全文数据库 前10条
1 周海清;王恭先;陈正汉;;基于面向对象遗传算法的抗滑桩优化设计程序的研制[A];中国土木工程学会第九届土力学及岩土工程学术会议论文集(下册)[C];2003年
2 吴建生;金龙;;基于实数编码的遗传算法神经网络预报建模研究[A];推进气象科技创新加快气象事业发展——中国气象学会2004年年会论文集(下册)[C];2004年
3 申元霞;张翠芳;;GA-BP算法在系统辨识中的应用[A];中国自动化学会、中国仪器仪表学会2004年西南三省一市自动化与仪器仪表学术年会论文集[C];2004年
4 刘辙;彭亮;崔广才;吴学礼;;混合遗传算法在车间调度中的应用[A];中国自动化学会全国第九届自动化新技术学术交流会论文集[C];2004年
5 曹春红;李文辉;张永坚;;遗传蚂蚁算法在几何约束求解中的应用[A];中国仪器仪表学会第六届青年学术会议论文集[C];2004年
6 姜楠;张春森;;遗传算法在图像模板匹配中的应用[A];高精度几何量光电测量与校准技术研讨会论文集[C];2008年
7 朱秀娥;周宝焜;;振动筛设计的遗传算法[A];福建省科协第三届学术年会装备制造业专题学术年会论文集[C];2003年
8 何奉道;梁向阳;;基于遗传算法的机车周转图优化编制方法[A];1999年中国神经网络与信号处理学术会议论文集[C];1999年
9 刘忠凯;薛正辉;任武;李伟明;高本庆;;用遗传算法优化八木天线[A];2005'全国微波毫米波会议论文集(第二册)[C];2006年
10 汝勇;杨树强;;遗传算法在历史性约束组合优化问题中的应用[A];2010通信理论与技术新发展——第十五届全国青年通信学术会议论文集(上册)[C];2010年
中国博士学位论文全文数据库 前10条
1 刘玉国;基于内容的互联网舆情信息挖掘关键技术研究[D];山东大学;2011年
2 张旭;具有拓扑结构布局优化的理论及算法[D];大连理工大学;2004年
3 廖平;基于遗传算法的形状误差计算研究[D];中南大学;2002年
4 周明;高新技术产业投资环境系统研究[D];西北工业大学;2006年
5 张需溥;小型化微带天线的设计与数值分析[D];上海大学;2004年
6 杨春成;空间数据挖掘中聚类分析算法的研究[D];解放军信息工程大学;2004年
7 方娟;基于移动代理的网格资源监控技术的研究[D];北京工业大学;2005年
8 崔晓芳;箱型结构焊接变形预测、控制及应用[D];大连交通大学;2005年
9 张材;薄带坯铸轧板形智能识别与控制系统研究[D];中南大学;2004年
10 田方;遗传算法的改进研究及其在压缩机性能分析与优化中的应用[D];东北大学;2006年
中国硕士学位论文全文数据库 前10条
1 高晔;高校网络舆情管理对策研究[D];上海交通大学;2010年
2 巨慧慧;针对网络舆情的情感倾向性研究[D];哈尔滨工业大学;2010年
3 项斌;网络舆情监测系统设计与实现[D];电子科技大学;2010年
4 赵若尘;高校校园网络舆情引导研究[D];西南大学;2010年
5 殷婷;网络舆情逆转研究[D];河北大学;2010年
6 陈华;危机管理视角下的公安网络舆情应对研究[D];复旦大学;2010年
7 罗引;互联网舆情发现与观点挖掘技术研究[D];电子科技大学;2010年
8 林艳;网络舆情突发事件的应急管理研究[D];郑州大学;2010年
9 王培顺;互联网教育舆情监测系统的设计与实现[D];华中师范大学;2011年
10 张岚岚;新浪微博的网络舆情分析研究[D];华东师范大学;2011年
中国重要报纸全文数据库 前10条
1 孙愫、媛媛;中宣部舆情局领导来我市参观考察[N];唐山劳动日报;2010年
2 临县宣传部 李玉峰;浅谈舆情信息写作[N];吕梁日报;2011年
3 记者 邹雄;研究网络舆情的调查回应工作[N];柴达木日报;2011年
4 记者 李高阳;国企承受负面舆情压力大[N];第一财经日报;2011年
5 记者 郝勇;妇女舆情信息直报点制年内建[N];四川日报;2011年
6 郑言;人民网副总裁陈智霞:资本市场舆情监测已成朝阳行业[N];证券时报;2011年
7 南方日报记者 赵新星;舆情和微博问政报告 舆情汹涌,政府怎么办?[N];南方日报;2011年
8 陈婕;《环保舆情》成有力助手[N];中国环境报;2011年
9 兰州大学图书馆馆长、教授 沙勇忠;重视网络舆情的监测与导控[N];民主协商报;2011年
10 本报记者 唐琳;以自信和坦诚的态度看待网络舆情[N];人民公安报;2011年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978