收藏本站
《山东师范大学》 2014年
收藏 | 手机打开
二维码
手机客户端打开本文

基于时间发展的微博自适应话题追踪研究

薛素芝  
【摘要】:随着互联网的快速发展,社交网络由于其交互性、自由性和开放性受到越来越多的人的青睐。自从2006年,世界首款微博客(以下简称微博)服务网站—Twitter由美国的埃文-威廉姆斯公司Obvious推出以来,微博服务蒸蒸日上,堪称蓬勃发展。微博不同于传统的新闻、博客,其内容简短,限制在140字以内。但是,用户除了可以在自己的微博内容里加入简短的文本以外,还可以加入图片、视频、音频和其他链接等。这种自由、开放的传播方式,受到了广大用户的欢迎和关注,同时,微博服务也在全球各地快速传播,掀起了一股微博服务的热潮。 由于微博的自由性、交互性和开放性,人们可以随时随地分享自己的所见所闻或发表自己的情感态度。随着微博用户的急剧增长,微博信息量日益剧增,一些突发事件往往也容易在微博平台显现出来。因此,现阶段微博话题检测研究正受到研究学者的关注,正逐渐成为研究热点。但是,人们有时更关注某一事件的发展状况,因此微博话题追踪显得尤为重要。为了充分利用微博的时间敏感特性,及时检测和追踪微博热点话题,本文进行了如下研究: 1.针对微博信息量大而时间敏感性强的特点,提出基于速度增长的微博话题发现方法 本文提出了基于速度增长的微博热点话题发现方法。首先把经过预处理的微博按等数量窗口划分,统计每个窗口内各词语的词频,并表示成时间二元组序列;然后通过计算每相邻两个窗口的个词语的增长斜率来发现增长速度快的词语;然后通过计算与该词语有关的用户的增长速度和微博条数的增长速度来确定该词语是否是热点主题词;最后通过热点主题词聚类产生热点话题。结果表明,该方法对新话题有很强的的挖掘能力。 2.针对话题追踪中的话题漂移问题,提出了基于时间发展的微博自适应话题追踪方法 该方法首先针对微博追踪中的数据稀疏问题,利用基于相关性检索的特征词扩展方法来扩展特征词;然后针对特征词权重不变容易导致召回率低的问题,利用基于时间衰减的特征词权重调整策略对特征词权重进行适当的衰减;最后针对话题模板静态不变问题,提出了基于双重过滤技术的话题模板调整方法,把相关报道且重要性得分高的报道用来更新话题模板。实验表明该方法在一定程度上提高了追踪效率。 3.设计并实现了基于时间发展的微博自适应话题追踪算法的网络舆情监测系统 将本文提出的自适应话题追踪方法应用于网络舆情监测系统中的话题追踪模块的话题模板调整,利用重要性得分高的微博条目更新话题模板,使系统有更高的召回率和准确率,满足用户的需求。
【学位授予单位】:山东师范大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP393.092;TP391.1

手机知网App
【参考文献】
中国期刊全文数据库 前7条
1 贾自艳 ,何清 ,张海俊 ,李嘉佑 ,史忠植;一种基于动态进化模型的事件探测和追踪算法[J];计算机研究与发展;2004年07期
2 于满泉;骆卫华;许洪波;白硕;;话题识别与跟踪中的层次化话题识别技术研究[J];计算机研究与发展;2006年03期
3 王会珍;朱靖波;季铎;叶娜;张斌;;基于反馈学习自适应的中文话题追踪[J];中文信息学报;2006年03期
4 洪宇;张宇;刘挺;李生;;话题检测与跟踪的评测及研究综述[J];中文信息学报;2007年06期
5 李心妍;刘俐俐;;浅析微博中的“微舆情”[J];新闻世界;2011年07期
6 崔争艳;;基于语义的微博短信息分类[J];现代计算机(专业版);2010年08期
7 谢岚;;微博客的分级化传播模式研究[J];新闻传播;2010年12期
【共引文献】
中国期刊全文数据库 前10条
1 税仪冬;瞿有利;黄厚宽;;周期分类和Single-Pass聚类相结合的话题识别与跟踪方法[J];北京交通大学学报;2009年05期
2 焦健;瞿有利;;知网的话题更新与跟踪算法研究[J];北京交通大学学报;2009年05期
3 宋晨宇;;微博的传播特征与舆论引导策略[J];今传媒;2011年12期
4 鲁明羽;姚晓娜;魏善岭;;基于模糊聚类的网络论坛热点话题挖掘[J];大连海事大学学报;2008年04期
5 许志凯;徐志明;李栋;李生;;面向互联网新闻的话题检测与追踪[J];智能计算机与应用;2011年03期
6 张瑛;张娅婷;;动态文本会话抽取技术研究[J];电视技术;2011年11期
7 谢林燕;戚银城;孙卓;;地点信息在话题检测中的应用[J];电子科技;2012年01期
8 潘文富;郭友实;;网络舆情监测技术研究综述[J];福建电脑;2011年08期
9 陈学昌;韩佳珍;魏桂英;;话题识别与跟踪技术发展研究[J];中国管理信息化;2011年09期
10 李龙;李芝棠;涂浩;史春永;;一种分布式微博数据采集平台的设计与实现[J];广西大学学报(自然科学版);2011年S1期
中国重要会议论文全文数据库 前10条
1 彭楠赟;王厚峰;凌晨添;;基于层次聚类的网络新闻热点发现[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
2 陈都;郑玲;;基于反馈学习的自适应搜索机制的研究[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
3 张晓菲;张火明;高明正;;三种智能优化算法的研究进展[A];中国仪器仪表学会第十一届青年学术会议论文集[C];2009年
4 邱立坤;陶然;龙志祎;程葳;;面向互联网的话题发现技术研究[A];全国网络与信息安全技术研讨会论文集(下册)[C];2007年
5 丁伟莉;赵华;郑德权;赵铁军;于浩;;中文Blog热门话题检测与排序技术研究[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
6 郑伟;张宇;邹博伟;洪宇;刘挺;;基于相关性模型的中文话题跟踪研究[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
7 张阔;李涓子;吴刚;;基于关键词元的话题内事件检测[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
8 刘星星;何婷婷;龚海军;陈龙;;网络热点事件发现系统的设计[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
9 楚克明;李芳;;基于LDA新闻话题的演化[A];第五届全国信息检索学术会议论文集[C];2009年
10 吴晨;宋丹;薛德军;师庆辉;;科技主题识别及表示[A];第五届全国信息检索学术会议论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 陈伟;基于时序文本挖掘的新闻内容理解与推荐技术研究[D];浙江大学;2010年
2 张晓艳;新闻话题表示模型和关联追踪技术研究[D];国防科学技术大学;2010年
3 杜萍;基于本体的中国行政区划地名识别与抽取研究[D];兰州大学;2011年
4 仲兆满;事件本体及其在查询扩展中的应用[D];上海大学;2011年
5 刘玉国;基于内容的互联网舆情信息挖掘关键技术研究[D];山东大学;2011年
6 王肃;基于多Agent的突发事件信息智能监测系统研究[D];北京邮电大学;2011年
7 吴永辉;面向专业领域的网络信息采集及主题检测技术研究与应用[D];哈尔滨工业大学;2010年
8 单建芳;面向事件的文本表示研究[D];上海大学;2012年
9 史树敏;基于领域本体的汉语共指消解及相关技术研究[D];南京理工大学;2008年
10 郝秀兰;文本分类技术与应用研究[D];复旦大学;2008年
中国硕士学位论文全文数据库 前10条
1 赵慧杰;面向论坛的话题发现、跟踪及传播技术研究[D];哈尔滨工程大学;2010年
2 秦宏宇;网络舆情热点发现相关技术研究[D];哈尔滨工程大学;2010年
3 江涛;基于藏文web舆情分析的热点发现算法研究[D];西北民族大学;2010年
4 印文涛;基于星型K部图的网络视频话题挖掘和可视化的研究[D];浙江大学;2011年
5 白志杰;新闻视频主题追踪技术研究[D];解放军信息工程大学;2009年
6 吕楠;话题追踪与演化分析技术研究[D];解放军信息工程大学;2009年
7 王允;网络舆情数据获取与话题分析技术研究[D];解放军信息工程大学;2010年
8 刘嵩;网络中文事件自动检测技术研究[D];解放军信息工程大学;2010年
9 和婷;面向机械产品设计领域中自然语言理解的动词聚类[D];西安电子科技大学;2011年
10 李恒训;网络论坛采集及热点话题发现研究[D];首都师范大学;2011年
【二级参考文献】
中国期刊全文数据库 前10条
1 孙卫华;张庆永;;微博客传播形态解析[J];传媒观察;2008年10期
2 张俐,李晶皎,胡明涵,姚天顺;中文WordNet的研究及实现[J];东北大学学报;2003年04期
3 刘丽清;;微博虽“微”足值道尔——微博特性之浅析[J];东南传播;2009年11期
4 赵华;赵铁军;张姝;王浩畅;;基于内容分析的话题检测研究[J];哈尔滨工业大学学报;2006年10期
5 刘佳;;微博来了[J];互联网周刊;2009年22期
6 贾自艳 ,何清 ,张海俊 ,李嘉佑 ,史忠植;一种基于动态进化模型的事件探测和追踪算法[J];计算机研究与发展;2004年07期
7 于满泉;骆卫华;许洪波;白硕;;话题识别与跟踪中的层次化话题识别技术研究[J];计算机研究与发展;2006年03期
8 李保利,俞士汶;话题识别与跟踪研究[J];计算机工程与应用;2003年17期
9 王永恒;贾焰;杨树强;;大规模文本数据库中的短文分类方法[J];计算机工程与应用;2006年22期
10 夏天;;汉语词语语义相似度计算研究[J];计算机工程;2007年06期
中国重要会议论文全文数据库 前1条
1 王会珍;朱靖波;陈文亮;季铎;张斌;;基于一元语法模型的中文话题追踪[A];第二届全国学生计算语言学研讨会论文集[C];2004年
【相似文献】
中国期刊全文数据库 前10条
1 黄玮;;自适应同步参数未知的Lü混沌系统[J];吉林大学学报(信息科学版);2006年03期
2 宋雄亮;马力妮;刘超;;一种改进的自适应六边形搜索方法[J];北京机械工业学院学报;2009年01期
3 付桂涛;赵天磊;唐川;邢座程;;优化迁移共享的自适应令牌协议[J];上海交通大学学报;2013年01期
4 梁春燕,钟庆昌,谢剑英;基于模型参考的自适应PID控制器[J];上海交通大学学报;2000年05期
5 孙小卓,宋国文,王世力,赵玉华;区间自适应算法与回声抵消[J];信号处理;2001年05期
6 杨盐生;一种自适应鲁棒跟踪模糊控制新算法[J];系统工程与电子技术;2003年06期
7 李国勇;一种改进的自适应PID控制器[J];太原理工大学学报;2003年01期
8 陈亮,刘实,李云剑;基于F-范数的小波自适应量化的语音伪装[J];中山大学学报(自然科学版);2004年S2期
9 项文君,余忠华,殷建军;热态误差的自适应分段补偿方法研究[J];计量技术;2005年09期
10 黄玮,张化光,王智良;参数未知的不同结构混沌系统的自适应同步[J];系统仿真学报;2005年11期
中国重要会议论文全文数据库 前10条
1 杨寒光;;电子地图中的自适应注记[A];工程设计与计算机技术:第十五届全国工程设计计算机应用学术会议论文集[C];2010年
2 孟宏;刘玉;;基于复调制的自适应细化谱算法[A];2008中国仪器仪表与测控技术进展大会论文集(Ⅰ)[C];2008年
3 王平;冯海朋;李勇;康燕;;一种工业无线网络的自适应节能机制[A];2009中国仪器仪表与测控技术大会论文集[C];2009年
4 刘铁;樊剑;钟秀蓉;;地震波的自适应时频分析方法对比研究[A];第17届全国结构工程学术会议论文集(第Ⅲ册)[C];2008年
5 张竞新;张广岩;;全局收敛的自适应广义预报控制算法[A];1991年控制理论及其应用年会论文集(上)[C];1991年
6 彭云;王遂学;陈莽;李欣冀;张宇翔;肖继红;;自适应抗干扰天线在飞行器导航系统中的应用研究[A];2009年全国天线年会论文集(下)[C];2009年
7 张士娟;孙金生;;自适应PID主动队列管理算法设计[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
8 唐文彬;郝重阳;;目标成像识别的自适应融合系统和方法[A];中国图象图形科学技术新进展——第九届全国图象图形科技大会论文集[C];1998年
9 徐振中;;多指机器人手的一种自适应力/位控制方法[A];1994年中国控制会议论文集[C];1994年
10 李维;汪小帆;;群集的自适应速度策略[A];第三届全国复杂动态网络学术论坛论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 王胜春;自适应时频分析技术及其在故障诊断中的应用研究[D];山东大学;2007年
2 刘亚;复杂非线性系统的智能自适应重构控制[D];南京航空航天大学;2003年
3 马国成;车辆自适应巡航跟随控制技术研究[D];北京理工大学;2014年
4 吴礼福;脉冲噪声自适应有源控制算法研究[D];南京大学;2012年
5 梁凌宇;人脸图像的自适应美化与渲染研究[D];华南理工大学;2014年
6 叶镇清;自适应聚类算法挖掘网络模块结构及其在酵母蛋白作用网络中的应用[D];浙江大学;2008年
7 伍宇;移动计算中自适应负载转移决策模型研究[D];复旦大学;2012年
8 朱磊;基于自适应邻域概念的视频图像处理技术研究[D];中国科学技术大学;2007年
9 杨洋;三维人体动作分析及其在智能舞蹈教学系统中的应用[D];中国科学技术大学;2012年
10 田勇;室内无线传感器网络环境自适应定位和路由算法研究[D];大连理工大学;2014年
中国硕士学位论文全文数据库 前10条
1 韦群锋;校园网环境下的自适应考试系统的设计与实现[D];东南大学;2006年
2 彭青艳;粒子滤波及跟踪窗口尺寸自适应调整方法的研究[D];苏州大学;2013年
3 徐聪聪;基于眼动追踪技术的自适应服务方式的实证研究[D];四川师范大学;2014年
4 来林;双螺旋桨自适应双重控制系统设计[D];哈尔滨工业大学;2008年
5 饶睿楠;自适应对消的收发隔离技术[D];西安电子科技大学;2006年
6 汤佳惠;自适应泄漏弹性的基于身份加密机制[D];苏州大学;2012年
7 丁蕾;用于运动载体的三轴自主稳定系统自适应鲁棒控制方法研究[D];南京理工大学;2013年
8 杨晓;基于内容特征的图像自适应压缩研究[D];大连海事大学;2008年
9 任俊伟;关于自适应小波相关问题的一些研究[D];陕西师范大学;2008年
10 王晓玲;复杂网络的自适应同步及其应用[D];北方工业大学;2013年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026