收藏本站
《武汉大学》 2012年
收藏 | 手机打开
二维码
手机客户端打开本文

基于微博平台的事件趋势分析及预测研究

田野  
【摘要】:社交网络服务是近年来迅速兴起并逐渐渗透到社会各用户群体的计算机应用服务,微博是其中一个重要应用,并且在最近几年得到迅速发展。平台用户的高覆盖性、内容的自生产性和信息传播的及时性,使微博平台成为目前重要的消息传播媒介。平台上的巨大用户规模和海量信息内容,为研究者们提供了良好数据以进行群体用户的信息挖掘。本文尝试利用微博平台的海量文本资源,抽取出各种特征数据,对传统研究中难以量化的事件趋势这一社会内容进行计算和分析,并根据基于样本范围内数据的趋势建模,来预测范围外的事件未来趋势。本文旨在通过这一方面的工作,阐述对难以进行形式化描述的非确定性社会内容进行计算的可行性。 本文研究了在微博平台上进行事件趋势分析及预测的几个关键问题,包括群体行为的定义与计算方法;事件趋势的样本回归分析和未来趋势预测模型;事件相关微博内容的识别及获取方法;微博平台上的用户特征和博文文本特征抽取;以及事件趋势的形式化描述和特征指标抽取方法。主要的研究工作和创新点概括如下: 1.提出了一种基于群体行为的社会计算方法。首先根据样本用户的特征抽取和分类,获得特征相应的指标和计算方法,再通过对大规模用户特征值的综合计算,获得该用户群体的整体特征,直接对用户整体进行量化计算。结果表明,采用该方法进行群体特征计算具有可行性。 2.提出了一种基于微博平台的事件趋势分析和事件未来趋势预测的算法,并给出了具体过程。首先通过对样本范围内数据的计算,获得事件趋势各相关指标的数据值,再通过回归分析,构建基于样本数据的回归模型。然后通过对最佳拟合模型的分析,计算预测点之前单位时长内的回归模型函数值,根据差值斜率的融合模型计算预测点的未来趋势。在实际语料基础上进行的实验结果表明该方法可以辅助人工决策,与实际数据的绝对差异较小,且在针对情感比重一类相对值的实验中有较好结果。 3.提出了一种事件内容的抽取方法。该方法结合了MACD算法(MovingAverage Convergence and Divergence,指数平滑异同移动平均线)和LDA算法(Latent Dirichlet Allocation,潜在狄利克雷分布),分别进行突发事件内容的获取和已知事件的相关文本内容扩展。利用MACD算法,计算微博文本中单位时间片的词频变化,利用短周期移动平均线和长周期移动平均线之间的聚合及分离情况,识别平台文本流中讨论量突增内容,以此抽取有可能成为讨论热点的事件。而LDA算法,则被用来计算事件相关的“词袋”内容及各相关词在该事件中的关联权重。根据若干词组合的方式作为关键词查询的补充,以此扩展事件相关内容的抽取结果。实验结果表明此抽取方法效果明显。 4.本文提出了一套微博平台上相关内容的形式化定义方法和一种简单高效的用户特征识别方法,以及事件特征的定义和事件趋势指标的建立方法。首先对用户群体和事件趋势等非数值化的社会内容进行量化,通过此方法对平台系统、平台涉及的网络、平台用户、用户消息内容等各项指标进行具体的数值计算,用可计算的数学模型对非量化的社会趋势内容进行描述。然后在此基础上,基于社会学、传播学和心理学中的个体及群体特征分析,以样本数据中标注用户的特征取值构造规则集,再以规则集为筛选标准,根据测试用户关键特征的数据值关系,来区分微博平台上的关键用户和垃圾用户,较好的支持了针对研究对象的计算与分析。
【学位授予单位】:武汉大学
【学位级别】:博士
【学位授予年份】:2012
【分类号】:TP393.09

手机知网App
【参考文献】
中国期刊全文数据库 前5条
1 王飞跃;人工社会、计算实验、平行系统——关于复杂社会经济系统计算研究的讨论[J];复杂系统与复杂性科学;2004年04期
2 冯志伟;;当前自然语言处理发展的几个特点[J];暨南大学华文学院学报;2006年01期
3 彭京;杨冬青;唐世渭;付艳;蒋汉奎;;一种基于语义内积空间模型的文本聚类算法[J];计算机学报;2007年08期
4 王飞跃;社会计算与数字网络化社会的动态分析[J];科技导报;2005年09期
5 王飞跃;社会计算——科学、技术与人文的数字化动态交融[J];中国基础科学;2005年05期
中国重要会议论文全文数据库 前1条
1 骆卫华;刘群;程学旗;;话题检测与跟踪技术的发展与研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
【共引文献】
中国期刊全文数据库 前10条
1 李远行;大共同体本位?小共同体本位?——中国农村基层组织性质探析[J];安徽大学学报(哲学社会科学版);2004年01期
2 任丙强;家庭与近代资本主义的兴起——对马克斯·韦伯观点的阐释[J];安徽教育学院学报;2004年01期
3 陈亚鹏;李向利;;中国信用制度的法理思考[J];安徽职业技术学院学报;2006年04期
4 贾莉莉;徽州民居村落聚居形态的有机更新[J];安徽建筑工业学院学报(自然科学版);2004年06期
5 张传恩;文太林;;农村劳动力回归创业是建设社会主义新农村的有效途径——以安徽省金寨县关庙乡为例[J];安徽农业科学;2006年11期
6 刘进才;京派小说还乡叙事的文化内涵及美学风貌[J];安徽师范大学学报(人文社会科学版);2003年06期
7 卢保娣;浅析《乡土中国》中的“差序格局”[J];安阳大学学报;2004年01期
8 ;目前我国人口流动的经济学意义[J];北方论丛;1996年03期
9 潘修华;论中国公民社会组织政治参与的建设问题[J];北京航空航天大学学报(社会科学版);2003年03期
10 李纯;非正式制度与家族企业的发展[J];北京工商大学学报(社会科学版);2005年01期
中国重要会议论文全文数据库 前10条
1 王惠;苏新春;;XHK基于语法知识的汉语词义描述[A];第六届汉语词汇语义学研讨会论文集[C];2005年
2 王松;杨沐昀;赵铁军;;基于统计的命名实体翻译[A];黑龙江省计算机学会2007年学术交流年会论文集[C];2007年
3 陈小荷;;属性分析说略[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
4 郝长伶;董强;;知网知识库描述语言[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
5 周强;陈祖舜;梅立军;;情境描述的构建方法研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
6 吴平博;陈群秀;马亮;;基于时空分析的线索性事件的抽取与集成系统研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
7 骆卫华;于满泉;许洪波;王斌;程学旗;;基于多策略优化的分治多层聚类算法的话题发现研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
8 邱立坤;程葳;龙志祎;孙娇华;;面向BBS的话题挖掘初探[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
9 张桂平;蔡东风;徐立军;尹宝生;陈建军;;以互联网为知识源的基于语段分析的交互式机器翻译技术的研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
10 徐琳宏;林鸿飞;杨志豪;;基于语义理解的文本倾向性识别机制[A];第三届学生计算语言学研讨会论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 戴俊潭;电视传播与转型期中国农民的意识现代化[D];复旦大学;2004年
2 许建潮;Web挖掘中若干问题的研究[D];吉林大学;2005年
3 张军;人的发展的历史形态及其当代意蕴[D];中共中央党校;2002年
4 吴怀连;边缘性:中国社会结构性质分析,以重庆·合川市为例[D];中国社会科学院研究生院;2000年
5 应星;从“讨个说法”到“摆平理顺”[D];中国社会科学院研究生院;2000年
6 傅建明;我国小学语文教科书价值取向研究[D];华东师范大学;2002年
7 刘翌;我国公司治理文化理论与实证研究[D];浙江大学;2002年
8 尹晨;中国证券市场信息监管研究[D];复旦大学;2003年
9 黄剑波;“四人堂”纪事——中国乡村基督教的人类学研究[D];中央民族大学;2003年
10 符戈;中国民营企业融资问题研究[D];福建师范大学;2003年
中国硕士学位论文全文数据库 前10条
1 曾慧宏;面向网络学习的知识服务平台及检索方法研究[D];中南大学;2005年
2 闫峰;大学生心理咨询专家系统的研究和实现[D];湖南大学;2006年
3 李智;基于树结构的网页数据自动抽取方法的研究与实现[D];吉林大学;2005年
4 张玉良;一种基于后缀树的包装器自动生成方法的研究[D];吉林大学;2005年
5 汤赛丽;常识知识问答系统中知识库构建的研究与设计[D];河南大学;2005年
6 李跃进;基于Internet的信息抽取技术研究[D];大连理工大学;2005年
7 王展楣;关系词“是”和“be”的伪歧义分析及判别[D];大连理工大学;2005年
8 金珠;基于知网的话题跟踪和倾向性跟踪研究[D];大连理工大学;2005年
9 孟令谦;基于ontology的中文信息抽取系统的研究与实现[D];电子科技大学;2004年
10 姬敏;农村社区环境与区域经济发展[D];南京农业大学;2000年
【同被引文献】
中国期刊全文数据库 前5条
1 邵强,李友俊,田庆旺;综合评价指标体系构建方法[J];大庆石油学院学报;2004年03期
2 李红燕;基于模糊层次分析法的可信度评估方法[J];数学的实践与认识;2004年05期
3 唐文,陈钟;基于模糊集合理论的主观信任管理模型研究[J];软件学报;2003年08期
4 袁禄来;曾国荪;王伟;;基于Dempster-Shafer证据理论的信任评估模型[J];武汉大学学报(理学版);2006年05期
5 于建嵘;;集体行动的原动力机制研究——基于H县农民维权抗争的考察[J];学海;2006年02期
中国硕士学位论文全文数据库 前1条
1 卢锋华;顾客对B2C网站初始信任的影响因素研究[D];浙江大学;2006年
【二级参考文献】
中国期刊全文数据库 前10条
1 彭喜元,彭宇,戴毓丰;群智能理论及应用[J];电子学报;2003年S1期
2 高海兵,高亮,周驰,喻道远;基于粒子群优化的神经网络训练算法研究[J];电子学报;2004年09期
3 李耀东,崔霞,戴汝为;综合集成研讨厅的理论框架、设计与实现[J];复杂系统与复杂性科学;2004年01期
4 王飞跃,史帝夫·兰森;从人工生命到人工社会——复杂社会系统研究的现状和展望[J];复杂系统与复杂性科学;2004年01期
5 王飞跃,汤淑明;人工交通系统的基本思想与框架体系[J];复杂系统与复杂性科学;2004年02期
6 王飞跃,戴汝为,张嗣瀛,陈国良,汤淑明,杨东援,杨晓光,李平;关于城市交通、物流、生态综合发展的复杂系统研究方法[J];复杂系统与复杂性科学;2004年02期
7 戴汝为,李耀东;基于综合集成的研讨厅体系与系统复杂性[J];复杂系统与复杂性科学;2004年04期
8 王飞跃;人工社会、计算实验、平行系统——关于复杂社会经济系统计算研究的讨论[J];复杂系统与复杂性科学;2004年04期
9 王飞跃,蒋正华,戴汝为;人口问题与人工社会方法:人工人口系统的设想与应用[J];复杂系统与复杂性科学;2005年01期
10 李德毅;刘坤;孙岩;韩明畅;;涌现计算:从无序掌声到有序掌声的虚拟现实[J];中国科学(E辑:信息科学);2007年10期
【相似文献】
中国期刊全文数据库 前10条
1 李欣;李若琼;董海鹰;;基于仿生群体协同的集群智能控制研究[J];电气自动化;2006年04期
2 ;中国电子工业运行分析及2007趋势预测[J];财经界;2007年06期
3 崔秀伶;李晓白;郎荣玲;;机载设备性能趋势预测系统研究[J];微计算机信息;2008年24期
4 杨杰,吴建兵,吴月华,刘际明,何多慧;自主式机器人群体行为的进化计算实现[J];机器人;1999年01期
5 胡宏伟;周晓军;庞茂;;基于LS-SVM的火电厂给水泵组状态趋势预测研究[J];传感技术学报;2007年05期
6 陈世明;黄江平;姜红;;不确定环境中的群体行为建模及仿真研究[J];计算机工程与应用;2007年21期
7 李钢;周东华;;一类设备故障过程的故障趋势预测方法研究[J];空军工程大学学报(自然科学版);2007年04期
8 蔡芝蔚;;计算机技术发展研究[J];电脑与电信;2008年02期
9 王洪波;朱启兵;;基于EMD和LS-SVM的非平稳振动信号趋势预测[J];计算机工程与应用;2008年16期
10 岳峰;胡晓峰;李志强;罗批;荣明;;基于复合虚拟力场的大规模人群行为模拟[J];系统仿真学报;2009年01期
中国重要会议论文全文数据库 前10条
1 柏文阳;何瑗;马耀华;肖建华;徐洁磐;;基于消息的汇率趋势预测方法[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
2 卢山;;基于灾时网络动员导引下的群体行为研究[A];第19届中国社会学年会社会稳定与社会管理机制研究论文集[C];2009年
3 冯岑;房莉;;机织物的叠层与透气量变化关系的趋势预测[A];苏州市自然科学优秀学术论文汇编(2008-2009)[C];2010年
4 苏永康;;船舶安全管理群体行为与动力理论探讨[A];1995-2009航海技术论文选集(第1集)[C];2010年
5 方亚;施侣元;;乳腺癌危险因素综合评价及其趋势预测[A];新世纪预防医学面临的挑战——中华预防医学会首届学术年会论文摘要集[C];2002年
6 黎平;刘国栋;;强化法律对群体行为的控制是当务之急[A];行为法学在中国的崛起[C];1993年
7 易奇志;;多细胞网络系统中信号整合的效果[A];第五届全国复杂网络学术会议论文(摘要)汇集[C];2009年
8 杜淑菊;;宣武区1993—2000年糖尿病死亡分析及趋势预测[A];新世纪预防医学面临的挑战——中华预防医学会首届学术年会论文摘要集[C];2002年
9 陶磊;;湖北省2002年森林火灾趋势预测及对策[A];2002年湖北省减轻自然灾害白皮书——湖北省2002年重大自然灾害合趋势分析会商会论文集[C];2002年
10 梁伟福;;奇特的岩溶塌陷[A];广西生态建设与经济协调发展学术研讨会论文集[C];2001年
中国重要报纸全文数据库 前10条
1 编译 黄梦 ;2005年五大技术与趋势预测(上)[N];电脑商报;2005年
2 史芬;2000年全国装饰装修趋势预测[N];中华合作时报;2000年
3 记者 范俊;2005年IT行业趋势预测[N];国际金融报;2004年
4 ;台式PC趋势预测[N];中国计算机报;2004年
5 王松群;2005年职业发展趋势预测[N];中国旅游报;2004年
6 仇威;今后20年的出版与印刷趋势预测(12)[N];中国包装报;2002年
7 牟鑫;亦庄地产今后什么样?[N];华夏时报;2002年
8 记者 黄智军;Gartner发布十大趋势预测 云和虚拟化最热门[N];计算机世界;2011年
9 记者王晴颖;趋势预测引导产品战略型开发[N];中国服饰报;2009年
10 钟实;2005年冷饮行业现状及市场趋势预测[N];经理日报;2005年
中国博士学位论文全文数据库 前10条
1 田野;基于微博平台的事件趋势分析及预测研究[D];武汉大学;2012年
2 张文斌;汽轮发电机组状态趋势预测及故障诊断方法研究[D];浙江大学;2009年
3 徐旭林;社会群体行为建模及其动力学分析[D];南开大学;2010年
4 王素锋;煤矿员工的事故心理致因及行为决策研究[D];中国矿业大学(北京);2010年
5 程远;基于演化博弈论的群体疏散行为研究[D];北京化工大学;2012年
6 夏功成;企业知识群体行为的定性模拟研究[D];华中科技大学;2005年
7 杨建军;关中地区地震活动规律及其与构造活动的关系研究[D];西北大学;2006年
8 陈晓东;大陆台资企业的区域集群与竞争优势研究[D];厦门大学;2009年
9 叶金珠;网络突发事件蔓延及干预研究[D];华中科技大学;2012年
10 马笑潇;智能故障诊断中的机器学习新理论及其应用研究[D];重庆大学;2002年
中国硕士学位论文全文数据库 前10条
1 于艳;多个体系统的群体行为与稳定性分析[D];北方工业大学;2010年
2 蔡云;突发事件下的群体行为模拟研究[D];浙江大学;2012年
3 曹元元;某省梅毒和淋病流行特征及趋势预测研究[D];山西医科大学;2012年
4 王建利;滚动轴承性能退化评价与趋势预测研究[D];大连理工大学;2013年
5 林祈元;基于HMM的回转窑喂煤量趋势预测[D];湖南大学;2011年
6 王沙沙;基于类模型的Web舆情趋势预测[D];电子科技大学;2011年
7 姜正;水轮发电机组轴系故障趋势预测与评估[D];华中科技大学;2012年
8 赵自芳;河南省农村劳务经济发展问题研究[D];郑州大学;2004年
9 张伟;基于GA优化的SVM算法的股票趋势预测[D];吉林大学;2010年
10 汪惠;基于小波的企业管理预测方法研究[D];北京工业大学;2003年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026