收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于六度分割理论和中心度识别微博网络的关键人物

李熙  
【摘要】:随着互联网信息和科技的演变,迎来了Web2.0时代,微博作为一种新兴的传播载体,迅速崛起,并受到人们的广泛关注。与传统媒体相比,其具有信息量大、信息传播速度快、即时性强等特点,这些特点使其成为了人们交流和传递信息的新平台,也给谣言散播提供了新渠道。面对每天产生过亿条的微博数据量,如何处理微博数据,如何及时有效的识别微博中的关键节点,这都是本文将要面对的挑战。本文分析了微博的基本功能,信息特点以及传播特点等等,在此基础上结合国内外现有的关于中心度和聚类分类的算法,着重于研究了识别微博网络中关键节点的技术,在时间与精确度的平衡处理下,提出了解决方法: (1)对微博的特点进行整理分析,结合中心度算法思想,给出了互动指数和影响指数,并将两种指数结合起来,最终提出了适用于微博的关键指数,用于识别微博网络中的关键人物。 (2)面对微博每天产生的海量数据,本文结合了六度分割理论的思想,采用SPLINE算法原理,对规模过大的节点集进行整理,移除与源节点最短路径大于5的节点,经过此步,得到了若干联系紧密的节点集。 (3)针对紧密联系的节点集,本文分析了层次聚类算法,采用基于模块度凝聚数据的CNM算法,对微博数据集进行聚类,将相似度较高的微博聚集在一起,划分数据集,形成若干更加重要的节点集。 (4)针对第三步所得重要节点集,提取出影响力节点的用户信息,对其使用关键节点的算法,有效识别出微博网络中的关键节点。 最后,验证提出的方法,本文使用了该方法进行算法编程,对NLPIR微博内容语料库进行微博网络关键节点的识别,针对实验结果,本文对其进行分析,表明本文的方法是可行的和实用的。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张敏;耿焕同;王煦法;;一种利用BC方法的关键词自动提取算法研究[J];小型微型计算机系统;2007年01期
2 陶乃航;赵星;彭晓东;翟伟希;;中心度指标在期刊引文网络分析中的运用及改进[J];图书情报工作;2009年14期
3 栾春娟;曾国屏;;基于SNA核心技术领域测度研究[J];图书情报工作;2011年06期
4 高小强;赵星;陶乃航;;网络中心度用于期刊引文评价的有效性研究[J];大学图书馆学报;2009年05期
5 梁潇;;三螺旋创新模式中信息流主体研究——以信息论加权的社会网络分析法[J];情报科学;2008年01期
6 张玥;朱庆华;;Web 2.0环境下学术交流的社会网络分析——以博客为例[J];情报理论与实践;2009年08期
7 马丽;赵星;彭晓东;;新型期刊引文评价方法比较研究[J];情报理论与实践;2010年05期
8 张世怡;刘春茂;;中文网站社会网络分析方法的实证研究[J];情报科学;2011年02期
9 崔鑫;胡勇;丁雪峰;吴越;吴荣军;;基于SNA点度的网络舆论导向机理研究[J];四川大学学报(工程科学版);2011年01期
10 柳朝阳;用聚类回归模型预测粮食产量[J];计算机应用;1988年06期
11 阎辉,张学工,李衍达;基于核函数的最大间隔聚类算法[J];清华大学学报(自然科学版);2002年01期
12 颜雪松,蔡之华;一种快速聚类高维数据的算法研究[J];计算机工程;2003年01期
13 刘志成,文全刚;“K-中心点”聚类算法分析及其实现[J];电脑知识与技术;2005年06期
14 熊家军,涂静,李庆华;入侵检测聚类中相似性度量的等效性研究[J];计算机工程;2005年07期
15 夏咏梅;基于文本挖掘的分类与聚类技术[J];情报探索;2005年03期
16 林树宽;张冬岩;李文贤;张天成;张一飞;;基于聚类和主成分分析的神经网络预测模型[J];小型微型计算机系统;2005年12期
17 陈婷婷;方滨兴;郑军;;基于层次自组织特征映射的网络异常检测系统数据分析器[J];计算机应用与软件;2006年05期
18 陈琦;刘蓉;周茉;罗强;;一种改进的关联规则挖掘算法[J];计算机与数字工程;2006年08期
19 胡元蛟;邵波;;留学咨询网链接结构的社会网络分析[J];新世纪图书馆;2010年05期
20 余重远;李珊;赵文;李瑞;;基于SNA的网络舆论领袖确定方法研究[J];科技信息;2011年12期
中国重要会议论文全文数据库 前10条
1 刘法建;张捷;陈冬冬;;基于网络分析的中国入境旅游流特征及动因研究[A];中国地理学会百年庆典学术论文摘要集[C];2009年
2 何书杰;邓永;费翔;杨庆国;;滤棒添加香线的加香量和中心度控制技术[A];中国烟草学会2006年学术年会论文集[C];2007年
3 穆向禹;浦剑涛;张树武;徐波;;基于状态子空间聚类的多层MLLR自适应算法[A];第七届全国人机语音通讯学术会议(NCMMSC7)论文集[C];2003年
4 武森;金海燕;高学东;;数据挖掘中CABOSFV聚类算法的实现与应用[A];全国第八届工业工程与企业信息化学术会议论文集[C];2004年
5 杜方键;杨宏晖;;K均值聚类优化集成学习[A];2011'中国西部声学学术交流会论文集[C];2011年
6 王宁;苑春法;黄昌宁;;汉语名词和形容词的聚类算法研究[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年
7 饶鲜;李斌;杨绍全;;用核聚类法进行异常检测[A];信号与信息处理技术第三届信号与信息处理全国联合学术会议论文集[C];2004年
8 杨广林;赵云峰;王书理;;Gabor滤波器及其在图像特征提取方面的优化算法[A];2005年中国智能自动化会议论文集[C];2005年
9 冯又层;蔡勖;;基于自组织特征映射的证券市场聚类[A];第二届全国复杂动态网络学术论坛论文集[C];2005年
10 孙俊;曹海龙;赵铁军;;面向句法分析的样本选择[A];第三届学生计算语言学研讨会论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 吕海拜;合著网络中作者的合作模式分析[D];哈尔滨工业大学;2010年
2 廖丽平;模糊社会网络分析(FSNA)及企业技术创新影响因素研究[D];广东工业大学;2012年
3 吕龑;200GeV金金碰撞中K_s~0和Λ粒子椭圆流的中心度依赖性[D];华中师范大学;2007年
4 高红艳;社会网络与“新生存空间”的生成[D];上海大学;2007年
5 王鑫;高能重离子碰撞中末态粒子的产生与关联[D];华中师范大学;2013年
6 姚涛;QGP强子化过程中夸克组合机制普适性的研究[D];山东大学;2009年
7 王亚平;超高能诱发核反应中的光子与μ子探针研究[D];华中师范大学;2008年
8 彭新敏;企业网络对技术创新绩效的作用机制研究:利用性—探索性学习的中介效应[D];浙江大学;2009年
9 陈毅恒;文本检索结果聚类及类别标签抽取技术研究[D];哈尔滨工业大学;2010年
10 马赓宇;基于HMM的时间序列聚类与识别[D];清华大学;2004年
中国硕士学位论文全文数据库 前10条
1 李熙;基于六度分割理论和中心度识别微博网络的关键人物[D];西华大学;2013年
2 李丽蓉;管理信息系统领域的合著网络研究[D];哈尔滨工业大学;2010年
3 杨娇;企业员工工作中心度的测量及其与工作—家庭冲突的关系[D];沈阳师范大学;2012年
4 于洋;寻找消隐的中心空间[D];郑州大学;2012年
5 杨志强;研发成员创新人格与人际中心度对团队效能的影响[D];山西大学;2010年
6 孙超;微博网络信息流的影响因素研究[D];清华大学;2012年
7 贾媛媛;若干图的Estrada指标的研究[D];青海师范大学;2009年
8 王云飞;RHIC中强子p_T谱的中心度和能量依赖[D];曲阜师范大学;2008年
9 张岩;中小企业网络:结构、资源与绩效[D];汕头大学;2007年
10 万英;音乐论坛社会网络挖掘系统设计与实现[D];电子科技大学;2009年
中国重要报纸全文数据库 前10条
1 ;少女妈妈疲于奔命[N];中国妇女报;2003年
2 本报记者  段树军 孟歌;提升合肥中心城市带动力[N];中国经济时报;2006年
3 胡先权施惊雷;川渝中烟自主创新结硕果 品牌打造跃上新层面[N];经理日报;2008年
4 本报记者  包月阳 孟歌 王永群;合肥:新蓝图指导下的城建新格局[N];中国经济时报;2006年
5 ;节约文化传统是影响指数的关键[N];社会科学报;2009年
6 杨文;长沙电机环保工业园安新家[N];中国工业报;2007年
7 王云鹤 熊立;武汉电信直销中心剑指聚类市场[N];人民邮电;2009年
8 郭彦俊;植电极可让脑瘫患者开口说话[N];中国社会报;2007年
9 ;2007年 印象吴忠旅游[N];吴忠日报;2008年
10 记者 肖卓;聚类市场:想挖金矿不容易[N];人民邮电;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978