收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于Hadoop的微博用户影响力排名算法研究

陈浩  
【摘要】:随着互联网和移动设备的发展,人与人之间的互动和联系越来越依赖社交网络。微博作为最流行的社交网络平台之一,在信息和言论传播、用户沟通交流等方面所扮演的角色越来越重要。微博影响力作为用户的重要衡量指标,是微博关系的基础,用户影响力越大,所受到的关注程度也就越高,对网络的影响、对信息的传播作用也就越大。通过影响力大的用户进行信息扩散、舆论导向、商品推介和宣传,无疑将收到事半功倍的效果,这对于社会信息传播和商业营销来说意义重大。 在当下IT领域,不管是学术界还是业界,不管是企业、媒体还是技术人员,似乎都在谈论“大数据”。从技术的角度来说,Hadoop是大数据最重要的标签之一。Hadoop是一个能够让用户简易架构和使用的分布式计算平台,用户可以便捷地在Hadoop上开发运行处理海量数据的应用程序。 本文首先研究与讨论了Hadoop平台及其相关技术,以及传统微博用户影响力评定方法,比如追随者数量排名算法、PageRank排名算法和用户行为权值排名算法等。在此基础上提出了基于PageRank改进的用户影响力排名算法UserRank。UserRank算法从用户自身质量及其追随者(即follower)质量入手,考虑追随者数量、追随者质量、评论率、转发率和是否微博认证用户等因素,全面分析得到用户微博影响力指数。最后,UserRank算法在搭建的Hadoop集群上实现,实验结果表明UserRank算法相对于追随者数量排名算法、PageRank算法等都具有很大优势,信息更充分,排名更真实,客观地反映出用户的实际影响力。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 胡彧;封俊;;Hadoop下的分布式搜索引擎[J];计算机系统应用;2010年07期
2 蔡建超;蔡明;;搜索引擎PageRank算法研究[J];计算机应用与软件;2008年09期
3 杨炳儒,李岩,陈新中,王霞;Web结构挖掘[J];计算机工程;2003年20期
4 付真真;陆伟;;基于关键词的搜索引擎优化策略及效果分析[J];现代图书情报技术;2009年06期
5 张亚男;王鑫;;基于内容管理的网站构建系统的研究[J];硅谷;2010年23期
6 陈谦;;PageRank算法在孤立点检测中的应用[J];微型机与应用;2010年24期
7 李长玲;翟雪梅;;基于PageRank的引文分析方法探讨[J];情报理论与实践;2007年01期
8 张毅;张冬梅;;搜索引擎PageRank算法的比较与改进[J];科技创新导报;2008年21期
9 马海波;陈时勇;;基于网页等级的PageRank算法改进[J];大连交通大学学报;2010年02期
10 宋聚平,王永成,尹中航,滕伟;对网页PageRank算法的改进[J];上海交通大学学报;2003年03期
11 张佳;梁少华;;Web结构挖掘与其基于超链接结构的算法[J];科技信息;2007年02期
12 潘大胜;;面向校园网搜索引擎的PageRank改进算法[J];湖南文理学院学报(自然科学版);2009年01期
13 洪田玉;陈志刚;;一种跨语言的自动摘要技术[J];电脑与信息技术;2009年04期
14 林元元;;搜索引擎优化技术(SEO)的应用[J];软件导刊;2009年11期
15 卢超 ,朱政文 ,方华 ,蔡克红 ,陈俊良;高效Internet个性化信息发现的实现[J];计算机应用与软件;2003年12期
16 何晓阳,吴强,吴治蓉;HITS算法与PageRank算法比较分析[J];情报杂志;2004年02期
17 程传鹏;郑源;;基于元搜索的主题式WebCrawler的研究[J];中原工学院学报;2006年02期
18 崔明;王振妘;;当前搜索引擎不足及改进建议[J];图书馆学研究;2006年07期
19 杜光芹;张化祥;;基于超链接结构和向量空间模型的网页排序算法研究[J];信息技术与信息化;2006年04期
20 张光年;李茂青;;基于PageRank算法的一种搜索引擎优化方法及实现[J];科技信息;2007年04期
中国重要会议论文全文数据库 前10条
1 蔺继国;徐锡山;;一种基于用户点击数据的个性化PageRank算法[A];第六届全国信息检索学术会议论文集[C];2010年
2 陈小飞;王轶彤;冯小军;;一种基于网页质量的PageRank算法改进[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
3 李文;李淼;张建;朱海;陈雷;;基于混淆网络和PageRank的Nbest重排序[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
4 张佳宝;周斌;吴泉源;;基于Hadoop的并行化命名实体识别技术研究与实现[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
5 金松昌;方滨兴;杨树强;贾焰;;基于Hadoop的网络安全日志分析系统的设计与实现[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
6 丁辉;张大华;罗志明;;基于Hadoop的海量数据处理平台研究[A];2011电力通信管理暨智能电网通信技术论坛论文集[C];2011年
7 刘建毅;王菁华;王枞;;基于语言网络的关键词抽取[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
8 刘菁菁;林鸿飞;杨志豪;;基于PageRank和锚文本的网页排序研究[A];第三届学生计算语言学研讨会论文集[C];2006年
9 陆勇;侯汉清;;基于词典注释的汉语同义词自动识别[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
10 杨磊;束罡;牛振东;;基于引力模型的链接分析(英文)[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 李韧;基于Hadoop的大规模语义Web本体数据查询与推理关键技术研究[D];重庆大学;2013年
2 王菁华;文本中知识的获取[D];北京邮电大学;2008年
3 李方涛;基于产品评论的情感分析研究[D];清华大学;2011年
4 孙韬;社会化媒体中提升用户参与度的关键因素研究[D];北京大学;2013年
5 钱筱琳;基于用户的家具设计目标定位分析系统研究[D];南京林业大学;2013年
6 肖宇;校园网络信息传播特性与用户影响力研究[D];华中科技大学;2012年
7 张勇实;基于链接相似性分析的WEB结构挖掘方法研究[D];哈尔滨工程大学;2012年
8 张磊;个性化推荐和搜索中若干关键问题的研究[D];北京邮电大学;2009年
9 王永刚;以数据为中心的在线社会网络若干安全问题研究[D];北京大学;2013年
10 刘继;基于网络社团分析的协作推荐方法研究[D];大连理工大学;2010年
中国硕士学位论文全文数据库 前10条
1 陈浩;基于Hadoop的微博用户影响力排名算法研究[D];华东理工大学;2014年
2 冯静;微博用户排名机制的研究[D];燕山大学;2012年
3 姜玥旭;PageRank算法的改进及在生物网络数据上的应用[D];吉林大学;2012年
4 乔红光;基于改进PageRank算法的文献价值评估方法研究[D];河北大学;2013年
5 赵波;PageRank算法在非网页检索问题中的应用[D];复旦大学;2010年
6 刘先明;基于链接分析的PageRank排序算法的改进研究[D];湖北工业大学;2010年
7 李更生;基于时间反馈和分类技术的PageRank算法改进研究[D];北京化工大学;2013年
8 袁方;基于改进PageRank算法的个性化搜索的研究[D];北京邮电大学;2012年
9 李稚楹;基于网页内容和时间反馈的网页排序PageRank算法研究[D];重庆理工大学;2012年
10 田浩;基于PageRank值的文本相似度改进模型[D];湖北工业大学;2010年
中国重要报纸全文数据库 前10条
1 孙定;云计算、大数据与Hadoop[N];计算机世界;2011年
2 CUBN记者 陈文喜;安全巨头又爆“口水仗” 奇虎360遭瑞星“后门”诽谤?[N];中国联合商报;2010年
3 实习记者 孙超逸;腾讯360“隔空交锋”斗争升级[N];北京日报;2010年
4 ;熊猫软件发现Inwi 一种用于非法盗取用户信息的特洛伊木马[N];通信信息报;2002年
5 本版编译 王惠民;打印机暗藏代码可暴露用户信息[N];北京科技报;2005年
6 戴宝纯;ERP实施:提高用户信息满意度[N];中国冶金报;2003年
7 李洋;遇到查询用户信息该咋办?[N];人民邮电;2006年
8 本报记者  史晓菲;手机实名 消费者最担心个人资料外泄[N];消费日报;2006年
9 河北 我思故我在;聊聊BAR[N];电脑报;2004年
10 周童;“网立方”促新媒体精准营销[N];计算机世界;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978