收藏本站
《河北大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

基于改进的PageRank的网页信息可信度评估方法研究

马伟瑜  
【摘要】:近年来,随着Internet的快速发展,Web为用户提供了大量的网页信息资源,并逐步成为了人们获取信息的主要途径之一。但Web数量及内容的快速增加,使得用户越来越难对网络中信息的可信程度进行甄别。 本文在传统的Web结构挖掘算法PageRank的基础之上,针对如何评估Web信息可信度的问题进行了研究。 通过实际考察和具体分析,网页信息可信的影响因素主要有网页之间的交互结构、网页信息主题之间的相关程度以及网页信息的发布时间等。本文综合考虑了上述影响因素,提出了一种基于改进的PageRank的网页信息可信度评估方法。该方法首先考虑了网页间的交互结构,通过分析网页信息所在网页的链接与被链接的数量、对象,建立网页信息自身的交互结构图;然后利用TF-IDF公式将网页信息主题表示成tf ? idf向量的形式,并利用向量余弦距离公式计算网页信息主题间的相关程度,通过分析网页信息主题间的相关程度把最具代表性的网页信息提取出来;此外,本文又考虑到网页信息内容具有不同的发布时间,因而该方法在可信度评估过程中引入了时间衰减函数,利用该函数反映时间这一要素对网页信息可信度的影响。文章最终的评估方法是在加权的交互结构图中计算每个网页信息的可信度。文中将网页信息主题之间的相关程度、网页信息的发布时间等相关因素引入到网页信息的交互结构图中,利用信任传播机制在交互结构图中维护节点的可信度,达到了一个结点的可信度改变后,其他相关结点都随之动态改变的目的。 通过具体实验对本文提出方法进行了验证,实验结果表明基于改进的PageRank的网页信息可信度评估方法能够为用户提供更为可信的、有价值的网页信息。
【学位授予单位】:河北大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP393.092

【引证文献】
中国期刊全文数据库 前1条
1 王平;程齐凯;;网络信息可信度评估的研究进展及述评[J];信息资源管理学报;2013年01期
中国硕士学位论文全文数据库 前2条
1 张珺;基于Web公共舆情自动分析及预警关键技术研究[D];北京邮电大学;2012年
2 周静;基于信任的协同过滤推荐算法研究[D];燕山大学;2013年
【参考文献】
中国期刊全文数据库 前10条
1 李荣军;王小捷;周延泉;;PageRank模型在中文情感词极性判别中的应用[J];北京邮电大学学报;2010年05期
2 刘彤彤;伍小芹;;融入权威性与相关性的PageRank算法[J];信息技术;2008年11期
3 张岭,马范援;加速评估算法:一种提高Web结构挖掘质量的新方法[J];计算机研究与发展;2004年01期
4 杨小平,丁浩,黄都培;基于向量空间模型的中文信息检索技术研究[J];计算机工程与应用;2003年15期
5 何明;周军;李树友;;语义相似的PageRank改进算法[J];计算机工程与应用;2009年27期
6 田甜;倪林;;基于PageRank算法的权威值不均衡分配问题[J];计算机工程;2007年18期
7 焦金涛;;基于PageRank的Web挖掘改进算法[J];计算机工程;2009年15期
8 赵波;;基于PageRank的计算机性能评价方法[J];计算机工程;2010年17期
9 鞠时光;吕霞;王崝;;基于时间链接分析的页面排序优化算法[J];计算机应用研究;2009年07期
10 艾静;王仲远;孟小峰;;C-Rank:一种Deep Web数据记录可信度评估方法[J];计算机科学与探索;2009年06期
【共引文献】
中国期刊全文数据库 前10条
1 黎孟雄;;基于移动Agent的教学资源智能采集系统的研究[J];长春大学学报;2010年12期
2 吴江宁;王晓欢;;面向呼叫中心的知识导航系统研究[J];大连理工大学学报;2009年06期
3 马海波;陈时勇;;基于网页等级的PageRank算法改进[J];大连交通大学学报;2010年02期
4 阎亚杰;;网页去重方法研究[J];电脑开发与应用;2008年08期
5 陈丽珍;卡米力·毛依丁;;基于WEB信息检索系统中维文处理方面的研究[J];电脑知识与技术;2005年36期
6 高灵霞;;基于主题爬虫的个性化搜索引擎技术分析[J];电脑知识与技术;2009年32期
7 李江;殷之明;;链接分析研究综述[J];大学图书馆学报;2008年02期
8 张芳;;基于用户行为的PageRank算法[J];福建电脑;2009年06期
9 徐家良;;个性化服务在WAP中的应用[J];福建电脑;2012年02期
10 曹青;;中国旅游企业电子商务网站评价研究——基于网络链接与网络影响因子测度的分析[J];广东广播电视大学学报;2009年02期
中国重要会议论文全文数据库 前6条
1 马春雷;;基于向量空间模型的中文文本检索研究[A];2007年河北省电子学会、河北省计算机学会、河北省自动化学会、河北省人工智能学会、河北省计算机辅助设计研究会、河北省软件行业协会联合学术年会论文集[C];2007年
2 胡金柱;陈俊平;卢丽君;赵东萌;张琮;王益维;;基于本体视图的特征项抽取方法研究[A];第二十二届中国(天津)'2008IT、网络、信息技术、电子、仪器仪表创新学术会议论文集[C];2008年
3 胡金柱;陈俊平;卢丽君;赵东萌;张琮;王益维;;基于本体视图的特征项抽取方法研究[A];第二十三届中国(天津)2009IT、网络、信息技术、电子、仪器仪表创新学术会议论文集[C];2009年
4 刘国刚;;人工智能客户服务体系的研究与实现[A];2008年中国通信学会无线及移动通信委员会学术年会论文集[C];2008年
5 彭渊;赵铁军;郑德权;于浩;;基于特征句抽取的网页去重研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
6 程刚;;近年我国企业网站评价研究综述[A];促进科技经济结合,服务创新驱动发展——蚌埠市科协2012年度学术年会论文集[C];2012年
中国博士学位论文全文数据库 前10条
1 杨瑞龙;基于短语特征的Web文档聚类方法研究[D];重庆大学;2010年
2 吴春明;Deep Web数据集成关键技术及其在农业领域的应用[D];西南大学;2011年
3 徐建锁;知识管理和文本挖掘的若干问题研究[D];天津大学;2004年
4 周斌;面向公众服务的电子政务研究[D];同济大学;2007年
5 宗校军;中文网页定题采集及分类研究[D];华中科技大学;2006年
6 臧铖;个性化搜索中隐私保护的关键问题研究[D];浙江大学;2008年
7 陈红涛;基于搜索日志的用户行为研究及应用[D];北京邮电大学;2008年
8 高茂庭;文本聚类分析若干问题研究[D];天津大学;2007年
9 周婷婷;基于代谢网络的系统发育重建方法研究[D];国防科学技术大学;2009年
10 张顺香;Web环境下关联语义链接特征分析及其应用研究[D];上海大学;2012年
中国硕士学位论文全文数据库 前10条
1 蔡颂梅;语义增强的关系相似度度量算法研究[D];华东师范大学;2011年
2 周志刚;数据挖掘技术在计算机取证的研究[D];大连交通大学;2010年
3 刘王峰;一种新的Web结构挖掘算法的研究[D];西安电子科技大学;2010年
4 詹圣君;基于用户行为日志分析的搜索引擎排序算法研究[D];湖北工业大学;2011年
5 陈凯;搜索引擎有关排序算法研究[D];武汉理工大学;2011年
6 邓丹君;基于Lucene的垂直搜索引擎关键技术研究[D];武汉理工大学;2011年
7 文军舰;基于Nutch的Web结构挖掘算法研究[D];天津财经大学;2011年
8 薛萍;基于教育领域的垂直搜索引擎的研究与实现[D];天津师范大学;2011年
9 马燕;基于快速相似度的Web结构挖掘的研究[D];南京信息工程大学;2011年
10 许武权;基于Web文本信息的智能检索系统的设计与实现[D];电子科技大学;2011年
【同被引文献】
中国期刊全文数据库 前10条
1 周云倩;陈信凌;;广电媒体网站评价的量化研究——以BBC、CNN和央视国际网站为样本[J];当代传播;2010年01期
2 聂璐;;搜索引擎在网络信息挖掘中的应用[J];电脑知识与技术;2009年27期
3 李强;;创建决策树算法的比较研究——ID3,C4.5,C5.0算法的比较[J];甘肃科学学报;2006年04期
4 邢春晓;高凤荣;战思南;周立柱;;适应用户兴趣变化的协同过滤推荐算法[J];计算机研究与发展;2007年02期
5 侯锋;王传廷;李国辉;;网络意见挖掘、摘要与检索研究综述[J];计算机科学;2009年07期
6 郭艳红;邓贵仕;雒春雨;;基于信任因子的协同过滤推荐算法[J];计算机工程;2008年20期
7 李道全;梁永全;张炜;;电子商务系统信任管理研究综述[J];计算机应用研究;2010年04期
8 姚天昉;程希文;徐飞玉;汉思·乌思克尔特;王睿;;文本意见挖掘综述[J];中文信息学报;2008年03期
9 王巍;杨武;齐海凤;;基于多中心模型的网络热点话题发现算法[J];南京理工大学学报(自然科学版);2009年04期
10 许鑫;章成志;;互联网舆情分析及应用研究[J];情报科学;2008年08期
中国博士学位论文全文数据库 前2条
1 刘琼;中国网络新闻可信度研究[D];华中科技大学;2011年
2 李晓静;中国大众媒介可信度指标研究[D];复旦大学;2005年
中国硕士学位论文全文数据库 前8条
1 殷风景;面向网络舆情监控的热点话题发现技术研究[D];国防科学技术大学;2010年
2 李璐旸;面向网络文本的信息可信度研究[D];哈尔滨工业大学;2011年
3 何安;协同过滤技术在电子商务推荐系统中的应用研究[D];浙江大学;2007年
4 罗亚平;基于用户浏览行为的网络热点话题发现模型研究[D];北京邮电大学;2008年
5 张珏;网络舆情预测模型与平台的研究[D];北京交通大学;2009年
6 宋嘎子;网络热点舆情的发现及预警模型研究[D];暨南大学;2010年
7 张鹏;中文意见挖掘的特征层次构建和抽取算法[D];重庆大学;2010年
8 李存青;中文意见挖掘中的特征词提取以及情感倾向分析[D];重庆大学;2010年
【二级引证文献】
中国硕士学位论文全文数据库 前1条
1 唐勇;互联网舆情监控系统的设计与实现[D];北京邮电大学;2013年
【二级参考文献】
中国期刊全文数据库 前10条
1 宋建康,张礼平;Web结构挖掘算法探讨[J];华东理工大学学报;2003年05期
2 张岭,马范援;加速评估算法:一种提高Web结构挖掘质量的新方法[J];计算机研究与发展;2004年01期
3 李凯,赫枫龄,左万利;PageRank-Pro——一种改进的网页排序算法[J];吉林大学学报(理学版);2003年02期
4 张承立;陈剑波;齐开悦;;基于语义网的语义相似度算法改进[J];计算机工程与应用;2006年17期
5 钱功伟;倪林;曹荣;;基于网页链接和内容分析的改进PageRank算法[J];计算机工程与应用;2007年21期
6 刘金桂;李绪蓉;;基于网页相似度的Page Rank算法的改进[J];淮阴工学院学报;2006年01期
7 刘悦;程学旗;李国杰;;提高PageRank算法效率的方法初探[J];计算机科学;2002年06期
8 张蓉;;Web挖掘技术研究[J];计算机工程;2006年15期
9 王彤;何丕廉;;Web挖掘中的用户识别与虹膜识别技术[J];计算机工程;2008年06期
10 朱嫣岚;闵锦;周雅倩;黄萱菁;吴立德;;基于HowNet的词汇语义倾向计算[J];中文信息学报;2006年01期
中国重要会议论文全文数据库 前1条
1 吴琼;谭松波;张刚;段洣毅;程学旗;;基于图排序模型的跨领域倾向性分析算法[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
【相似文献】
中国期刊全文数据库 前10条
1 蔡建超;蔡明;;搜索引擎PageRank算法研究[J];计算机应用与软件;2008年09期
2 杨炳儒,李岩,陈新中,王霞;Web结构挖掘[J];计算机工程;2003年20期
3 付真真;陆伟;;基于关键词的搜索引擎优化策略及效果分析[J];现代图书情报技术;2009年06期
4 张亚男;王鑫;;基于内容管理的网站构建系统的研究[J];硅谷;2010年23期
5 陈谦;;PageRank算法在孤立点检测中的应用[J];微型机与应用;2010年24期
6 李长玲;翟雪梅;;基于PageRank的引文分析方法探讨[J];情报理论与实践;2007年01期
7 张毅;张冬梅;;搜索引擎PageRank算法的比较与改进[J];科技创新导报;2008年21期
8 马海波;陈时勇;;基于网页等级的PageRank算法改进[J];大连交通大学学报;2010年02期
9 宋聚平,王永成,尹中航,滕伟;对网页PageRank算法的改进[J];上海交通大学学报;2003年03期
10 张佳;梁少华;;Web结构挖掘与其基于超链接结构的算法[J];科技信息;2007年02期
中国重要会议论文全文数据库 前10条
1 蔺继国;徐锡山;;一种基于用户点击数据的个性化PageRank算法[A];第六届全国信息检索学术会议论文集[C];2010年
2 陈小飞;王轶彤;冯小军;;一种基于网页质量的PageRank算法改进[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
3 李文;李淼;张建;朱海;陈雷;;基于混淆网络和PageRank的Nbest重排序[A];少数民族青年自然语言处理技术研究与进展——第三届全国少数民族青年自然语言信息处理、第二届全国多语言知识库建设联合学术研讨会论文集[C];2010年
4 刘建毅;王菁华;王枞;;基于语言网络的关键词抽取[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
5 刘菁菁;林鸿飞;杨志豪;;基于PageRank和锚文本的网页排序研究[A];第三届学生计算语言学研讨会论文集[C];2006年
6 陆勇;侯汉清;;基于词典注释的汉语同义词自动识别[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
7 杨磊;束罡;牛振东;;基于引力模型的链接分析(英文)[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
8 刘强国;左志宏;董祥千;;基于WEB超链接分析算法的研究综述[A];四川省通信学会2006年学术年会论文集(二)[C];2006年
9 冯迪;李晋宏;曹原;;基于网页的数据挖掘研究[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
10 黄云平;孙乐;李文波;;基于上下文图模型文本表示的文本分类研究[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
中国重要报纸全文数据库 前10条
1 本报记者 马文方;匠心在胸[N];中国计算机报;2008年
2 喻宁;群雄逐鹿搜索经济[N];经理日报;2004年
3 文/大海;微软亚研院“微妙转向”[N];计算机世界;2004年
4 复旦大学国际政治系博士 沈逸;谷歌的权力与生意[N];东方早报;2010年
5 清华大学计算机系智能技术与系统国家重点实验室 张敏 金奕江;实验与实用系统[N];计算机世界;2003年
6 本报记者 王翌;Google的左手[N];计算机世界;2004年
7 文/老鬼阿定;微软搜索灵不灵?[N];计算机世界;2004年
8 本报实习记者 田娴;三大搜索引擎角逐中国市场[N];通信信息报;2004年
9 北京 窦芳芳;给IE加上Google搜索工具条[N];电脑报;2001年
10 本报记者 顾洪文;大鱼GOODLE面对问题[N];计算机世界;2003年
中国博士学位论文全文数据库 前10条
1 王菁华;文本中知识的获取[D];北京邮电大学;2008年
2 李方涛;基于产品评论的情感分析研究[D];清华大学;2011年
3 张勇实;基于链接相似性分析的WEB结构挖掘方法研究[D];哈尔滨工程大学;2012年
4 王永刚;以数据为中心的在线社会网络若干安全问题研究[D];北京大学;2013年
5 于红;Web结构挖掘与高维数据挖掘研究[D];大连理工大学;2012年
6 张金松;基于引文上下文分析的文献检索技术研究[D];大连海事大学;2013年
7 刘淇;基于用户兴趣建模的推荐方法及应用研究[D];中国科学技术大学;2013年
8 俞唯仁;普适的结构相似度在大规模网络中的计算优化技术研究[D];东华大学;2012年
9 陈浩;Web搜索的用户兴趣与智能优化研究[D];中南大学;2012年
10 孟佳娜;迁移学习在文本分类中的应用研究[D];大连理工大学;2011年
中国硕士学位论文全文数据库 前10条
1 姜玥旭;PageRank算法的改进及在生物网络数据上的应用[D];吉林大学;2012年
2 乔红光;基于改进PageRank算法的文献价值评估方法研究[D];河北大学;2013年
3 赵波;PageRank算法在非网页检索问题中的应用[D];复旦大学;2010年
4 刘先明;基于链接分析的PageRank排序算法的改进研究[D];湖北工业大学;2010年
5 李更生;基于时间反馈和分类技术的PageRank算法改进研究[D];北京化工大学;2013年
6 袁方;基于改进PageRank算法的个性化搜索的研究[D];北京邮电大学;2012年
7 李稚楹;基于网页内容和时间反馈的网页排序PageRank算法研究[D];重庆理工大学;2012年
8 田浩;基于PageRank值的文本相似度改进模型[D];湖北工业大学;2010年
9 郭庆宝;基于PageRank的搜索引擎优化方法研究[D];山东师范大学;2012年
10 夏露;基于MapReduce的PageRank计算系统的设计与实现[D];东北大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026