收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

社会性标注关键技术及其在信息检索中的应用研究

刘凯鹏  
【摘要】:社会性标注是一种Web上的用户共享、组织、搜索和管理资源的一种机制。随着Web2.0的兴起,社会性标注系统得到了迅猛的发展,目前已经成为一种流行的共享网络资源的方式。本文研究社会性标注的关键技术及其在信息检索中的应用,主要内容包括: (1)社会性标注系统中的个性化标签推荐算法:社会性标注系统中的个性化标签推荐是指根据用户对资源的历史标注信息,为目标用户对特定资源推荐能够满足其个性化需求的标签。以往的研究大都假设用户是独立同分布的。这种假设没有考虑到用户之间日益增多的社会关系。本文研究如何利用用户之间的社会关系等信息改进标签推荐算法,提出一种能够有机结合用户个性化标签使用偏好和用户协同标注信息的个性化标签推荐算法。首先将社会性标注、用户之间的社会关系和资源之间的相似关系等数据用图建模。与以往的研究使用的基于特征向量计算相似度的方法不同,使用基于随机游走的方法来计算对象之间的相似度。在此基础上,利用用户和标签之间的相似度作为用户的个性化标签使用偏好,并将其融合到基于协同过滤的个性化标签推荐算法中。通过在Delicious数据集上进行实验,对不同的相似度函数和不同的标签推荐算法进行了比较。实验结果表明,与目前的代表性算法相比,本文提出的个性化标签推荐算法的在Precison、Recall和NDCG等性能指标上有明显提高。 (2)社会性标注系统中的标签词义消歧算法:由于不存在一致的分类体系或本体论,社会性标注存在歧义性的问题,即相同的标签可以被用来表示不同的含义。研究在社会性标注系统中的标签语义消歧问题可以使很多基于社会性标注数据的应用受益。本文提出一种无监督的标签语义消歧算法。对于目标标签,通过将其相关的所有标注表示为三维张量来为其标注上下文建模,并在由此张量导出的超图上进行谱聚类分析来发现表示不同标签语义的标签簇。通过在从实际的社会性标注系统中采集的实验数据集上进行实验来评价算法性能。定性分析和定量评价结果表明了本文提出的标签语义消歧方法的有效性。 (3)基于社会性标注的本体学习算法:由相互协作的用户在社会性标注系统中产生的大量的标注数据可以用来作为语义网应用的数据源。本文提出一种基于社会性标注的本体学习方法来挖掘蕴涵在社会性标注中的语义信息。提出一种隐含包容层次结构来刻画标签空间中潜在的结构,并基于此模型推导出本体学习算法。首先利用集合论的方法确定标签之间的包容关系,并用图建模包容关系。在将此图转化为层次关系时,注意到其中固有的包容关系的不一致性,并提出一种基于随机游走的标签普遍性计算方法。最后提出一种凝聚式层次聚类算法,利用标签普遍性的计算结果来生成概念层次结构。在实际社会性标注系统中采集的数据集上进行的实验表明,与目前的代表性方法比较,本文提出的方法无论在定性还是在量化比较上,均有较明显的提高。 (4)基于社会性标注的网页排序算法:社会性标注系统作为一种新的资源管理和共享方式,吸引为数众多的用户参与其中。由此产生的大量社会性标注数据成为网页质量评价的一个新维度。本文研究如何利用社会性标注改进网页检索性能,提出一种有机结合网页和用户的查询相关性与互增强关系的网页排序算法。首先利用统计主题模型,使用相关标签为网页和用户建模,并计算查询相关性。然后利用二部图模型刻画网页和用户间的互增强关系,使用相关标签与网页内容和用户兴趣的匹配程度为互增强关系赋予权重。最后结合查询相关性和互增强关系,以迭代方式同时计算网页和用户的排序。实验结果表明,与目前的代表性算法相比,该算法在检索性能上有明显提高。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 张圣;;一种混合式协作过滤服务推荐算法[J];通信技术;2011年07期
2 杨博;赵鹏飞;;推荐算法综述[J];山西大学学报(自然科学版);2011年03期
3 闫洲;石刘红;;基于用户和项目组合的协同过滤推荐算法[J];电脑知识与技术;2011年16期
4 尹柱平;李幼平;;基于用户角色与行为的协同过滤推荐算法[J];桂林电子科技大学学报;2011年03期
5 王爱国;李廉;杨静;陈桂林;;一种基于Bayesian网络的网页推荐算法[J];山东大学学报(工学版);2011年04期
6 张华青;王红;滕兆明;马晓慧;;多维加权社会网络中的个性化推荐算法[J];计算机应用;2011年09期
7 陈志敏;姜艺;;综合项目评分和属性的个性化推荐算法[J];微电子学与计算机;2011年09期
8 陈志敏;李志强;;基于用户特征和项目属性的协同过滤推荐算法[J];计算机应用;2011年07期
9 冷亚军;梁昌勇;张恩桥;戚筱雯;;基于项类偏好的协同过滤推荐算法[J];情报学报;2011年07期
10 赵宏霞;杨皎平;万君;;考虑时间和价格因素的Web客户需求协同推荐模型[J];计算机系统应用;2011年08期
11 程婷婷;王恒山;刘建国;;分类对基于资源分配股票网个性化推荐影响[J];计算机应用研究;2011年09期
12 赵宏霞;王新海;杨皎平;;基于Web客户因子分析的协同推荐算法[J];计算机应用研究;2011年07期
13 赵宏霞;王新海;杨皎平;;基于项目因子分析的Web客户需求协同推荐算法[J];计算机系统应用;2011年07期
14 吴月萍;郑建国;;协同过滤推荐算法[J];计算机工程与设计;2011年09期
15 傅鹤岗;李冉;;基于用户实时反馈的协同过滤算法[J];计算机应用;2011年07期
16 陈宏;陈伟;;基于多主题追踪的网络新闻推荐[J];计算机应用;2011年09期
17 赵晓岚;张招杰;;数字化图书馆个性化推荐研究与实例[J];科技情报开发与经济;2011年23期
18 赵华;林政;方艾;杨翊平;;一种基于知识树的推荐算法及其在移动电子商务上的应用[J];电信科学;2011年06期
19 薛伟莲;王蕴慧;;一种基于对话的电子商务推荐系统[J];辽宁师范大学学报(自然科学版);2011年02期
20 尹柱平;;基于用户行为与角色约束的协同过滤算法[J];软件导刊;2011年06期
中国重要会议论文全文数据库 前10条
1 王韬丞;罗喜军;杜小勇;;基于层次的推荐:一种新的个性化推荐算法[A];第二十四届中国数据库学术会议论文集(技术报告篇)[C];2007年
2 梁莘燊;刘莹;;基于效能的学术资源推荐算法研究[A];第六届(2011)中国管理学年会——信息管理分会场论文集[C];2011年
3 高凤荣;杜小勇;王珊;;数字图书馆环境下一种基于语义分类的个性化推荐算法[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
4 苏日启;胡皓;汪秉宏;;基于网络的含时推荐算法[A];第五届全国复杂网络学术会议论文(摘要)汇集[C];2009年
5 陶红亮;王明文;曹瑛;;基于项目平滑和聚类的协同过滤推荐算法[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
6 汤显;周军锋;郭景峰;;一种面向Web站点的个性化推荐算法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
7 周军锋;汤显;郭景峰;;一种优化的协同过滤推荐算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
8 黄创光;印鉴;汪静;刘玉葆;王甲海;;不确定近邻的协同过滤推荐算法[A];NDBC2010第27届中国数据库学术会议论文集A辑一[C];2010年
9 高旻;吴中福;;基于个性化情境和项目的协同推荐研究[A];2009年中国智能自动化会议论文集(第五分册)[东南大学学报(增刊)][C];2009年
10 李建国;姚良超;汤庸;郭欢;;基于认知度的协同过滤推荐算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
中国博士学位论文全文数据库 前10条
1 刘凯鹏;社会性标注关键技术及其在信息检索中的应用研究[D];哈尔滨工业大学;2010年
2 贾春晓;基于复杂网络的推荐算法和合作行为研究[D];中国科学技术大学;2011年
3 王科平;自动图像标注的关键技术研究[D];北京邮电大学;2011年
4 靳延安;社会标签推荐技术与方法研究[D];华中科技大学;2011年
5 王宏宇;商务推荐系统的设计研究[D];中国科学技术大学;2007年
6 唐磊;基于内容和用户历史的音乐可视分析[D];山东大学;2012年
7 郭艳红;推荐系统的协同过滤算法与应用研究[D];大连理工大学;2008年
8 夏丁胤;互联网图像高效标注和解译的关键技术研究[D];浙江大学;2010年
9 高滢;多关系聚类分析方法研究[D];吉林大学;2008年
10 熊英;中文自然语言理解中基于条件随机场理论的词法分析研究[D];上海交通大学;2009年
中国硕士学位论文全文数据库 前10条
1 代沁;电子商务中基于消费心理的个性化推荐方法研究[D];沈阳航空工业学院;2010年
2 封素石;分布式协同过滤推荐算法研究[D];燕山大学;2010年
3 何克勤;基于标签的推荐系统模型及算法研究[D];华东师范大学;2011年
4 李有超;基于项目属性与偏爱比较的协同过滤推荐算法研究[D];燕山大学;2010年
5 袁先虎;基于混合用户模型的协同过滤推荐算法研究[D];重庆大学;2010年
6 夏小伍;基于信任模型的协同过滤推荐算法的研究[D];中国科学技术大学;2011年
7 刘亭;隐私保持协同过滤推荐算法研究[D];燕山大学;2010年
8 胡航博;上下文相关的查询推荐算法研究[D];河南大学;2010年
9 叶金平;车辆导航中多路径推荐算法研究[D];重庆大学;2011年
10 王小亮;基于协同过滤的个性化推荐算法的优化和应用[D];浙江工商大学;2010年
中国重要报纸全文数据库 前3条
1 记者 王夕;网络也会“读心术”[N];北京科技报;2011年
2 记者 向阳;软件测试关键技术研究有望降低测试成本[N];科技日报;2009年
3 本报记者 雷彬;百度推出移动开放平台 优化服务提升用户体验[N];通信信息报;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978