基于相似度融合的协同过滤推荐算法研究
【摘要】:在大数据时代和信息时代,有着海量的信息,也存在不少冗杂的内容,导致用户有时无法在短时间内发现感兴趣的信息。所以,个性化推荐系统在很多领域都有应用,例如:新闻社交、电子商务、视频媒体等。推荐算法是推荐系统中的重要组成,种类繁多。Slope One是一种基于项目的协同过滤算法,它经典、实用,实现的过程简便、高效,已经得到了广泛应用。不过,它未衡量到用户间的相似性,未考虑到项目间的相似度问题,对预测准确度和执行效率造成影响,导致算法优势不明显。围绕以上问题,将相似度与Slope One算法相结合,主要研究工作如下:(1)本文介绍了协同过滤算法基础理论,阐述了国内外研究现状和成果以及存在的问题,并详细说明Slope One算法的预测方法和计算步骤,对存在的缺陷提出对应的改进策略。(2)本文针对Slope One算法没有对相似度进行考虑的问题,进行深入研究。一是采用信任加权方法以及杰卡德系数加权方法计算用户间的相似性,提出融合用户相似度的Weighted Slope One算法;二是采用皮尔森相关系数来对项目间的相似性进行计算,得到融合项目相似度的Weighted Slope One算法;最后,将两种改进的办法进行融合,得到两种混合加权推荐算法。(3)本文对改进的算法分别基于Epinions数据集和基于Movielens数据集设计实验,可以发现新提出的方法优于最初的Slope One算法,能有效提高推荐质量。