基于协同过滤的推荐系统的研究
【摘要】:
随着互联网的快速发展,电子商务得到了广泛的应用。系统规模也变得越来越大。面对如此多的信息量,传统的推荐系统已经无法满足向人们进行个性化推荐的需求。协同过滤做为一种常用的减少信息过载的技术,已经成为个性化推荐系统的一种主要工具,然而现有的大多数协同过滤算法都存在数据稀疏的问题。如何在数据稀疏的情况下提高推荐系统预测的精确率成为本文需要研究的主要问题。
本文以协同过滤系统中的数据稀疏问题为主要研究对象。在深入分析常见的推荐算法的基础上,提出了结合奇异值分解、基于用户和项目的协同过滤算法的混合型推荐算法。在数据稀疏的情况下,该算法可以提高推荐系统的预测精确率。主要工作包括:
1.论述了推荐系统的研究意义以及国内外研究现状。
2.深入介绍了基于内容的过滤技术与协同过滤技术,并对这两种技术的优缺点进行了探讨。
3.介绍了奇异值分解的有关概念与评价个性化推荐系统性能的各种指标。
4.深入研究了协同过滤系统中的数据稀疏问题和相似度计算存在的问题的解决方法,先分析了现有的解决方法,然后提出了HybridSVD方法。HybridSVD方法先用奇异值分解来获得活动用户的邻居,然后利用修正的相似度计算方法和基于用户与项目的协同过滤技术来预测活动用户的评分。
5.对常用的推荐算法与HybridSVD方法在两个数据集上的实验结果进行了对比分析。结果显示本文的方法比其它方法有更好的性能。