基于融合属性矩阵分解的冷启动推荐算法研究
【摘要】:推荐系统旨在帮助用户从海量的信息中挑选出用户感兴趣的信息。它通过历史记录自动挖掘用户的兴趣和喜好,最后为每个用户提供个性化的服务。协同过滤推荐算法在促进服务推荐生态上扮演着重要的角色。然而在实际应用中,协同过滤算法也存在着数据稀疏性、冷启动、迁移性以及是否侵犯用户隐私的问题。其中最为严重也最需要解决的问题就是冷启动问题。冷启动问题分为三种,分别是用户冷启动问题,项目冷启动问题以及系统冷启动问题。利用项目和用户的信息通常是解决冷启动问题的有效方法。对于项目冷启动而言,有效的利用项目的属性信息是有效解决该问题的方法之一。然而对于用户冷启动问题,由于隐私泄露的日益严重,用户越来越在乎个人的隐私,所以利用用户的个人信息作为解决冷启动问题的解决方案往往是行不通的。协同过滤在促进服务推荐生态系统上发挥着重要的功效,其中矩阵分解技术更是被证明是最有效的推荐方法之一。本文针对推荐系统中所存在的项目冷启动问题和用户冷启动给问题分别提出了解决方法。对于新项目的冷启动问题,本文提出了一种融合项目属性的相似度计算方法,利用该方法来预测用户对新服务的偏好,将预测出来的偏好与矩阵分解模型进行结合,最后利用模型来预测用户对新用户的评分。对于新用户的冷启动推荐,本文从位置信息入手,结合霍夫斯泰德文化维度理论来计算新用户的文化距离,通过文化距离与矩阵分解模型经行动态结合,最终完成对新用户进行服务的推荐。本文的主要贡献如下:(1)针对新项目的冷启动问题,本文采用项目的属性信息来代替传统的评分信息进行相似度计算,利用当前用户的历史记录信息来发掘用户的偏好,通过用户的偏好信息与项目的属性进行初步匹配,然后将匹配结果融入到矩阵分解模型,利用训练产生的模型完成对新项目的推荐。在计算用户偏好过程中,考虑到用户的偏好可能随着时间的推移而改变,本文还引入了时间惩罚因子,用来降低用户久远历史记录所计算出来的偏好的权重。(2)针对新用户的冷启动问题,本文在不侵犯用户隐私的情况下,利用用户的位置信息,计算得出用户和服务的文化距离。通过对启发性服务的寻找,来完成对新用户的初步预测。将初步预测的结果与矩阵分解技术动态的融合,通过对训练集的拟合完成对模型参数的更新。利用训练出的最终模型完成对新用户的预测。(3)通过在真实数据集上面的大量实验可以证明:对于新项目的冷启动问题,我们的方法在准确性、可扩展性以及解决数据稀疏性上面都明显优于对比方法;对于新用户的冷启动问题,本文采用的方法在不侵犯用户隐私的情况下能够精确的完成对冷启动用户的推荐,同时在数据稀疏性环境下也能取得十分优异的推荐效果。