基于二分网络的个性化推荐系统研究
【摘要】:随着英特网的迅猛发展和Web2.0技术的广泛应用,电子商务网站和社交平台给我们带来了海量的信息,但是面对如此大量的信息,我们很难找到自己需要的内容,于是个性化推荐系统已经成为英特网时代不可或缺的部分。个性化推荐系统是一个可以用来解决信息过载问题的有效工具,它无需用户介入就能够预测用户的兴趣爱好,具有较强的自学能力和实时能力。进入21世纪以来,随着电子商务的发展,个性化推荐技术取得了飞速的发展和广泛的应用前景。目前个性化推荐系统在社交网络、电子商务、视频、新闻、电影、音乐等各种类型的web站点取得了广泛的应用。
近年来,人们对复杂网络的研究方兴未艾,二分网络作为复杂网络中的一种重要的网络表现形式,具有一定的普遍性。本文深入研究了基于用户-产品二分网络的推荐算法,主要考察了产品的初始资源对推荐算法的影响,研究结果表明改变初始配额能够同时提高推荐结果的准确性和多样性。我们根据每个产品的度,将初始资源不均匀地分配给各个产品,称之为非均匀初始资源配置的偏热传导算法。实验结果表明提出的算法不仅比标准热传导算法的推荐准确性提高47.33%,而且比准确的物质扩散算法提高24.04%。非均匀初始资源配置的偏热传导算法与性能较好的热传导与物质扩散混合算法、偏热传导算法相比较,非均匀初始资源配置的偏热传导算法的多种指标都有所提高。
此外,在热传导与物质扩散的混合算法中,不同的推荐产品之间可能存在着某种共同属性,这种特定的属性引起的相关性会被重复计算。本文考虑了二阶的相关性,设计了两种改进的算法,可以在一定程度上消除冗余的相关性。其中一种方法是从物质扩散角度进行去除二阶冗余关联,另一种方法是从热传导角度去除二阶冗余关联。我们的实验结果表明,两种方法都能够较好地去除二阶关联带来的冗余,并因此能够进一步提高推荐的准确度。