摘要:
在社交网络数据中,幂率分布是数据的基本规律,幂率分布的长尾部分数据有明显的稀疏性,长尾推荐一直是推荐系统的挑战,而冷启动、数据稀疏和覆盖率这些问题也是推荐系统的重要研究内容。通过分析数据幂律分布的特性,在研究社交网络个性化推荐方法的基础上,结合社交网络用户行为数据反映出来的幂律分布特性,通过极大似然估计数据幂律分布的标度值。结合幂率特性改进了相似度计算方法,提出了一种基于幂率特性的混合推荐方法PowerLawCF。最后,使用新浪微博的用户签到数据进行对比分析,PowerLawCF算法的推荐效果有显著提升,提高了长尾推荐的效果,对推荐系统的数据稀疏性和冷启动问题解决效果较好,说明基于幂律分布特征的推荐方法在推荐系统中的应用有积极的效果。