计算机工程与科学 ›› 2022, Vol. 44 ›› Issue (03): 436-446.
汪静,钱晓东
WANG Jing,QIAN Xiao-dong
摘要: 针对区块链环境中海量高维的数据使得推荐性能低下的问题,通过对局部敏感哈希算法的优化,降低其在近邻搜索过程中带来的额外计算和存储开销。利用数据分布的主成分减少传统LSH中不良捕获的投影方向,同时对投影向量权重进行量化,以减少哈希表和哈希函数的使用;通过对哈希桶的间隔进行调整,并且根据冲突次数的大小进一步细化查询结果集,以显著降低距离计算的时间开销;最后采用加权平均策略进行评分预测并产生推荐列表。实验表明:与其他算法相比,优化后的LSH仅需要少量的哈希表和哈希函数就可以获得较为精确的近邻搜索结果,且搜索效率有很大的提高。优化后的LSH可以很好地应对区块链中数据特点所造成的问题,缓解高维大规模数据对推荐性能的影响,在一定程度上提高了推荐质量和效率。