计算机工程与科学 ›› 2025, Vol. 47 ›› Issue (12): 2227-2252.
李金忠,刘伟东,陈盛博
LI Jinzhong,LIU Weidong,CHEN Shengbo
摘要: 传统搜索引擎仅通过关键词查询以返回相关性搜索结果的排序无法满足用户日益多样化的信息需求。为此,搜索结果多样化排序技术应运而生,它在保持查询相关性的基础上,考虑不同文档的新颖性以及用户潜在的多样化查询意图,向用户呈现内容更为丰富全面的排序结果。随着深度学习技术的快速发展与突破,生成对抗网络GAN和图神经网络GNN等深度学习模型也被广泛应用于搜索结果多样化排序领域。虽然近期涌现了较多搜索结果多样化排序的最新研究成果,但较缺乏对新近提出的搜索结果多样化排序方法等相关研究的综述性工作。基于此,针对近5年来搜索结果多样化排序的研究进展进行了一个较为全面的综述。首先,回顾了搜索结果多样化排序的发展现状和相关综述,并阐述了搜索结果多样化排序问题的定义;其次,对近5年来搜索结果多样化排序的最新方法进行了分类,并重点分析了每个类别中的代表性方法;再次,对主流和新颖的搜索结果多样化评价指标进行了阐述与分析,并总结了现有的主要搜索结果多样化数据集,同时梳理和分析了最新搜索结果多样化排序方法的性能,以及总结了当前搜索结果多样化排序技术的应用进展;最后,对搜索结果多样化排序的未来研究方向进行了展望,以期为相关人员研究搜索结果多样化排序提供参考,并促进这一领域的进一步发展与创新。