计算机工程与科学 ›› 2020, Vol. 42 ›› Issue (09): 1697-1703.
官蕊1,2,丁家满1,2,贾连印1,2,游进国1,2,姜瑛1,2
GUAN Rui1,2,DING Jia-man1,2,JIA Lian-yin1,2,YOU Jin-guo1,2,JIANG Ying1,2
摘要: 在排序学习方法中,通过直接优化信息检索评价指标来学习排序模型的方法,取得了很好的排序效果,但是其损失函数在利用所有排序位置信息以及融合多样性排序因素方面还有待提高。为此,提出基于强化学习的多样性文档排序算法。首先,将强化学习思想应用于文档排序问题,通过将排序行为建模为马尔可夫决策过程,在每一次迭代过程中利用所有排序位置的信息,不断为每个排序位置选择最优的文档。其次,在排序过程中结合多样性策略,依据相似度阈值,裁剪高度相似的文档,从而保证排序结果的多样性。最后,在公共数据集上的实验结果表明,提出的算法在保证排序准确性的同时,增强了排序结果的多样性。