计算机工程与科学 ›› 2021, Vol. 43 ›› Issue (06): 1081-1087.
李晓红,王闪闪,马堉银,马慧芳
LI Xiao-hong,WANG Shan-shan,MA Yu-yin,MA Hui-fang
摘要: 提出一种融合相似度图和随机游走模型的多标签短文本分类算法。首先,以样本数据和标签为节点创建相似度图,借助外部知识库计算样本与标签之间的权重,得到预测样本与标签集合之间的匹配度。然后,将多标签数据映射成多标签依赖图,在图上进行重启随机游走,并将已获得的匹配度作为初始预测值,计算每个节点的概率分布,直到概率分布趋于稳定时,节点的概率分布即为标签的概率分布,进而确定预测文本的标签集。实验结果表明,本文提出的算法有较好的多标签文本分类性能,与同类算法相比较,分类性能显著提升。