计算机工程与科学 ›› 2024, Vol. 46 ›› Issue (06): 1092-1100.
肖新正1,2,3,黄瑞章1,2,3,陈艳平1,2,3,秦永彬1,2,3,宋玉梅1,2,3,周裕林1,2,3
XIAO Xin-zheng1,2,3,HUANG Rui-zhang1,2,3,CHEN Yan-ping1,2,3,QIN Yong-bin1,2,3,SONG Yu-mei1,2,3,ZHOU Yu-lin1,2,3
摘要: 在目前的多标签文本分类任务中,主要面临以下2个问题:(1)侧重文本表示学习,对标签之间的关联信息建模不充分;(2)尽管使用了标签关联信息来改善多标签分类任务,但对标签关联的建模过于依赖人工预定义的外部知识,而外部知识的获取成本高昂,限制了其实际应用。针对以上问题,提出了一种面向多标签文本分类的标签关联学习模块Corrective-Net。该模块可以在不依赖外部知识的前提下,自动学习数据中的标签关联信息;同时,它还可以利用标签关联信息,对基础分类模块的初始预测结果进行修正,使得最终预测兼顾语义信息和标签关联信息,以获得更精准的多标签预测结果。在AAPD和SO数据集上的大量实验表明,Corrective-Net具有通用性和有效性,通过分析标签修正对各个标签性能的影响,得到了显式的标签关联信息,并进行了可视化。