计算机工程与科学 ›› 2026, Vol. 48 ›› Issue (2): 330-340.
田宇,李军辉,朱苏阳,周国栋
TIAN Yu,LI Junhui,ZHU Suyang,ZHOU Guodong
摘要: 对话情绪识别旨在对一段对话中的每句话进行情绪分类。然而,数据集中的标签分布通常存在显著的不平衡性,针对这一问题,采用基于数据增强的方法,提升模型在标签不平衡情况下的表现。具体而言,利用大语言模型的生成能力,通过回译、句子改写和对话生成3种方法扩充低频标签的数据,并根据余弦相似度和自我编辑距离的调和平均值挑选。在多个数据集上的实验结果表明,利用该方法训练后的模型有效改善了在数据标签不平衡情况下的性能,在加权F1值和少数类样本的识别上,相较于其他前沿模型有显著提升。