计算机工程与科学 ›› 2023, Vol. 45 ›› Issue (02): 338-345.
赵亚丽1,2,余正涛1,2,郭军军1,2,高盛祥1,2,相艳1,2
ZHAO Ya-li 1,2,YU Zheng-tao1,2,GUO Jun-jun1,2 GAO Sheng-xiang1,2,XIANG Yan1,2
摘要: 传统的基于机器翻译的跨语言情感分类方法,由于受机器翻译性能影响,导致越南语等低资源语言的情感分类准确率较低。针对源语言和目标语言标记资源不平衡的问题,提出一种基于情感语义对抗的跨语言情感分类模型。首先,将句子和句子中情感词进行拼接,用卷积神经网络对拼接后的句子分别进行特征抽取,分别获得单语语义空间下的情感语义表征;其次,通过对抗网络,在双语情感语义空间将带标签数据与无标签数据的情感语义表征进行对齐;最后,将句子与情感词最显著的表征进行拼接,得到情感分类结果。基于汉英公共数据集和自主构建的汉越数据集的实验结果表明,所提模型相比跨语言情感分类主流模型,实现了双语情感语义对齐,可以有效提升越南语情感分类的准确率,且在差异性不同的语言对上也具有明显优势。