计算机工程与科学 ›› 2026, Vol. 48 ›› Issue (5): 906-913.doi: 10.3969/j.issn.1007-130X.2026.05.014
袁亮,郭卫斌
YUAN Liang,GUO Weibin
摘要: 互联网中的攻击性信息会对个人和社会造成严重危害。在攻击性文本检测方法中,现有的方法存在对含有脏话的非攻击性文本的误判问题和对特殊群体存在偏见的问题。针对前者,提出了一种基于情感分析的攻击性文本检测模型SAOD,利用情感特征辅助预测文本是否具有攻击性;针对后者,提出了一种去偏见的数据增强方法SGM,在训练时将特殊群体进行掩盖,使特殊群体不经过模型训练,从而降低模型对特殊群体的偏见。以BERT+LSTM为基础模型,基于公开数据集ToxiCN和COLD,进行了相应的实验验证。实验结果表明,前者以F1为评价指标,将基础模型的F1分数由80.18%提升到了82.67%;后者实验建立在前者基础上,以误报率FPR为指标,将其由18.27%降低到12.77%。