计算机工程与科学 ›› 2021, Vol. 43 ›› Issue (01): 134-141.
史小静,宁秋怡,季佰军,段湘煜
SHI Xiao-jing,NING Qiu-yi,JI Bai-jun,DUAN Xiang-yu
摘要: 神经机器翻译领域中多层神经网络结构能够显著提升翻译效果,但是多层神经网络结构存在信息传递的退化问题。为了缓解这一问题,提出了层间和子层间信息融合传递增强的方法,增强多层神经网络的层与层之间信息传递的能力。通过引入“保留门”机制来控制融合信息的传递权重,将融合信息与当前层的输出信息连接共同作为下一层的输入,使得信息传递更加充分。在目前最先进的多层神经网络Transformer上进行相关的实验,在中英和德英翻译任务上的实验结果表明,该信息传递增强方法相比于基线系统,BLEU得分分别提高了0.66和0.42。