计算机工程与科学 ›› 2024, Vol. 46 ›› Issue (06): 1121-1127.
陈璐1,2,董凌1,2,王文君1,2,王剑1,2,余正涛1,2,高盛祥1,2
CHEN Lu1,2,DONG Ling1,2,WANG Wen-jun1,2,WANG Jian1,2,YU Zheng-tao1,2,GAO Sheng-xiang1,2
摘要: 缅甸语语音识别文本中包含大量的同音和空格错误,使用通用的文本语义信息纠正错误字符,对缅甸语空格和同音错误定位和纠正不准确。考虑到缅甸语是一种声调语言,并且音素中包含了声调信息,因此提出融合音素的缅甸语语音识别文本纠错方法。通过参数共享策略对转录文本及其音素进行联合建模,利用音素信息辅助检测并纠正缅甸语同音和空格错误。实验结果表明,本文所提方法相比基线方法ConvSeq2Seq,在缅甸语语音识别纠错任务中的F1值提升了85.97%,达到了79.15%。