计算机工程与科学 ›› 2021, Vol. 43 ›› Issue (06): 1088-1094.
王涛,全海燕
WANG Tao,QUAN Hai-yan
摘要: 提升低信噪比下的分离语音质量是语音分离技术研究的重点,而大多数语音分离方法在低信噪比下仍只对目标说话人的语音进行特征训练。针对目前方法的不足,提出了一种基于联合训练生成对抗网络GAN的混合语音分离方法。为避免复杂的声学特征提取,生成模型采用全卷积神经网络直接提取混合语音时域波形的高维特征,判别模型通过构建二分类卷积神经网络来学习干扰说话人的特征信息,继而使系统得到的分离信息来源不再单一。实验结果表明,所提方法在低信噪比下仍能更好地恢复高频成分的信息,在双说话人混合语音数据集上的分离性能要优于所对比的方法。