计算机工程与科学 ›› 2024, Vol. 46 ›› Issue (08): 1425-1432.
潘雨青,于浩,李峰
PAN Yu-qing,YU Hao,LI Feng
摘要: 异常声音检测方法多用强标签数据进行训练,而高质量的强标签音频数据标注难度较大、收集成本高昂。针对现有异常音频检测方法使用弱标签数据会受到非平稳和时变噪声的干扰,导致训练结果较差、准确率低的问题,提出一种基于音频频谱的加权非负矩阵分解WNMF方法。该方法使用WNMF对弱标签和无标签数据进行标记,并分离目标声音事件和背景噪声。在适当的权值下,WNMF改变标记时不同频段音频信息的重要性,以抑制噪声,提高分离质量,使其逼近全监督模型训练的效果;之后使用卷积神经网络产生帧级预测和音频标签预测。仿真实验结果表明,该方法的准确率相比于传统NMF处理弱标签数据的方法提升了4.8%。