计算机工程与科学 ›› 2025, Vol. 47 ›› Issue (8): 1503-1510.
王嘉文1,2,高定国1,2,尼琼1,2,巴果1,2
WANG Jiawen1,2,GAO Dingguo1,2,NI Qiong1,2,BA Guo1,2
摘要: 藏语语音合成是人工智能领域的一个重要研究方向,对推动藏语语言信息处理的发展和创新具有重要意义。针对藏语语音语料稀缺、文本复杂以及方言多样的合成难点,首先提出了一种基于藏字构件的语料处理方法,以减少文本处理的难度;其次采用端到端的语音合成模型,探讨了2种低资源的多方言藏语合成方案。实验结果表明,所提方法通过混合数据集训练能够实现单一模型对多方言的语音合成,提高语音的自然度和表现力,达到了平均MOS为 4.56 的语音质量。