提出一种将STRAIGHT 模型和深度信念网络DBN相结合实现语音转换的方式。首先,通过STRAIGHT 模型提取出源说话人和目标说话人的语音频谱参数,用提取的频谱参数分别训练两个DBN 得到语音高阶空间的个性特征信息;然后,用人工神经网络ANN将两个具有高阶特征的空间连接并进行特征转换;最后,用基于目标说话人数据训练出的DBN 来对转换后的特征信息进行逆处理得到语音频谱参数,并用STRAIGHT 模型合成具有目标说话人个性化特征的语音。实验结果表明,采用此种方式获得的语音转换效果要比传统的采用GMM 实现语音转换更好,转换后的语音音质和相似度与目标语音更接近。