西安建筑科技大学 信息与控制工程学院, 陕西 西安710055
针对粒子群算法优化神经网络进行语音转换时容易产生收敛速度慢、早熟的问题,本文采用一种新的量子粒子群算法优化广义回归神经网络的语音转换模型。该量子粒子群通过改变量子比特相位进而改变位置矢量, 并利用量子非门进行变异操作。因此首先利用量子粒子群对网络进行优化得到最佳的光滑因子参数, 从而建立频谱映射规则。接着, 利用频谱参数和基频参数的相关性, 对韵律特征基频也进行转换。然后, 联立转换后的频谱参数和基频参数, 利用STRAIGHT模型合成目标语音。最后, 采用主观和客观测评方式进行评价。实验结果表明, 与传统粒子群算法优化广义回归神经网络相比, 该方法转换后的语音自然度和相似度得到提升, 谱失真率下降2.1%。本文方法具有比径向基神经网络、广义回归神经网络、粒子群算法优化广义回归神经网络更好的语音转换性能。
语音转换 量子粒子群 广义回归神经网络 量子比特 光滑因子。 voice conversion quantum particle swarm optimization generalized regression neural network quantum bite smooth factor.