HiFi-GAN:高效,高保真语音合成的生成对抗网络
姜俊il,金在贤,裴在京
在我们的,我们提出了HiFi-GAN:一种能够有效生成高保真语音的基于GAN的模型。我们在此存储库中将实现和预训练的模型作为开源提供。
摘要:最近有关语音合成的一些工作已经采用了生成对抗网络(GAN)来生成原始波形。尽管此类方法提高了采样效率和内存使用率,但其采样质量尚未达到自回归和基于流的生成模型的质量。在这项工作中,我们提出了HiFi-GAN,它可以实现高效和高保真语音合成。由于语音音频由具有不同周期的正弦信号组