论文MelGAN的官方资料库:条件波形合成的生成对抗网络
以前的工作已经发现,使用GAN生成相干的原始音频波形具有挑战性。 在,我们表明通过引入一组体系结构更改和简单的训练技术,可以可靠地训练GAN以生成高质量的相干波形。 主观评估指标(平均意见得分,或MOS)显示了所提出的方法对高质量的Mel谱图反演的有效性。 为了建立所提出技术的通用性,我们在语音合成,音乐域翻译和无条件音乐合成中显示了模型的定性结果。 我们通过消融研究评估模型的各个组成部分,并提出一套指导原则,以设计用于条件序列合成任务的