文件名称:
Lip2Wav:这是包含我们2020年CVPR论文代码的存储库,标题为“学习准确的口语到语音合成的个别说话风格”-源码
开发工具:
文件大小: 3mb
下载次数: 0
上传时间: 2021-03-20
详细说明:更新:如果您正在寻找Wav2Lip,
Lip2Wav
仅通过唇部动作即可产生高质量的语音。该代码是论文的一部分:在CVPR'20上发表的论文,学习个人说话风格以实现准确的语音合成。
| |
最近更新
发布了适用于所有扬声器的数据集和预训练模型!
已发布在LRW数据集上训练的多扬声器单词级Lip2Wav模型的预训练模型! (分支)
强调
在不受限制的情况下,仅通过嘴唇运动即可产生可理解的语音的第一项工作。
问题的序列到序列建模。
提供5个扬声器的数据集,其中包含100多个小时的视频数据!
提供了完整的培训代码和预训练的模型。
推理代码从预训练的模型生成结果。
还提供了用于计算论文中报告的指标的代码。
你也可能对此有兴趣:
:party_popper:使用Wav2Lip进行口语同步的语音视频到任何语音: :
先决条件
Python 3.7.4 (此版本已通过代码测试)
ffmpeg: sudo apt
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.