您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. wenet:生产优先和生产就绪的端到端语音识别工具包-源码

  2. 微网 | | | | 我们一起共享神经网络。 WeNet的主要动机是缩小研究与生产端到端(E2E)语音识别模型之间的差距,减少生产E2E模型的工作量,并探索用于生产的更好的E2E模型。 强调 生产至生产准备就绪:WeNet的python代码符合Torchscr ipt的要求,因此由WeNet训练的模型可以由Torch JIT直接导出,并使用LibTorch进行推理。 研究模型和生产模型之间没有差距。 模型推断既不需要模型转换也不需要其他代码。 流和非流ASR的统一解决方案:WeNet
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:2097152
    • 提供者:weixin_42134051
  1. TORGO-ASR-源码

  2. 使用TORGO数据集进行语音处理 有关使用Kaldi进行韵律性语音识别和说话者识别的教程。 所使用的数据由多伦多大学免费提供。 说话者由于脑瘫或肌萎缩性侧索硬化症而导致语言障碍。 这项运动的目标 建立用于语音识别的基于kaldi的GMM​​-HMM声学模型。 提高对受损语音的识别精度(数据增强,超参数调整等) 使用GMM-HMM模型中的路线训练DNN-HMM声学模型。 通过i向量执行说话者识别/识别。 栏目 第1部分: 第2部分: 第3部分: GMM-HMM声学模型 DNN-HMM声学
  3. 所属分类:其它

    • 发布日期:2021-03-09
    • 文件大小:112640
    • 提供者:weixin_42107165
  1. espresso:Espresso:快速的端到端神经语音识别工具包-源码

  2. 浓咖啡 Espresso是基于深度学习库和流行的神经机器翻译工具的开源,模块化,可扩展的端到端神经自动语音识别(ASR)工具包。 Espresso支持在GPU和计算节点之间进行分布式训练,并具有ASR中常用的各种解码方法,包括基于超前单词的语言模型融合,为此实现了快速,并行的解码器。 我们为以下语音数据集提供最新的培训食谱: 什么是新的: 2020年6月:发布了变压器配方。 2020年4月:现已支持 (使用 )和混合ASR的交叉熵训练。 和分别提供WSJ配方作为示例。 2020年3月:支
  3. 所属分类:其它

    • 发布日期:2021-02-24
    • 文件大小:3145728
    • 提供者:weixin_42116585
  1. ASR:语音识别工具包-源码

  2. 不要使用pytorch == 1.4.0 !!!!!! 这是序列到序列的语音识别工具包。 要求 Python> = 3.7.0 PyTorch> = 1.2.0 我们强烈建议您准备 。 安装 对于预处理,我们需要和 pip install -r requirements.txt 预处理 examples/*/preprocess.sh是一个预处理脚本。 在preprocess.sh之后,您可以获取训练数据和测试数据。 火车 python train.py --hp_file
  3. 所属分类:其它

    • 发布日期:2021-02-14
    • 文件大小:912384
    • 提供者:weixin_42168230