您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. TORGO-ASR-源码

  2. 使用TORGO数据集进行语音处理 有关使用Kaldi进行韵律性语音识别和说话者识别的教程。 所使用的数据由多伦多大学免费提供。 说话者由于脑瘫或肌萎缩性侧索硬化症而导致语言障碍。 这项运动的目标 建立用于语音识别的基于kaldi的GMM​​-HMM声学模型。 提高对受损语音的识别精度(数据增强,超参数调整等) 使用GMM-HMM模型中的路线训练DNN-HMM声学模型。 通过i向量执行说话者识别/识别。 栏目 第1部分: 第2部分: 第3部分: GMM-HMM声学模型 DNN-HMM声学
  3. 所属分类:其它

    • 发布日期:2021-03-09
    • 文件大小:112640
    • 提供者:weixin_42107165
  1. 基于语音的性别识别:使用梅尔频率倒谱系数(MFCC)和高斯混合模型(GMM)的基于语音的性别识别-源码

  2. 基于语音的性别识别 基于语音的性别识别,使用: 免费的ST美国英语语料库数据集(SLR45) 梅尔频率倒谱系数(MFCC) 高斯混合模型(GMM) 数据集 可以在上找到免费的ST美国英语语料库数据集(SLR45) 。 它是提供的免费的美国英语语料库,其中包含10位说话者(5位女性和5位男性)的讲话。 每个说话者大约有350种话语。 理论 语音特征提取 此处使用梅尔频率倒谱系数(MFCC),因为它们可在说话者验证中提供最佳结果。 MFCC通常如下得出: 进行信号(窗口摘要)的傅立叶变换。
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:18874368
    • 提供者:weixin_42120997
  1. 基于语音的说话者识别:使用语音MFCC和GMM识别说话者-源码

  2. 基于语音的说话人识别 说话人识别/识别使用: 免费的ST美国英语语料库数据集(SLR45) 梅尔频率倒谱系数(MFCC) 高斯混合模型(GMM) 数据集 可以在上找到免费的ST美国英语语料库数据集(SLR45) 。 它是提供的免费的美国英语语料库,其中包含10位说话者(5位女性和5位男性)的讲话。 每个说话者大约有350种话语。 理论 语音特征提取 此处使用梅尔频率倒谱系数(MFCC),因为它们可在说话者验证中提供最佳结果。 MFCC通常如下得出: 进行信号(窗口摘要)的傅立叶变换。
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:57344
    • 提供者:weixin_42139429