您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 百度LSTM建模与CTC训练_贾磊

  2. 《LSTM and CTC training for speech recognition from Baidu》,百度语音技术部贾磊介绍百度语音识别技术的最新进展(2015.10.26)。
  3. 所属分类:互联网

    • 发布日期:2015-10-30
    • 文件大小:1048576
    • 提供者:happytofly
  1. LSTM及其在语音识别中的应用

  2. 经过几十年的研究与发展,语音识别建立了以隐马尔可夫模型(Hidden Markov Models,HMM)为基础的框架。近几年,在HMM基础上深度神经网络(Deep Neural Network,DNN)的应用大幅度提升了语音识别系统的性能。DNN将每一帧语音及其前后的几帧语音拼接在一起作为网络的输入,从而利用语音序列中上下文的信息。DNN中每次输入的帧数是固定的,不同的窗长对最终的识别结果会有影响。递归神经网络(Recurrent neural network,RNN)通过递归来挖掘序列中的
  3. 所属分类:专业指导

    • 发布日期:2016-12-03
    • 文件大小:310272
    • 提供者:u014780546
  1. LSTM训练过程[英文版]

  2. LSTM(Long Short-Term Memory)是长短期记忆网络,是一种时间递归神经网络,适合于处理和预测时间序列中间隔和延迟相对较长的重要事件。LSTM 已经在科技领域有了多种应用。基于 LSTM 的系统可以学习翻译语言、控制机器人、图像分析、文档摘要、语音识别图像识别、手写识别、控制聊天机器人、预测疾病、点击率和股票、合成音乐等等任务。
  3. 所属分类:机器学习

    • 发布日期:2017-11-21
    • 文件大小:225280
    • 提供者:qq_18857415
  1. LSTM:A Search Space Odyss

  2. 主要长短记忆神经在语音识别上的应用 。。。。。。。。。。
  3. 所属分类:深度学习

    • 发布日期:2018-01-02
    • 文件大小:2097152
    • 提供者:u011535275
  1. 大词汇的辨别训练进行语音识别

  2. 约翰霍普金斯大学自动语音识别系统kaldi
  3. 所属分类:深度学习

    • 发布日期:2018-06-22
    • 文件大小:1048576
    • 提供者:azureskyy
  1. 长短时记忆神经网络(LSTM)介绍及公式推导

  2. 长短时记忆网络(Long Short Term Memory Network, LSTM),它有效地解决了原始循环神经网络(RNN)的缺陷,在语音识别、图片描述、自然语言处理等许多领域中成功应用。本文讲解由三个Gate(input、forget、output)和一个cell 单元组成的基础LSTM 网络。
  3. 所属分类:深度学习

    • 发布日期:2018-07-08
    • 文件大小:247808
    • 提供者:qq_38562705
  1. 长短时记忆神经网络(LSTM-2)型介绍及公式推导

  2. 长短时记忆网络(Long Short Term Memory Network, LSTM),它有效地解决了原始循环神经网络(RNN)的缺陷,在语音识别、图片描述、自然语言处理等许多领域中成功应用。(LSTM-2)型引入了Ct,Ct-1记忆对神经网络的影响,这个算法的预测效果要更好。
  3. 所属分类:深度学习

    • 发布日期:2018-07-08
    • 文件大小:199680
    • 提供者:qq_38562705
  1. 深度神经网络语音识别

  2. 深度神经网络语音识别 深度学习 DNN HMM CTC LSTM 人工智能
  3. 所属分类:深度学习

    • 发布日期:2018-12-28
    • 文件大小:2097152
    • 提供者:weixin_44276261
  1. Python-DFSMN阿里达摩院公布自研语音识别模型

  2. 对比目前业界使用最为广泛的 LSTM 模型,DFSMN 模型训练速度更快、识别准确率更高。采用全新 DFSMN 模型的智能音响或智能家居设备,相比前代技术深度学习训练速度提到了 3 倍,语音识别速度提高了 2 倍。
  3. 所属分类:其它

    • 发布日期:2019-08-11
    • 文件大小:45056
    • 提供者:weixin_39840914
  1. LSTM及其在语音识别中的应用

  2. 经过几十年的研究与发展,语音识别建立了以隐马尔可夫模型(Hidden Markov Models,HMM)为基础的框架。近几年,在HMM基础上深度神经网络(Deep Neural Network,DNN)的应用大幅度提升了语音识别系统的性能。DNN将每一帧语音及其前后的几帧语音拼接在一起作为网络的输入,从而利用语音序列中上下文的信息。DNN中每次输入的帧数是固定的,不同的窗长对最终的识别结果会有影响。递归神经网络(Recurrent neural network,RNN)通过递归来挖掘序列中的上
  3. 所属分类:专业指导

    • 发布日期:2020-02-27
    • 文件大小:286720
    • 提供者:weixin_42329419
  1. LSTM及其在语音识别中的应用

  2. 经过几十年的研究与发展,语音识别建立了以隐马尔可夫模型(Hidden Markov Models,HMM)为基础的框架。近几年,在HMM基础上深度神经网络(Deep Neural Network,DNN)的应用大幅度提升了语音识别系统的性能。DNN将每一帧语音及其前后的几帧语音拼接在一起作为网络的输入,从而利用语音序列中上下文的信息。DNN中每次输入的帧数是固定的,不同的窗长对最终的识别结果会有影响。递归神经网络(Recurrent neural network,RNN)通过递归来挖掘序列中的上
  3. 所属分类:专业指导

    • 发布日期:2020-01-27
    • 文件大小:286720
    • 提供者:tld12
  1. LSTM及其在语音识别中的应用

  2. 经过几十年的研究与发展,语音识别建立了以隐马尔可夫模型(Hidden Markov Models,HMM)为基础的框架。近几年,在HMM基础上深度神经网络(Deep Neural Network,DNN)的应用大幅度提升了语音识别系统的性能。DNN将每一帧语音及其前后的几帧语音拼接在一起作为网络的输入,从而利用语音序列中上下文的信息。DNN中每次输入的帧数是固定的,不同的窗长对最终的识别结果会有影响。递归神经网络(Recurrent neural network,RNN)通过递归来挖掘序列中的上
  3. 所属分类:专业指导

    • 发布日期:2020-07-20
    • 文件大小:286720
    • 提供者:lemonzx2008
  1. DFCNN-master:这是一个基于全卷积神经网络的语音识别系统-源码

  2. 基于全卷积神经网络的中文语音识别系统 基于全卷积神经网络的中文语音识别系统 简介简介 通过git克隆仓库以后,需要将数据列表目录下的文件全部复制到数据集目录下,也就是将其跟数据集放在一起。 $ cp -rf datalist/ * dataset/ 目前可用的模型有24、25和251 本项目开始训练请执行: $ python3 train_mspeech.py 本项目开始测试请执行: $ python3 test_mspeech.py iters_num (这里的iters_num为迭代的
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:37748736
    • 提供者:weixin_42118161
  1. speech-to-text:混合语言语音识别系统; 混合(GMM + NNet)模型; 卡尔迪+凯拉斯-源码

  2. 混合语言语音识别 来自团队: 当中国学生在各州学习时,我们发现自己的说话习惯发生了变化-英文单词和短语很容易滑入汉语句子中。 我们非常感到需要具有能够处理多语言语音到文本翻译的消息传递应用程序。 因此,在此任务中,我们将开发此功能-使用深度学习架构(DNN,CNN,LSTM)构建模型,以将多语言音频(在同一句子中具有中英文)正确地翻译成文本。 - 表中的内容: 目录说明 代码开关: 包含用于构建系统的脚本 描述: LDC2015S04,我们的数据集描述 笔记: 我们关于Kaldi相关t
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:1073741824
    • 提供者:weixin_42109732
  1. CTC-LSTM-ENSPEECH-英语语音识别

  2. 英语语音识别项目试验,仅供学习
  3. 所属分类:互联网

    • 发布日期:2021-03-05
    • 文件大小:53477376
    • 提供者:weixin_36640822
  1. wer_are_we:尝试跟踪语音识别的最新技术和最新结果(参考书目)-源码

  2. wer_are_we 我们是吗? 尝试跟踪现有技术和语音识别的最新结果。 随时纠正! (受启发 ) WER LibriSpeech (可能比LibriSpeech接受了更多的数据培训。) WER测试清洁 WER测试其他 纸 已发表 笔记 5.83% 12.69% 人类 2015年12月 人类 1.9% 3.9% 2020年5月 卷积增强变压器(Conformer)+ 3层LSTM LM(数据增强:SpecAugment) 1.9% 4.1% 2020年5月 CNN-RNN-Tra
  3. 所属分类:其它

    • 发布日期:2021-02-27
    • 文件大小:6144
    • 提供者:weixin_42165018
  1. 详解卷积神经网络(CNN)在语音识别中的应用

  2. 总结目前语音识别的发展现状,dnn、rnn/lstm和cnn算是语音识别中几个比较主流的方向。2012年,微软邓力和俞栋老师将前馈神经网络FFDNN(FeedForwardDeepNeuralNetwork)引入到声学模型建模中,将FFDNN的输出层概率用于替换之前GMM-HMM中使用GMM计算的输出概率,引领了DNN-HMM混合系统的风潮。长短时记忆网络(LSTM,LongShortTermMemory)可以说是目前语音识别应用最广泛的一种结构,这种网络能够对语音的长时相关性进行建模,从而提高
  3. 所属分类:其它

    • 发布日期:2021-02-25
    • 文件大小:406528
    • 提供者:weixin_38702726
  1. tensorflow_end2end_speech_recognition:基于TensorFlow的端到端语音识别实现(CTC,Attention和MTL培训)-源码

  2. 端到端语音识别的TensorFlow实现 要求 TensorFlow> = 1.3.0 tqdm> = 4.14.0 python-Levenshtein> = 0.12.0 setproctitle> = 1.1.10 海上> = 0.7.1 语料库 电话(39,48,61电话) 字符 电话(实施中) 字符 字 电话(实施中) 日语假名字符(约150个班级) 日语汉字字符(约3000类) 这些语料库将在将来添加。 总机 华尔街日报 该存储库
  3. 所属分类:其它

    • 发布日期:2021-02-06
    • 文件大小:828416
    • 提供者:weixin_42169971
  1. 详解卷积神经网络(CNN)在语音识别中的应用

  2. 总结目前语音识别的发展现状,dnn、rnn/lstm和cnn算是语音识别中几个比较主流的方向。2012年,微软邓力和俞栋老师将前馈神经网络FFDNN(FeedForwardDeepNeuralNetwork)引入到声学模型建模中,将FFDNN的输出层概率用于替换之前GMM-HMM中使用GMM计算的输出概率,引领了DNN-HMM混合系统的风潮。长短时记忆网络(LSTM,LongShortTermMemory)可以说是目前语音识别应用最广泛的一种结构,这种网络能够对语音的长时相关性进行建模,从而提高
  3. 所属分类:其它

    • 发布日期:2021-02-02
    • 文件大小:406528
    • 提供者:weixin_38730840
  1. 用于腹腔镜扶持器控制的特定人语音识别算法

  2. 提出了一种基于融合i-vector特征的长短时记忆(LSTM)循环神经网络模型,用于腹腔镜扶持器语音控制,在小训练样本下实现对特定医生语音中的短时、孤立词指令的识别。该模型以LSTM循环神经网络作为基础模型,以梅尔频率倒谱系数(MFCC)作为输入特征参数,将i-vector特征作为LSTM循环神经网络的深层输入信息,与神经网络中LSTM层后的深层特征信息进行拼接,达到参数融合的目的,实现对特定主刀医生语音指令的准确识别以及对非主刀医生语音指令的拒识别,为腹腔镜操作提供安全智能的语音识别方案。使用
  3. 所属分类:其它

    • 发布日期:2021-01-22
    • 文件大小:3145728
    • 提供者:weixin_38623000
« 12 »