您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. kaldi工具箱

  2. kaldi工具箱,kaldi是一款语音识别工具库,由Daniel Povey进行开发和维护,整个框架比较成熟,在容纳经久不衰的GMM-HMM、SGMM-HMM、DNN-HMM等多种语音识别模型之外,还将现阶段比较“火”的DNN、CNN、LSTM、BLSTM等深度神经网络模型加入其中,获得了广大科研工作者和不少企业公司研发团队的青睐。
  3. 所属分类:深度学习

    • 发布日期:2018-03-10
    • 文件大小:4194304
    • 提供者:hdd_gcw
  1. 循环神经网络

  2. lstm网络 双向blstm 双向RNN 网络训练 解码 实验结果分析
  3. 所属分类:深度学习

    • 发布日期:2018-04-22
    • 文件大小:3145728
    • 提供者:weixin_38858860
  1. BLSTM语音识别技术和模式识别

  2. The RWTH Speech Recognition System,Human Language Technology and Pattern Recognition Lehrstuhl für Informatik 6 Computer Science Department RWTH Aachen University, Germany
  3. 所属分类:深度学习

    • 发布日期:2018-06-22
    • 文件大小:259072
    • 提供者:azureskyy
  1. 基于BLSTM-Attention-CRF模型的新能源汽车领域术语抽取

  2. 从深度学习的角度出发,提出了一种基于Attention 的双向长短时记忆网络(bidirectional long short-term memory,BLSTM)与条件随机场(conditional random fields,CRF)相结合的领域术语抽取模型(BLSTM_Attention_CRF 模型),并使用基于词典与规则相结合的方法对结果进行校正,准确率可达到 86%以上,该方法切实可行。
  3. 所属分类:深度学习

    • 发布日期:2018-07-03
    • 文件大小:1048576
    • 提供者:beaujor
  1. 基于CNN5DenseNetBLSTMLSTMCTC来验证码识别

  2. This project is based on CNN5/DenseNet BLSTM/LSTM CTC to realize verification code identification(验证码识别). This project is only for training the model.
  3. 所属分类:其它

    • 发布日期:2019-08-11
    • 文件大小:15728640
    • 提供者:weixin_39840588
  1. 【13】Achieving Human Parity in Conversational Speech Recognition.pdf

  2. Conversational speech recognition has served as a flagship speech recognition task since the release of the DARPA Switchboard corpus in the 1990s. In this paper, we measure the human error rate on the widely used NIST 2000 test set, and find that ou
  3. 所属分类:深度学习

    • 发布日期:2019-08-26
    • 文件大小:254976
    • 提供者:xinghaoyan
  1. LISTEN ATTEND AND SPELL A NEURAL NETWORK FOR SPEECH RECOGNITION.pdf

  2. 语音识别LAS结构where d and y, are MLP networks. After training, the a; distribution Table 1: WER comparison on the clean and noisy Google voice is typically very sharp and focuses on only a few frames of h; ci car search task. The CLDNN-hMM system is the s
  3. 所属分类:专业指导

    • 发布日期:2019-07-13
    • 文件大小:647168
    • 提供者:weixin_41778389
  1. 金融股票深度学习论文整理

  2. 具体论文名列表: A deep learning framework for financial time series using stacked autoencoders and longshort term memory.pdf Big_Data_Deep_Learning_for_financial_sentiment_ana.pdf Deep Direct Reinforcement Learning for Financial Signal Representation and
  3. 所属分类:深度学习

    • 发布日期:2019-07-06
    • 文件大小:20971520
    • 提供者:weixin_45289854
  1. MediaEval 2015“音乐中的情感”任务的多尺度方法

  2. MediaEval 2015中“音乐中的情感”任务的目标是,以一种持续时间的方式自动估计音乐所表达的情感(就Arousal和Valence而言)。 在本文中,考虑到音乐特征序列之间的高关联性,我们研究了几种不同级别的多尺度方法,包括使用Deep Brief Networks(DBN)的声学功能学习和改进的Autoencoder(AE),双向Long-基于短期记忆递归神经网络(BLSTM-RNN)的多尺度回归融合与极限学习机(ELM),以及分层预测与支持向量回归(SVR)。 提交的所有运行的评估性
  3. 所属分类:其它

    • 发布日期:2021-03-16
    • 文件大小:56320
    • 提供者:weixin_38716872
  1. 基于blstm的维吾尔语文本情感分析

  2. 基于blstm的维吾尔语文本情感分析
  3. 所属分类:其它

    • 发布日期:2021-03-06
    • 文件大小:795648
    • 提供者:weixin_38500117
  1. OCR算法:CNN+BLSTM+CTC架构(VS15)-附件资源

  2. OCR算法:CNN+BLSTM+CTC架构(VS15)-附件资源
  3. 所属分类:互联网

  1. OCR算法:CNN+BLSTM+CTC架构(VS15)-附件资源

  2. OCR算法:CNN+BLSTM+CTC架构(VS15)-附件资源
  3. 所属分类:互联网

  1. caffe_ocr:主流ocr算法研究实验性的项目,目前实现了CNN + BLSTM + CTC架构-源码

  2. 简介 caffe_ocr是一个对现有主流ocr算法研究实验性的项目,目前实现了CNN + BLSTM + CTC的识别架构,并在数据准备,网络设计,调参等方面进行了很多的实验。代码包含了对lstm ,warp-ctc,multi-label等的适应和修改,还基于inception,restnet,densenet的网络结构。代码是针对Windows平台的,linux平台下只需要合并相关的修改到caffe代码中即可。 caffe代码修改 1.数据层增加了对多标签的支持2. lstm使用的是junh
  3. 所属分类:其它

    • 发布日期:2021-02-22
    • 文件大小:27262976
    • 提供者:weixin_42172972
  1. captcha_trainer.zip

  2. CNN+BLSTM+CTC的训练部署套件
  3. 所属分类:网络攻防

    • 发布日期:2021-02-08
    • 文件大小:16777216
    • 提供者:weixin_44549063
  1. captcha_platform:[验证码识别-部署]该项目基于CNN + BLSTM + CTC进行验证。 此项目代码标识仅适用于部署模型-源码

  2. 项目介绍 该项目基于CNN + BLSTM + CTC实现验证码识别。 该项目仅适用于部署模型,如果您需要训练模型,请转到 知情的 默认的require.txt将安装CPU版本,将“ requirements.txt”从“ TensorFlow”更改为“ TensorFlow-GPU”以切换到GPU版本,使用GPU版本安装相应的CUDA和cuDNN。 demo.py:有关如何调用预测方法的示例。 模型文件夹文件夹用于存储模型配置文件,例如model.yaml。 graph文件夹用于存储编译
  3. 所属分类:其它

    • 发布日期:2021-02-06
    • 文件大小:1048576
    • 提供者:weixin_42172572
  1. OntoNotes-5.0-NER-BIO:从OntoNotes 5.0版本中提取的BIO格式的命名实体识别数据集-源码

  2. OntoNotes-5.0-NER-BIO 这是CoNLL-2003格式的版本,带有OntoNotes 5.0版本NER的BIO标记方案。 此格式化的版本基于的说明以及在此存储库中创建的新脚本。 简单地说,名为“(Yuchen Zhang,Zhi Zhong,CoNLL 2013),提出了针对OntoNotes 5.0数据的Train-dev-split,并提供了将其转换为CoNLL 2012格式的脚本。 但是,结果不在BIO标记方案中,不能直接用于许多序列标记体系结构中,例如BLSTM-C
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:87031808
    • 提供者:weixin_42103128
  1. NER-pytorch:LSTM + CRF NER-源码

  2. 注意: 该软件包已停止更新,请参阅我们的新 参考: 纸: 用于命名实体识别的神经架构通过BLSTM-CNN-CRF进行端到端序列标记码: 用法: python train.py 性能 f1 91.00%
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:1048576
    • 提供者:weixin_42098759
  1. 基于循环神经网络的图像特定文本抽取方法

  2. 光学字符识别(OCR)难以针对图像中某些特定文本进行识别,尤其在实际场景中,识别结果通常会包含大量噪声文本。针对这一问题,提出一种基于循环神经网络的双向长短时记忆-条件随机场(BLSTM-CRF)模型。首先利用BLSTM网络捕获OCR识别结果中序列的上下文信息,得到特征序列;然后结合CRF建立模型特征与标签的关系,进行标签预测,通过标签即可得到特定文本。实验结果表明,该方法在场景图像数据集YNIDREAL上可以达到88.52%的准确率,相较于CRF模型,准确率提高了16.39个百分点,证明了本方
  3. 所属分类:其它

    • 发布日期:2021-01-26
    • 文件大小:7340032
    • 提供者:weixin_38683195
  1. 视频检索——BLSTM(复现方法说明)

  2. 0 导语 基于文章Play and Rewind: Optimizing Binary Representations of Videos by Self-Supervised Temporal Hashing的理解以及作者提供的源码,说明一些复现过程中需要注意的问题。 原作者源码地址github 我们的实现gitee 1 作者的readme 1.1 简介 An unsupervised hashing model that generates binary codes (+1,-1) for
  3. 所属分类:其它

    • 发布日期:2021-01-20
    • 文件大小:275456
    • 提供者:weixin_38709139
  1. 基于SDBN和BLSTM注意力融合的端到端视听双模态语音识别

  2. 提出一种端到端的视听语音识别算法。在该算法中,通过具有瓶颈结构的深度信念网络(deep belief network,DBN)中引入混合的l1/2范数和l1范数构建一种稀疏DBN(sparse DBN,SDBN)来提取稀疏瓶颈特征,从而实现对数据的特征降维,然后用双向长短期记忆网络(bidirectional long short-term memory,BLSTM)在时序上对特征进行模态处理,之后利用一种注意力机制将经过模态处理的唇部视觉信息和音频听觉信息进行自动对齐、融合,最后将融合的视听觉
  3. 所属分类:其它

    • 发布日期:2021-01-19
    • 文件大小:1048576
    • 提供者:weixin_38646914