您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. caffe深度学习薛开宇笔记实例-基于卷积神经网络的声音识别

  2. 目前的音乐检索系统用流派、风格、情感等类别标签检索音乐。其中,如果人工标注 音乐这些类别标签,则存在主动性强、费时费力、速度慢的问题,而如果采用传统的自动 标注方式,则存在准确率低的问题。后者准确率低的原因是,其标注时使用的模型不能 很好识别音乐。随着 Hinton 提出深度学习模型后,因其在图像和语音识别领域均取得很 好的成果,在识别领域成为了研究热点。因此,本文旨在研究如何使用深度学习中的卷 积神经网络(Convolutional Neural Networks,CNN)模型,设计出一个准
  3. 所属分类:其它

    • 发布日期:2016-12-27
    • 文件大小:5242880
    • 提供者:u014365862
  1. 基于Java实现CNN,并附MNIST和语音(MFCC特征)性别识别示例。

  2. 构建CNN LayerBuilder builder = new LayerBuilder(); builder.addLayer(Layer.buildInputLayer(new Size(28, 28))); builder.addLayer(Layer.buildConvLayer(6, new Size(5, 5))); builder.addLayer(Layer.buildSampLayer(new Size(2, 2))); builder.addLayer(Layer.bui
  3. 所属分类:Java

    • 发布日期:2018-05-04
    • 文件大小:1048576
    • 提供者:qq_40014195
  1. tensorflow google tensorflow-1.10.0-cp35-cp35m-linux_x86_64.whl

  2. TensorFlow可被用于语音识别或图像识别等多项机器学习和深度学习领域 适用环境ubuntu1604 python3.5 cuda9.1 cdnn7.1 nvidiaGPU 源码编译 官网上的版本支持cuda9.0 懒人适用
  3. 所属分类:深度学习

    • 发布日期:2018-08-28
    • 文件大小:98566144
    • 提供者:justoil
  1. CNN-DTW 语音识别论文

  2. CNN-DTW 语音识别论文 ASR 多种特征向量组合 人工智能
  3. 所属分类:深度学习

    • 发布日期:2018-12-28
    • 文件大小:460800
    • 提供者:weixin_44276261
  1. CNN卷积神经网络实现语音识别.zip

  2. 目的:使用CNN卷积神经网络实现语音识别 步骤:(1)预处理。 首尾端的静音切除,降低对后续步骤造成的干扰,然后进行声音分帧,把声音切开成帧,,各帧之间一般是有交叠。 (2)特征提取。运用的算法为倒谱系数(MFCC),把每一帧波形变成一个包含声音信息的多维向量; (3)RNN模型训练。有了特征,就可以使用TensorFlow完成模型的建立和训练了。 (4)验证模型。 目标:对相应的声音数据进行分类,例如数据的是数数的数据,能够输出对应的数字。
  3. 所属分类:深度学习

    • 发布日期:2019-07-19
    • 文件大小:5120
    • 提供者:shoulaxiao
  1. Python-该系统实现了基于深度框架的语音识别中的声学模型和语言模型建模

  2. 该系统实现了基于深度框架的语音识别中的声学模型和语言模型建模,其中声学模型包括CNN-CTC、GRU-CTC、CNN-RNN-CTC,语言模型包含transformer、CBHG,数据集包含stc、primewords、Aishell、thchs30四个数据集。
  3. 所属分类:其它

    • 发布日期:2019-08-10
    • 文件大小:113246208
    • 提供者:weixin_39841882
  1. 基于CNN的孤立词识别.zip

  2. 基于深度学习的孤立词语音识别系统,采用CNN,内含代码和数据以及课程,用python+tensorflow写的
  3. 所属分类:深度学习

    • 发布日期:2020-05-09
    • 文件大小:130023424
    • 提供者:lxhdy12345
  1. 机器学习在语音识别和图像识别中的应用.pdf

  2. 论文,本文主要应用不同的机器学习算法来对语音信号和图像进行识别分类,主要采用 BP神经网络模型、改进BP神经网络模型、SVM、改进的粒子群算法(IPSO)优化的 SVM模型、PCA优化的SVM模型、CNN模型、改进的CNN模型等。对
  3. 所属分类:深度学习

    • 发布日期:2020-04-15
    • 文件大小:8388608
    • 提供者:duanwuyu
  1. 车牌识别源码.zip

  2. 这是我的花了半年时间做的基于CNN里面有训练好的数据集这是用matlab做的车牌识别系统带语音报车牌和现在的车识别系统相近可以用来做研究
  3. 所属分类:深度学习

    • 发布日期:2019-07-19
    • 文件大小:71303168
    • 提供者:qq_20492531
  1. 语音识别数据集合,详细介绍了搭建网络的一步步的操作。 LanguageModel2.py为基于统计的语言模型,dic

  2. CNN+CTC_tutorial.ipynb为语音模型的教程,详细介绍了搭建网络的一步步的操作。 LanguageModel2.py为基于统计的语言模型,dict.txt为统计的字典。 test.ipnb用于测试模型性能。 数据集使用的是清华的数据集,下载后放在项目同级目录即可运行
  3. 所属分类:深度学习

    • 发布日期:2020-07-15
    • 文件大小:834666496
    • 提供者:weixin_32759777
  1. MATLAB车牌识别语音播报停车场应用系统.zip

  2. 平台:MATLAB;流程:车牌定位,字符分割,车牌识别;算法:车牌定位【边缘检测】,字符分割【连通域法】,车牌识别【模板匹配或者bp神经网络,cnn卷积神经网络】;含GUI界面;特殊功能:语音播报,库外识别,计时计费,停车场应用场景;附送资料:开题,提纲,技术文档等。
  3. 所属分类:软件测试

    • 发布日期:2020-08-03
    • 文件大小:1048576
    • 提供者:matlab1998_vx
  1. 中文语音识别cnn + gru +ctc

  2. 自动语音识别模型,包括cnn+ctc模型和gru+ctc模型。使用tensorflow1.+和keras进行模型训练。实现中文语音识别。
  3. 所属分类:深度学习

    • 发布日期:2020-11-12
    • 文件大小:59392
    • 提供者:qq_41854731
  1. TensorFlow1.x入门(9)——卷积神经网络(CNN)

  2. 系列文章 1. 计算图的创建与启动 2. 变量的定义及其操作 3. Feed与Fetch 4. 线性回归 5. 构建非线性回归模型 6. 简单分类问题 7. Dropout与优化器 8. 手动调整学习率与TensorBoard 卷积神经网络(CNN)系列文章引言知识点示例 引言 卷积神经网络(Convolutional Neural Networks, CNN)是深度学习领域内的一个重要的组成构建。CNN现在大量的用于图像识别领域,但是在自然语言处理和语音识别领域作为特征抽取器有广泛的应用。 一
  3. 所属分类:其它

    • 发布日期:2020-12-21
    • 文件大小:59392
    • 提供者:weixin_38687199
  1. AutoSpeech:[InterSpeech 2020]“自动语音-源码

  2. AutoSpeech:用于说话人识别的神经体系结构搜索 本文的代码 丁少金*,陈天龙*,龚新宇,查微微,王章阳 概述 基于卷积神经网络(CNN)的说话人识别系统通常是使用现成的主干网构建的,例如VGG-Net或ResNet。但是,这些主干最初是用于图像分类的,因此可能自然不适合说话人识别。由于手动探索设计空间的复杂性过高,我们提出了第一种用于说话人识别任务的神经体系结构搜索方法,称为AutoSpeech 。我们在上的评估结果表明,从提议的方法衍生的CNN架构明显优于基于VGG-M,ResNet-
  3. 所属分类:其它

    • 发布日期:2021-03-20
    • 文件大小:186368
    • 提供者:weixin_42131405
  1. DFCNN-master:这是一个基于全卷积神经网络的语音识别系统-源码

  2. 基于全卷积神经网络的中文语音识别系统 基于全卷积神经网络的中文语音识别系统 简介简介 通过git克隆仓库以后,需要将数据列表目录下的文件全部复制到数据集目录下,也就是将其跟数据集放在一起。 $ cp -rf datalist/ * dataset/ 目前可用的模型有24、25和251 本项目开始训练请执行: $ python3 train_mspeech.py 本项目开始测试请执行: $ python3 test_mspeech.py iters_num (这里的iters_num为迭代的
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:37748736
    • 提供者:weixin_42118161
  1. speech-to-text:混合语言语音识别系统; 混合(GMM + NNet)模型; 卡尔迪+凯拉斯-源码

  2. 混合语言语音识别 来自团队: 当中国学生在各州学习时,我们发现自己的说话习惯发生了变化-英文单词和短语很容易滑入汉语句子中。 我们非常感到需要具有能够处理多语言语音到文本翻译的消息传递应用程序。 因此,在此任务中,我们将开发此功能-使用深度学习架构(DNN,CNN,LSTM)构建模型,以将多语言音频(在同一句子中具有中英文)正确地翻译成文本。 - 表中的内容: 目录说明 代码开关: 包含用于构建系统的脚本 描述: LDC2015S04,我们的数据集描述 笔记: 我们关于Kaldi相关t
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:1073741824
    • 提供者:weixin_42109732
  1. 基于频谱图的语音识别

  2. 深度学习在人工智能领域取得了巨大突破。 当前,时域语音识别的鲁棒性较差,频域语音识别的频谱图复杂度也需要大大降低。 因此,本文提出了一种基于R-CNN的快速目标检测方法,用于在时域和频域中识别用于语音识别的频谱图。 提出的方法仅关注频谱图的局部感兴趣区域(明显的声纹),该区域过滤高频噪声以提高性能。 实验结果表明,所提出的方法比现有方法具有更高的准确性和鲁棒性,并且在嘈杂的工厂中可以表现良好。
  3. 所属分类:其它

    • 发布日期:2021-03-08
    • 文件大小:527360
    • 提供者:weixin_38539018
  1. wer_are_we:尝试跟踪语音识别的最新技术和最新结果(参考书目)-源码

  2. wer_are_we 我们是吗? 尝试跟踪现有技术和语音识别的最新结果。 随时纠正! (受启发 ) WER LibriSpeech (可能比LibriSpeech接受了更多的数据培训。) WER测试清洁 WER测试其他 纸 已发表 笔记 5.83% 12.69% 人类 2015年12月 人类 1.9% 3.9% 2020年5月 卷积增强变压器(Conformer)+ 3层LSTM LM(数据增强:SpecAugment) 1.9% 4.1% 2020年5月 CNN-RNN-Tra
  3. 所属分类:其它

    • 发布日期:2021-02-27
    • 文件大小:6144
    • 提供者:weixin_42165018
  1. 详解卷积神经网络(CNN)在语音识别中的应用

  2. 总结目前语音识别的发展现状,dnn、rnn/lstm和cnn算是语音识别中几个比较主流的方向。2012年,微软邓力和俞栋老师将前馈神经网络FFDNN(FeedForwardDeepNeuralNetwork)引入到声学模型建模中,将FFDNN的输出层概率用于替换之前GMM-HMM中使用GMM计算的输出概率,引领了DNN-HMM混合系统的风潮。长短时记忆网络(LSTM,LongShortTermMemory)可以说是目前语音识别应用最广泛的一种结构,这种网络能够对语音的长时相关性进行建模,从而提高
  3. 所属分类:其它

    • 发布日期:2021-02-25
    • 文件大小:406528
    • 提供者:weixin_38702726
  1. 详解卷积神经网络(CNN)在语音识别中的应用

  2. 总结目前语音识别的发展现状,dnn、rnn/lstm和cnn算是语音识别中几个比较主流的方向。2012年,微软邓力和俞栋老师将前馈神经网络FFDNN(FeedForwardDeepNeuralNetwork)引入到声学模型建模中,将FFDNN的输出层概率用于替换之前GMM-HMM中使用GMM计算的输出概率,引领了DNN-HMM混合系统的风潮。长短时记忆网络(LSTM,LongShortTermMemory)可以说是目前语音识别应用最广泛的一种结构,这种网络能够对语音的长时相关性进行建模,从而提高
  3. 所属分类:其它

    • 发布日期:2021-02-02
    • 文件大小:406528
    • 提供者:weixin_38730840
« 12 »