搜索资源 - 语音识别cnn - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - 语音识别cnn

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

caffe深度学习薛开宇笔记实例-基于卷积神经网络的声音识别
目前的音乐检索系统用流派、风格、情感等类别标签检索音乐。其中，如果人工标注音乐这些类别标签，则存在主动性强、费时费力、速度慢的问题，而如果采用传统的自动标注方式，则存在准确率低的问题。后者准确率低的原因是，其标注时使用的模型不能很好识别音乐。随着 Hinton 提出深度学习模型后，因其在图像和语音识别领域均取得很好的成果，在识别领域成为了研究热点。因此，本文旨在研究如何使用深度学习中的卷积神经网络(Convolutional Neural Networks，CNN)模型，设计出一个准
所属分类：其它
- 发布日期：2016-12-27
- 文件大小：5242880
- 提供者：u014365862

基于Java实现CNN，并附MNIST和语音（MFCC特征）性别识别示例。
构建CNN LayerBuilder builder = new LayerBuilder(); builder.addLayer(Layer.buildInputLayer(new Size(28, 28))); builder.addLayer(Layer.buildConvLayer(6, new Size(5, 5))); builder.addLayer(Layer.buildSampLayer(new Size(2, 2))); builder.addLayer(Layer.bui
所属分类：Java
- 发布日期：2018-05-04
- 文件大小：1048576
- 提供者：qq_40014195

tensorflow google tensorflow-1.10.0-cp35-cp35m-linux_x86_64.whl
TensorFlow可被用于语音识别或图像识别等多项机器学习和深度学习领域适用环境ubuntu1604 python3.5 cuda9.1 cdnn7.1 nvidiaGPU 源码编译官网上的版本支持cuda9.0 懒人适用
所属分类：深度学习
- 发布日期：2018-08-28
- 文件大小：98566144
- 提供者：justoil

CNN-DTW 语音识别论文
CNN-DTW 语音识别论文 ASR 多种特征向量组合人工智能
所属分类：深度学习
- 发布日期：2018-12-28
- 文件大小：460800
- 提供者：weixin_44276261

CNN卷积神经网络实现语音识别.zip
目的：使用CNN卷积神经网络实现语音识别步骤：（1）预处理。首尾端的静音切除，降低对后续步骤造成的干扰，然后进行声音分帧，把声音切开成帧，，各帧之间一般是有交叠。（2）特征提取。运用的算法为倒谱系数（MFCC），把每一帧波形变成一个包含声音信息的多维向量；（3）RNN模型训练。有了特征，就可以使用TensorFlow完成模型的建立和训练了。（4）验证模型。目标：对相应的声音数据进行分类，例如数据的是数数的数据，能够输出对应的数字。
所属分类：深度学习
- 发布日期：2019-07-19
- 文件大小：5120
- 提供者：shoulaxiao

Python-该系统实现了基于深度框架的语音识别中的声学模型和语言模型建模
该系统实现了基于深度框架的语音识别中的声学模型和语言模型建模，其中声学模型包括CNN-CTC、GRU-CTC、CNN-RNN-CTC，语言模型包含transformer、CBHG，数据集包含stc、primewords、Aishell、thchs30四个数据集。
所属分类：其它
- 发布日期：2019-08-10
- 文件大小：113246208
- 提供者：weixin_39841882

基于CNN的孤立词识别.zip
基于深度学习的孤立词语音识别系统，采用CNN，内含代码和数据以及课程，用python+tensorflow写的
所属分类：深度学习
- 发布日期：2020-05-09
- 文件大小：130023424
- 提供者：lxhdy12345

机器学习在语音识别和图像识别中的应用.pdf
论文，本文主要应用不同的机器学习算法来对语音信号和图像进行识别分类，主要采用 BP神经网络模型、改进BP神经网络模型、SVM、改进的粒子群算法(IPSO)优化的 SVM模型、PCA优化的SVM模型、CNN模型、改进的CNN模型等。对
所属分类：深度学习
- 发布日期：2020-04-15
- 文件大小：8388608
- 提供者：duanwuyu

车牌识别源码.zip
这是我的花了半年时间做的基于CNN里面有训练好的数据集这是用matlab做的车牌识别系统带语音报车牌和现在的车识别系统相近可以用来做研究
所属分类：深度学习
- 发布日期：2019-07-19
- 文件大小：71303168
- 提供者：qq_20492531

语音识别数据集合，详细介绍了搭建网络的一步步的操作。 LanguageModel2.py为基于统计的语言模型，dic
CNN+CTC_tutorial.ipynb为语音模型的教程，详细介绍了搭建网络的一步步的操作。 LanguageModel2.py为基于统计的语言模型，dict.txt为统计的字典。 test.ipnb用于测试模型性能。数据集使用的是清华的数据集，下载后放在项目同级目录即可运行
所属分类：深度学习
- 发布日期：2020-07-15
- 文件大小：834666496
- 提供者：weixin_32759777

MATLAB车牌识别语音播报停车场应用系统.zip
平台：MATLAB；流程：车牌定位，字符分割，车牌识别；算法：车牌定位【边缘检测】，字符分割【连通域法】，车牌识别【模板匹配或者bp神经网络，cnn卷积神经网络】；含GUI界面；特殊功能：语音播报，库外识别，计时计费，停车场应用场景；附送资料：开题，提纲，技术文档等。
所属分类：软件测试
- 发布日期：2020-08-03
- 文件大小：1048576
- 提供者：matlab1998_vx

中文语音识别cnn + gru +ctc
自动语音识别模型，包括cnn+ctc模型和gru+ctc模型。使用tensorflow1.+和keras进行模型训练。实现中文语音识别。
所属分类：深度学习
- 发布日期：2020-11-12
- 文件大小：59392
- 提供者：qq_41854731

TensorFlow1.x入门（9）——卷积神经网络（CNN）
系列文章 1. 计算图的创建与启动 2. 变量的定义及其操作 3. Feed与Fetch 4. 线性回归 5. 构建非线性回归模型 6. 简单分类问题 7. Dropout与优化器 8. 手动调整学习率与TensorBoard 卷积神经网络（CNN）系列文章引言知识点示例引言卷积神经网络（Convolutional Neural Networks, CNN）是深度学习领域内的一个重要的组成构建。CNN现在大量的用于图像识别领域，但是在自然语言处理和语音识别领域作为特征抽取器有广泛的应用。一
所属分类：其它
- 发布日期：2020-12-21
- 文件大小：59392
- 提供者：weixin_38687199

AutoSpeech:[InterSpeech 2020]“自动语音-源码
AutoSpeech：用于说话人识别的神经体系结构搜索本文的代码丁少金*，陈天龙*，龚新宇，查微微，王章阳概述基于卷积神经网络（CNN）的说话人识别系统通常是使用现成的主干网构建的，例如VGG-Net或ResNet。但是，这些主干最初是用于图像分类的，因此可能自然不适合说话人识别。由于手动探索设计空间的复杂性过高，我们提出了第一种用于说话人识别任务的神经体系结构搜索方法，称为AutoSpeech 。我们在上的评估结果表明，从提议的方法衍生的CNN架构明显优于基于VGG-M，ResNet-
所属分类：其它
- 发布日期：2021-03-20
- 文件大小：186368
- 提供者：weixin_42131405

DFCNN-master:这是一个基于全卷积神经网络的语音识别系统-源码
基于全卷积神经网络的中文语音识别系统基于全卷积神经网络的中文语音识别系统简介简介通过git克隆仓库以后，需要将数据列表目录下的文件全部复制到数据集目录下，也就是将其跟数据集放在一起。 $ cp -rf datalist/ * dataset/ 目前可用的模型有24、25和251 本项目开始训练请执行： $ python3 train_mspeech.py 本项目开始测试请执行： $ python3 test_mspeech.py iters_num （这里的iters_num为迭代的
所属分类：其它
- 发布日期：2021-03-11
- 文件大小：37748736
- 提供者：weixin_42118161

speech-to-text:混合语言语音识别系统；混合（GMM + NNet）模型；卡尔迪+凯拉斯-源码
混合语言语音识别来自团队：当中国学生在各州学习时，我们发现自己的说话习惯发生了变化-英文单词和短语很容易滑入汉语句子中。我们非常感到需要具有能够处理多语言语音到文本翻译的消息传递应用程序。因此，在此任务中，我们将开发此功能-使用深度学习架构（DNN，CNN，LSTM）构建模型，以将多语言音频（在同一句子中具有中英文）正确地翻译成文本。 - 表中的内容：目录说明代码开关：包含用于构建系统的脚本描述： LDC2015S04，我们的数据集描述笔记：我们关于Kaldi相关t
所属分类：其它
- 发布日期：2021-03-11
- 文件大小：1073741824
- 提供者：weixin_42109732

基于频谱图的语音识别
深度学习在人工智能领域取得了巨大突破。当前，时域语音识别的鲁棒性较差，频域语音识别的频谱图复杂度也需要大大降低。因此，本文提出了一种基于R-CNN的快速目标检测方法，用于在时域和频域中识别用于语音识别的频谱图。提出的方法仅关注频谱图的局部感兴趣区域（明显的声纹），该区域过滤高频噪声以提高性能。实验结果表明，所提出的方法比现有方法具有更高的准确性和鲁棒性，并且在嘈杂的工厂中可以表现良好。
所属分类：其它
- 发布日期：2021-03-08
- 文件大小：527360
- 提供者：weixin_38539018

wer_are_we：尝试跟踪语音识别的最新技术和最新结果（参考书目）-源码
wer_are_we 我们是吗？尝试跟踪现有技术和语音识别的最新结果。随时纠正！（受启发） WER LibriSpeech （可能比LibriSpeech接受了更多的数据培训。） WER测试清洁 WER测试其他纸已发表笔记 5.83％ 12.69％人类 2015年12月人类 1.9％ 3.9％ 2020年5月卷积增强变压器（Conformer）+ 3层LSTM LM（数据增强：SpecAugment） 1.9％ 4.1％ 2020年5月 CNN-RNN-Tra
所属分类：其它
- 发布日期：2021-02-27
- 文件大小：6144
- 提供者：weixin_42165018

详解卷积神经网络（CNN）在语音识别中的应用
总结目前语音识别的发展现状，dnn、rnn/lstm和cnn算是语音识别中几个比较主流的方向。2012年，微软邓力和俞栋老师将前馈神经网络FFDNN（FeedForwardDeepNeuralNetwork）引入到声学模型建模中，将FFDNN的输出层概率用于替换之前GMM-HMM中使用GMM计算的输出概率，引领了DNN-HMM混合系统的风潮。长短时记忆网络（LSTM，LongShortTermMemory）可以说是目前语音识别应用最广泛的一种结构，这种网络能够对语音的长时相关性进行建模，从而提高
所属分类：其它
- 发布日期：2021-02-25
- 文件大小：406528
- 提供者：weixin_38702726

详解卷积神经网络（CNN）在语音识别中的应用
总结目前语音识别的发展现状，dnn、rnn/lstm和cnn算是语音识别中几个比较主流的方向。2012年，微软邓力和俞栋老师将前馈神经网络FFDNN（FeedForwardDeepNeuralNetwork）引入到声学模型建模中，将FFDNN的输出层概率用于替换之前GMM-HMM中使用GMM计算的输出概率，引领了DNN-HMM混合系统的风潮。长短时记忆网络（LSTM，LongShortTermMemory）可以说是目前语音识别应用最广泛的一种结构，这种网络能够对语音的长时相关性进行建模，从而提高
所属分类：其它
- 发布日期：2021-02-02
- 文件大小：406528
- 提供者：weixin_38730840

« 12 »