搜索资源 - Kaldi和语音识别 - 点数信息

点数信息

注册会员 | 设为首页 | 加入收藏夹

您好，欢迎光临本网站！[请登录] ！[注册会员]！

热门搜索： 源码 Android 整站插件识别 p2p 游戏算法更多...

在线客服QQ:632832888

当前位置：

搜索资源 - Kaldi和语音识别

下载资源分类

移动开发

开发技术

课程资源

网络技术

操作系统

安全技术

数据库

行业

服务器应用

存储

信息化

考试认证

云计算

大数据

跨平台

音视频

游戏开发

人工智能

区块链

资源分类

搜索资源列表

kaldi工具箱
kaldi工具箱，kaldi是一款语音识别工具库，由Daniel Povey进行开发和维护，整个框架比较成熟，在容纳经久不衰的GMM-HMM、SGMM-HMM、DNN-HMM等多种语音识别模型之外，还将现阶段比较“火”的DNN、CNN、LSTM、BLSTM等深度神经网络模型加入其中，获得了广大科研工作者和不少企业公司研发团队的青睐。
所属分类：深度学习
- 发布日期：2018-03-10
- 文件大小：4194304
- 提供者：hdd_gcw

Python-ESPnet端到端语音处理工具集
主要侧重于端到端语音识别和端到端的文本到语音转换。 ESPnet使用chainer和pytorch作为主要的深度学习引擎，并遵循Kaldi风格的数据处理，特征提取/格式和配方，为语音识别和其他语音处理实验提供完整的设置。
所属分类：其它
- 发布日期：2019-08-09
- 文件大小：1048576
- 提供者：weixin_39841856

语音识别.zip
语音识别资料，kaldi 和 htk ，htk比较适合入门学习，而kaldi比较适合做项目，目前被很多大公司为基础开发，从语言角度讲，HTK是基于面向过程的方式用C语言开发的，Kaldi是C++基于面向对象开发的。HTK的C代码的优点是简单高效，缺点包括一切面向过程的缺点，以及需要使用自己定制的内存管理模块、数据结构等等。Kaldi代码本应包括C++面向对象的各种优点，不过可能因为很多作者不熟悉面向对象，以及没有办法采用严格开发管理的方式，其实不少代码（比如nnet1的Nnet class）
所属分类：深度学习
- 发布日期：2019-08-10
- 文件大小：24117248
- 提供者：hn_zhangkun

kaldi中文资料_v0.4和thch30学习笔记.zip
语音识别工具kaldi学习资料：kaldi官网中文学习资料翻译第四版+thch30数据学习笔记
所属分类：深度学习
- 发布日期：2019-09-16
- 文件大小：2097152
- 提供者：cipai5547

构建Kaldi需要的openfst和测试Kaldi是否安装成功的音频文件
资源里面有两个文件夹，一个是构建Kaldi语音识别工具箱非常重要的openfst，版本为1.6.7，将名称为openfst-1.6.7的文件拷贝到tools文件夹下。另一个文件是最后测试工具是否安装成功的音频，可以拷贝到Kaldi的egs->yesno->s5文件夹。
所属分类：深度学习
- 发布日期：2020-04-10
- 文件大小：5242880
- 提供者：weixin_45416911

Kaldi 和语音识别
Kaldi 和语音识别
所属分类：专业指导
- 发布日期：2017-04-13
- 文件大小：1048576
- 提供者：u012809299

基于Kaldi+GStreamer搭建线上的实时语音识别器
一、安装python2.7和Tornado 4，ws4py, YAML,JSON等依赖包 1、sudo pip2 install tornado==4.3（4.0版本不行） 2、sudo pip2 install ws4py==0.3.2 3、sudo pip2 install pyyaml 4、sudo pip2 install https://pypi.python.org/packages/40/ad/52c1f3a562df3b210e8f165e1aa243a178c454ead65
所属分类：其它
- 发布日期：2021-01-06
- 文件大小：188416
- 提供者：weixin_38545485

莫愁前路无网络，离线语音正待君——Kaldi篇
基于Kaldi开发安卓离线语音识别项目(一) 在安卓项目中集成lib-share-asr组件 ”持续更编“ 前言近期在开发智能家居领域产品——带屏智能音箱，其中语音场景要求在、离线语音识别支持。由于，讯飞、百度等大厂，收费颇高。对于，穷苦大众的小生，撸起袖子，就在Github上遨游。果然，邂逅了两位梦中情人——Pocketsphinx和Kaldi。作为老资格的Pocketsphinx已经被后生Kaldi拍在沙滩上，但还是对Pocketsphinx做了一番实践(详情可在小生的博客中浏览)。最后
所属分类：其它
- 发布日期：2021-01-03
- 文件大小：471040
- 提供者：weixin_38536841

speech-to-text:混合语言语音识别系统；混合（GMM + NNet）模型；卡尔迪+凯拉斯-源码
混合语言语音识别来自团队：当中国学生在各州学习时，我们发现自己的说话习惯发生了变化-英文单词和短语很容易滑入汉语句子中。我们非常感到需要具有能够处理多语言语音到文本翻译的消息传递应用程序。因此，在此任务中，我们将开发此功能-使用深度学习架构（DNN，CNN，LSTM）构建模型，以将多语言音频（在同一句子中具有中英文）正确地翻译成文本。 - 表中的内容：目录说明代码开关：包含用于构建系统的脚本描述： LDC2015S04，我们的数据集描述笔记：我们关于Kaldi相关t
所属分类：其它
- 发布日期：2021-03-11
- 文件大小：1073741824
- 提供者：weixin_42109732

TORGO-ASR-源码
使用TORGO数据集进行语音处理有关使用Kaldi进行韵律性语音识别和说话者识别的教程。所使用的数据由多伦多大学免费提供。说话者由于脑瘫或肌萎缩性侧索硬化症而导致语言障碍。这项运动的目标建立用于语音识别的基于kaldi的GMM-HMM声学模型。提高对受损语音的识别精度（数据增强，超参数调整等）使用GMM-HMM模型中的路线训练DNN-HMM声学模型。通过i向量执行说话者识别/识别。栏目第1部分：第2部分：第3部分： GMM-HMM声学模型 DNN-HMM声学
所属分类：其它
- 发布日期：2021-03-09
- 文件大小：112640
- 提供者：weixin_42107165

pika:基于Pytorch和（Py）Kaldi的轻量级语音处理工具包-源码
PIKA：基于Pytorch和（Py）Kaldi的轻量级语音处理工具包 PIKA是基于Pytorch和（Py）Kaldi的轻量级语音处理工具包。第一个版本侧重于端到端语音识别。我们使用作为深度学习引擎，使用进行数据格式化和特征提取。主要特点即时数据扩充和特征提取加载程序 TDNN变压器编码器以及基于卷积和变压器的解码器模型结构 RNNT训练和批量解码带有外部Ngram FST的RNNT解码（即时记录，aka浅层融合） RNNT最低贝叶斯风险（MBR）培训用于RNNT的LAS前向和后
所属分类：其它
- 发布日期：2021-03-08
- 文件大小：97280
- 提供者：weixin_42166105

kaldi-active-grammar：具有语法的Python Kaldi语音识别，可以在解码时动态将其设置为activeinactive-源码
卡尔迪主动语法具有语法的Python Kaldi语音识别，可以在解码时动态设置有效/无效开发了Python软件包，以便使用自动语音识别引擎在语音识别框架中实现对计算机应用程序的基于上下文的命令和控制。 [ GitHub与（仅）我的GitHub赞助者捐款相匹配。] 通常，Kaldi解码图是整体的，需要昂贵的前期离线编译，并且在解码期间是静态的。卡尔迪（Kaldi）的新语法框架允许将多个具有非终结符的独立语法分别编译并在解码时动态地拼接在一起，但是所有语法始终处于活动状态并且能够被识别。
所属分类：其它
- 发布日期：2021-02-28
- 文件大小：195584
- 提供者：weixin_42152298

kaldi-gstreamer-server：基于Kaldi工具包和GStreamer框架的实时全双工语音识别服务器-源码
Kaldi GStreamer服务器这是基于Kaldi工具包和GStreamer框架并以Python实现的实时全双工实时语音识别服务器。广告塔林工业大学正在寻找一名从事语音识别的博士生，重点是轻度代码转换的语音（例如，芬兰语包含很多英语技术术语）。。注意！该职位仍然开放！特征基于websocket的全双工通信：语音进入，出现部分假设（考虑Android的语音输入）高度可扩展：服务器由主组件和工作程序组成；每个并发识别会话需要一名工作人员；可以独立于远程计算机上的主机启
所属分类：其它
- 发布日期：2021-02-23
- 文件大小：244318208
- 提供者：weixin_42134117

对话：STT-NLP-TTS堆栈-源码
在Python中玩STT-NLP-TTS堆栈 STT 使用Vanilla Vosk离线版，这是一种自动语音识别API，它使用Kaldi工具包作为后端并用于模型开发，是用C ++构建的。链接：： Google，IBM和其他大型企业中有许多在线API。其他离线选项包括Mozilla的Deepspeech，百度的Deepspeech 2.0，EESEN，纯Kaldi。到目前为止，最好的葡萄牙语免费离线模型是Vosk。自然语言处理使用 TTS 使用一些灵感来自这里： :
所属分类：其它
- 发布日期：2021-02-14
- 文件大小：2048
- 提供者：weixin_42144707

卡尔迪：卡尔迪-阿斯卡尔迪是卡尔迪项目的官方所在地-源码
Kaldi语音识别工具包要构建工具箱：请参阅./INSTALL 。这些说明对UNIX系统（包括各种Linux）有效。达尔文和Cygwin（尚未在UNIX的更多“外来”品种上进行测试）。有关Windows安装说明（不包括Cygwin），请参见windows/INSTALL 。要运行示例系统构建，请参见egs/README.txt 如果您遇到问题（并且可能会遇到），请不要犹豫与开发人员联系（请参阅下文）。除了特定的问题之外，请让我们知道项目的某些方面是否可以改进，感到困惑等，以及您最
所属分类：其它
- 发布日期：2021-02-05
- 文件大小：17825792
- 提供者：weixin_42125770

pytorch-kaldi：pytorch-kaldi是用于开发最新的DNNRNN混合语音识别系统的项目。 DNN部分由pytorch管理，而特征提取，标签计算和解码则通过kaldi工具箱执行-源码
PyTorch-Kaldi语音识别工具包 PyTorch-Kaldi是一个开放源代码存储库，用于开发最新的DNN / HMM语音识别系统。 DNN部分由PyTorch管理，而特征提取，标签计算和解码则由Kaldi工具包执行。该存储库包含PyTorch-Kaldi工具箱的最新版本（PyTorch-Kaldi-v1.0）。要查看以前的版本（PyTorch-Kaldi-v0.1），。如果使用此代码或其一部分，请引用以下文章： M. Ravanelli，T。Parcollet，Y。Bengi
所属分类：其它
- 发布日期：2021-02-05
- 文件大小：370688
- 提供者：weixin_42168750

SincNet：SincNet是一种用于有效处理原始音频样本的神经体系结构-源码
SincNet SincNet是用于处理原始音频样本的神经体系结构。这是一种新颖的卷积神经网络（CNN），它鼓励第一个卷积层发现更多有意义的滤波器。 SincNet基于参数化的Sinc函数，这些函数实现了带通滤波器。与学习每个滤波器的所有元素的标准CNN相比，所提出的方法只能从数据中直接学习低和高截止频率。这提供了一种非常紧凑而有效的方式来导出专门针对所需应用进行了调整的定制滤波器组。该项目发布了一系列代码和实用程序，可通过SincNet进行说话人识别。使用TIMIT数据库提供了
所属分类：其它
- 发布日期：2021-02-04
- 文件大小：177152
- 提供者：weixin_42139357

雅典娜：基于序列到序列的语音处理引擎的开源实现-源码
雅典娜 Athena是端到端语音处理引擎的开源实现。我们的愿景是增强语音处理的端到端模型的工业应用和学术研究。为了使所有人都能使用语音处理，我们还将在一些开源数据集上发布示例实现和配方，以完成各种任务（自动语音识别，语音合成，语音转换，说话者识别等）。我们所有的模型都在Tensorflow> = 2.0.1中实现。为了易于使用，我们提供了带有的无Kaldi 特征提取器。 1）目录 2）主要特点基于混合注意力/ CTC的端到端ASR 语音转换器无人监督的预训练使用Horov
所属分类：其它
- 发布日期：2021-02-04
- 文件大小：892928
- 提供者：weixin_42131013

基于《Kaldi语音识别》技术及开源语音语料库分享
前言：数据堂自AI开源计划发起，面向高校和科研机构首次开源的【1505小时中文普通话语音数据集】，该数据集句标注准确率达到了98%，得到了很多开发者的认可。不仅如此，数据堂基于此开源数据集还精选出了【200小时中文普通话语音数据】同期发布，并提供了基于Kaldi【200小时中文普通话语音数据】训练方法。该训练方法同时得到了广泛的关注及开发者的极度认可，并表示希望数据堂持续分享相关技术。日前，数据堂AI开放实验室发起基于《Kaldi语音识别》技术的分享会，分享会也一同邀请到了北印和北工商实验
所属分类：其它
- 发布日期：2021-01-20
- 文件大小：2097152
- 提供者：weixin_38607554