点数信息
www.dssz.net
注册会员
|
设为首页
|
加入收藏夹
您好,欢迎光临本网站!
[请登录]
!
[注册会员]
!
首页
移动开发
云计算
大数据
数据库
游戏开发
人工智能
网络技术
区块链
操作系统
模糊查询
热门搜索:
源码
Android
整站
插件
识别
p2p
游戏
算法
更多...
在线客服QQ:632832888
当前位置:
资源下载
搜索资源 - 端到端语音合成
下载资源分类
移动开发
开发技术
课程资源
网络技术
操作系统
安全技术
数据库
行业
服务器应用
存储
信息化
考试认证
云计算
大数据
跨平台
音视频
游戏开发
人工智能
区块链
在结果中搜索
所属系统
Windows
Linux
FreeBSD
Unix
Dos
PalmOS
WinCE
SymbianOS
MacOS
Android
开发平台
Visual C
Visual.Net
Borland C
CBuilder
Dephi
gcc
VBA
LISP
IDL
VHDL
Matlab
MathCAD
Flash
Xcode
Android STU
LabVIEW
开发语言
C/C++
Pascal
ASM
Java
PHP
Basic/ASP
Perl
Python
VBScript
JavaScript
SQL
FoxBase
SHELL
E语言
OC/Swift
文件类型
源码
程序
CHM
PDF
PPT
WORD
Excel
Access
HTML
Text
资源分类
搜索资源列表
speech recognition
这是语音识别技术的第一个例子。 语音技术的概念实际包括两个技术:合成器和识别器(参见图 1)。语音合成器将文本作为输入,并产生 音频流作为输出。语音合成也称为“文本到语音”(text-to-speech,TTS)。另一方面,语音识别器的行 探究 Windows Vista 中新的语音识别与合成 API 为刚好相反。它将音频流作为输入,并将其转换为文本副本。 对于合成器而言,将一串字符转换为听起来符合规范的音频流需要做大量工作。想象其工作方式的最简单 的方法是分析一个两部分系统的前端和后端。
所属分类:
专业指导
发布日期:2009-05-24
文件大小:144384
提供者:
liuning0820
语音识别与AgentNet 的整体实现
本设计的目标是利用语音技术和动画技术作为与用户交流的主要人机界面。用户通过语音识别控制程序运行,程序通过语音合成通知现在运行状况。而作为被控制的对象是一个网络服务模型。 用户登陆上AgentNet服务器上以后,可以要求读新闻,与同时登陆到AgentNet的其他客户通讯等等。 在客户端用户可用语音控制去完成接收电子邮件等日常工作。
所属分类:
网络基础
发布日期:2009-07-25
文件大小:404480
提供者:
yeyanbin
低速率语音压缩编码对语音识别系统的影响
通过窄带信道将语音信号传输到远端的识别系统,从而实现远距离的人机对话,具有重要的现 实意义。在2.4kbps的速率下,语音编码算法依然可以合成出可懂度非常高的语音,但是这样的语音信号 与原始语音相比还是有巨大的损失。低速率语音编码算法对于语音识别产生的影响是巨大的,因此必须 想办法减轻这种损失对于识别的损害。在此选择了三种不同的低速率语音编码器,分别使用LPC(Linear Predictive Coding,线性预测)算法、MELP(Mixed Excitation Linear Predi
所属分类:
其它
发布日期:2010-04-13
文件大小:84992
提供者:
babiwangwang
Dialogic从入门到系统工程师_完整版
有很多只有333页 我这个是完整版本 总共666页 序言 14 写作本书的原因 14 目标读者 15 作者编写的其他书籍 15 第一章 CTI通信基础知识 16 1.1 概述 16 1.2 电信技术概念和术语 16 1.2.1 模拟信号和数字信号 16 1.1.2 模拟线路和数字线路 18 1.1.3信令的基本概念 19 1.1.4 信令的分类 20 1.1.4 脉冲拨号和DTMF拨号 21 1.2 计算机语音技术相关标准 21 第二章 常用名词解释 23 2.1 CTI 23 2.2 呼叫处
所属分类:
硬件开发
发布日期:2010-04-27
文件大小:3145728
提供者:
zhaozhitian
VoIP:IP语音技术
目 录 前言 第1章 绪论 1 1.1 因特网电话和分组语音 1 1.2 为何热衷于因特网电话 1 1.2.1 商业考虑 1 1.2.2 IP的普遍存在 3 1.2.3 技术的成熟 4 1.2.4 向数据网转移 4 1.3 为什么用IP传送电话业务 5 1.4 成功使用IP电话技术的障碍 5 1.5 在因特网和专用互连网中的VoIP 5 1.6 问题不在于是否,而是如何 6 1.7 VoIP的配置选择 6 1.8 专用VoIP网 8 1.9 下一步 9 1.10 基于IP的呼叫中心和电子商务
所属分类:
其它
发布日期:2011-04-06
文件大小:12582912
提供者:
yiluzhuixun206
SYN6658中文语音合成芯片用户手册V1.0正式版
SYN6658 中文语音合成芯片是北京宇音天下科技有限公司于 2012 年最新推出的一款性/价比更高, 效果更 自然的一款高端语音合成芯片。SYN6658 通过 UART 接口或 SPI 接口通讯方式,接收待合成的文本数据,实现 文本到语音(或 TTS 语音)的转换。 公司最新推出的 SYN6658 语音合成芯片,继承了 OSYNO6188 和 SYN6288 语音芯片的优秀特点:小尺寸贴 片封装、硬件接口简单、低功耗、音色清亮圆润、极高的性/价比;除此之外,SYN6658 在识别文本/数字/
所属分类:
硬件开发
发布日期:2012-05-02
文件大小:739328
提供者:
h340365651
syn6288例程
SYN6288 中文语音合成芯片是北京宇音天下科技有限公司于 2010 年初推出的一款性价比更高,效果更自然的一款中高端语音合成芯片。 SYN6288 通过异步串口接收待合成的文本,实现文本到声音( TTS )的转换。
所属分类:
C
发布日期:2012-07-18
文件大小:18432
提供者:
ailutu
dialogic从入门到系统工程师
有很多只有333页 我这个是完整版本 总共666页 序言 14 写作本书的原因 14 目标读者 15 作者编写的其他书籍 15 第一章 CTI通信基础知识 16 1.1 概述 16 1.2 电信技术概念和术语 16 1.2.1 模拟信号和数字信号 16 1.1.2 模拟线路和数字线路 18 1.1.3信令的基本概念 19 1.1.4 信令的分类 20 1.1.4 脉冲拨号和DTMF拨号 21 1.2 计算机语音技术相关标准 21 第二章 常用名词解释 23 2.1 CTI 23 2.2 呼叫处
所属分类:
硬件开发
发布日期:2012-12-22
文件大小:4194304
提供者:
swbzpf
Python-Tacotron的TensorFlow实现一个完全端到端的文本到语音合成模型
Tacotron的TensorFlow实现:一个完全端到端的文本到语音合成模型
所属分类:
其它
发布日期:2019-08-11
文件大小:1048576
提供者:
weixin_39841365
Python-根据语音端到端合成人脸动画
根据语音端到端合成人脸动画
所属分类:
其它
发布日期:2019-08-11
文件大小:1048576
提供者:
weixin_39840924
基于transformer的端到端中文语音合成
基于transformer的端到端中文语音合成,张宇强,刘刚,语音合成是人机交互关键部分,有很高的研究价值和应用价值。传统的语音合成系统需要多个组件如:文本前端、声学模型、声码器后端
所属分类:
其它
发布日期:2020-03-09
文件大小:578560
提供者:
weixin_38624183
微信小程序语音同步智能识别的实现案例代码解析
一、背景 在小程序的一些应用场景中,会有语音转文字的需求。原有的做法一般是先通过小程序的录音功能录下语音文件,然后再通过调用语音智能识别WebApi(比如百度云AI平台,科大讯飞平台)将语音文件转成文字信息,以上的做法比较繁琐且用户的体验性较差。 为解决此问题,微信直接开放了同声传译的插件,小程序作者可以直接使用该插件进行语音同声传译的开发。此文章将通过前后端整合应用的完整案例完成语音的实时转换,并将语音上传到服务端后台备份。 二、同声传译插件介绍 微信同声传译由微信智聆语音团队、微信翻译团队与
所属分类:
其它
发布日期:2020-11-20
文件大小:285696
提供者:
weixin_38645373
Tesi_suono-源码
GST Tacotron(使用全局样式令牌的富有表现力的端到端语音合成) 的张量流实现以及。 音频样本 使用默认超级参数使用此存储库训练的模型中的。 使用带有和不带有全局样式标记(GST)的集进行了训练。 我发现合成音频可以学习参考音频的韵律。 音频质量不如纸质。 也许更多的数据,更多的训练步骤以及Wavenet声码器将改善质量,并改善注意力机制。 快速开始: 安装依赖 安装Python 3。 为您的平台安装最新版本的 。 为了获得更好的性能,请安装GPU支持(如果有)。 该代码可与Te
所属分类:
其它
发布日期:2021-03-17
文件大小:36864
提供者:
weixin_42116713
Adversarially-Trained-End-to-end-Korean-Singing-Voice-Synthesis-System:经过对抗训练的端到端韩国SInging语音合成系统-源码
对抗训练的端到端韩语语音合成系统 李聚贤,崔亨锡,全昌彬,古政yun,李京九 首尔国立大学音乐与音频研究小组 INTERSPEECH 2019(最佳学生论文奖,口头报告) 抽象的 在本文中,我们提出了一种使用以下三种新颖方法从歌词和符号旋律开始的端到端韩国唱歌语音合成系统:1)语音增强掩蔽,2)文本和音高的局部调节到超分辨率网络,以及3)有条件的对抗训练。 拟议的系统由两个主要模块组成; mel合成网络根据给定的输入信息生成mel频谱图,超分辨率网络将生成的mel频谱图上采样为线性频谱图。 在m
所属分类:
其它
发布日期:2021-03-09
文件大小:14680064
提供者:
weixin_42138703
awesome_speech_papers:awesome_speech_papers-源码
关于此存储库 该资料库适合那些想学习语音任务的人员,例如语音识别,Speecn综合,口语理解等。 我没有尝试调查尽可能多的论文,而是按照我的标准对最关键的论文(尤其是最近发表的论文)进行了调查。 对于韩国人) 관련는는任务(음성,음성등)싶은들을들을들을들을들을다。 c이퍼를이포함하기보다합니(citation이충분히,신뢰할기관에서다수행했등등)이페이퍼들을다。 (주관적일) 指数 1,端到端语音识别 基于CTC的ASR模型 具有基于注意力的ASR模型的Seq2Seq CTC和注意力混合A
所属分类:
其它
发布日期:2021-02-22
文件大小:5242880
提供者:
weixin_42098830
marytts:MARY TTS-用纯Java编写的开源多语言文本到语音合成系统-源码
玛丽TTS 这是多语言开源MARY文本语音转换平台(MaryTTS)的源代码存储库。 MaryTTS是用纯Java编写的客户端-服务器系统,因此它可以在许多平台上运行。 有关准备使用的可下载软件包,请参见。 较早的文档也可以在发现 , 和 。 该自述文件是MaryTTS源代码存储库的一部分。 它包含有关编译和开发MaryTTS源代码的信息。 该代码位于次级通用公共许可证LGPL版本3下-有关详细信息,请参阅LICENSE.md。 运行MaryTTS 运行./gradlew run (
所属分类:
其它
发布日期:2021-02-19
文件大小:7340032
提供者:
weixin_42120541
idlak:Idlak语音合成工具包的官方主页-源码
Idlak语音合成工具包 这是Idlak的官方自述文件。 这是[ASR工具包Kaldi]( )的分支,并添加了各种工具和示例以使其适用于“文本到语音”。 Idlak是一个在Kaldi内构建端到端参数化TTS系统的项目,该系统将以相同的Apache 2许可证进行分发。 它包含一个健壮的前端,语音构建工具,语音分析实用程序和适用于参数合成的DNN工具。 它还在idlak-egs / tts_tangle_arctic / s2中包含一个使用Idlak作为端到端TTS系统的示例。 请注意,kal
所属分类:
其它
发布日期:2021-02-05
文件大小:57671680
提供者:
weixin_42114580
鹦鹉:基于RNN的语音生成模型-源码
使用递归神经网络进行语音合成。 此仓库包含我们提交ICLR的代码: Jose Sotelo,Soroush Mehri,Kundan Kumar,JoãoFelipe Santos,Kyle Kastner,Aaron Courville,Yoshua Bengio。 Char2Wav:端到端语音合成。 该网站在。 注意:该代码当前正在重构/清理/记录。 我们希望尽快使它可用,但我们知道当前版本尚未准备好进行复制。 因此,如果您对此感兴趣,请稍后再回来。 另外,您可以给我发送电子邮件,准
所属分类:
其它
发布日期:2021-02-04
文件大小:52224
提供者:
weixin_42116585
雅典娜:基于序列到序列的语音处理引擎的开源实现-源码
雅典娜 Athena是端到端语音处理引擎的开源实现。 我们的愿景是增强语音处理的端到端模型的工业应用和学术研究。 为了使所有人都能使用语音处理,我们还将在一些开源数据集上发布示例实现和配方,以完成各种任务(自动语音识别,语音合成,语音转换,说话者识别等)。 我们所有的模型都在Tensorflow> = 2.0.1中实现。 为了易于使用,我们提供了带有的无Kaldi 特征提取器。 1)目录 2)主要特点 基于混合注意力/ CTC的端到端ASR 语音转换器 无人监督的预训练 使用Horov
所属分类:
其它
发布日期:2021-02-04
文件大小:892928
提供者:
weixin_42131013
iOS开发微信收款到账语音提醒功能思路详解
一、背景 为了解决小商户老板们在频繁交易中不方便核对、确认到账的痛点,产品MM提出了新版本需要支持收款到账语音提醒功能。这篇文章总结了开发过程中遇到的坑和一些小技巧。 二、技术方案 后台唤醒App 收款到账语音提醒需要收款方在收到款后,播放一段TTS合成语音播报金额,微信在前台时可以通过模板消息将需要播报的金额带下来,再请求TTS数据并播放,但是app在挂起或者被kill掉的情况下要如何请求语音数据并播放呢? iOS提供了两种方式唤醒处于挂起或已经被kill掉的app。分别是Silent Not
所属分类:
其它
发布日期:2021-01-20
文件大小:222208
提供者:
weixin_38534683
«
1
2
»