您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 基于VoiceXML的语音浏览器的研究与实现.pdf

  2. 随着Internet技术在全球的蓬勃发展和网络用户的增加,如何让用户方便快捷地在互连网上遨游,享受Internet所带来的成果已经成为各大公司的发展目标,语音浏览器提供了用户使用电话访问Internet信息的手段,用户通过语音命令和电话按键,用“听”的方式来获取网上的信息内容。语音浏览器不但可以让那些由于环境或生理限制无法使用传统浏览器的用户得以访问Internet, 同时也为所有的用户提供了更为便捷 的Web 访问功能。而VoiceXML是XML语言在交互式语音浏览中的应用,W3C已经把其作
  3. 所属分类:Java

    • 发布日期:2007-08-14
    • 文件大小:165888
    • 提供者:uengine
  1. 语音识别 sphinx4 JAVA 教程

  2. Sphinx-4资料(java版).pdf 英文 网络上收集的资料全中文比较详细,我也简单研究了想下,在JAVA环境中可以正常工作我运行了几个例子效果不错,关键在于建立中文模型比较麻烦。
  3. 所属分类:Java

    • 发布日期:2009-05-14
    • 文件大小:608256
    • 提供者:xiaxiayoyo520
  1. 语音识别技术 及应用

  2. 语音识别技术近年来得到了飞速的发展并且在越来越多的领域得到了广泛的应用。隐马尔可夫模型 (HMM)语音识别技术是一种基于训练数据提供的概率自动构造识别系统的技术,主要用于大量词汇的语音识别,而 且具有良好的识别性能和抗噪性能。因此,一般的语音识别系统都采用基于HMM的识别方法作为其基本算法。本文 列举了语音识别在教学中的应用示例来分析其基本算法。
  3. 所属分类:其它

    • 发布日期:2011-04-12
    • 文件大小:89088
    • 提供者:peiweifeng
  1. 语音合成实验报告

  2. 从物理原理来看,语音信号是由肺挤压出的空气激励发声器官振动产生的。说话时声带相互靠拢但不完全封闭,这样声门变成一条窄缝,当气流通过时其间压力减小,从而声带完全合拢使气流不能通过;在气流被阻断时压力恢复正常,因而声带间形成空隙,气流再次通过。这一过程周而复始,就形成了一串周期性的脉冲气流送入声道。如图1所示。这个脉冲串的周期称为“基音周期”,其倒数是“基音频率”。男性说话时的基音频率在60-200Hz范围内,女性和小孩在200-450Hz之间。以上这种方式发出的音就是浊音。 图1 典型的声门脉冲
  3. 所属分类:专业指导

    • 发布日期:2011-12-14
    • 文件大小:1048576
    • 提供者:chenk09
  1. 声学语音模型

  2. 声学语音模型,简单介绍了声学语音模型!马尔科夫链
  3. 所属分类:C

    • 发布日期:2012-10-10
    • 文件大小:2097152
    • 提供者:anmdy2011
  1. 语音降噪实时处理算法研究

  2. 随着科学技术的进步,人类生产生活的场所不断扩大,噪声对人类的影响 也越来越严重。因此为了提高噪声环境下语音的质量,噪声消除问题变得日益 重要。近年来,由于DSP技术的快速发展,降噪技术的发展重点已经逐渐由硬 件上的改进过渡到了算法上的提高。自适应技术是降噪技术的一个重要方法, 其突出的优点在于不基于任何语音模型,语音特征损失小,消噪效果明显,所 以被广泛应用。自适应滤波算法是自适应信号处理中最活跃的研究方向之一。 寻求收敛速度快、稳态误差小、改善因子高的自适应滤波算法一直是研究人员 不断努力追
  3. 所属分类:嵌入式

    • 发布日期:2013-03-17
    • 文件大小:2097152
    • 提供者:spoonyboy1205
  1. 实用语音识别

  2. 关于语音识别基础,介绍了HMM语音模型的基本知识。
  3. 所属分类:硬件开发

  1. 语音数学模型

  2. 语音模型。搞语音的同学看一下吧,应该对你有帮助的
  3. 所属分类:互联网

    • 发布日期:2013-05-24
    • 文件大小:2097152
    • 提供者:chengiant2011
  1. 基于AR-HMM 在线能量调整的语音增强方法

  2. 针对单通道语音增强技术对非平稳噪声的跟踪不准确、噪声抑制效果较差的问题,本文提出一种基于在线能量调整的语音增强方法 .该方法以归一化临界带能量为特征,采用高斯混合模型对背景噪声进行分类,利用对应类型噪声的自回归隐马尔可夫模型和纯净语音的 ,在最小均方误差准则下估计语音和噪声的功率谱 .考虑到非平稳环境中训练集和测试集的差异性,需在线调整语音模型和噪声模型中的能量,语音模型的能量调整采用迭代的期望最大化算法
  3. 所属分类:机器学习

    • 发布日期:2018-03-12
    • 文件大小:1048576
    • 提供者:qq_41828110
  1. Python-DCTTS的TensorFlow实现另一个文本转语音模型

  2. DC-TTS的TensorFlow实现:另一个文本转语音模型
  3. 所属分类:其它

    • 发布日期:2019-08-11
    • 文件大小:3145728
    • 提供者:weixin_39841882
  1. CMU Sphinx的语音模型

  2. 内有mdef的文件包,官网很难下载,特此附上较方便的下载,一般作为语音发音模型,不作为字典
  3. 所属分类:直播技术

    • 发布日期:2019-03-15
    • 文件大小:44040192
    • 提供者:davidietop
  1. 语音识别数据集合,详细介绍了搭建网络的一步步的操作。 LanguageModel2.py为基于统计的语言模型,dic

  2. CNN+CTC_tutorial.ipynb为语音模型的教程,详细介绍了搭建网络的一步步的操作。 LanguageModel2.py为基于统计的语言模型,dict.txt为统计的字典。 test.ipnb用于测试模型性能。 数据集使用的是清华的数据集,下载后放在项目同级目录即可运行
  3. 所属分类:深度学习

    • 发布日期:2020-07-15
    • 文件大小:834666496
    • 提供者:weixin_32759777
  1. CNN+CTC_tutorial.ipynb为语音模型的教程,详细介绍了搭建网络的一步步的操作。 LanguageModel2.py为基于统计的语言模型,dic

  2. CNN+CTC_tutorial.ipynb为语音模型的教程,详细介绍了搭建网络的一步步的操作。 LanguageModel2.py为基于统计的语言模型,dict.txt为统计的字典。
  3. 所属分类:深度学习

    • 发布日期:2020-07-15
    • 文件大小:9437184
    • 提供者:weixin_32759777
  1. pocketsphinx、speechrecognition中文语音包.rar

  2. 这是我自己下载到的pocketsphinx的中文语音包/语音模型/声学模型,分享给一起学习语音识别的同学们。里面有这个语音包的使用方法
  3. 所属分类:其它

    • 发布日期:2020-09-01
    • 文件大小:52428800
    • 提供者:woshilaoli_CSDN
  1. 嵌入式系统/ARM技术中的基于分带谱熵的语音激活检测算法的设计与实现

  2. 采用一定的信号处理技术来检测信号中是否包含语音信号,并从背景噪声中找出每一段语音的开始和终止,以明确找出语音信号存在的范围,这就是语音激活检测VAD(Voice Activity Detection)。该技术目前被广泛应用在语音编码、语音增强、语音合成、回声抵消以及语音通信等领域。   语音激活检测的研究历史很长,从最早的基于短时能量、过零率的判断,到基于语音模型和统计知识的各种复杂算法,语音激活检测算法的原理和实现方法都在不断地更新。近年来,一些学者提出了基于支持向量机[1]、小波理论[2]、
  3. 所属分类:其它

    • 发布日期:2020-10-23
    • 文件大小:227328
    • 提供者:weixin_38657376
  1. RobinASR:ROBIN项目中的罗马尼亚语自动语音识别-源码

  2. 罗宾·阿斯 该存储库包含基于架构的罗马尼亚语言的罗宾自动语音识别(RobinASR),以及用于转录的语言模型。 预训练的文本-语音模型可被下载和预训练KenLM能下载。 另外,请确保访问: RELATE平台中可用的ASR系统演示: ://relate.racai.ro/index.php path robin/asr 允许断字和基本大小写还原的后处理Web服务: : 安装 您必须在系统中安装Python 3.6+和PyTorch 1.5.1+。 还。 如果要使用(推荐)GPU版
  3. 所属分类:其它

    • 发布日期:2021-03-16
    • 文件大小:60416
    • 提供者:weixin_42107561
  1. DFCNN-master:这是一个基于全卷积神经网络的语音识别系统-源码

  2. 基于全卷积神经网络的中文语音识别系统 基于全卷积神经网络的中文语音识别系统 简介简介 通过git克隆仓库以后,需要将数据列表目录下的文件全部复制到数据集目录下,也就是将其跟数据集放在一起。 $ cp -rf datalist/ * dataset/ 目前可用的模型有24、25和251 本项目开始训练请执行: $ python3 train_mspeech.py 本项目开始测试请执行: $ python3 test_mspeech.py iters_num (这里的iters_num为迭代的
  3. 所属分类:其它

    • 发布日期:2021-03-11
    • 文件大小:37748736
    • 提供者:weixin_42118161
  1. 实时语音克隆:在5秒内克隆语音以实时生成任意语音-源码

  2. 实时语音克隆 该存储库是使用实时工作的声码器实现的(SV2TTS)的实现。 如果您好奇或正在寻找我未记录的信息,请随时检查。 通常,我建议您快速浏览一下引言之外的数字。 SV2TTS是一个三阶段的深度学习框架,它允许从几秒钟的音频中创建语音的数字表示,并使用它来调节经过训练的文本到语音模型,以推广到新的语音。 视频演示(单击图片): 已实施文件 网址 指定 标题 实施源 SV2TTS 将学习从演讲者验证转移到多演讲者语音合成 这个回购 WaveRNN(声码器) 高效的神经音频合成
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:977920
    • 提供者:weixin_42137028
  1. tacotron:具有预训练模型的Google Tacotron语音合成的TensorFlow实现(非官方)-源码

  2. 塔科创 Tastron语音合成在TensorFlow中的实现。 音频样本 使用此存储库训练的模型中的。 第一组在上接受了441K步的训练大约2万步后,语音开始变得清晰。 第二组由在上进行了140K步训练。 最近更新 npuichigo了一个错误,该错误未在prenet中应用辍学。 begeekmyfriend创建了一个,以添加对位置敏感的注意以及论文中的stop令牌。 这可以大大减少训练模型所需的数据量。 背景 2017年4月,谷歌发表了论文《 ,他们提出了一种神经文本到语音模型,该模型
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:34816
    • 提供者:weixin_42131352
  1. Delta:DELTA是基于深度学习的自然语言和语音处理平台-源码

  2. DELTA-深度学习语言技术平台 什么是DELTA? DELTA是基于深度学习的端到端自然语言和语音处理平台。 DELTA旨在为学术界和行业用例提供使用,部署和开发自然语言处理和语音模型的便捷体验。 DELTA主要使用TensorFlow和Python 3实现。 有关DELTA的详细信息,请参阅。 DELTA可以做什么? DELTA已被用于开发几种最新的出版物算法,并为数百万用户提供真实的作品。 它可以帮助您训练,开发和部署NLP和/或语音模型,具有: 易于使用 一种训练NLP和语音模型
  3. 所属分类:其它

    • 发布日期:2021-02-03
    • 文件大小:26214400
    • 提供者:weixin_42116713
« 12 3 4 5 6 7 8 9 10 ... 50 »