您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 基于HMMSVM两级结构的汉语易混淆语音识别

  2. 基于HMM的汉语语音识别中,易混淆语音的识别率仍然不高.在分析HMM固有缺陷的基础上,本出一种使用SVM在HMM系统上进行二次识别来提高易混淆语音识别率的方法.通过引入置信度估计环节系统性能和效率.通过充分利用Viterbi解码获得的信息来构造新的分类特征,从而解决标准SVM难以处长数据的问题.详细探讨这种两级识别结构中置信度估计、分类特征提取和SVM识别器构造等问题.语音的结果显示,与采用HMM/SVM混合结构的模型相比,本文方法在对识别速度影响很小的情况下可以使有明显提高.这表明所提出的具
  3. 所属分类:专业指导

    • 发布日期:2009-12-23
    • 文件大小:594944
    • 提供者:viviantena
  1. 基于DTW和LVQ网络混合模型的语音识别方法

  2. 提出一种基于动态时间规整 DTW 和学习矢量量化 LVQ 神经网络的语音识别方法,该方法用动态时间规整算法先对语音信号进行时间规整 然后通过学习矢量量化神经网络进行语音的分类识别 首先介绍利用动态时间规整和学习矢量量化进行语音识别的基本方法 然后给出DTW/LVQ混合模型的系统结构和学习算法 最后给出三种语音识别算法的实验结果 大量实验表明 混合模型的识别率 皆明显高于单一的动态时间规整和学习矢量量化的识别率
  3. 所属分类:网络基础

    • 发布日期:2009-12-23
    • 文件大小:253952
    • 提供者:viviantena
  1. VoIP:IP语音技术

  2. 目 录 前言 第1章 绪论 1 1.1 因特网电话和分组语音 1 1.2 为何热衷于因特网电话 1 1.2.1 商业考虑 1 1.2.2 IP的普遍存在 3 1.2.3 技术的成熟 4 1.2.4 向数据网转移 4 1.3 为什么用IP传送电话业务 5 1.4 成功使用IP电话技术的障碍 5 1.5 在因特网和专用互连网中的VoIP 5 1.6 问题不在于是否,而是如何 6 1.7 VoIP的配置选择 6 1.8 专用VoIP网 8 1.9 下一步 9 1.10 基于IP的呼叫中心和电子商务
  3. 所属分类:其它

    • 发布日期:2011-04-06
    • 文件大小:12582912
    • 提供者:yiluzhuixun206
  1. 基于HMM和ANN的语音识别方法

  2. 本文对现有的语音识别技术发展现状进行了分析,首先介绍了语 音识别的基本理论,包括语音信号的预处理、端点检测和特征提取。 在此基础上,介绍了三个有效语音识别特征参数—线性预测编码系数 LPC、线性预测倒谱系数LPCC和美尔频率倒谱系数MFCC的具体提 取方法,其次分别讨论了隐马尔可夫模型HMM和人工网络模型ANN 在语音识别中的具体应用,介绍了它们各自的模型训练与识别算法, 最后针对HMM具有很强的对时间归整能力和ANN具有很强的分类 能力,利用它们各自的优点把HMM和ANN结合起来,实验证明,
  3. 所属分类:其它

    • 发布日期:2011-04-18
    • 文件大小:1048576
    • 提供者:virtualwolf
  1. 语音识别技术文章.rar

  2. 第一部分 基本理论 第2章 听觉机理和汉语语音基础 2. 1 概述 2.2 听觉机理和心理 2.2.1 语音听觉器官的生理结构 2.2.2 语音听觉的心理 2.3 发音的生理机构与过程 2.4 汉语语音基本特性 2.4. 1 元音和辅音 2.4.2 声母和韵母 2.4.3 音调(字调) 2.4.4 音节(字)构成 2.4.5 汉语的波形特征 2.4.6 音的频谱特性 2.4.7 辅音的频谱特性 2.4.8 汉语语音的韵律特征 2.5 小结 参考文献 第3章 语音信号处理方法--时域处理 3.1
  3. 所属分类:其它

    • 发布日期:2011-05-12
    • 文件大小:5242880
    • 提供者:wangjunhui1984
  1. 语音情感识别系统matlab仿真

  2. 过特定人语音情感数据库的建立;语音情感特征提取;语音情感分类器的设计,完成了一个特定人语音情感识别的初步系统。对于单个特定人,可以识别平静、悲伤、愤怒、惊讶、高兴5种情感,除愤怒和高兴之间混淆程度相对较大之外,各类之间区分特性良好,平均分类正确率为93.7%。对于三个特定人组成的特定人群,可以识别平静、愤怒、悲伤3种情感,各类之间区分特性良好,平均分类正确率为94.4%。其中分类器采用混合高斯分布模型。
  3. 所属分类:其它

    • 发布日期:2011-06-03
    • 文件大小:247808
    • 提供者:jichen1119
  1. 语音识别确认中的置信特征和判定算法

  2. 提出了一种基于支持向量机的联合多种置信特征进行语音识别确认的判定方法.从待确认语音中提 取出分段的后验概率和线性预测编码识别结果置信特征,其中后验概率根据垃圾模型近似计算得到;设计支持 向量机分类器联合多种置信特征给出最终确认结果.实验结果表明,所提出的置信特征和支持向量机分类器取 得了很好的确认效果.
  3. 所属分类:管理软件

    • 发布日期:2011-07-16
    • 文件大小:329728
    • 提供者:x764150486
  1. caffe深度学习薛开宇笔记实例-基于卷积神经网络的声音识别

  2. 目前的音乐检索系统用流派、风格、情感等类别标签检索音乐。其中,如果人工标注 音乐这些类别标签,则存在主动性强、费时费力、速度慢的问题,而如果采用传统的自动 标注方式,则存在准确率低的问题。后者准确率低的原因是,其标注时使用的模型不能 很好识别音乐。随着 Hinton 提出深度学习模型后,因其在图像和语音识别领域均取得很 好的成果,在识别领域成为了研究热点。因此,本文旨在研究如何使用深度学习中的卷 积神经网络(Convolutional Neural Networks,CNN)模型,设计出一个准
  3. 所属分类:其它

    • 发布日期:2016-12-27
    • 文件大小:5242880
    • 提供者:u014365862
  1. 语音合成与识别

  2. 马尔可夫模型。一个马尔科夫分类算法,其中使用了马尔科夫估计方法,分类的精度高。
  3. 所属分类:机器学习

    • 发布日期:2017-10-01
    • 文件大小:9216
    • 提供者:tobgreater
  1. 基于深度学习神经网络的孤立词语音识别的研究.pdf

  2. 为了提高语音识别系统性能, 研究提出将自编码器深度学习神经网络应用于语音识别中。 该网络结构引入贪婪逐层预训练学习算法, 通过预训练和微调两个步骤, 提取出待识别语音信号的本质特征, 克服传统多层人工神经网络模型在训练时存在易陷入局部极小值且需要大量标签数据的问题。然后经过规整网络, 将任意长度帧的语音特征参 数规整到某一特定帧, 输入到分类器中进行语音识别。 对反向传播神经网络和自编码神经网络分别进行了仿真实验,结果表明深度学习神经网络识别准确度较传统神经网络提升了 26.1%, 是一种优良的
  3. 所属分类:深度学习

    • 发布日期:2020-04-25
    • 文件大小:428032
    • 提供者:weixin_39164435
  1. 基于PAD模型的级联分类情感语音识别

  2. 针对声学特征(韵律特征和MFCC特征)对情感语音的分类识别性能不理想的问题,提出了一种将声学特征与情感语音PAD数据相结合的级联分类方法用于情感语音识别。首先提取情感语音的声学特征,对特征分别单独识别与组合识别,对比建立最优特征集合。然后将声学特征组合与情感语音PAD数据相结合,分两步逐级地判断出输入语音所属的情感类型。该方法在TYUT2.0情感语音数据库上得到了较好的结果,情感分类识别率相较于传统声学特征的分类识别率提高了15.4%.
  3. 所属分类:其它

    • 发布日期:2020-04-20
    • 文件大小:238592
    • 提供者:weixin_38680340
  1. 基于纠错输出编码的支持向量机在语音识别中的应用

  2. 利用纠错输出编码的矩阵编码构造出若干个无关的子支持向量机,用来改善分类模型的整体容错性能。使用了一对余、一对一、稠密型随机编码、稀疏型随机编码4种常用的纠错输出编码方法,用于训练集和测试集。实验结果显示,对于韩语非特定人小词汇量孤立词的语音识别,基于纠错输出编码的支持向量机比隐马尔科夫方法具有更高的识别率。其中,一对一编码是效果最好的。
  3. 所属分类:其它

    • 发布日期:2020-06-20
    • 文件大小:584704
    • 提供者:weixin_38551187
  1. 语音情感分析调查论文

  2. 改论文总结了语音情感分析相关的研究,包括情感模型,语音情感数据集,数据预处理,数据特征提取,情感分类模型等等
  3. 所属分类:机器学习

    • 发布日期:2020-12-08
    • 文件大小:1048576
    • 提供者:weixin_42396467
  1. 语音处理相关论文(共81篇)

  2. MATLAB环境下基于矢量量化的说话人识别系统.pdf MATLAB环境下的基于GMM模型的说话人识别系统.pdf MATLAB环境下的语音识别系统.pdf 一种基于GMM的说话人识别系统的实现.pdf 一种基于MFCC和LPCC的文本相关说话人识别方法.pdf 一种基于优化小波神经网络的语音识别.pdf 一种基于小波变换和隐Markov模型的声调识别方法.pdf 一种快速说话人搜索算法.pdf 一种改进的基于小波去噪HMM非特定人语音识别算法.pdf 一种改进的说话人识别系统
  3. 所属分类:其它

    • 发布日期:2009-08-08
    • 文件大小:17825792
    • 提供者:csstu
  1. Action-Points-retrieval-from-meeting-transcript:使用基于转换器的XLNet预训练模型和AMI会议语料库对会议记录中的对话语音进行分类-源码

  2. 从会议记录中检索动作点 使用基于变压器的XLNet预训练模型和AMI会议语料库对会议记录中的对话语音进行分类,从而对动作点进行检索 用例:将从会议笔录和提取的点中提取动作点的内容汇总并发送给所有参与者。 实现:用于训练和测试模型的数据来自AMI会议语料库,并相应地准备了xml中的数据用于训练多标签文本分类模型。 对于多标签文本分类,我们使用了Pytorch,使用了来自Huggingface的基于XLNet转换器的模型。 XLNet是Transformer-XL模型的扩展,该模型使用自回归方
  3. 所属分类:其它

    • 发布日期:2021-03-08
    • 文件大小:23068672
    • 提供者:weixin_42164685
  1. tflite-speech-recognition:用于训练卷积神经网络以对单词进行分类并将模型使用TensorFlow Lite部署到Raspberry Pi的演示-源码

  2. TensorFlow Lite语音识别演示 该项目演示了如何使用TensorFlow和Keras训练卷积神经网络(CNN)来识别唤醒词“停止”等。 此外,它还包含另一个Python示例,该示例使用TensorFlow Lite在经过训练的模型上进行推理,以识别Raspberry Pi上的口头单词“停止”。 可以在以下位置找到说明这些程序如何工作以及如何使用它们的完整文章: 以下是随附的视频,解释了如何使用TensorFlow训练和部署语音识别模型: 先决条件 您将需要在台式机或笔记本电脑上安装
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:371712
    • 提供者:weixin_42131352
  1. libfaceid:libfaceid是用于人脸识别解决方案原型的研究框架。 它通过语音合成和语音识别功能无缝集成了多种检测,识别和动态模型-源码

  2. libfaceid,适合所有人的人脸识别库 人脸识别变得容易。 libfaceid是用于面部识别的Python库,它无缝集成了多个面部检测和面部识别模型。 从零到英雄。 学习面部识别的基础知识,并尝试不同的模型。 libfaceid通过提供全面的模型列表供初学者学习各种模型,并简化面部识别解决方案的原型。 从基本模型(Haar Cascades + LBPH)到更高级的模型(MTCNN + FaceNet),支持多种检测和编码/嵌入模型,包括分类模型。 这些模型无缝集成,因此用户可以混合和匹配
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:467664896
    • 提供者:weixin_42178688
  1. 深度学习-语音识别实战(Python).rar

  2. 深度学习-语音识别实战(Python)视频教程分享; 章节1 seq2seq序列网络模型 章节2 LAS语音识别模型实战 章节3 starganvc2变声器论文原理解读 章节4 starganvc2变声器源码实战 章节5 语音分离ConvTasnet模型 章节6 ConvTasnet语音分离实战 章节7 语音合成技术概述 章节8 语音合成tacotron最新版实战 章节9 基础补充-PyTorch框架基本处理操作 章节10 PyTorch使用补充-神经网络实战分类与回归任务 章节11 算法补充-
  3. 所属分类:深度学习

    • 发布日期:2021-02-05
    • 文件大小:923
    • 提供者:u011552756
  1. 声纳:使用scikit-learn RandomForest模型进行机器学习语音分类-源码

  2. 声纳计划 这项研究由Wentworth理工学院的三名计算机科学本科生团队组成的团队于2020年7月进行,以探索机器学习在现实世界语音数据分类中的可能应用。 该工作的重点是尝试使用各种功能工程和数据分析方法,以及此应用程序中各种机器学习模型的性能。 该团队专注于应用scikit-learn Python库中可用的工具,以将常见的机器学习算法应用于该问题。 所采用的方法能够证明特征工程和数据处理以及各种机器学习模型的有效性。 结果表明,使用简单的机器学习模型,可以对音频扬声器进行分类。 经过数据调
  3. 所属分类:其它

    • 发布日期:2021-02-04
    • 文件大小:9216
    • 提供者:weixin_42098251
  1. img_ai_app_boilerplate:图像分类应用程序样板,可尽快为您的深度学习模型提供服务!-源码

  2. 图片 :framed_picture: 分类App样板 您是否对Internet上的大量视频,博客和其他资源感到困惑,不知道在哪里以及如何部署AI模型? 如果您有一个模板,可以在其中插入经过训练的模型文件,编辑一些促销文字,然后瞧瞧,那就好了,那就完成了。 好吧,别无所求,因为此存储库使您听起来像它一样容易! 如何使用这个项目? :thinking_face: :thinking_face: : 注意:目前,我们仅专注于使用tensorflow / pytorch构建的图像分类模型。
  3. 所属分类:其它

    • 发布日期:2021-01-29
    • 文件大小:1048576
    • 提供者:weixin_42160645
« 12 3 4 5 6 7 8 »