您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 基于Mellin变换和Mel频率分析的非特定人语音识别特征研究

  2. 提出了一种结合Mellin变换和Mel频率分析的语音信号特征——MMCC特征.该特征利用Mellin变换的尺度不变性质,抑制了特征参数受不同说话人声道变化的影响,同时结合Mel频率的人耳听觉特性,改善了特征的鲁棒性,适合于非特定人识别系统的应用.仿真结果表明,采用MMCC特征的非特定人语音识别系统,其识别效果优于采用LPCC特征、MFCC特征和MMTLS特征的非特定人语音识别系统.
  3. 所属分类:C++

    • 发布日期:2009-12-23
    • 文件大小:387072
    • 提供者:viviantena
  1. 基于倒谱的语音特性提取算法设计及其实现

  2. 在语音信号处理中,常用的语音特性是基于Mel频率的倒谱系数(MFCC)以及一些语音信号的固有特征,如共振峰和基音频率等。倒谱可以较好地将语音信号中的激励信号和声道响应分离,并只需要用十几个倒谱系数就能较好地描述语言信号的声道响应,在语音信号处理中占有很重要的位置。本论文设计了基于倒谱的语音特性参数提取算法,并在Matlab中予以实现。
  3. 所属分类:其它

    • 发布日期:2010-04-15
    • 文件大小:832512
    • 提供者:jy00272082
  1. 语音数字特真参数mfcc提取程序

  2. Mel频率倒谱参数的计算过程如下: (1)根据公式(1)将实际频率尺度转换为Mel频率尺度。在Mel频率轴上配置L个通道的三角形滤波 器组,L的个数由信号的截止频率决定。 (2)对每帧语音信号进行预加重处理后,求取语音信号的短时自相关函数rx(τ)然后对其进行傅立叶变 换得到短时功率谱
  3. 所属分类:C++

    • 发布日期:2010-05-01
    • 文件大小:7168
    • 提供者:ajie0922
  1. 作为说话人识别特征参量的MFCC的提取过程

  2. 作为说话人识别特征参量的MFCC的提取过程,Mel频率倒谱系数(MFCC)是语音信号的 频域参数,它是一种基于人耳对语音频率的非线形感 知特征的描述
  3. 所属分类:嵌入式

    • 发布日期:2012-03-01
    • 文件大小:186368
    • 提供者:dcdos139
  1. 支持向量机对语音的识别

  2. 自动语音情感识别器(SER)是目前具有广泛的应用人机交互(HCI)领域的研究课题。语音特征,如Mel频率倒谱系数(MFCC )和梅尔能谱动态系数(本中心) ,都是从言语交流中提取的。支持向量机(SVM)作为分类器对柏林情绪数据库中的不同情绪状态进行分类,如愤怒,快乐,悲伤,中性,恐惧。 LIBSVM是用于情绪的分类。性别无关的情况下给出了93.75%的分辨率,男性语音94.73% 和女性语音的100 % 。
  3. 所属分类:其它

    • 发布日期:2012-05-09
    • 文件大小:137216
    • 提供者:liuna11322
  1. mfcc特征提取 语音识别特征提取

  2. MFCC:Mel频率倒谱系数的缩写。Mel频率是基于人耳听觉特性提出来的,它与Hz频率成非线性对应关系。Mel频率倒谱系数(MFCC)则是利用它们之间的这种关系,计算得到的Hz频谱特征,MFCC已经广泛地应用在语音识别领域。由于Mel频率与Hz频率之间非线性的对应关系,使得MFCC随着频率的提高,其计算精度随之下降。
  3. 所属分类:其它

    • 发布日期:2012-12-01
    • 文件大小:1024
    • 提供者:honeyrr
  1. 基于MFCC的GMM的语音识别

  2. 语音识别的Matlab代码,提取的特征为Mel频率倒谱系数,采用的方法为高斯混合模型
  3. 所属分类:其它

    • 发布日期:2013-03-10
    • 文件大小:1048576
    • 提供者:wgs1024
  1. Mel频率倒谱系数提取及其在声纹识别中的作用

  2. 从说话人的语音信号中提取出说话人的个性特征是声纹识别的关键。本文介绍了一种基于HMM的声纹识别系统,采用能够反映人对语音的感知特性的Mel频率倒谱系数(Me1.Frequency Cepstral Coeficients,MFCC)作为特征参数,取得了很好的结果。
  3. 所属分类:专业指导

    • 发布日期:2013-05-10
    • 文件大小:158720
    • 提供者:u010564810
  1. 基于MATLAB的语音识别算法研究

  2. 本论文介绍了双门限语音端点检测理论, 研究了语音特征参数地提取过程, 特征参数包括:线性预测系数(LPC)、线性预测倒谱系数(LPCC)和Mel频率倒 频系数(MFCC)。并研究了3种不同的语音识别算法:DTW算法、VQ算法和HMM算 法。 并且在MATLAB环境中提取了孤立字语音 (十个数字0~9的汉语发音) 的LPCC、 MFCC特征参数,用它们配合上述3种语音识别算法实现了对这些孤立字语音的识 别。
  3. 所属分类:电信

    • 发布日期:2014-09-06
    • 文件大小:2097152
    • 提供者:hdpsy21
  1. 基于谱质心直方图-SVM的滚动轴承故障诊断

  2. 轴承早期故障信号的信噪比较低,较难识别。为提高轴承早期故障诊断的准确,分析了现有方法和视觉信息处理方式的相似点,从视觉信息处理的角度进行研究,提出一种基于谱质心直方图的滚动轴承故障特征提取方法,将所提出方法用于滚动轴承不同运行状态下的故障特征提取,将所提取特征作为支持向量机的输入特征向量从而实现对滚动轴承不同运行状态的智能分类。实验证明,谱质心直方图提高了轴承早期故障诊断准确率,准确率平均提高了2 %,优于Mel频率倒谱系数特征。
  3. 所属分类:交通

    • 发布日期:2014-10-13
    • 文件大小:1048576
    • 提供者:lijianjunjie
  1. 语音特征提取和识别

  2. 本文意在讲解语音识别的方法,主要包括语音特征提取(Mel频率倒谱系数的提取),softmax分类器进行四分类,数据库为京剧。
  3. 所属分类:讲义

    • 发布日期:2015-04-12
    • 文件大小:4194304
    • 提供者:hlx371240
  1. 语音解锁MATLAB程序

  2. mfcc特征全称为Mel频率倒谱系数(Mel-Frequency Ceptral Coefficients,MFCC),它能够反映人对语音的感知特性。为什么能反映人对语音的基本感知呢?根据人耳听觉机理的研究发现,人耳对不同频率的声波有不同的听觉敏感度。从200Hz到5000Hz的语音信号对语音的清晰度影响对大。两个响度不等的声音作用于人耳时,则响度较高的频率成分的存在会影响到对响度较低的频率成分的感受,使其变得不易察觉,这种现象称为掩蔽效应。由于频率较低的声音在内耳蜗基底膜上行波传递的距离大于频
  3. 所属分类:其它

    • 发布日期:2018-09-08
    • 文件大小:104448
    • 提供者:qq_32015827
  1. MFCC(梅尔频率倒谱系数)计算代码

  2. MFCC特征提取过程: 1)先对语音进行预加重、分帧和加窗: 2)对每一个短时分析窗,通过FFT得到对应的频谱; 3)将上面的频谱通过Mel滤波器组得到Mel频谱; 4)在Mel频谱上面进行倒谱分析
  3. 所属分类:软件测试

    • 发布日期:2019-05-06
    • 文件大小:621568
    • 提供者:westbrooook
  1. MFCC(梅尔频率倒谱系数)全部计算代码

  2. MFCC特征提取过程: 1)先对语音进行预加重、分帧和加窗: 2)对每一个短时分析窗,通过FFT得到对应的频谱; 3)将上面的频谱通过Mel滤波器组得到Mel频谱; 4)在Mel频谱上面进行倒谱分析
  3. 所属分类:软件测试

    • 发布日期:2019-05-06
    • 文件大小:622592
    • 提供者:westbrooook
  1. 音乐识别系统Audio-Fingerprinting.zip

  2. Audio-Fingerprinting 是一个音乐指纹识别系统,使用的语言为 JAVA,同时需要用到 MySQL 数据库(虽然不是必须的,但这个系统采用他保存指纹和音乐信息)。他包含了指纹生成,数据库存储,和简易的服务器和客户端。他通过生成和记录音乐指纹,能够识别来自麦克风、文件等各个来源的音乐,并且有很高的抗噪性,同时他对文件属性和音乐质量不敏感。你可以使用服务器给手机或者其他程序提供音乐识别服务。你可以根据需求调节里面的参数,当前参数是为了在较短时间识别来自极大噪声和失真的音源,1500
  3. 所属分类:其它

    • 发布日期:2019-07-19
    • 文件大小:95420416
    • 提供者:weixin_39840650
  1. 高压水射流靶物反射声信号的特征提取方法

  2. 为了提高利用高压水射流靶物反射声信号识别靶物材质的效率,针对地雷探测过程常见的地雷、石块、砖块和木块4种靶物,采用不同的特征提取方法来识别靶物材质。在分析Mel频率倒谱系数及小波包变换倒谱系数基本原理的基础上,结合靶物反射声信号的特点,提出了一种基于Mel频率倒谱和小波包变换倒谱特征融合的特征提取方法:利用小波包变换将原始靶物反射声信号划分为若干子频段,选取其中一个子频段作为低频和高频的划分层;低频部分提取Mel频率倒谱系数作为特征值,高频部分则提取小波包变换倒谱系数作为特征值,将2组特征值线性
  3. 所属分类:其它

    • 发布日期:2020-05-14
    • 文件大小:649216
    • 提供者:weixin_38647039
  1. 基于Mel频率倒谱系数和遗传算法的煤矸界面识别研究

  2. 针对现有的煤矸界面识别技术采用的γ射线法不适用于顶板不含放射性元素或者放射性元素含量较低的工作面,而雷达探测法探测范围小、信号衰减严重的问题,提出了一种基于Mel频率倒谱系数和遗传算法的煤矸界面识别方法。该方法利用煤矸放落过程中产生的声波信号的特征差异进行煤矸识别,采用Mel频率倒谱系数将去噪后的煤矸声波信号变换到频域进行处理,提取出煤矸声波信号的32维特征参数;采用遗传算法优化处理32维特征参数,得到最优参数组合;采用支持向量机和BP神经网络对最优参数进行识别。实验结果表明,该方法能够准确识别
  3. 所属分类:其它

    • 发布日期:2020-05-02
    • 文件大小:621568
    • 提供者:weixin_38731761
  1. abstract_Gemmeke.pdf

  2. dcase2013题目,基于字典学习的音频异常事件的检测与分类 本文介绍了非负矩阵分解(NMF)这一新的数学研究成果,NMF 非负性的限制造成了相应描述在一定程度上的稀疏性,而稀疏性可以实现特征的自动选择,降低特征学习的难度,减少数据的存储空间,并且可以使得矩阵非线性的维数削减,同时尽可能保持信息不变。在音频识别方面,本文采用了基于隐马尔可夫模型(HMM)的识别方法,采用鲁棒性较好的 Mel 频率倒谱系数(MFCC)作为特征参数。我们通过维特比算法(Viterbi)对其进行解码,来找出最有可能产
  3. 所属分类:机器学习

    • 发布日期:2020-04-27
    • 文件大小:176128
    • 提供者:rainbow_dream
  1. 梅尔频率倒谱系数(mfcc)及Python实现

  2. 语音识别系统的第一步是进行特征提取,mfcc是描述短时功率谱包络的一种特征,在语音识别系统中被广泛应用。 一、mel滤波器 每一段语音信号被分为多帧,每帧信号都对应一个频谱(通过FFT变换实现),频谱表示频率与信号能量之间的关系。mel滤波器是指多个带通滤波器,在mel频率中带通滤波器的通带是等宽的,但在赫兹(Hertz)频谱内mel滤波器在低频处较密集切通带较窄,高频处较稀疏且通带较宽,旨在通过在较低频率处更具辨别性并且在较高频率处较少辨别性来模拟非线性人类耳朵对声音的感知。 赫兹频率和梅尔频
  3. 所属分类:其它

    • 发布日期:2020-12-26
    • 文件大小:94208
    • 提供者:weixin_38641561
  1. 基于语音的性别识别:使用梅尔频率倒谱系数(MFCC)和高斯混合模型(GMM)的基于语音的性别识别-源码

  2. 基于语音的性别识别 基于语音的性别识别,使用: 免费的ST美国英语语料库数据集(SLR45) 梅尔频率倒谱系数(MFCC) 高斯混合模型(GMM) 数据集 可以在上找到免费的ST美国英语语料库数据集(SLR45) 。 它是提供的免费的美国英语语料库,其中包含10位说话者(5位女性和5位男性)的讲话。 每个说话者大约有350种话语。 理论 语音特征提取 此处使用梅尔频率倒谱系数(MFCC),因为它们可在说话者验证中提供最佳结果。 MFCC通常如下得出: 进行信号(窗口摘要)的傅立叶变换。
  3. 所属分类:其它

    • 发布日期:2021-02-05
    • 文件大小:18874368
    • 提供者:weixin_42120997
« 12 »