点数信息
www.dssz.net
注册会员
|
设为首页
|
加入收藏夹
您好,欢迎光临本网站!
[请登录]
!
[注册会员]
!
首页
移动开发
云计算
大数据
数据库
游戏开发
人工智能
网络技术
区块链
操作系统
模糊查询
热门搜索:
源码
Android
整站
插件
识别
p2p
游戏
算法
更多...
在线客服QQ:632832888
当前位置:
资源下载
搜索资源 - 语音聚类
下载资源分类
移动开发
开发技术
课程资源
网络技术
操作系统
安全技术
数据库
行业
服务器应用
存储
信息化
考试认证
云计算
大数据
跨平台
音视频
游戏开发
人工智能
区块链
在结果中搜索
所属系统
Windows
Linux
FreeBSD
Unix
Dos
PalmOS
WinCE
SymbianOS
MacOS
Android
开发平台
Visual C
Visual.Net
Borland C
CBuilder
Dephi
gcc
VBA
LISP
IDL
VHDL
Matlab
MathCAD
Flash
Xcode
Android STU
LabVIEW
开发语言
C/C++
Pascal
ASM
Java
PHP
Basic/ASP
Perl
Python
VBScript
JavaScript
SQL
FoxBase
SHELL
E语言
OC/Swift
文件类型
源码
程序
CHM
PDF
PPT
WORD
Excel
Access
HTML
Text
资源分类
搜索资源列表
一种基于能量聚类分析的句子语音端点检测法
:针对语音复读系统等背景噪声相对较小且稳定的实际应用环境,提出一种改进的基于时域分析的句子语音端点 检测算法。因为在此类应用环境中,对句子语音端点检测的干扰因素较少,且一般需要实现快速的句子语音端点检测。 因此,简化了所要使用的语音特征参数,不再使用时域分析中常用的过零率,仅使用语音信号能量特征值辅以聚类分析完 成语音端点检测。实验表明,本算法简化了端点检测的过程,可以便捷有效地检测出句子中的语音端点。
所属分类:
其它
发布日期:2009-11-26
文件大小:309248
提供者:
sihuajian
数字语音信号处理1111
前言 语音信号处理是研究用数字信号处理技术和语音学知识对语音信号进行处理的新兴的学科,是目前发展最为迅速的信息科学研究领域的核心技术之一。通过语音传递信息是人类最重要、最有效、最常用和最方便的交换信息形式。同时,语言也是人与机器之间进行通信的重要工具,它是一种理想的人机通信方式,因而可为信息处理系统建立良好的人机交互环境,进一步推动计算机和其他智能机器的应用,提高社会的信息化程度。 语音信号处理是一门新兴的学科,同时又是综合性的多学科领域和涉及面很广的交叉学科。虽然从事这一领域研究的人员主要来
所属分类:
硬件开发
发布日期:2011-03-06
文件大小:1048576
提供者:
c429375860
语音识别技术文章.rar
第一部分 基本理论 第2章 听觉机理和汉语语音基础 2. 1 概述 2.2 听觉机理和心理 2.2.1 语音听觉器官的生理结构 2.2.2 语音听觉的心理 2.3 发音的生理机构与过程 2.4 汉语语音基本特性 2.4. 1 元音和辅音 2.4.2 声母和韵母 2.4.3 音调(字调) 2.4.4 音节(字)构成 2.4.5 汉语的波形特征 2.4.6 音的频谱特性 2.4.7 辅音的频谱特性 2.4.8 汉语语音的韵律特征 2.5 小结 参考文献 第3章 语音信号处理方法--时域处理 3.1
所属分类:
其它
发布日期:2011-05-12
文件大小:5242880
提供者:
wangjunhui1984
聚类算法研究
聚类算法研究 据挖掘、模式识别等研究方向的重要研究内容之一,在识别数据的内在结构方面具有极其重要的作用.聚类主 要应用于模式识别中的语音识别、字符识别等,机器学习中的聚类算法应用于图像分割和机器视觉,图像处理 中聚类用于数据压缩和信息检索.聚类的另一个主要应用是数据挖掘(多关系数据挖掘)、时空数据库应用(GIS 等)、序列和异类数据分析等.此外,聚类还应用于统计科学.值得一提的是,聚类分析对生物学、心理学、考古学、 地质学、地理学以及市场营销等研究也都有重要作用[1−3]. 本文一方面从算法思
所属分类:
专业指导
发布日期:2012-03-06
文件大小:883712
提供者:
comaple
应用HTK搭建语音拨号系统(有说明文件和实例代码)
应用HTK搭建语音拨号系统:苏统华,哈尔滨工业大学人工智能研究室。 该系统能够识别连续说出的数字串和若干组姓名。建模是针对子词(sub-word, eg. 音素),具有一定的可扩充性。当加入一个新名字时,只需修改发音词典和任务语法即可。模型为连续混合高斯输出,运用语音决策树聚类形成的绑定状态式三音素。
所属分类:
C
发布日期:2013-12-11
文件大小:8388608
提供者:
ygyan521
fuzzy clustering neural network in speech signal system identification
通过模糊聚类和神经网络方法,对语言进行识别
所属分类:
专业指导
发布日期:2015-10-22
文件大小:117760
提供者:
hitguoliang
speaker segmentation and clustering语音分割聚类
语音分割与语音聚类 speaker segmentation and clustering
所属分类:
互联网
发布日期:2016-11-02
文件大小:471040
提供者:
wh357589873
基于说话人的音频分割与聚类
李稀敏,洪青阳,黄晓丹 (厦门大学智能科学与技术系,福建 厦门 361005) 说话人分割与聚类主要应用于两个方面的问题,一方面可以用于自动语音识别的说话人自适 应;另一方面可用于说话人检索和富文本转录。主要包括三个过程:有效语音检测、说话人分割以及说 话人聚类。本文主要就这三个方面展开叙述,全面地介绍了各类算法。
所属分类:
互联网
发布日期:2016-11-04
文件大小:838656
提供者:
wh357589873
说话人聚类源码(pyaudioAnalysis)
audio feature extraction, classification, segmentation and applications 语音特征提取 分类 分割 应用
所属分类:
互联网
发布日期:2016-11-06
文件大小:60817408
提供者:
wh357589873
基于kmeans的语音聚类
源码请在csdn中搜索 MUS490-master
所属分类:
互联网
发布日期:2016-11-06
文件大小:492544
提供者:
wh357589873
语音聚类源码(MUS490-master)
Unsupervised, Auto K-Means Audio Clustering using Dynamic Weight Selection这个论文的源码。论文地址:http://download.csdn.net/detail/wh357589873/9674372
所属分类:
互联网
发布日期:2016-11-06
文件大小:27262976
提供者:
wh357589873
语音合成与识别
马尔可夫模型。一个马尔科夫分类算法,其中使用了马尔科夫估计方法,分类的精度高。
所属分类:
机器学习
发布日期:2017-10-01
文件大小:9216
提供者:
tobgreater
基频包络的音节聚类分析
对汉语TTS 系统的大规模语料库做了基本的韵律参数统计, 分析了音节的韵律特征与其所在的韵律结构位 置以及韵律结构边界的关系. 进一步, 对有调音节样本集基于基频包络采进行聚类, 通过听辨实验检验了聚类结果, 并分析了音节聚类与其所在韵律结构之间的对应关系
所属分类:
专业指导
发布日期:2008-12-30
文件大小:261120
提供者:
aouming
语音情绪识别,声纹识别
本课题的研究内容主要是呼叫中心电话语音分割和客服代表语音情绪检 测,主要内容如下: (1)绪论,主要讲述说话者语音分割和情绪识别的国内外研究现状。介绍各研究者所用的方法和结论以及存在的问题。 (2)语音特征提取,主要讲述语音的物理模型,以及基于此模型的特征种类和 提取方法。是本研究的基础。 (3)话者分割和聚类,主要讲述语音分割的内容和方,重点介绍了基于距离和 模型的分割聚类方法,并有相关实验分析。 (4)客服代表情绪检测,主要讲述语音识别的特征提取,选择以及模型的选择, 重点介绍了 SVM
所属分类:
机器学习
发布日期:2018-08-16
文件大小:1048576
提供者:
qq_17816517
1-1 聚类分析.pdf
模式识别就是通过计算机用数学技术方法来研究模式的自动处理和判读,把环境与客体统称为“模式”。随着计算机技术的发展,人类有可能研究复杂的信息处理过程,其过程的一个重要形式是生命体对环境及客体的识别。模式识别以图像处理与计算机视觉、语音语言信息处理、脑网络组、类脑智能等为主要研究方向,研究人类模式识别的机理以及有效的计算方法。
所属分类:
讲义
发布日期:2020-01-03
文件大小:2097152
提供者:
weixin_44249704
用于语音动画合成的语音特征提取和聚类技术
在基于图像的人脸语音动画合成过程中,为了保证音频帧和视频帧的精确映射关系,需要提取鲁棒的语音信号特征参数,并对特征参数聚类。本文介绍了直接从原始语音信号中提取LPC复倒谱及短时能量组成特征矢量的方法,以及对特征矢量进行聚类的方法。
所属分类:
其它
发布日期:2020-10-26
文件大小:95232
提供者:
weixin_38565480
基于音素后验概率和层次凝聚聚类算法的音素边界检测
提出了一种基于音素后验概率和层次凝聚聚类算法的音素边界检测方法。该方法首先利用改进的TRAP结构提取语音信号的帧级音素后验概率;然后,运用层次凝聚聚类算法将提取的音素后验概率进行聚类分析;最后根据其全部的最小损失函数值获取阈值,并通过此阈值决定聚类数目和音素边界。实验证明:该方法具有较好的检测性能,且相对于梅尔倒谱参数(MFCC),音素后验概率更为适合音素边界的检测。
所属分类:
其它
发布日期:2021-03-16
文件大小:320512
提供者:
weixin_38702110
语音数据的局域约束传递距离聚类
语音数据的局域约束传递距离聚类
所属分类:
其它
发布日期:2021-03-12
文件大小:237568
提供者:
weixin_38728347
audio_noise_clustering:https://dodiku.github.ioaudio_noise_clusteringresults ==>使用各种聚类(和类似聚类)技术来减少音频语音录音中噪声的实验-源码
语音噪声聚类 进行了各种聚类(和类聚类)技术的实验,以减少语音音频录制中的噪声。 结果显着 突出显示的结果可以上找到。 主题演讲 进一步的工作 添加kmeans集群 添加分层集群 尝试实现Word2vec 查找聚类算法和ICA之间的更多组合 尝试链接ICA结果(将输出用作下一次运行的输入) 清理代码(看起来很烂。) 归因 开源python3软件包: ,作者
所属分类:
其它
发布日期:2021-02-04
文件大小:1073741824
提供者:
weixin_42110469
基于模糊核聚类的多模式情感识别算法研究
为了克服单模式情感识别存在的局限性,该文以语音信号和面部表情信号为研究对象,提出了一种新型的多模式情感识别算法,实现对喜悦、愤怒、惊奇和悲伤4种人类基本情感的识别。首先,将获取的信号进行预处理并提取情感特征参数,然后利用模糊核聚类算法对其进行聚类分析,即利用Mercer核,将原始空间通过非线性映射到高维特征空间,在高维特征空间中对多模式情感特征进行模糊核聚类分析。由于经过了核函数的映射,使原来没有显现的特征突现出来。实验结果验证了该方法的可行性和有效性。
所属分类:
其它
发布日期:2021-01-27
文件大小:799744
提供者:
weixin_38623009
«
1
2
3
4
»