开发工具:
文件大小: 4mb
下载次数: 0
上传时间: 2021-03-18
详细说明:EEC201_Project
团体双声:Begum Kasap,Rishad Raiyan
抽象的
该项目旨在利用梅尔频率倒谱,矢量量化和LGB算法来识别说话者。音频文件经过预处理,以便对其幅度进行归一化并删除所有无声部分。大小为256的汉明窗框用于计算STFT。帧增量设置为256/3。 20个mel滤波器组用于获得20个MFCC系数。使用20个MFCC和16个群集从训练数据集中生成一个密码本。将测试数据集与密码本进行比较,并根据测试数据样本和密码本质心之间的平均失真对说话者进行分类。总共提供了11个音频文件用于培训和测试。如果我们将所有11个音频文件都用于训练和测试,则从提供的训练数据集获得100%的准确性,从提供的测试数据集获得81.82%的准确性。如果我们仅使用8个音频文件进行训练而使用11个音频文件进行测试,则我们的算法可以正确拒绝2/3个新的未知skeaper,并达到71.73%
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.