AMR 12.2k的语音编码程序,matlab调用mex文件实现。 speechencode函数实现语音编码部分,speechdecode函数实现解码。测试文件testAMR.pcm为标准PCM文件,8000采样率,单声道,16位PCM编码,时长30s。通过speechencode生成12.2k码率二进制01比特流,并保存为文件bit.txt。speechdecode将比特流还原为PCM文件。PCM文件可用CoolEdit试听,音质良好,几乎无损失。
在文本无关说话人确认领域,基于总差异空间的说话人确认方法已成为主流方法,其中概率线性判别分析(Probabilistic Linear Discriminant Analysis, PLDA)因其优异的性能受到广泛关注。然而传统PLDA模型没有考虑注册语音与测试语音时长失配情况下的差异信息,不能很好地解决因时长失配带来的说话人确认系统性能下降的问题。该文提出一种估计时长差异信息方法,并将此差异信息融入PLDA模型,从而提高PLDA模型对时长差异的鲁棒性。在NIST数据库上的实验表明,所提出的方法