MASR中文语音识别
MASR是一个基于端到端的深度神经网络的中文普通话语音识别项目。
原理
MASR使用的是门控卷积神经网络(Gated Convolutional Network),网络结构在Facebook在2016年提出的Wav2letter。但是使用的激活函数不是ReLU HardTanh ,而不是GLU (门控线性单元)。因此根据我的实验,使用GLU的收敛速度比HardTanh要快。如果您想要研究卷积网络用于语音识别的效果,这个项目可以作为一个参考。
以下用字错误率CER来假定模型的