阿里巴巴 2018 年开源的语音识别模型 DFSMN,将全球语音识别准确率纪录提高至 96.04%。DFSMN 模型,是阿里巴巴的高效工业级实现,相对于传统的 LSTM、BLSTM 等声学模型,该模型具备训练速度更快、识别更高效、识别准确率更高和模型大小压缩等效果。
本场 Chat 的主要内容包括:
- 语音识别流程简介;
- Kaldi 的部署使用;
- 如何训练基于中文的 DFSMN 声学模型;
- 语音特征提取 MFCC 算法源码解读;
- 语音识别工具对比。
阅读全文: http://gitbook.cn/gitchat/activity/5bcc8f9b0920511ab0ff412b
您还可以下载 CSDN 旗下精品原创内容社区 GitChat App ,阅读更多 GitChat 专享技术内容哦。