语音识别资料整理

语音识别

Information

cmu sphinx
Kaldi

DataSet

# 下载中文语音数据集(5G+):
$ wget http://data.cslt.org/thchs30/zip/wav.tgz  
$ wget http://data.cslt.org/thchs30/zip/doc.tgz  
$ wget http://data.cslt.org/thchs30/zip/lm.tgz  
# 解压  
$ tar xvf wav.tgz  
$ tar xvf doc.tgz  
$ tar xvf lm.tgz  

CSLT数据
清华大学cslt实验室分享中文语音识别: 数据集

data_thchs30.tgz [6.4G] ( speech data and transcripts )
test-noise.tgz [1.9G] ( standard 0db noisy test data )
resource.tgz [24M] ( supplementary resources, incl. lexicon for training data, noise samples )

PCM、WAV格式介绍及用C语言实现PCM转WAV

Theory

Examples

posted on 2017-08-30 11:00  Vanessa_Feng  阅读(1189)  评论(0)    收藏  举报