1. mkdir MyTrain
2. 从http://www.speech.cs.cmu.edu/databases/an4/an4_sphere.tar.gz. 下载 AN4 数据库,此数据库是一个字母、数字数据库。
3. sudo cp –rf an_sphere.tar.gz SphinxTrain-1.0.tar.bz2 MyTrain
4. cd MyTrain
5. cd SphinxTrain
6. ./configure
7. make
8. 使用setup_tutorial.pl,训练出数据
cd MyTrain/SphinxTrain
perl scripts_pl/setup_tutorial.pl an4
9. 产生特征
cd MyTrain/an4
perl scripts_pl/make_feats.pl -ctl etc/an4_train.fileids
10.最后生成声学模型
perl scripts_pl/RunAll.pl
11.开始识别
cd model_parameters/
sudo cp -rf an4.cd_cont_1000 /usr/local/bin
cd etc/
sudo cp -rf an4.dic /usr/local/bin
sudo cp -rf an4.ug.lm.DMP /usr/local/bin
cd /usr/local/bin
pocketsphinx_continuous -hmm an4.cd_cont_1000 -lm an4.ug.lm.DMP -dict an4.dic
12.存在一定的识别错误
补充:解码,可以测试语音训练的质量