心胸决定格局,眼界决定境界...

上一页 1 2 3 4 5 6 ··· 11 下一页
摘要: 转:http://ftli.farbox.com/post/kaldizhong-wen-shi-bie 阅读全文
posted @ 2017-09-18 17:50 WELEN 阅读(4239) 评论(0) 推荐(0) 编辑
摘要: 首先,thchs30有两种数据库,kaldi运行的数据库最好是 thchs30-openslr。 修改run.sh里面的语音库路径 thchs30=... 修改nj线程数 等于CPU的核心数 修改cmd.sh queue.pl 改为run.pl本地机器跑 运行出现错误: lexicon.txt验证出 阅读全文
posted @ 2017-09-18 15:10 WELEN 阅读(6916) 评论(0) 推荐(0) 编辑
摘要: ============================================================================ MMI + SGMM2 Training & Decoding ===============================================... 阅读全文
posted @ 2017-09-15 17:59 WELEN 阅读(1868) 评论(0) 推荐(0) 编辑
摘要: steps/diagnostic/analyze_alignments.sh --cmd run.pl --mem 4G data/lang exp/monosteps/diagnostic/analyze_alignments.sh: see stats in exp/mono/log/analy 阅读全文
posted @ 2017-09-15 12:09 WELEN 阅读(1430) 评论(0) 推荐(0) 编辑
摘要: TIMIT语音库是IT和MIT合作音素级别标注的语音库,用于自动语音识别系统的发展和评估,包括来自美式英语,8个地区方言,630个人。 每个人读10个句子,每个发音都是音素级别、词级别文本标注,16kHz,16bit。 注意:不用使用TIMIT配置作为运行Kaldi的一个通用型例子,因为它不是一个非 阅读全文
posted @ 2017-09-15 11:40 WELEN 阅读(4944) 评论(0) 推荐(0) 编辑
摘要: steps/decode.sh 阅读全文
posted @ 2017-09-14 17:31 WELEN 阅读(2376) 评论(0) 推荐(0) 编辑
摘要: utils/split_data.sh 阅读全文
posted @ 2017-09-14 15:58 WELEN 阅读(2051) 评论(0) 推荐(0) 编辑
摘要: 转:http://blog.csdn.net/shmilyforyq/article/details/76807431 博主话:这篇博客是对kaldi官网中Feature and model-space transforms in Kaldi 的翻译,因为不是专业翻译人士,接触kaldi时间也不长, 阅读全文
posted @ 2017-09-13 17:06 WELEN 阅读(3243) 评论(0) 推荐(0) 编辑
摘要: 转:http://blog.csdn.net/wbgxx333/article/details/25778483 本翻译原文http://kaldi.sourceforge.net/feat.html,由@煮八戒翻译,@wbglearn校对和修改。 特征提取 简介 我们做特征提取和波形读取的这部分代 阅读全文
posted @ 2017-09-13 17:02 WELEN 阅读(2743) 评论(0) 推荐(0) 编辑
摘要: 转:http://blog.csdn.net/wbgxx333/article/details/41019453 深度神经网络已经是语音识别领域最热的话题了。从2010年开始,许多关于深度神经网络的文章在这个领域发表。许多大型科技公司(谷歌和微软)开始把DNN用到他们的产品系统里。(备注:谷歌的应该 阅读全文
posted @ 2017-09-13 16:44 WELEN 阅读(1889) 评论(0) 推荐(0) 编辑
摘要: 转:http://blog.sina.com.cn/s/blog_66f725ba0101bw8i.html 关于语音识别的声学模型训练方法已经是比较成熟的方法,一般企业或者研究机构会采用HTK工具包、Kaldi等进行训练,目前从声学模型出发,提高系统性能的主要策略主要有: 1)增加训练数据。不同的 阅读全文
posted @ 2017-09-13 16:23 WELEN 阅读(2617) 评论(0) 推荐(0) 编辑
摘要: 转自: http://blog.csdn.net/wbgxx333/article/details/24932533 本文是kaldi学习联盟中@冒顿翻译的,下面是@冒顿的翻译结果,在这里感谢@冒顿的辛勤劳动,希望更多的人加入到这个翻译上来,为更多的人学习…… 因为我们翻译的文档都有url,csdn 阅读全文
posted @ 2017-09-13 11:30 WELEN 阅读(1337) 评论(0) 推荐(0) 编辑
摘要: 转自:http://blog.csdn.net/chenhoujiangsir/article/details/51613144 说明:本文是kaldi主页相关内容的翻译(http://kaldi-asr.org/doc/tree_externals.html)。目前网上已经有一个翻译的版本,但翻译 阅读全文
posted @ 2017-09-12 17:48 WELEN 阅读(2398) 评论(0) 推荐(0) 编辑
摘要: 参考文章: http://blog.csdn.net/quheDiegooo/article/details/60873999 http://blog.csdn.net/quhediegooo/article/details/61202901 在发音过程中,因为协同发音的影响,同一个音素在不同的位置 阅读全文
posted @ 2017-09-12 16:34 WELEN 阅读(2597) 评论(0) 推荐(0) 编辑
摘要: 参考文章: 《Tree-Based State Tying for High Accuracy Acoustic Modelling Basics Triphone Tying Decision Trees 》, S.J. Young, J.J. Odell, P.C. Woodland 1994. 阅读全文
posted @ 2017-09-12 14:35 WELEN 阅读(8334) 评论(2) 推荐(2) 编辑
摘要: 转自:http://blog.csdn.net/wbgxx333/article/details/38986507 本文是翻译Speech and Language Processing: An introduction to natural language processing, computa 阅读全文
posted @ 2017-09-11 16:36 WELEN 阅读(1236) 评论(0) 推荐(0) 编辑
摘要: 在Kaldi中,单音素GMM的训练用的是Viterbi training,而不是Baum-Welch training。因此就不是用HMM Baum-Welch那几个公式去更新参数,也就不用计算前向概率、后向概率了。Kaldi中用的是EM算法用于GMM时的那三个参数更新公式,并且稍有改变。 Baum 阅读全文
posted @ 2017-09-11 15:22 WELEN 阅读(8072) 评论(1) 推荐(0) 编辑
摘要: Data preparation Audio data 自己创建数据集: 10个不同的说话人 每个人说10句话 每句话包含3个词 总共300个词,(数字0~9) Task kaldi-trunk/egs/digits创建digits_audio 文件夹,然后digits_audio,再创建train 阅读全文
posted @ 2017-09-08 17:40 WELEN 阅读(2521) 评论(0) 推荐(0) 编辑
摘要: Getting started, and prerequisites. rm/s5/run.sh Data preparation 如果有GridEngine, 如果需要在本地运行 local : Contains the dictionary for the current data. 包含当前数 阅读全文
posted @ 2017-09-08 14:42 WELEN 阅读(2550) 评论(0) 推荐(0) 编辑
摘要: Introduction 跑完kaldi的一些脚本例子,你可能想要自己用Kaldi跑自己的数据集。这里将会阐述如何准备好数据。 run.sh较上的部分是有关数据准备的,通常local与数据集相关。 例如:RM数据集 再例如:再WSJ数据集 Data preparation-- the "data" 阅读全文
posted @ 2017-09-07 18:17 WELEN 阅读(6248) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 ··· 11 下一页