上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 38 下一页

2020年12月13日

AIBigKaldi(四)| Kaldi的特征提取(源码解析)

摘要: 本文来自公众号“AI大道理”。 准备好了数据,接下来就可以特征提取了。最常用到的语音特征就是梅尔倒谱系数(Mel-scaleFrequency Cepstral Coefficients,简称MFCC)。以最简单的YesNo为例。​ 1 run.sh 特征提取步骤: MFCC提取过程包括预处理、快速 阅读全文

posted @ 2020-12-13 17:01 AI大道理 阅读(679) 评论(0) 推荐(0) 编辑

2020年12月12日

OfficialKaldi(二十九)| Kaldi的特征提取(翻译注解)

摘要: 介绍 我们的特征提取和波形读取代码旨在创建标准的MFCC和PLP功能,设置合理的默认值,但保留人们最可能想要调整的选项(例如,梅尔箱的数量,最小和最大频率截止,等等)。此代码仅从包含pcm数据的.wav文件中读取。这些文件通常后缀为.wav或.pcm(尽管有时将.pcm后缀应用于sphere文件;在 阅读全文

posted @ 2020-12-12 23:59 AI大道理 阅读(368) 评论(0) 推荐(0) 编辑

OfficialKaldi(九)——Kaldi的项目历史(翻译注解)

摘要: 卡尔迪(Kaldi)在2009年约翰·霍普金斯大学(Johns Hopkins University)研讨会上的存在开始变得笨拙,该研讨会的标题为“开发成本低,新语言和新领域的高质量语音识别”(请参阅致谢)。 该项目的重点是基于子空间高斯混合模型(SGMM)的建模以及对词典学习的一些研究。现在开始在 阅读全文

posted @ 2020-12-12 23:42 AI大道理 阅读(191) 评论(0) 推荐(0) 编辑

OfficialKaldi(八)——Kaldi的编码样式(翻译注解)

摘要: 当开始编码Kaldi工具箱的最终版本时,我们决定将OpenFst用作C ++库。 为了与OpenFst保持一致,我们决定在大多数方面使用相同的编码样式。 通过查看代码,可以明显看出Kaldi编码样式的许多方面。关键点包括: 标记命名规则,例如MyTypeName,MyFunction,my_clas 阅读全文

posted @ 2020-12-12 23:39 AI大道理 阅读(80) 评论(0) 推荐(0) 编辑

OfficialKaldi(八)——Kaldi的编码样式(翻译注解)

摘要: 当开始编码Kaldi工具箱的最终版本时,我们决定将OpenFst用作C ++库。 为了与OpenFst保持一致,我们决定在大多数方面使用相同的编码样式。 通过查看代码,可以明显看出Kaldi编码样式的许多方面。关键点包括: 标记命名规则,例如MyTypeName,MyFunction,my_clas 阅读全文

posted @ 2020-12-12 23:38 AI大道理 阅读(133) 评论(0) 推荐(0) 编辑

OfficialKaldi(七)| Kaldi编译过程(翻译注解)

摘要: 该页面以一般术语描述了Kaldi构建过程的工作方式。 另请参见外部矩阵库,以获取有关矩阵代码如何使用外部库以及由此产生的链接错误的说明;下载和安装Kaldi可能也很有趣。 Windows上的构建过程 Windows的构建过程与类似UNIX的系统的构建过程是分开的,并且在Windows / INSTA 阅读全文

posted @ 2020-12-12 21:57 AI大道理 阅读(287) 评论(0) 推荐(0) 编辑

OfficialKaldi(六)| 数据准备(翻译注解)

摘要: 介绍 在运行完示例脚本后(见Kaldi教程),你可能会想用自己的数据在Kaldi上跑一下。本节主要讲述如何准备相关数据。本页的读者应该使用最新版本的实例脚本(即在脚本目录下被命名为s5的那些,例如 egs/rm/s5)。 另外,除了阅读本页所述内容外,你还可以阅读脚本目录下的那些数据准备相关的脚本。 阅读全文

posted @ 2020-12-12 21:06 AI大道理 阅读(443) 评论(0) 推荐(0) 编辑

AIBigKaldi(三)| Kaldi的数据准备(源码解析)

摘要: 本文来自公众号“AI大道理”。 正所谓巧妇难为无米之炊。对于语音识别任务来说,对于Kaldi来说,数据就是这个米。 在进行特征提取、模型训练之前,首先要做的就是数据准备。以最简单的YesNo为例。 1 YesNo实例结构 ​ 其中: 文件夹 ​ 脚本 ​ 2 脚本解析 cmd.sh ​ 源码解读: 阅读全文

posted @ 2020-12-12 11:03 AI大道理 阅读(511) 评论(0) 推荐(0) 编辑

2020年12月11日

AIBigKaldi(二)| Kaldi的I/O机制(源码解析)

摘要: 本文来自公众号“AI大道理”。 作为传统语音识别神器,kaldi拥有自己一套独特的输入输出机制。先来感受一下吧。 feats="ark,s,cs:apply-cmvn $cmvn_opts --utt2spk=ark:$sdata/JOB/utt2spk scp:$sdata/JOB/cmvn.sc 阅读全文

posted @ 2020-12-11 15:08 AI大道理 阅读(276) 评论(0) 推荐(0) 编辑

OfficialKaldi(十四)| 从命令行角度来看Kaldi的 I / O

摘要: 此页面从命令行工具用户的角度描述了Kaldi中的I / O机制。 有关更多代码级概述,请参见Kaldi I / O机制。 总览 非表I / O 我们首先描述“非表” I / O。这是指仅包含一个或两个对象的文件或流(例如,声学模型文件;转换矩阵),而不是由字符串索引的对象的集合。 Kaldi文件格式 阅读全文

posted @ 2020-12-11 10:54 AI大道理 阅读(187) 评论(0) 推荐(0) 编辑

上一页 1 ··· 5 6 7 8 9 10 11 12 13 ··· 38 下一页

导航