OfficialKaldi(三)| 安装和运行Kaldi所需软件(翻译注解)

理想的计算环境
首先,我们将说明理想的计算环境类型,然后说明运行Kaldi所需的最低要求。理想的计算环境是运行Sun GridEngine(SGE)的Linux计算机集群(任何主要发行版),并且可以通过NFS或某些类似的网络文件系统访问共享目录。在理想情况下,网格上的某些计算机将具有NVidia GPU,您可以将它们用于神经网络训练,并且可以通过向qsub添加一些额外的选项将它们保留在队列中。有关更多信息,请参见Kaldi中的并行化
不久前,我们启动了一个名为Kluster的单独项目,向您展示了如何在Amazon EC2上创建这样的集群。但是,维护得不是很好。麻省理工学院的StarCluster是一个更大且得到更好支持的项目,它提供了相同的功能。大多数脚本应适用于基于Debian或Red Hat的本地托管集群。您可以研究旨在帮助您建立类似集群的Rocks
裸机最低计算环境
运行Kaldi的最基本的计算环境是任何类似Unix的环境。并且可以在单台机器上运行它,尽管这样做当然会慢一些,并且您可能必须减少某些示例脚本中使用的作业数量,以免耗尽机器的内存。
Kaldi已在Debian和Red Hat Linux上进行了最佳测试,但可在任何Linux发行版或Cygwin或Mac OsX上运行。
Kaldi的脚本的编写方式是,如果您使用具有不同语法的类似机制(例如Tork)替换SGE,则使其工作起来相对容易;我们还提供了一个“哑”替代品,您可以在没有排队系统时使用它(在脚本中搜索run.pl和ssh.pl)。
过去,Kaldi是在Windows上编译的。但是,示例脚本无法在此处运行,并且我们还没有非常积极地维护代码与Windows或Windows构建脚本的Windows兼容性(尽管我们会在得知问题的同时修复问题)。
所需的软件包
以下是安装Kaldi所需的某些软件包的非详尽列表。完整列表并不重要,因为安装脚本会告诉您所缺少的内容。
  • Git:这是下载Kaldi及其依赖的其他软件所必需的。
  • wget是安装某些下述非Kaldi组件所必需的
  • 示例脚本需要标准的UNIX实用程序,例如bash,perl,awk,grep和make。
如果您的系统上安装了ATLAS线性代数软件包,这也将很有帮助。大多数系统已经具备了这一功能(您也可以通过“ yum search atlas”或“ apt-cache search libatlas”之类的简单命令在Linux中搜索软件包以进行安装);最好的方法是暂时忽略此要求,并在安装Kaldi时查看是否有问题。
Kaldi安装的软件包
以下工具和库在tools /目录中随安装脚本一起提供,因此您不必自己安装它们(请注意:这不是详尽的列表)。
  • OpenFst:我们对此进行编译并大量使用。
  • IRSTLM:这是一种语言建模工具包。一些示例脚本需要它,但是它没有与Kaldi紧密集成。我们可以将任何Arpa格式的语言模型转换为FST。
    • IRSTLM的构建过程需要automake,aclocal和libtoolize(相应的软件包是automake和libtool)。
    • 注意:现在,一些示例脚本使用SRILM。尽管您仍然必须在线注册才能下载它,但它使安装变得很容易。
  • SRILM:一些示例脚本使用了此功能。通常,它是比IRSTLM更好,更完整的语言建模工具包;唯一的缺点是许可证,它不是免费用于商业用途。您必须在下载页面上输入您的名称才能下载它,因此安装脚本需要一些人为干预。
  • sph2pipe:用于将sph格式文件转换为其他格式,例如wav。使用LDC数据的示例脚本需要它。
  • sclite:这是用于计分的,因为我们有自己的简单计分程序(
  • compute-wer.cc
  • ),所以这不是必需的。
  • ATLAS,线性代数库。只有头文件才需要;在典型设置中,我们希望ATLAS可以在您的系统上使用。但是,如果您的计算机尚未启用CPU节流,则可以编译ATLAS(如果尚未在系统上)。
  • CLAPACK,线性代数库(我们下载标头)。这仅在没有ATLAS且使用CLAPACK进行编译的系统上有用。
  • OpenBLAS:这是ATLAS或CLAPACK的替代方案。脚本默认情况下不使用它,但是我们提供了安装脚本,因此如果您想将其与ATLAS进行比较(可以比ATLAS进行更积极地维护)进行比较,就可以安装它。

——————

浅谈则止,细致入微AI大道理

扫描下方“AI大道理”,选择“关注”公众号

—————————————————————

—————————————————————

稿  | 留言吧

posted on 2020-12-03 09:14  AI大道理  阅读(338)  评论(0编辑  收藏  举报

导航