OfficialKaldi(九)——Kaldi的项目历史(翻译注解)

卡尔迪(Kaldi)在2009年约翰·霍普金斯大学(Johns Hopkins University)研讨会上的存在开始变得笨拙,该研讨会的标题为“开发成本低,新语言和新领域的高质量语音识别”(请参阅致谢)。

该项目的重点是基于子空间高斯混合模型(SGMM)的建模以及对词典学习的一些研究。现在开始在此开发Kaldi软件,但是我们当时开发的配方仍然依赖于HTK。该研讨会的正式和非正式参加者名单如下(按姓氏命名):

Mohit Agarwal,Pinar Akyazi,Lukas Burget,Arnab Ghoshal,Ondrej Glembek,Nagendra Goel,Martin Karafiat,Feng Kai,Daniel Povey,Ariya Rastrow,Richard C.Rose,Petr Schwarz,Samuel Thomas。

该讲习班的一些参加者同意于2010年夏天在捷克共和国布尔诺(由布尔诺工业大学主办)再次开会。该研讨会的目的是根据2009年完成的工作创建一个干净且可发布的食谱,并创建一个通用语音工具包作为副产品。我们试图解决的问题是,我们以前的配方是基于涉及HTK和我们自己的早期“ Kaldi”代码的不同脚本,并且不容易封装。我们还认为,具有开放许可的,精心设计的现代通用语音工具包将是语音识别社区的资产。在2010年8月,以下一群人在布尔诺见面了(再次按字母顺序):

Pinar Akyazi,Lukas Burget,Gilles Boullianne,Ondrej Glembek,Arnab Ghoshal,Nagendra Goel,Mirko Hannemann,Petr Motlicek,Daniel Povey,Yanmin Qian,Petr Schwarz,Jan Silowsky,Georg Stemmer和Karel Vesely。

大约在此期间以及之后不久,我们还获得了Sandeep Boda,Sandeep Reddy和Haihai Xu的一些远程帮助(他们曾协助编码,代码清理和文档编写);我们拜访了Michael Riley(他帮助我们了解了OpenFst并做了一些FST讲座),并想感谢Honza Cernocky的帮助(谈判场地并获得了BUT信息技术学院的研讨会支持)并协助组织),Renata Kohlova(行政管理)和Tomas Kasparek(系统行政管理)。此贡献者列表可能包含疏忽;任何重要的遗漏都不太可能是故意的。

在2010年夏天编写了很多代码,但我们仍然没有完整的工作系统。2010年研讨会的一些参与者继续努力完成工具包并获得一套工作脚本。该代码于2011年5月14日发布,并在布拉格的ICASSP 2011上向公众展示,请参见相关录音

自最初发行以来,Kaldi一直在很大程度上由Daniel Povey维护和开发,他一直在Microsoft Research工作,直到2012年初,此后在Johns Hopkins大学工作。但也得到了其他方面的重大贡献:特别是开发神经网络训练框架的Karel Vesely和早期协调声学建模工作的Arnab Ghoshal。还有其他一些主要的贡献者,我们在这里不愿透露姓名,因为很难确定从哪里删除名单;以及未成年人的长尾巴;到目前为止,贡献代码,脚本或补丁的总人数约为70。

致谢

在美国国家科学基金会(National Science Foundation)资助号IIS-0833652的支持下,JHU 2009研讨会得到了Google研究,DARPA的GALE计划以及约翰霍普金斯大学人类语言技术卓越中心的补充资助。在此期间,捷克贸易和商务部的No.2项目部分支持了BUT研究人员。FR-TI1 / 034,捷克共和国赠款局项目编号:102/08/0707,捷克教育部项目 MSM0021630528。Arnab Ghoshal隶属于萨尔兰大学,并获得了欧洲共同体第七框架计划拨款213850(SCALE)的支持,爱丁堡大学也获得了英国工程和物理科学研究委员会的拨款EP / I031022 / 1(自然语音技术)的支持”

BUT研究人员在Kaldi上的工作得到了捷克共和国技术局(TA01011328)的支持。

我们要感谢Microsoft Research的Geoffrey Zweig和Alex Acero的支持,以及Henrique(Rico)Malvar慷慨地允许使用他的FFT代码。还要感谢Patrick Nguyen在组织JHU'09研讨会和《华尔街日报》食谱方面的帮助。在JHU'09研讨会期间,我们还要感谢约翰·霍普金斯大学语言和语音处理中心的教职员工的帮助,特别是Sanjeev Khudanpur,Desiree Cleves和已故的Fred Jelinek。

自2012年以来,卡尔迪的开发得到了IARPA的BABEL计划(IARPA-BAA-11-02)和人类语言技术卓越中心(HLTCOE)的大力支持;自2015年以来,获得了NSF计算研究基础架构(CRI)的奖项``CI-EN:卡尔迪语音识别工具包的增强功能''。

Sanjeev Khudanpur在为Kaldi项目的成功创造条件方面值得特别提及,首先是在JHU'09研讨会上,他作为研讨会的组织者,在组建团队方面发挥了重要作用(例如,建议增加Lukas Burget,没有他们,这会发生);从2012年起,丹尼尔·鲍维(Daniel Povey)得以在约翰·霍普金斯大学(Johns Hopkins University)工作,这使他可以将大部分时间投入到卡尔迪的发展中。

posted on 2020-12-12 23:42  AI大道理  阅读(203)  评论(0编辑  收藏  举报

导航