随笔分类 -  语音识别

摘要:简介 最近在看 speechbrain 语音识别项目,其中第一步就是对文本标签进行 tokenization 了,各种参数看得云里雾里的,现在系统 总结 googel的 sentencepiece 的使用。 参考:https://github.com/google/sentencepiece 一、安 阅读全文
posted @ 2021-09-19 15:39 blackx 阅读(4575) 评论(0) 推荐(0) 编辑
摘要:MASR: https://github.com/nobody132/masr pytorch框架实现, 提供了AISHELL-1数据集上的中文预训练模型 ASRT https://asrt.ailemon.net/ Tensorflow框架实现 比较全面的文档和维护,提供了中文预训练模型 Deep 阅读全文
posted @ 2021-09-16 08:23 blackx 阅读(2900) 评论(0) 推荐(1) 编辑