2023 年 12月 29 日随笔档案 - jackieathome

2023年12月29日

摘要：使用机器学习方法来训练模型，使用训练得到的模型来预测语音数据，进而得到识别的结果文本，这是实现语音识别产品的一般思路。本文着重介绍通用语音识别产品对于数据的诉求。对数据的要求训练集相关要求，如下：地域，需要覆盖使用人群所在的地域，且数据的比例适中。口音，需要覆盖典型的口音。年龄，从18 阅读全文

posted @ 2023-12-29 23:02 jackieathome 阅读(106) 评论(0) 推荐(0) 编辑

ASR项目实战-构建Kaldi

摘要：准备工作安装构建时依赖的基础软件软件清单如下： bzip2 python3 automake libtool cmake gcc g++ gfortran git subversion 不同平台安装软件的方式不同，比如可以使用yum或者apt-get等。下载开源软件软件清单如下： Libun 阅读全文

posted @ 2023-12-29 22:01 jackieathome 阅读(220) 评论(0) 推荐(0) 编辑

ASR项目实战-语音识别

摘要：本文深入探讨语音识别处理环节。本阶段的重点特性为语音识别、VAD、热词、文本的时间偏移、讲话人的识别等。语音识别业界流派众多，比如Kaldi、端到端等，具体选择哪一种，需要综合考虑人员能力、训练数据量和质量、硬件设施、交付周期等，作出相对合理的交付规划。基于Kaldi的方案，优点在于其发挥稳阅读全文

posted @ 2023-12-29 20:44 jackieathome 阅读(160) 评论(0) 推荐(0) 编辑

jackieathome

公告