Fork me on GitHub

Coding Poineer

Coding Poineer

Coding Poineer

Coding Poineer

Coding Poineer

Coding Poineer

Coding Poineer

Coding Poineer

Coding Poineer

Coding Poineer

Coding Poineer

ASR基础知识整理

`音频取样率`：1秒钟采样的次数

语音识别服务支持8000HZ/16000HZ，如果超过16000HZ需要先转换为8000HZ，8000HZ的语音数据则只能使用8000HZ的模型

`采样位数`：每个采样样本的幅度`量化`

1字节：8bit，256个等级分类
2字节：16bit，65536个等级分类

`语音编码`：会在文件头部定义音频编码格式，如WAV、PCM、Ark

`声道`：录制声音时在不同空间位置采集的相互独立的音频信号

posted @ 2022-05-30 00:38 365/24/60 阅读(103) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

相关博文：

· 语音信号特征研究

· K2-lhotse数据读取、训练流程分析

· 音频基础知识(一)

· ASR项目实战-产品分析

· ASR项目实战-前处理

阅读排行：
· 震惊！C++程序真的从main开始吗？99%的程序员都答错了
· winform 绘制太阳，地球，月球运作规律
· 【硬核科普】Trae如何「偷看」你的代码？零基础破解AI编程运行原理
· 上周热点回顾（3.3-3.9）
· 超详细：普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人