08 2020 档案

AI大语音(七)——基于GMM的0-9语音识别系统
摘要:点击上方“AI大道理”,选择“置顶”公众号 重磅干货,细致入微AI大道理 —————— 1 系统概要 孤立词识别:语音中只包含一个单词的英文识别 识别对象:0-9以及o的英文语音 训练数据:330句话,每个字符30句话,11个字符 测试数据:110句话,每个字符10句话,11个字符 模型:混合高斯模 阅读全文

posted @ 2020-08-27 16:15 AI大道理 阅读(1093) 评论(0) 推荐(0) 编辑

AI大语音(六)——混合高斯模型(GMM)
摘要:点击上方“AI大道理”,选择“置顶”公众号 重磅干货,细致入微AI大道理 —————— 1 GMM基础 高斯混合模型(GMM)指的是多个高斯分布函数的线性组合,理论上GMM可以拟合出任意类型的分布,通常用于解决同一集合下的数据包含多个不同的分布的情况。 灵魂的拷问:为什么GMM可以拟合出任意类型的分 阅读全文

posted @ 2020-08-25 17:40 AI大道理 阅读(1548) 评论(0) 推荐(0) 编辑

AI大语音(五)——隐马尔科夫模型(HMM)
摘要:​点击上方“AI大道理”,选择“置顶”公众号 重磅干货,细致入微AI大道理 —————— 1HMM基础 一模型、两假设、三问题 1)一个模型 随机过程:是依赖于参数的一组随机变量的全体,参数通常是时间。随机变量是随机现象的数量表现,其取值随着偶然因素的影响而改变。 例如,某商店在从时间t0到时间tK 阅读全文

posted @ 2020-08-20 01:09 AI大道理 阅读(1143) 评论(0) 推荐(0) 编辑

AI大语音(四)——MFCC特征提取
摘要:点击上方“AI大道理”,选择“置顶”公众号 —————— 1 特征提取流程 在语音识别和话者识别方面,最常用到的语音特征就是梅尔倒谱系数(Mel-scaleFrequency Cepstral Coefficients,简称MFCC)。 MFCC提取过程包括预处理、快速傅里叶变换、Mei滤波器组、对 阅读全文

posted @ 2020-08-12 22:47 AI大道理 阅读(2029) 评论(0) 推荐(0) 编辑

AI大语音(三)—傅里叶变换家族
摘要:1 特征提取流程 在语音识别和话者识别方面,最常用到的语音特征就是梅尔倒谱系数(Mel-scaleFrequency Cepstral Coefficients,简称MFCC)。 MFCC提取过程包括预处理、快速傅里叶变换、Mei滤波器组、对数运算、离散余弦变换、动态特征提取等步骤。 2 傅里叶家族 阅读全文

posted @ 2020-08-12 17:15 AI大道理 阅读(1352) 评论(1) 推荐(0) 编辑

AI大语音(二)——语音预处理
摘要:1 预滤波 CODEC(所谓Codec,就是编码-解码器“Coder-Decoder”的缩写。说得通俗一点,对于音频就是A/D和D/A转换。)前端带宽为300-3400Hz(语音能量主要集中在250~4500Hz)。的抗混叠滤波器。 工程测量中采样频率不可能无限高也不需要无限高,因为一般只关心一定频 阅读全文

posted @ 2020-08-11 21:44 AI大道理 阅读(1739) 评论(1) 推荐(1) 编辑

AI大语音(一)——语音识别基础
摘要:1 语音识别基础 1.1 声音特性 声音是由物体振动产生的声波。是通过介质传播并能被人或动物听觉器官所感知的波动现象。最初发出振动的物体叫声源。声音以波的形式振动传播。声音是声波通过任何介质传播形成的运动。 频率:是每秒经过一给定点的声波数量,它的测量单位为赫兹,1千赫或1000赫表示每秒经过一给定 阅读全文

posted @ 2020-08-09 21:44 AI大道理 阅读(1754) 评论(1) 推荐(0) 编辑

导航