davidtym - 博客园

基于WFST的语音识别解码器

摘要：学习语音识别有些时间了。老板要求我们基于Kaldi搭一个语音识别系统，在设备上通过MIC讲话，连着设备的PC的console上就能基本实时显示出讲话的内容。由于我们都是小白，刚开始可以要求低些，就用传统的GMM-HMM，能实现孤立词识别就算达标了，后面随着这方面能力的提高，再做更难一点的。任务下达后阅读全文

posted @ 2019-06-23 22:53 davidtym 阅读(3674) 评论(0) 推荐(0) 编辑

语音识别中唤醒技术调研

摘要：上篇博客（语音识别传统方法(GMM+HMM+NGRAM)概述）说到我们team要做语音识别相关的项目，而我们公司的芯片是用在终端上的，即我们要做终端上的语音识别。由于目前终端（如手机）上的CPU还不足够强劲，不能让语音识别的各种算法跑在终端上，尤其现在语音识别都是基于深度学习来做了，更加不能跑在终端阅读全文

posted @ 2019-05-28 22:26 davidtym 阅读(4942) 评论(2) 推荐(1) 编辑

语音识别传统方法(GMM+HMM+NGRAM)概述

摘要：春节后到现在近两个月了，没有更新博客，主要是因为工作的关注点正从传统语音（语音通信）转向智能语音（语音识别）。部门起了个新项目，要用到语音识别（准备基于Kaldi来做）。我们之前做的传统音频已基本成熟，就开始关注在语音识别上了。对于我们来说，这是个全新的领域（虽然都是语音相关的，但是语音通信偏信号处阅读全文

posted @ 2019-04-02 19:09 davidtym 阅读(5664) 评论(0) 推荐(2) 编辑

写在技术博客开通一周年之际：这一年在技术上我做了什么

摘要：去年的这个时候我在博客园开通了技术博客。一晃一年过去了，这一年中我写了二十几篇原创，全是对音频开发中的知识和经验的总结。不高产，差不多一个月两篇的节奏。平时工作比较忙，基本都是利用周末时间写出来的。中途有一段时间特别忙，差点想放弃，庆幸还是坚持下来了。我想后面还会坚持下去，内容还是对我工作中知识和经阅读全文

posted @ 2018-06-19 08:33 davidtym 阅读(3753) 评论(10) 推荐(19) 编辑

移动通信最先进的音频编解码器EVS及用好要做的工作

摘要：语音通信从最初的只有有线通信变成后来的有线通信与无线通信（移动通信）的竞争，当移动语音通信价格下来后有线语音通信明显处于逆势。如今移动语音通信的竞争对手是OTT（On The Top）语音，OTT语音是互联网厂商提供的服务，一般免费，如微信语音。目前语音通信技术上就分成了两大阵营：传统通信阵营和互联阅读全文

posted @ 2018-05-28 08:07 davidtym 阅读(6606) 评论(2) 推荐(3) 编辑

Android智能手机中各种音频场景下的audio data path

摘要：上一篇文章（Android智能手机上的音频浅析）说本篇将详细讲解Android智能手机中各种音频场景下的音频数据流向，现在我们就开始。智能手机中音频的主要场景有音频播放、音频录制、语音通信等。不同场景下的音频数据流向有很大差异，即使是同一场景，在不同的模式下音频数据流向也有所不同。 1，音频播放 A 阅读全文

posted @ 2018-04-23 21:36 davidtym 阅读(7277) 评论(2) 推荐(3) 编辑

聊聊音频类开源代码这点事

摘要：我工作的头几年是在通信设备商做通信设备上的语音软件开发，主要是follow ITU-T/3GPP/RFC等SPEC写代码，相对封闭，没怎么接触开源代码。后来到芯片公司做终端上的voice engine，开始接触音频类的开源代码，先是ITU-T/3GPP的各种codec，后来是各种完整的解决方案。刚开阅读全文

posted @ 2018-03-26 19:46 davidtym 阅读(2381) 评论(0) 推荐(1) 编辑

谈谈语音通信中的各种tone

摘要：今天谈的这个主题（tone）存在于我们的日常打电话过程中。先举两个场景：1，你拿起固话话筒准备打电话，按电话号码前先从话筒里听到“嗡”的连续音，这叫dial tone(拨号音，表示你可以拨电话号码了)，你拨完号码对方振铃后你又听到有规律的“嘟-嘟-”的断续音，这叫ring back tone(回铃音阅读全文

posted @ 2018-02-25 19:38 davidtym 阅读(3508) 评论(0) 推荐(0) 编辑

记开发过的一款无线音箱解决方案

摘要：从2017年开始国外智能音箱的热潮席卷到国内，各大小厂商都推出了智能音箱，主要有阿里的天猫精灵京东的叮咚和小米的小爱同学等。我也在去年双11入手了一款智能音箱（天猫精灵），体验下来总体感觉还是不错的，我相信这股热潮在今年（2018）会愈演愈热。有报道说美国的青年有了智能音箱后对手机的依赖度有所下降，阅读全文

posted @ 2018-02-07 20:58 davidtym 阅读(6145) 评论(10) 推荐(1) 编辑

如何在嵌入式Linux上开发一个语音通信解决方案

摘要：开发一个语音通信解决方案是一个软件项目。既然是软件项目，就要有相应的计划：有多少功能，安排多少软件工程师去做，这些工程师在这一领域的经验如何，是否需要培训，要多长时间做完，中间有几个主要的milestone等。我们曾经四个人花了近一年时间开发了一个语音解决方案，成功通过验收，各项关键指标（语音质量、阅读全文

posted @ 2018-01-14 17:48 davidtym 阅读(4911) 评论(3) 推荐(2) 编辑

谈谈音频开发

公告

搜索

常用链接

积分与排名

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论