python3解析wav文件获取dtmf值

操作系统 :Windows 10_x64

Python版本:3.9.2

从事FreeSwitch相关工作,大概率会遇得到DTMF,DTMF的传递方式有三种:
  • In-band
  • RFC2833
  • SIP-INFO

使用RFC2833或SIP-INFO传递方式的DTMF,FreeSwitch可以在日志中打印出来,但遇到inband模式的DTMF,FreeSwitch的日志就打印不出来了。

如果是会议场景,使用In-band模式(比如固话)发送DTMF,DTMF按键的声音和音频流混合在一起发送到对端:

1)在传输过程转换为2833格式dtmf后,会添加2833格式的DTMF按键信息,混合在音频流里面的DTMF按键未移除;

2)会出现在会议系统中可以听到座机传来的DTMF按键音。

这个问题目前没有比较好的解决办法,这里记录一下。但这个问题引发了我的思考:

In-band模式的DTMF能识别吗?如果可以识别,怎么识别?

今天整理下In-band模式DTMF识别的笔记。我将从以下几个方面进行展开:

  • DTMF介绍

  • 如何生成包含DTMF按键音的wav文件

  • 如何使用python脚本解析wav文件获取DTMF按键值

  • 运行效果截图及配套资源下载

一、DTMF介绍

DTMF信号即双音多频信号,网上介绍的资料比较多,这里主要关注的是频率信息,可以参考下pypi上关于DTMF的介绍:
https://pypi.org/project/dtmf/

二、生成包含DTMF按键音的wav文件

1、使用Audacity生成wav文件

Audacity版本:3.1.3这里使用Audacity进行噪音文件的生成,如果不了解Audacity软件,可参考这篇文章:

https://www.cnblogs.com/MikeZhang/p/audacity2022022.html

1)选择"生成->DTMF音..."

2)生成0123456789音频

3)导出音频

这里使用8000hz导出音频。

如果想直接使用导出的音频文件(dtmf-au.wav),可从如下渠道获取:

关注微信公众号(聊聊博文,文末可扫码)后回复 20240803 获取。

2、使用软电话模拟inband模式生成wav文件

1)配置软电话,使用inband模式

 2)用会议室模拟通话过程的DTMF按键

conference test bgdial user/1001
conference test bgdial user/1002

1001按键,在会议室的1002可以听见按键音(按键值:123456789*0#)。

3)执行会议室录音

命令如下:

conference test recording start /tmp/dtmf-fs.wav

这里描述下大概流程,如果想直接使用导出的音频文件(dtmf-fs.wav),可从如下渠道获取:

关注微信公众号(聊聊博文,文末可扫码)后回复 20240803 获取。

三、python解析wav文件获取DTMF按键值

在GitHub上找到一个解析dtmf的库:

https://github.com/ribt/dtmf-decoder

 如果无法打开,可从文末提供的渠道获取下载的源码压缩包。

其核心是 dtmf.py 文件,运行效果如下:

 也可直接使用我修改过的代码(dtmf2.py):

完整代码可从如下渠道获取:

关注微信公众号(聊聊博文,文末可扫码)后回复 20240803 获取。

运行效果如下:

四、资源下载

本文涉及源码及相关文件,可从如下途径获取:

关注微信公众号(聊聊博文,文末可扫码)后回复 20240803 获取。

 好,就这么多了,别忘了点赞哈! 

posted on 2024-08-03 11:39  Mike_Zhang  阅读(124)  评论(0编辑  收藏  举报