python3解析wav文件获取dtmf值
操作系统 :Windows 10_x64
Python版本:3.9.2
从事FreeSwitch相关工作,大概率会遇得到DTMF,DTMF的传递方式有三种:- In-band
- RFC2833
- SIP-INFO
使用RFC2833或SIP-INFO传递方式的DTMF,FreeSwitch可以在日志中打印出来,但遇到inband模式的DTMF,FreeSwitch的日志就打印不出来了。
如果是会议场景,使用In-band模式(比如固话)发送DTMF,DTMF按键的声音和音频流混合在一起发送到对端:
1)在传输过程转换为2833格式dtmf后,会添加2833格式的DTMF按键信息,混合在音频流里面的DTMF按键未移除;2)会出现在会议系统中可以听到座机传来的DTMF按键音。
这个问题目前没有比较好的解决办法,这里记录一下。但这个问题引发了我的思考:
In-band模式的DTMF能识别吗?如果可以识别,怎么识别?
今天整理下In-band模式DTMF识别的笔记。我将从以下几个方面进行展开:
DTMF介绍
如何生成包含DTMF按键音的wav文件
如何使用python脚本解析wav文件获取DTMF按键值
运行效果截图及配套资源下载
一、DTMF介绍
DTMF信号即双音多频信号,网上介绍的资料比较多,这里主要关注的是频率信息,可以参考下pypi上关于DTMF的介绍:
https://pypi.org/project/dtmf/
二、生成包含DTMF按键音的wav文件
1、使用Audacity生成wav文件
Audacity版本:3.1.3这里使用Audacity进行噪音文件的生成,如果不了解Audacity软件,可参考这篇文章:
1)选择"生成->DTMF音..."
2)生成0123456789音频
3)导出音频
这里使用8000hz导出音频。
如果想直接使用导出的音频文件(dtmf-au.wav),可从如下渠道获取:
2、使用软电话模拟inband模式生成wav文件
1)配置软电话,使用inband模式
2)用会议室模拟通话过程的DTMF按键
conference test bgdial user/1001
conference test bgdial user/1002
1001按键,在会议室的1002可以听见按键音(按键值:123456789*0#)。
3)执行会议室录音
命令如下:
conference test recording start /tmp/dtmf-fs.wav
这里描述下大概流程,如果想直接使用导出的音频文件(dtmf-fs.wav),可从如下渠道获取:
三、python解析wav文件获取DTMF按键值
在GitHub上找到一个解析dtmf的库:
https://github.com/ribt/dtmf-decoder
如果无法打开,可从文末提供的渠道获取下载的源码压缩包。
其核心是 dtmf.py 文件,运行效果如下:
也可直接使用我修改过的代码(dtmf2.py):
完整代码可从如下渠道获取:
运行效果如下:
四、资源下载
本文涉及源码及相关文件,可从如下途径获取:
好,就这么多了,别忘了点赞哈!