我正在为Php或Python寻找一个可以处理音频文件的库。我需要循环播放录制的电话,并对其进行处理,以删除那些具有特定模式的电话,例如,只有嘟嘟声而不是人声。我认为通过比较音频文件中的振幅样本是可能的。你知道有什么图书馆可以提供帮助吗?
谢谢!
Python附带了标准库wave模块,可以加载和解析.wav文件;检测嘟嘟声可能比你想象的要困难一点,但并不困难。
仅包含嘟嘟声的音频可能具有相当简单的功率谱,该功率谱可以使用numpy.fft
从音频阵列中获得。
有人向我推荐pyaudiere,它可以"将声音缓冲区作为float32的NumPy数组传递"。我以前从来没有用过,你可以试一试。
我以前用过pymad,它可能有点旧,买起来很方便。