我需要能够分析(搜索)成百上千个WAV文件,并检测但不能消除静态噪声。像现在所做的那样,我必须听每个对话并手动找到特征性的噪音/静电,这会花费太多时间。理想情况下,我需要一个程序,该程序可以读取每个新的WAV文件并能够检测静态噪声的特征信号,例如白噪声或整个音频频带的突发周期,高振幅噪声(例如电话通话中的AM radio 噪声等)。 (如白噪声的墙壁)或在正常语音背景下发出的尖锐的高频高振幅(如电话线上的crack啪声)。我不需要消除噪音,而只需检测一下并标记录音以进行进一步的故障排除。有想法吗?
我可以听录音并找到静态或or啪声,但这需要时间。我需要一个可以自动运行并标记有问题的电话录音(电话PBX的WAV文件)的自动化或批处理过程。这些是SIP和模拟对话,具体取决于对话的内容,因此可以选择RTSP / SIP数据包分析,但原始WAV文件是最简单的。我可以使用Audacity,但这仍然需要打开每个文件并查看音频光谱的视觉表示,并且比收听每个 call 仅快一点,但仍然很麻烦。
我目前没有此任务的代码或方法。我只是听每个调用wav文件来查找噪音。
我需要一个批处理的Wav文件搜索,该搜索可以呈现wav文件录音,其中包含录音电话通话中的特征性噪声,静态或or啪声。
最佳答案
除非您能告诉程序噪音如何,否则运行任何类型的批处理都将是一个挑战。我面临着类似的挑战,这促使我开发(免费和开源)软件来帮助用户进行音频探索,分析和信号分离:
本质上,它可以将音频可视化为二维散点图,而不是像波形或频谱图那样仅显示“线性”。当您上传音频时,会发生以下情况:
None
。 Pitch statistics
。考虑为带通滤波器和样本长度(这是我们将要使用的音频片段的长度)设置适当的值。样本长度可以在将来动态建立。检查docs了解更多信息。 k
-Dimension(其中k
是要素数量)结构,然后使用您选择的降维算法将其投影到2d空间。均匀歧管逼近和投影是一个不错的选择。 它现在不能完全解决您的问题,但是可能会大大减少工作量。一天中要花很多时间进行数百次wave,但是您会成功的。想要自动化吗?我正在同时开发CLI(命令行界面)。在不太遥远的将来,它应该采用您标记为噪声和信号的内容,然后使用监督式机器学习以批处理模式遍历所有内容。
建议/反馈?在GitHub上发布问题。
关于audio - 我需要分析许多音频WAV文件中的特征性噪声,想法吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56370564/