audio - 我需要分析许多音频WAV文件中的特征性噪声，想法吗？

我需要能够分析(搜索)成百上千个WAV文件，并检测但不能消除静态噪声。像现在所做的那样，我必须听每个对话并手动找到特征性的噪音/静电，这会花费太多时间。理想情况下，我需要一个程序，该程序可以读取每个新的WAV文件并能够检测静态噪声的特征信号，例如白噪声或整个音频频带的突发周期，高振幅噪声(例如电话通话中的AM radio 噪声等)。 (如白噪声的墙壁)或在正常语音背景下发出的尖锐的高频高振幅(如电话线上的crack啪声)。我不需要消除噪音，而只需检测一下并标记录音以进行进一步的故障排除。有想法吗？

我可以听录音并找到静态或or啪声，但这需要时间。我需要一个可以自动运行并标记有问题的电话录音(电话PBX的WAV文件)的自动化或批处理过程。这些是SIP和模拟对话，具体取决于对话的内容，因此可以选择RTSP / SIP数据包分析，但原始WAV文件是最简单的。我可以使用Audacity，但这仍然需要打开每个文件并查看音频光谱的视觉表示，并且比收听每个 call 仅快一点，但仍然很麻烦。

我目前没有此任务的代码或方法。我只是听每个调用wav文件来查找噪音。

我需要一个批处理的Wav文件搜索，该搜索可以呈现wav文件录音，其中包含录音电话通话中的特征性噪声，静态或or啪声。

最佳答案

除非您能告诉程序噪音如何，否则运行任何类型的批处理都将是一个挑战。我面临着类似的挑战，这促使我开发(免费和开源)软件来帮助用户进行音频探索，分析和信号分离:

应用程序:https://audioexplorer.online/

文件:https://tracek.github.io/audio-explorer/

源代码:https://github.com/tracek/audio-explorer

本质上，它可以将音频可视化为二维散点图，而不是像波形或频谱图那样仅显示“线性”。当您上传音频时，会发生以下情况:

根据您设置的阈值检测到发病(基于aubio的高频内容算法)。如果需要全部设置为None。

对于每个音频片段，请根据您的选择来计算音频功能。没有通用的最佳功能集，所有功能都取决于应用程序。您可以尝试使用Pitch statistics。考虑为带通滤波器和样本长度(这是我们将要使用的音频片段的长度)设置适当的值。样本长度可以在将来动态建立。检查docs了解更多信息。

结果是，对于每个片段，您都有许多功能，例如6或60。这意味着我们具有k -Dimension(其中k是要素数量)结构，然后使用您选择的降维算法将其投影到2d空间。均匀歧管逼近和投影是一个不错的选择。

从理论上讲，最终的嵌入应使相似的声音(根据我们选择的功能)紧密地在一起，而彼此之间的距离则要远一些。现在，您的噪音应该与“非噪音”和表格簇分开了。

将鼠标悬停在图形上方时，在右上角会显示一组图标。一种是套索选择。用它来标记点，检查频谱图和下载表，其中包含描述该信号的功能。那时，您还可以以类似于Audacity的方式降低噪声(出现额外的按钮)-它分析频谱并通过某种平滑降低这些频率。

它现在不能完全解决您的问题，但是可能会大大减少工作量。一天中要花很多时间进行数百次wave，但是您会成功的。想要自动化吗？我正在同时开发CLI(命令行界面)。在不太遥远的将来，它应该采用您标记为噪声和信号的内容，然后使用监督式机器学习以批处理模式遍历所有内容。

建议/反馈？在GitHub上发布问题。

关于audio - 我需要分析许多音频WAV文件中的特征性噪声，想法吗？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/56370564/

audio - 我需要分析许多音频WAV文件中的特征性噪声，想法吗？

上一篇：elasticsearch - 覆盖Elasticsearch的默认关键字分析

下一篇：powershell - 十六进制到十进制转换-PowerShell 5