audio - 从音频文件中删除相同的音频部分

作为一名收藏家，我拥有从播客服务下载的数千个音频文件。所有提要都以 15 秒的相同介绍开始。这对我来说很烦人，所以我尝试将它们全部裁剪。

但它们都不是规则的。语音演示完全相同，但其中一些...

...从 00:00 或 00:05 或我们不知道的任何秒开始

...启动时没有介绍

我无法确定应该裁剪哪几秒。

问题:我们如何根据特定的音频剪辑裁剪所有音频文件？

用其他说法“检测相同的部分并删除它”？

最佳答案

据我了解，您已经有办法在特定点裁剪文件。所以问题归结为找出每个剪辑中介绍的结束位置。这是我的做法:

首先，手动将介绍音频隔离在单独的文件/缓冲区中。

对于每个剪辑，您需要确定在剪辑中出现介绍音频的位置。通过计算 cross-correlation 来做到这一点在介绍音频和主要剪辑之间。正确的偏移量将是具有最高相关系数的偏移量。 (您也可以在均值差中寻找最小值，这是等效的。)

一旦你知道介绍音频的位置，你就可以计算你的裁剪位置。

有一些明显的优化:

仅在每个剪辑的前(例如)30 秒内搜索介绍音频。

不要搜索整个介绍音频，只搜索最后 1/2 秒。

如果您不能 100% 确定音频是否存在，您可能需要设置接受阈值。

关于audio - 从音频文件中删除相同的音频部分，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/23747486/

相关文章：

audio - .wav 样本的解释