audio - 从音频文件中删除相同的音频部分

标签 audio audio-processing audacity

作为一名收藏家,我拥有从播客服务下载的数千个音频文件。所有提要都以 15 秒的相同介绍开始。这对我来说很烦人,所以我尝试将它们全部裁剪。

但它们都不是规则的。语音演示完全相同,但其中一些...

  • ...从 00:00 或 00:05 或我们不知道的任何秒开始
  • ...启动时没有介绍

  • 我无法确定应该裁剪哪几秒。

    问题:我们如何根据特定的音频剪辑裁剪所有音频文件?

    用其他说法“检测相同的部分并删除它”?

    最佳答案

    据我了解,您已经有办法在特定点裁剪文件。所以问题归结为找出每个剪辑中介绍的结束位置。这是我的做法:

  • 首先,手动将介绍音频隔离在单独的文件/缓冲区中。
  • 对于每个剪辑,您需要确定在剪辑中出现介绍音频的位置。通过计算 cross-correlation 来做到这一点在介绍音频和主要剪辑之间。正确的偏移量将是具有最高相关系数的偏移量。 (您也可以在均值差中寻找最小值,这是等效的。)
  • 一旦你知道介绍音频的位置,你就可以计算你的裁剪位置。

  • 有一些明显的优化:
  • 仅在每个剪辑的前(例如)30 秒内搜索介绍音频。
  • 不要搜索整个介绍音频,只搜索最后 1/2 秒。
  • 如果您不能 100% 确定音频是否存在,您可能需要设置接受阈值。
  • 关于audio - 从音频文件中删除相同的音频部分,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23747486/

    相关文章:

    audio - .wav 样本的解释

    angularjs - Angular $ sce阻止了我的音频src,尝试了$ sce.trustAsResourceUrl,但仍然出现错误

    javascript - 如何检测音频在网页中播放完毕?

    c - 枚举捕获 ALSA 设备并从中捕获

    matlab - 使用 FFT、PSD 和 STFT 进行音频特征提取并查找最强大的频率

    react-native - React Native - 聆听特定的声音输入 - Vroom of Car

    algorithm - 两个音频序列之间的感知相似度

    macos - Sphinx-4的WAV音频录制失败

    audio - 我可以使用Tensorflow使用旧模型训练新数据吗?