音频分析以检测低音量时段

标签 audio wav analysis volume detect

我有一系列音频文件(它们目前都是 wav 和 mp3)。这些文件由哔哔声、暂停和一个人的回复组成。我需要找出哔哔声和回复人之间的 react 时间。有很多数据,所以我想制作一个可以为我做这件事的程序。有谁知道这可以用什么语言完成,或者知道任何现有的程序可以做到这一点。我查看了 python 中的 wave 工具,似乎找不到任何代表低时刻的数据。

我的程序是这样运行的:

wav = open(wave file)
chunk = getNextChunk(wav)
volume = analyse(chunk)
check against threshold
if silent period, check for loud period
find difference
log time in seconds

任何人都可以帮我解决这个问题,我知道这是一个非常开放的问题,但我不知道从哪里开始,我已经在 java 和 python 等中编程过,但会使用最好的,与声音格式相同。将文件制作成单声道会更好吗?

谢谢你的帮助!

最佳答案

至于您选择的语言,我个人会选择 Matlab。但是它要花钱,而且由于您已经有使用 python 的经验,因此 numpy 模块可能对您来说是正确的选择。

根据您对问题的描述,这可能是一种方法:

  • 加载 wav
  • 使用快速时间常数查找包络和平滑
  • 阈值
  • 找时间发出哔哔声
  • 找时间回复
  • 计算差异

  • 去单声道会很好,同时减少你的数据量。

    关于音频分析以检测低音量时段,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14385655/

    相关文章:

    audio - 无论音频源如何,如何在iOS上采样音频流以进行可视化?

    html - 无法在 safari 上播放 wav 文件

    c++ - 在 win32 上将 wav 文件解码为 raw

    header - 为什么整数字节向后存储?这仅适用于标题吗?

    algorithm - 2^n 复杂度算法

    c++ - 两个输入函数的 T(n) 运行时间

    html - 播放实时音频流 - html5

    javascript - 查找上传到React应用程序的音频文件的持续时间/长度

    iphone - 是否有适用于iOS的实时线性相位均衡器?

    algorithm - 我可以对这个递推关系使用大师定理吗?