python - 使用 Python 静音后在 PCM WAV 文件中查找索引

标签 python audio indexing wav

我需要能够在暂停(静音)后立即找到 WAV 片段的索引,最好以毫秒为单位。我将使用此索引来指示在前一个句子停顿后新句子的语音开始位置。我可以提供一段两三秒的片段,其中包含双方的停顿和讲话。

我看过 Python Wave 如何打开和保存文件,但我不确定如何找到相对静音后的第一个声音并获取索引。

更新:

我的目的是为圣经经文编制索引,以便用户可以选择任何经文并聆听朗读。找到第一个声音提示的索引后,我会将其倒退几十毫秒以进行导入。

谢谢

最佳答案

我在我的应用程序中使用过一次,但我从 SO 复制/粘贴了它。感谢写它的人 ;)

import wave

handle = wave.open('file', 'r')

for i in range(handle.getnframes()):
  frame = handle.readframes(i)

  zero = True

  for j in range(len(frame)):
    if ord(frame[j]) > 0:
      zero = False
      break

    if zero:
      print 'Silence found at frame {0}'.format(handle.tell())

关于python - 使用 Python 静音后在 PCM WAV 文件中查找索引,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5250841/

相关文章:

python - 将 csv(不统一)拆分为 2 个列表

缺少 Python.h header

python - 有没有办法在 Python 中指定 reduce() 累加器?

c++ - 如何在 Qt 上运行 AudioOutput 示例代码?

python - Tensorflow - 时间卷积网络不学习

java - Android 缓冲区大小和频率

iOS6 多路由音频

mysql - 创建前判断MySQL表索引是否存在

oracle - 不使用索引访问时基于函数的索引

python - 将解析后的 pdf 中的句子连接在一起