audio - FFT可以用于查找音频文件中的鼓独奏/断点吗?

标签 audio signal-processing fft

使用FFT是否可以在音频文件中找到鼓独奏或断鼓? FFT可以做到这一点吗?在线上有什么资源可以帮助我学习吗?

最佳答案

通常,FFT不是检测敲击声开始的好选择:

  • 总是在样本窗口(实际上是一段时间)内计算FFT,并产生bin内信号的幅度及其相位偏移。因此,您可以确定该特定仓位处有信号,但没有确定其开始时间。可用的最佳时间分辨率是窗口时段。当然,您可以缩短周期,但会牺牲频率分辨率。
  • 打击乐器的声音看起来像是噪音,并散布在整个频谱中。如果您只有敲击声,但在现实的复音内容中却不是很好,那就可以了。

  • 但是,您可能可以从鼓独奏与轨道乐器部分的频谱的不同特征中找到一些推断。

    在学术期刊中将查找打击乐声音开始的时间的问题在学术期刊中描述为起步检测,这是用于特征提取的许多技术之一。更广泛的 Realm 被称为音乐信息检索。您的问题听起来像是识别音频文件中的部分之一,这可能被描述为分区

    一个很好的起点是Sonic Visualiser,它是专门为MIR应用程序编写的工具。存在用于各种类型的特征提取的插件。通过这些,您将可以轻松找到该 Realm 的大量学术著作。另外一个好处是现有的插件也都是开源的。

    关于audio - FFT可以用于查找音频文件中的鼓独奏/断点吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15905105/

    相关文章:

    iphone - 反转来自麦克风的音频

    audio - GStreamer - 从 MP4 文件生成音频波形

    java - 每次使用 Processing 和 Beads 运行 FFT 时都会得到不同的结果

    c - 增加不同频率信号的输出

    algorithm - 从哪里获得 vp8 编码算法的算法?(至少是基本配置文件)

    javascript - 为什么 getFloatFrequencyData 返回的值为负数?

    fft - 亲吻 FFT 线程安全

    c++ - 从 libav 收集解码的音频作为 double

    iPhone iOS7系统声音(铃声和提醒)音量控制

    python - 在 AudioLazy 库中从 python 中的 zfilter 对象中提取数值