python-3.x - “Innerjoin”用python获得两个音频文件以获取重叠的音频

标签 python-3.x audio audio-processing frequency-analysis

我有两个音频文件,想在python3中将文件相互比较。

这是在x轴上具有频率的两个音频文件的示例:

Audio A

Audio B

您知道创建仅包含重叠频率的新音频文件的好方法吗? (与MySQL中的“innerjoin”相比)

要过滤和编辑我一直在使用ThinkDSP(https://github.com/AllenDowney/ThinkDSP)的音频文件

最佳答案

第1步现在暂时忽略频率重叠...并使用FFT进行音频(时域)转换,这将为您提供数据(频率域),这里您有一系列频率框,每个频率框都有一个幅度和相位移位...然后将该数据输入到逆FFT中,再次将您的数据作为音频(时域)...确认代码正常工作的好方法是您的音频输出将与您的音频输入匹配

上面的代码正常工作后,执行第2步,然后增强您的上面的代码,使值0成为没有重叠的每个频率仓(频率域)的大小(振幅)……

在第2步中,您的数据处于频域(在音频发送到FFT调用后),通常是复数数组... here is some pseudocode to parse this array

您将面临想要使用尽可能少的音频样本以获得最大程度的时间特异性的挑战(如果使用过多的音频样本,您的音频听起来会像糊糊的一样)...但是,如果您使用的音频样本太少,则频率仓的粒度将很低,这意味着您在频率域中的每个频率之间会有更大的增量

关于python-3.x - “Innerjoin”用python获得两个音频文件以获取重叠的音频,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58204432/

相关文章:

python - 如何编写代码来获取 python 列表中每个列表的最低值?

python - 如何在 tensorflow 2.0 中使用预制的密集层进行训练?

audio - 加密后测量音频文件.WAV的质量我的项目语言是VB.net

ios - 如何从麦克风实时或从 iOS 中保存的音频文件中获取原始音频帧?

audio - 我如何在嘈杂的环境中识别出独特的声音?

python - scikit-learn 中对象没有属性,如何访问它?

python-3.x - 数据流作业卡在从 Pub/Sub 读取

objective-c - 识别低频噪声中短促的高频声音(objc/c)

PHP - 流媒体的 MP3 代理

audio - 识别 "ding-dong"声音