我有在不同时间开始和结束的录音。
audio 1: -----t1--------------------------s1->time
audio 2: ---------t2----s2------------------->time
audio 3: ------------------------t3-------s3->time
音频1最长,并且与音频2和3重叠。
音频2和音频3是短段,但它们根本不重叠。
是否有执行此操作的python库?
最佳答案
您可以首先使用python库读取音频文件(例如numpy或scipy,请参阅https://stackoverflow.com/a/26716031/3244382)。
然后,您必须为每个文件确定t和s。如果文件不是太吵,则音频信号的简单阈值就足够了。稍微复杂一点的方法是计算 RMS能量或包络(对信号求平均),并在其上使用阈值。
一旦知道的和 t ,就可以使用相同的音频库从该边界写入一个新的音频文件。
关于python - 对齐在不同时间开始和结束的音频文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38344701/