关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。
想改进这个问题?将问题更新为 on-topic对于堆栈溢出。
8年前关闭。
Improve this question
您能否解释或指出正确的方法来思考如何在 wav 文件上实现两种音效。
所以我读取 wav 文件并将其转换为 int 值(在 numpy
数组中)
array([59383, 58290, 60629, ..., 52606, 51982, 56274], dtype=uint16)
首先,我不确定我是否清楚数组中的这些值真正代表什么?
每个值都是模拟输出设备在某个时刻会产生的 65535 (
unsigned int16
) 幅度级别之一,这对吗?理论上合唱效果可以通过以下步骤来实现:
value < 1
)在实践中,我不知道如何正确添加它们。我是否应该简单地一个一个地添加值,对两个数组进行卷积或交错原始数组并且它是修改后的副本。
还有合唱效果应该有任意时间延迟 我不知道我怎么能做到这一点。
我怎样才能实现我要添加的数据的随机性?
最佳答案
你基本上有正确的想法。这里有几点:
1)波形文件是线性信号与时间,所以你的理解是正确的。 (许多音频事物都是对数的,因此认为它可能是非线性的并非不合理——例如,LP 是以非线性方式编码的。)
2)如果你要做数学,首先转换为float
或 int32
这样您就不会超出 int16
的限制.
3)为了及时抵消,使用numpy切片。也就是说,类似于 new = old[1000:]+old[:-1000]
.请注意,您需要将相同长度的部分添加在一起,因此如果添加时移,则无法将其添加到完整数组中,因为时移会更短。
4)至于添加“随机时间”,您可以在上面添加一个随机时间。为了使时间在整个加法过程中不断变化,您需要扭曲原始信号,这将更加复杂。
关于python 合唱效果和音频数据的含义,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/21887862/