y, sound = scipy.io.wavfile.read('mysound.wav')
如果我绘制 sound 的绝对值,那是“mysound.wav”的幅度吗?也就是说,声音有多响?
声音中到底存储了什么?我知道这代表声音吗?如何从该表示中获得频率和幅度?
最佳答案
这不是太多的编码问题,而是与物理学有关的问题!您的sound
变量包含“瞬时振幅”列表,但我认为这不是您要查找的。如果文件是纯正弦曲线,则数据的最大值将是声音的振幅(强度)。
但是,您的声音可能会随时间变化。例如,您可以强烈弹奏乐器的音符,然后慢慢消失。因此,在短时间内定义了幅度。
声音也可以由不同的频率组成(谐波,人声...)。更完整的描述使用傅里叶变换和spectrograms。
关于python - 如何从声音文件中获取振幅和频率?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/58478470/