python - 如何将梅尔频谱图转换为对数缩放梅尔频谱图

标签 python audio speech-recognition spectrogram librosa

我正在使用卷积神经网络阅读有关环境噪声识别的this paper，并希望重现其结果。他们将WAV文件转换为对数比例的梅尔频谱图。你怎么做到这一点？我能够将WAV文件转换为梅尔频谱图

y, sr = librosa.load('audio/100263-2-0-117.wav',duration=3)
ps = librosa.feature.melspectrogram(y=y, sr=sr)
librosa.display.specshow(ps, y_axis='mel', x_axis='time')

我还可以将其显示为对数刻度的频谱图:

librosa.display.specshow(ps, y_axis='log', x_axis='time')

显然，它们看起来不同，但是实际的频谱图ps是相同的。使用librosa，如何将此质谱图转换为对数刻度的质谱图？ 此外，对数原始频谱图的对数缩放频谱图有什么用途？只是为了减小频域的方差以使其与时间轴可比，还是其他？

最佳答案

librosa.power_to_db应该这样做，看看

关于python - 如何将梅尔频谱图转换为对数缩放梅尔频谱图，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/48692687/

上一篇：powershell - PowerShell Get-ChildItem完整路径被截断

下一篇：php - 我无法通过PHP使用Powershell脚本制作Word文件

相关文章：

python - 如何将 mp3 转换为 ogg python

javascript - Firefox 中的语音识别

离线Android语音 Activity 检测

android - 在 AudioTrack.MODE_STATIC 中使用 AudioTrack？

Java - 如何区分 2 个具有 1 个端口的麦克风

nlp - Dialogflow 无法识别训练短语中的名称

python - 静态文件在生产中加载但不在开发中

python深拷贝和浅拷贝并传递引用

python - 使用组标签 ?P<> 正则表达式到字典

python - 如何在 pandas python> 中获取数据框中三列的所有组合