python - 将窗口函数应用于librosa中的框架

标签 python audio speech-recognition librosa

我目前正在ASR系统上工作，但是我忘记对每个帧应用窗口功能。我正在提取，这可能是导致我收到不良结果的原因。但这可能是librosa吗？

我在librosa文档中找不到此选项。

我需要在每个帧上应用一个汉明窗，将其提取出来。

   for fp in file_paths:
        y,sr = librosa.load(fp,sr=16000)
        X = librosa.util.frame(y, frame_length=400, hop_length=160)

最佳答案

Librosa使用scipy.signal:

window = scipy.signal.hann(win_length, sym=False)

# Reshape so that the window can be broadcast
window = window.reshape((-1, 1))

windowed = fft_window * X

Here，您可以了解librosa内部的操作方式。

但是，为什么不使用librosa.stft或librosa.mfcc呢？它将完成您需要的一切。

关于python - 将窗口函数应用于librosa中的框架，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/41353821/

上一篇：python - 如何在不打开任何媒体播放器的情况下播放声音文件？

下一篇：powershell - Powershell检查点作为作业或工作流

相关文章：

javascript - 录音机组件

python - 如何通过pyspeech或dragonfly输入和处理音频文件以转换为文本

python - 从大型存储库到文件的关键字匹配

python - 重音字符的 Bash 背景颜色更改

python - 仅从数据框中返回空白或零值

.net - System.Speech.Recognition 和 Microsoft.Speech.Recognition 之间有什么区别？

android - 为什么我使用 SpeechRecognizer 的 Android 应用在升级到 Android 12 后停止工作？

python - 将 Unicode 转换为等效 ASCII (SCRAPY)

audio - 在调整音量的同时将两个音频文件与sox合并

java - 在来电 Android 中打开扬声器