python - 将窗口函数应用于librosa中的框架

标签 python audio speech-recognition librosa

我目前正在ASR系统上工作,但是我忘记对每个帧应用窗口功能。我正在提取,这可能是导致我收到不良结果的原因。但这可能是librosa吗?

我在librosa文档中找不到此选项。

我需要在每个帧上应用一个汉明窗,将其提取出来。

   for fp in file_paths:
        y,sr = librosa.load(fp,sr=16000)
        X = librosa.util.frame(y, frame_length=400, hop_length=160)

最佳答案

Librosa使用scipy.signal:

window = scipy.signal.hann(win_length, sym=False)

# Reshape so that the window can be broadcast
window = window.reshape((-1, 1))

windowed = fft_window * X

Here,您可以了解librosa内部的操作方式。

但是,为什么不使用librosa.stftlibrosa.mfcc呢?它将完成您需要的一切。

关于python - 将窗口函数应用于librosa中的框架,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41353821/

相关文章:

javascript - 录音机组件

python - 如何通过pyspeech或dragonfly输入和处理音频文件以转换为文本

python - 从大型存储库到文件的关键字匹配

python - 重音字符的 Bash 背景颜色更改

python - 仅从数据框中返回空白或零值

.net - System.Speech.Recognition 和 Microsoft.Speech.Recognition 之间有什么区别?

android - 为什么我使用 SpeechRecognizer 的 Android 应用在升级到 Android 12 后停止工作?

python - 将 Unicode 转换为等效 ASCII (SCRAPY)

audio - 在调整音量的同时将两个音频文件与sox合并

java - 在来电 Android 中打开扬声器