machine-learning - 语音识别需要MFCC功能吗

标签 machine-learning speech-recognition feature-selection mfcc

我目前正在开发一个语音识别项目,我正在尝试选择最有意义的特征。 大多数相关论文建议使用过零率、F0 和 MFCC 功能,因此我正在使用这些功能。 我的问题是,持续时间为 00:03 的训练样本有 268 个特征。考虑到我正在做一个多类分类项目,每类训练有 50 多个样本,包括所有 MFCC 特征,该项目可能会受到维数诅咒或“降低其他特征的重要性”的影响。 所以我的问题是,我是否应该包含所有 MFCC 功能,如果不包含,您可以建议替代方案吗?

最佳答案

你不应该使用f0和过零,它们太不稳定了。您可以简单地增加训练数据并使用 mfcc,它们具有良好的表示能力。但请记住对它们进行均值标准化。

关于machine-learning - 语音识别需要MFCC功能吗,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38833661/

相关文章:

r - 如何在 R 中使用包装特征选择算法?

python - 如何在Python中使用多标签分类器对文本进行分类?

audio - 解码带有口袋狮身人面像的8位Wave文件

Python SpeechRecognition 与 Google Cloud Speech API

speech-recognition - "Voice trigger"检测

r - 连续值特征的特征选择算法POE1ACC

python - 如何将 RFE 与 xgboost Booster 一起使用?

python-3.x - 使用 python3 给定方程的线性逼近

python - 计算损失相对于层输入的偏导数 |链式法则 | Python

python - 如何在视频游戏中赋予 AI 控制权?