machine-learning - 语音识别需要MFCC功能吗

标签 machine-learning speech-recognition feature-selection mfcc

我目前正在开发一个语音识别项目，我正在尝试选择最有意义的特征。大多数相关论文建议使用过零率、F0 和 MFCC 功能，因此我正在使用这些功能。我的问题是，持续时间为 00:03 的训练样本有 268 个特征。考虑到我正在做一个多类分类项目，每类训练有 50 多个样本，包括所有 MFCC 特征，该项目可能会受到维数诅咒或“降低其他特征的重要性”的影响。所以我的问题是，我是否应该包含所有 MFCC 功能，如果不包含，您可以建议替代方案吗？

最佳答案

你不应该使用f0和过零，它们太不稳定了。您可以简单地增加训练数据并使用 mfcc，它们具有良好的表示能力。但请记住对它们进行均值标准化。

关于machine-learning - 语音识别需要MFCC功能吗，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/38833661/

上一篇：machine-learning - 在将数据发送到 SVM 之前应用 PCA

下一篇：r - R 中多行的一次热编码

相关文章：

r - 如何在 R 中使用包装特征选择算法？

python - 如何在Python中使用多标签分类器对文本进行分类？

audio - 解码带有口袋狮身人面像的8位Wave文件

Python SpeechRecognition 与 Google Cloud Speech API

speech-recognition - "Voice trigger"检测

r - 连续值特征的特征选择算法POE1ACC

python - 如何将 RFE 与 xgboost Booster 一起使用？

python-3.x - 使用 python3 给定方程的线性逼近

python - 计算损失相对于层输入的偏导数 |链式法则 | Python

python - 如何在视频游戏中赋予 AI 控制权？