我想用不同的声音训练我的神经网络。然而,每个声音的大小是不同的。有谁知道如何训练具有不同大小输入的神经网络?谢谢。
最佳答案
无法对不同大小的输入进行分类,但您可以将信号转换为一系列固定大小的特征向量(或转换为一系列固定大小的原始声音片段)。 对于声音,我们通常使用 MFCC 或仅使用频谱图。因此,您需要应用对序列进行操作的方法。它可以是一个循环神经网络,或者您可以采用前馈网络,然后以某种方式对每个帧的输出进行后处理。
关于machine-learning - 如何训练具有不同大小输入的神经网络?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41047916/