machine-learning - 如何为我的全连接神经网络找到合适的架构?

标签 machine-learning deep-learning neural-network

我想解决一些涉及不同大小的序列的问题,并在序列中间的某些元素上给出单位数字输出。我使用的是双向 RNN,因此我需要将从其获得的两个输出压缩为单个数字。这既是一个具体的问题,也是一个普遍的问题——我如何才能找到解决这个问题的正确的网络架构?一般来说,如何在任何问题中找到合适的全连接网络架构?因为我没有看到任何常见的全连接架构,而在计算机视觉领域,您可以使用常见的卷积架构。

最佳答案

根据我的经验,有三种方法。

  • 找到尝试解决您的问题或接近问题的人,并开始使用他的参数。如果您不满意,请开始稍微修改。
  • 尝试错误并不是很有趣,但如果你没有发现任何有用的东西,你就需要做点什么。
  • AutoML - 取决于您的计算机能力。如果你有足够的资源,那么计算机就会尝试为你的问题找到最佳架构。

关于machine-learning - 如何为我的全连接神经网络找到合适的架构?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59518520/

相关文章:

python - tf.train.ExponentialMovingAverage 和 tf.train.MomentumOptimizer 有什么区别?

python - 如何在 tensorflow 中平均一层的输出?

machine-learning - 标记数据和未标记数据有什么区别?

java - XOR Java 神经网络

python - 如何从 model.predict() 结果中获取单个值

matlab - 神经网络不适合 XOR

machine-learning - 如何学习语言模型?

tensorflow - 如何利用客户数据建立回归模型

TensorFlow:如何在supervisor.loop中使用tf.train.SummaryWriter(0.12.0rc1)

validation - 训练准确性提高但验证准确性保持不变