machine-learning - ResNet架构中如何计算梯度?

标签 machine-learning neural-network deep-learning

我假设每层的梯度都是 0.1。图层的绘制/堆栈网络的梯度可以通过累积梯度来计算: enter image description here

在ResNet中,梯度是通过跳跃连接来传播的。那么,如何才能实现如上图所示的x的渐变效果呢?是0.1x0.1+0.1还是0.1

最佳答案

enter image description here

上图中添加了梯度计算。梯度delta_x是传入梯度delta_y的总和以及梯度delta_ydelta_F的乘积。

所以在你的例子中,它应该是0.1x0.1x0.1+0.1。

但请注意,在 delta_F 的实际计算中,delta_y 乘以 weight_1 并获得通过/阻止 code> 取决于 ReLu 是否处于事件状态,然后乘以 weights_2

关于machine-learning - ResNet架构中如何计算梯度?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44512126/

相关文章:

machine-learning - 为什么神经网络的权重应该初始化为随机数?

python - 比较 2 个 ML 模型的性能准确性之间的差异是否具有统计显着性

machine-learning - 如何在训练时向 CNN 添加额外参数

tensorflow - 如何使用FFT和神经网络对声音进行分类?我应该使用 CNN 还是 RNN?

machine-learning - 学习率对神经网络的影响

python - 在加载 Keras 保存模型时,是否有人得到 "AttributeError: ' str' 对象没有属性 'decode'"

tensorflow - 如何在机器学习中训练模型以从图像中去除背景

r - 如何使用像素矩阵将多个图像定位在同一个绘图上

python - 具有多个输入的 TensorFlow 自定义层中构建方法的 Input_shape

matlab - 在 MATLAB 中训练简单神经网络时出现错误