在 pytorch 网站上,他们的教程中有以下模型
class BasicCNN(nn.Module):
def __init__(self):
super(BasicCNN, self).__init__()
self.conv1 = nn.Conv2d(3, 6, 5)
self.pool = nn.MaxPool2d(2, 2)
self.conv2 = nn.Conv2d(6, 16, 5)
self.fc1 = nn.Linear(16 * 5 * 5, 120)
self.fc2 = nn.Linear(120, 84)
self.fc3 = nn.Linear(84, 10)
def forward(self, x):
x = x.permute(0, 3, 1, 2)
x = self.pool(F.relu(self.conv1(x)))
x = self.pool(F.relu(self.conv2(x)))
x = x.view(-1, 16 * 5 * 5)
x = F.relu(self.fc1(x))
x = F.relu(self.fc2(x))
x = self.fc3(x)
return x
该模型有多少个内核/过滤器?是两个吗 - 例如 conv1 和 conv2。如何通过指定过滤器的数量轻松创建多个过滤器?例如 100 个过滤器。
谢谢!
最佳答案
你的问题有点含糊,但让我尝试回答一下。
通常,在卷积层中,我们将滤波器的数量设置为out_channels
的数量。但这并不简单。让我们根据您提供的示例进行讨论。
What are the convolutional layer parameters?
model = BasicCNN()
for name, params in model.named_parameters():
if 'conv' in name:
print(name, params.size())
输出:
conv1.weight torch.Size([6, 3, 5, 5])
conv1.bias torch.Size([6])
conv2.weight torch.Size([16, 6, 5, 5])
conv2.bias torch.Size([16])
Explanation
让我们考虑上述模型中的 conv1
层。我们可以说,有 6 个形状为 5 x 5
的滤波器,因为我们选择了 2d 卷积。由于输入 channel 数为 3,因此总共有 6 x 3 = 18 个内核。
这里,该模型的输入是类似 3D 的图像。您可以考虑,我们有形状为 W x H
的图像,并且图像有 3 个 channel (RGB)。因此,我们可以将表示图像的 3d 张量提供给该模型。
现在回到您的问题,“如何通过指定数量轻松创建多个过滤器?例如 100 个过滤器。”。如果您只想在每个输入 channel 使用 100 个过滤器,则只需在 conv1
中设置 100,而不是 6
。这通常是人们在计算机视觉中所做的事情!
但是您绝对可以根据需要修改架构并确定最佳设置。
关于python - 如何在pytorch中定义具体数量的卷积核/过滤器?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56030884/