我正在尝试使用 PyTorch 制作反向传播神经网络。我可以成功执行并测试其准确性,但它的工作效率不是很高。现在,我应该通过为神经元设置不同的激活规则来提高其效率,以便将那些对最终输出没有贡献的神经元从计算中排除(修剪),从而提高时间和准确性。
我的代码如下所示(提取的片段)-
# Hyper Parameters
input_size = 20
hidden_size = 50
num_classes =130
num_epochs = 500
batch_size = 5
learning_rate = 0.1
# normalise input data
for column in data:
# the last column is target
if column != data.shape[1] - 1:
data[column] = data.loc[:, [column]].apply(lambda x: (x - x.mean()) / x.std())
# randomly split data into training set (80%) and testing set (20%)
msk = np.random.rand(len(data)) < 0.8
train_data = data[msk]
test_data = data[~msk]
# define train dataset and a data loader
train_dataset = DataFrameDataset(df=train_data)
train_loader = torch.utils.data.DataLoader(train_dataset, batch_size=batch_size, shuffle=True)
# Neural Network
class Net(nn.Module):
def __init__(self, input_size, hidden_size, num_classes):
super(Net, self).__init__()
self.fc1 = nn.Linear(input_size, hidden_size)
self.sigmoid = nn.Sigmoid()
self.fc2 = nn.Linear(hidden_size, num_classes)
def forward(self, x):
out = self.fc1(x)
out = self.sigmoid(out)
out = self.fc2(out)
return out
net = Net(input_size, hidden_size, num_classes)
# train the model by batch
for epoch in range(num_epochs):
for step, (batch_x, batch_y) in enumerate(train_loader):
# convert torch tensor to Variable
X = Variable(batch_x)
Y = Variable(batch_y.long())
# Forward + Backward + Optimize
optimizer.zero_grad() # zero the gradient buffer
outputs = net(X)
loss = criterion(outputs, Y)
all_losses.append(loss.data[0])
loss.backward()
optimizer.step()
if epoch % 50 == 0:
_, predicted = torch.max(outputs, 1)
# calculate and print accuracy
total = predicted.size(0)
correct = predicted.data.numpy() == Y.data.numpy()
print('Epoch [%d/%d], Step [%d/%d], Loss: %.4f, Accuracy: %.2f %%' % (epoch + 1, num_epochs, step + 1, len(train_data) // batch_size + 1, loss.data[0], 100 * sum(correct)/total))
有人可以告诉我如何在 PyTorch 中执行此操作,因为我对 PyTorch 非常陌生。
最佳答案
我不确定这个问题是否应该出现在 stackoverflow 上,但无论如何我都会给你一个提示。您目前正在使用 sigmoid 激活函数,如果输入值太大或太小,其梯度就会消失。常用的方法是使用 ReLU 激活函数(代表修正线性单元)。
ReLU(x) 是正域的恒等式,0 是负域的恒等式,在 Python 中可以写成如下:
def ReLU(x):
if(x > 0):
return x
else:
return 0
它应该可以在 PyTorch 中轻松使用
关于python - PyTorch - 如何设置神经元的激活规则以提高神经网络的效率?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/50014365/