我需要使用SVM将28x28矩阵区分为9类。有 60,000 个训练输入和 10,000 个测试输入。
我目前的计划如下:
clear;
load mnist.mat
xtest = xtest ./ 255; <--- Normalizing the data
xtrain = xtrain ./ 255;
SVMModels = cell(9,1);
classes = unique(ytrain);
rng(1); % For reproducibility
blah = fitcsvm(xtrain, ytrain);
for j = 1:numel(classes);
indx = strcmp(ytrain,classes(j)); % Create binary classes for each classifier
SVMModels{j} = fitcsvm(xtrain,indx, 'KernelFunction','rbf','BoxConstraint',1);
end
我认为问题是由于输入为 28x28 造成的。我该如何解决这个问题?
其他信息:
xtest: 28x28x10000
ytest = 1x10000
xtrain = 28x28x60000
ytrain = 1x60000
最佳答案
你是对的。 fitcsvm
要求输入训练示例是一个 N x P 矩阵,其中 N 是样本总数,P 是特征总数。在您的情况下,您需要做的是 reshape 您的数组,以便xtrain
和xtest
为60000 x 784
。 784 是由于 28 x 28
。具体来说,您必须展开 3D 矩阵的每个切片,使其适合单个向量。同样,类标签必须为 N x 1
,因此您只需转置 ytrain
和 ytest
。
要实现所需的 reshape ,您可以使用 reshape
像这样:
xtrain_final = reshape(xtrain, 784, 60000).'; %'
xtest_final = reshape(xtest, 784, 60000).'; %'
ytrain_final = ytrain.'; %'
ytest_final = ytest.'; %'
现在训练和测试示例的 reshape 有点奇怪。 MATLAB 在 reshape 时的工作原理是,它以列为主为基础执行此操作。这意味着当您 reshape 时,一次需要列才能产生结果。因此,由于您的矩阵为 28 x 28 x 60000
,因此 3D 矩阵的每个切片均为 28 x 28
。因此,为了方便列主要排序,您需要获取每个 2D 切片并将其拟合到单个列。因此,您将拥有 60000 列,对应于 60000 个训练示例。您现在需要做的最后一件事是转置此结果以获得 fitcsvm
所需的内容。
现在完成了,您可以训练您的模型。
关于matlab - FitSCVM - 多个类,28x28 0 到 1 之间的数字矩阵,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33419217/