matlab - FitSCVM - 多个类,28x28 0 到 1 之间的数字矩阵

标签 matlab machine-learning

我需要使用SVM将28x28矩阵区分为9类。有 60,000 个训练输入和 10,000 个测试输入。

我目前的计划如下:

clear;
load mnist.mat
xtest = xtest ./ 255; <--- Normalizing the data
xtrain = xtrain ./ 255;

SVMModels = cell(9,1);
classes = unique(ytrain);
rng(1); % For reproducibility
blah = fitcsvm(xtrain, ytrain);


for j = 1:numel(classes);
    indx = strcmp(ytrain,classes(j)); % Create binary classes for each classifier
    SVMModels{j} = fitcsvm(xtrain,indx, 'KernelFunction','rbf','BoxConstraint',1);
end

我认为问题是由于输入为 28x28 造成的。我该如何解决这个问题?

其他信息:

xtest: 28x28x10000
ytest = 1x10000
xtrain = 28x28x60000
ytrain = 1x60000

最佳答案

你是对的。 fitcsvm要求输入训练示例是一个 N x P 矩阵,其中 N 是样本总数,P 是特征总数。在您的情况下,您需要做的是 reshape 您的数组,以便xtrainxtest60000 x 784。 784 是由于 28 x 28。具体来说,您必须展开 3D 矩阵的每个切片,使其适合单个向量。同样,类标签必须为 N x 1,因此您只需转置 ytrainytest

要实现所需的 reshape ,您可以使用 reshape像这样:

xtrain_final = reshape(xtrain, 784, 60000).'; %'
xtest_final = reshape(xtest, 784, 60000).'; %'
ytrain_final = ytrain.'; %'
ytest_final = ytest.'; %'

现在训练和测试示例的 reshape 有点奇怪。 MATLAB 在 reshape 时的工作原理是,它以列为主为基础执行此操作。这意味着当您 reshape 时,一次需要列才能产生结果。因此,由于您的矩阵为 28 x 28 x 60000,因此 3D 矩阵的每个切片均为 28 x 28。因此,为了方便列主要排序,您需要获取每个 2D 切片并将其拟合到单个列。因此,您将拥有 60000 列,对应于 60000 个训练示例。您现在需要做的最后一件事是转置此结果以获得 fitcsvm 所需的内容。

现在完成了,您可以训练您的模型。

关于matlab - FitSCVM - 多个类,28x28 0 到 1 之间的数字矩阵,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33419217/

相关文章:

c++ - 为什么单纯的C++矩阵乘法比BLAS慢100倍?

c++ - 如何使用法 vector (在 matlab 中)从点云中删除隐藏点?

azure - Azure 机器学习端点的 API key

java - java中的文本分类库

machine-learning - 地理空间机器学习的人口抽样

r - 将 PCA 预处理参数传递给 train()

matlab - 使用 arrayfun 输出一行的向量化函数,返回一个矩阵

matlab - 如何在 MATLAB 中绘制通过大多数给定点的完美直线?

python - 在tensorflow 2中找不到Tensorflow模块,在哪里可以找到新方法的文档?

MATLAB R2014b : Rendering plots with lines in the same place