dataset - Libsvm 数据集格式中样本的含义(特别是 Mnist)

我从 Libsvm's dataset page 下载了 Mnist 数据集。所有样本如下:

5 153:3 154:18 155:18 156:18 157:126 ...

有人知道这是什么意思吗？ 5 是类标签，但是 153:3 对例如是什么？我也找不到 mnist's own web page 的含义.

最佳答案

这是libsvm编码(稀疏)向量的方式。正如您所说的 5 是标签，下面的对 i:v 表示向量的第 i 条目是 v。因此，您可以将 3 维向量 (a,b,c) 编码为

1:a 2:b 3:c

这对于密集向量来说效率低下，但对于稀疏数据来说是一种良好的既定格式。由于它是纯文本，因此存储空间不是最佳的，但对于大多数应用程序来说已经足够了。而这些文件很容易编写和读取。

关于dataset - Libsvm 数据集格式中样本的含义(特别是 Mnist)，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/7464042/

相关文章：

android - 支持向量机预测方法