dataset - Libsvm 数据集格式中样本的含义(特别是 Mnist)

标签 dataset machine-learning libsvm

我从 Libsvm's dataset page 下载了 Mnist 数据集。 所有样本如下:

5 153:3 154:18 155:18 156:18 157:126 ...

有人知道这是什么意思吗? 5 是类标签,但是 153:3 对例如是什么?我也找不到 mnist's own web page 的含义.

最佳答案

这是libsvm编码(稀疏)向量的方式。正如您所说的 5 是标签,下面的对 i:v 表示向量的第 i 条目是 v。因此,您可以将 3 维向量 (a,b,c) 编码为

1:a 2:b 3:c

这对于密集向量来说效率低下,但对于稀疏数据来说是一种良好的既定格式。由于它是纯文本,因此存储空间不是最佳的,但对于大多数应用程序来说已经足够了。而这些文件很容易编写和读取。

关于dataset - Libsvm 数据集格式中样本的含义(特别是 Mnist),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7464042/

相关文章:

android - 支持向量机预测方法

c++ - 如何判断 OpenMP 是否正常工作?

python - 如何将图像文件数据集加载到 TensorFlow Jupyter Notebook

c# - DataGridView with DataTable 数据源 : how to efficiently extract selected rows?

r - 一个数据集拆分成多个数据集后如何计算?

android - 预训练的 keras 模型在 android 中返回相同的结果

python - 使用相同来源的余弦相似度和完全不同的结果

r - 传递性地映射标识符

machine-learning - 在 google colab 上运行但不适用于 kaggle 的简单代码

machine-learning - LIBSVM 过拟合