我已经从 LeCun 网站下载了 MNIST 数据集。我想要的是编写 Python 代码以提取 gzip 并直接从目录中读取数据集,这意味着我不必再下载或访问 MNIST 站点。
欲望过程: 访问文件夹/目录 --> 解压 gzip --> 读取数据集(一次热编码)
怎么做?由于几乎所有教程都必须访问 LeCun 或 Tensoflow 站点才能下载和阅读数据集。提前致谢!
最佳答案
这个tensorflow调用
from tensorflow.examples.tutorials.mnist import input_data
input_data.read_data_sets('my/directory')
...如果您已经有文件,则不会下载任何内容。
但是如果出于某种原因你想自己解压它,你可以这样做:
from tensorflow.contrib.learn.python.learn.datasets.mnist import extract_images, extract_labels
with open('my/directory/train-images-idx3-ubyte.gz', 'rb') as f:
train_images = extract_images(f)
with open('my/directory/train-labels-idx1-ubyte.gz', 'rb') as f:
train_labels = extract_labels(f)
with open('my/directory/t10k-images-idx3-ubyte.gz', 'rb') as f:
test_images = extract_images(f)
with open('my/directory/t10k-labels-idx1-ubyte.gz', 'rb') as f:
test_labels = extract_labels(f)
关于python - 如何从特定目录或文件夹导入预下载的 MNIST 数据集?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48257255/