python - 如何从特定目录或文件夹导入预下载的 MNIST 数据集?

标签 python tensorflow machine-learning deep-learning mnist

我已经从 LeCun 网站下载了 MNIST 数据集。我想要的是编写 Python 代码以提取 gzip 并直接从目录中读取数据集,这意味着我不必再下载或访问 MNIST 站点。

欲望过程: 访问文件夹/目录 --> 解压 gzip --> 读取数据集(一次热编码)

怎么做?由于几乎所有教程都必须访问 LeCun 或 Tensoflow 站点才能下载和阅读数据集。提前致谢!

最佳答案

这个tensorflow调用

from tensorflow.examples.tutorials.mnist import input_data
input_data.read_data_sets('my/directory')

...如果您已经有文件,则不会下载任何内容

但是如果出于某种原因你想自己解压它,你可以这样做:

from tensorflow.contrib.learn.python.learn.datasets.mnist import extract_images, extract_labels

with open('my/directory/train-images-idx3-ubyte.gz', 'rb') as f:
  train_images = extract_images(f)
with open('my/directory/train-labels-idx1-ubyte.gz', 'rb') as f:
  train_labels = extract_labels(f)

with open('my/directory/t10k-images-idx3-ubyte.gz', 'rb') as f:
  test_images = extract_images(f)
with open('my/directory/t10k-labels-idx1-ubyte.gz', 'rb') as f:
  test_labels = extract_labels(f)

关于python - 如何从特定目录或文件夹导入预下载的 MNIST 数据集?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48257255/

相关文章:

python - Python 中的安全表达式解析器

C++ Eigen : dynamic tensor

opencv - 如何分割图像,使结果只是分割的图像(没有任何背景)

hadoop - 当本地模式下数据不适合 RAM 时,如何设置 Apache Spark 以使用本地硬盘?

Python - 我可以将文件分成几部分上传到服务器吗?

python - 如何旋转 x 轴标签

Tensorflow,Tensorflow 服务 : Multiple inputs for SavedModel signature

python - tensorflow 中的二进制阈值激活函数

amazon-web-services - 在AWS上加载预训练模型

Python 数据框复制切片警告