python - 如何在谷歌机器学习中将 jpeg 图像转换为 json 文件

标签 python json tensorflow jpeg google-cloud-ml

我正在使用 Google Cloud ML,我想对 jpeg 图像进行预测。为此,我想使用:

gcloud beta ml predict --instances=INSTANCES --model=MODEL [--version=VERSION]

( https://cloud.google.com/ml/reference/commandline/predict )

Instances 是包含图像所有信息的 json 文件的路径。 如何从我的 jpeg 图像创建 json 文件?

非常感谢!!

最佳答案

第一步是确保您导出的图形具有可以接受 JPEG 数据的占位符和操作。请注意,CloudML 假设您正在发送一批图像。我们必须使用 tf.map_fn 来解码和调整一批图像的大小。根据模型的不同,可能需要对数据进行额外的预处理以规范化数据等。如下所示:

# Number of channels in the input image
CHANNELS = 3

# Dimensions of resized images (input to the neural net)
HEIGHT = 200
WIDTH = 200

# A placeholder for a batch of images
images_placeholder = tf.placeholder(dtype=tf.string, shape=(None,))

# The CloudML Prediction API always "feeds" the Tensorflow graph with
# dynamic batch sizes e.g. (?,).  decode_jpeg only processes scalar
# strings because it cannot guarantee a batch of images would have
# the same output size.  We use tf.map_fn to give decode_jpeg a scalar
# string from dynamic batches.
def decode_and_resize(image_str_tensor):
  """Decodes jpeg string, resizes it and returns a uint8 tensor."""

  image = tf.image.decode_jpeg(image_str_tensor, channels=CHANNELS)

  # Note resize expects a batch_size, but tf_map supresses that index,
  # thus we have to expand then squeeze.  Resize returns float32 in the
  # range [0, uint8_max]
  image = tf.expand_dims(image, 0)
  image = tf.image.resize_bilinear(
      image, [HEIGHT, WIDTH], align_corners=False)
  image = tf.squeeze(image, squeeze_dims=[0])
  image = tf.cast(image, dtype=tf.uint8)
  return image

decoded_images = tf.map_fn(
    decode_and_resize, images_placeholder, back_prop=False, dtype=tf.uint8)

# convert_image_dtype, also scales [0, uint8_max] -> [0, 1).
images = tf.image.convert_image_dtype(decoded_images, dtype=tf.float32)

# Then shift images to [-1, 1) (useful for some models such as Inception)
images = tf.sub(images, 0.5)
images = tf.mul(images, 2.0)

# ...

此外,我们需要确保正确标记输入,在这种情况下,输入的名称(映射中的键)必须以 _bytes 结尾。当发送 base64 编码的数据时,它会让 CloudML 预测服务知道它需要解码数据:

inputs = {"image_bytes": images_placeholder.name}
tf.add_to_collection("inputs", json.dumps(inputs))

gcloud 命令期望的数据格式为以下形式:

{"image_bytes": {"b64": "dGVzdAo="}}

(请注意,如果 image_bytes 是模型的唯一输入,您可以简化为 {"b64": "dGVzdAo="})。

例如,要从磁盘上的文件创建它,您可以尝试类似的操作:

echo "{\"image_bytes\": {\"b64\": \"`base64 image.jpg`\"}}" > instances

然后像这样将它发送到服务:

gcloud beta ml predict --instances=instances --model=my_model

请注意,当直接向服务发送数据时,您发送的请求正文需要包含在“实例”列表中。所以上面的 gcloud 命令实际上将以下内容发送到 HTTP 请求正文中的服务:

{"instances" : [{"image_bytes": {"b64": "dGVzdAo="}}]}

关于python - 如何在谷歌机器学习中将 jpeg 图像转换为 json 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40849195/

相关文章:

python - 为什么 Mechanize(-Python) 似乎忽略了一些隐藏的表单字段而不是其他字段?

java - GWT 客户端中哪个是好的 Java 或 Json?

python-2.7 - 安装tensorflow时获取 "No module named queue"

python - 使用 python install 命令出现超时消息

python - 如何阻止 Keras 显示 "using XXX backend"?

python - python如何限制输入的字符类型

javascript - 从本地文件读取json返回html?

tensorflow - 如何在 COCO 数据集上加载预训练模型进行图像分割?

python - django 表单中的重复字段

javascript - 如何通过子节点递归并输出为json?