所以我最近按照本教程来训练我自己的图像分类器
对于那些不知道的人来说,它允许重新训练 Google Inception 模型的最后一层,以便使预测图适用于我们自己的自定义类别。
完成训练后,我使用本教程在 iOS 上部署了模型
https://petewarden.com/2016/09/27/tensorflow-for-mobile-poets/
该模型在自然图像上表现出色。我在自然图像上的准确率高达 98%。它只接受了两堂课的培训。假设它只是对图像中是否存在计算器给出"is"或“否”的答案。如果计算器存在,它会说"is",如果没有,它会说“否”。
我的问题是,是否可以使用我们的输出图甚至检测的热图在计算器上绘制边界框。因为我需要根据检测进一步裁剪图像。
最佳答案
令人失望但准确的答案是 ImageNet 训练仅从输入图像生成标签,而不是边界框。您需要训练网络来识别投资返回率。 this SO answer中有几篇有趣的论文这可能会有所帮助,关键术语是“投资返回率”和“显着性检测”。
如果您迫切希望重用该预先训练的网络,您可以尝试对图像进行随机子裁剪,并选择仍然具有正确标签的最小的一个。我从未尝试过这个,所以它可能是一个糟糕的代理。
编辑:看起来像 this paper使用图像分类网络 计算显着图。我会遵循他们的想法。
关于machine-learning - 如何使用tensorflow获取inception模型中分类图片的热图或x y坐标(边界框),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40187685/