python - 我将如何进行图像标记/分类？

假设我有一组护照图像。我正在开展一个项目，我必须识别每本护照上的姓名，并最终将该对象转换为文本。

对于标签(或分类(我认为是初学者))的第一部分，每本护照上都有姓名，我该怎么做？

我可以使用哪些技术/软件来完成此任务？

非常详细或任何链接都会很棒。我正在尝试弄清楚这是如何完成的，以便我可以开始编码

我知道可能涉及训练模型，但我只是不确定

如果重要的话我正在使用Python。

谢谢

最佳答案

您可以采取两种路线，一种是您已标记数据(或者您想自己标记数据)，另一种是您没有标记数据。

让我们从后者开始。假设您有护照的图像。您想要检测图像中文本的位置以及该文本的内容。您可以使用名为 pytessaract 的库来实现此目的。这是一个可以为你做这件事的人工智能。它效果很好，因为它已经在许多其他图像上进行了训练，因此它可以很好地检测任何图像中的文本。

如果您有标签，您也许可以改进使用 pytessaract 制作的模型，但这要困难得多。如果您无论如何都想学习它，我建议您学习ŧensorflow，并使用“迁移学习”来改进您的模型。

关于python - 我将如何进行图像标记/分类？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/56047785/

相关文章：

python - 更新PYQT5中的图表数据