python - 我将如何进行图像标记/分类?

标签 python machine-learning deep-learning classification

假设我有一组护照图像。我正在开展一个项目,我必须识别每本护照上的姓名,并最终将该对象转换为文本。

对于标签(或分类(我认为是初学者))的第一部分,每本护照上都有姓名,我该怎么做?

我可以使用哪些技术/软件来完成此任务?

非常详细或任何链接都会很棒。我正在尝试弄清楚这是如何完成的,以便我可以开始编码

我知道可能涉及训练模型,但我只是不确定

如果重要的话我正在使用Python。

谢谢

最佳答案

您可以采取两种路线,一种是您已标记数据(或者您想自己标记数据),另一种是您没有标记数据。

让我们从后者开始。假设您有护照的图像。您想要检测图像中文本的位置以及该文本的内容。您可以使用名为 pytessaract 的库来实现此目的。这是一个可以为你做这件事的人工智能。它效果很好,因为它已经在许多其他图像上进行了训练,因此它可以很好地检测任何图像中的文本。

如果您有标签,您也许可以改进使用 pytessaract 制作的模型,但这要困难得多。如果您无论如何都想学习它,我建议您学习ŧensorflow,并使用“迁移学习”来改进您的模型。

关于python - 我将如何进行图像标记/分类?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56047785/

相关文章:

python - 更新PYQT5中的图表数据

python - 弹性网是如何使用的?

machine-learning - 如何确定总隐藏层节点和输出节点?

python - 运行时错误 : one of the variables needed for gradient computation has been modified by an inplace operation?

python - tf.contrib.learn 快速入门中出现错误,没有名为 load_csv 的属性

python - 尝试在 Pyramid oauth 提供程序中生成请求 token 时出现无效签名错误

c# - 需要帮助将一些 F# 代码转换为 C#

tensorflow - conv2d 和 conv2d_transpose 的步幅=1

python - 检查目标 : expected dense_3 to have shape (2, 时出错)但得到形状为 (1,) 的数组

tensorflow - 如何在 Kaggle 中获取数据来训练我的神经网络模型?