假设我有一组护照图像。我正在开展一个项目,我必须识别每本护照上的姓名,并最终将该对象转换为文本。
对于标签(或分类(我认为是初学者))的第一部分,每本护照上都有姓名,我该怎么做?
我可以使用哪些技术/软件来完成此任务?
非常详细或任何链接都会很棒。我正在尝试弄清楚这是如何完成的,以便我可以开始编码
我知道可能涉及训练模型,但我只是不确定
如果重要的话我正在使用Python。
谢谢
最佳答案
您可以采取两种路线,一种是您已标记数据(或者您想自己标记数据),另一种是您没有标记数据。
让我们从后者开始。假设您有护照的图像。您想要检测图像中文本的位置以及该文本的内容。您可以使用名为 pytessaract 的库来实现此目的。这是一个可以为你做这件事的人工智能。它效果很好,因为它已经在许多其他图像上进行了训练,因此它可以很好地检测任何图像中的文本。
如果您有标签,您也许可以改进使用 pytessaract 制作的模型,但这要困难得多。如果您无论如何都想学习它,我建议您学习ŧensorflow
,并使用“迁移学习”来改进您的模型。
关于python - 我将如何进行图像标记/分类?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56047785/