我有很多文档,有些是手写的,有些是计算机打印的(扫描图像/pdf)。我想将它们分为计算机打印和手写两组。谁能指导我完成此操作。我正在使用 Google Vision API 进行数据提取,但我只想从手写文档中提取数据。
添加更多细节,我通过 RPA 工具 UiPath 调用 google vision api,我只能使用 google vision api 从图像中提取数据/文本。我不是在寻找机器学习解决方案,例如 Auto ML 或自定义机器学习项目。我正在寻找可以构建小程序来识别文档是计算机打印的还是手写的方法。程序会将图像或pdf作为输入和输出,无论是计算机打印的还是手写的图像或pdf。
如有任何帮助,我们将不胜感激。
最佳答案
你可以看看opencv的template match .因为手写的字几乎永远不会和电脑打印的字一样每次你都可以得到一个字母模板并检查模板结果点。如果它包含您的模板且可信度高,那么它就是计算机打印的。
关于classification - 文件分类 手写或电脑打印,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62576060/