classification - 文件分类 手写或电脑打印

标签 classification ocr document handwriting-recognition vision-api

我有很多文档,有些是手写的,有些是计算机打印的(扫描图像/pdf)。我想将它们分为计算机打印和手写两组。谁能指导我完成此操作。我正在使用 Google Vision API 进行数据提取,但我只想从手写文档中提取数据。

添加更多细节,我通过 RPA 工具 UiPath 调用 google vision api,我只能使用 google vision api 从图像中提取数据/文本。我不是在寻找机器学习解决方案,例如 Auto ML 或自定义机器学习项目。我正在寻找可以构建小程序来识别文档是计算机打印的还是手写的方法。程序会将图像或pdf作为输入和输出,无论是计算机打印的还是手写的图像或pdf。

如有任何帮助,我们将不胜感激。

最佳答案

你可以看看opencv的template match .因为手写的字几乎永远不会和电脑打印的字一样每次你都可以得到一个字母模板并检查模板结果点。如果它包含您的模板且可信度高,那么它就是计算机打印的。

关于classification - 文件分类 手写或电脑打印,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/62576060/

相关文章:

ios - 扫描名片 Tesseract 和 Leptonica iOS

python - 如何将 Tika python 与 Tesseract OCR 绑定(bind)?

java - java swing 文档中 Position 实例的处理

java - 使用 Java 创建 xml 时如何在标签之间添加信息

python - 由特征选择(即 chi2 方法)产生的 p 值的含义是什么?

python - 如何从Python中的URL中提取特征?

python - 为什么准确率和损失在训练时保持完全相同?

opencv - Open Cv - Emgu Cv 如何在灰度图像上找到 7 段显示器的矩形区域

javascript - chrome扩展InjectDetails中文档的含义

classification - 如何最好地处理图像分类中的 "None of the above"?