java - 使用 Java 捕获屏幕区域并识别在那里找到的文本

标签 java ocr

这个问题可能超出了堆栈 overflow 的简单答案的范围,但我希望它能引导我能够制定几个更具体的问题,以达到我需要的目的是。

我想编写一个程序来搜索缓冲图像中的文本并将其作为字符串返回。我不想编写整个 OCR 程序,而是宁愿使用免费提供的 API,例如 tesseract。不幸的是,我一直找不到用于 tesseract 的 Java API。

我知道字体是 arial 并且我知道它的大小。我想知道这是否有帮助。

我已经成功捕获了屏幕,但我不确定如何完成识别图像中找到的文本的下一步。

问题

如何在我的 java 程序中实现一个简单的 OCR 功能?

最佳答案

您可以使用 tesjeracttess4j Tesseract API 的包装器。请务必将图像重新调整为 300 DPI,因为屏幕截图的分辨率(72 或 96 DPI)通常不足以满足 OCR 目的。

关于java - 使用 Java 捕获屏幕区域并识别在那里找到的文本,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4513843/

相关文章:

java - 如何使用 mahout 中的朴素贝叶斯分类器创建我们自己的情感分析模型?

java - 随机梯度下降变量的显式指定

java - 上传带有java和azure blob存储sdk中子目录的目录

embedded - 在 ARM/Gumstix 上编译 tesseract-ocr?

java - 通过命令行与 JNI 调用

java - 正则表达式:用传递给的方法的输出替换匹配的文本

java - 将十六进制字符串解析为整数会引发 NumberFormatException?

python - 在 Python 中识别图像

python - OCR 文件夹中的每个 .png 文件

Java 图像旋转 : Is the computed angle correct?