ocr - 如何通过 tesseract OCR 识别带有少量数学符号的文本?

标签 ocr tesseract image-recognition

我的文本带有一些不那么复杂的数学符号,如下所示。

enter image description here

enter image description here

Tesseract OCR 默认无法识别此类数学符号(+-、角度)。我如何通过 tesseract 识别这些数学符号?

最佳答案

只需使用以下语句:

pytesseract.image_to_string(Image.open(img), config='-l eng + equ')

还要确保 pytesseract 使用方程进行训练。

蒂菲

关于ocr - 如何通过 tesseract OCR 识别带有少量数学符号的文本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/46437707/

相关文章:

c# - 如何从 C# 调用 Acrobat 功能 OCR?

python - 如何使用 OCR 有效地从 PDF 文件目录中提取文本?

ios - Tesseract CPU 使用率 100%

c++ - 找到潜在的最大圆

delphi - delphi中识别图片中的文字

android - Android 上的硬币识别

java - 如何将 PDF 转换为 JSON/EXCEL/WORD 文件?

ocr - 如何为tesseract创建uzn文件

c# - iTextSharp 从特定位置读取

r - 用 R 做 OCR