python - 使用 pyocr(tesseract) 在网格上检测字母

我已成功使用 pyocr 和 tesseract 来检测此 image 上的文本

代码:

from PIL import Image
import sys

import pyocr
import pyocr.builders

# Tools
tools = pyocr.get_available_tools()
if len(tools) == 0:
    print("No OCR tool found")
    sys.exit(1)
tool = tools[0]
print("Will use tool '%s'" % (tool.get_name()))

# Language
langs = tool.get_available_languages()
lang = langs[0]
print("Will use lang '%s'" % (lang))

# Get text
txt = tool.image_to_string(
    Image.open('1.jpg'),
    builder=pyocr.builders.TextBuilder()
)

print(txt)

不幸的是，当我尝试这个时 image ，我根本没有得到任何结果。我的计划是有一个数组，例如 (R, U, S, L)

最佳答案

您的jpeg背景太断断续续，试试
阅读:libpillowfight

img_out = pillowfight.unpaper_noisefilter(img_in)

或

img_out = pillowfight.swt(img_in, output_type=pillowfight.SWT_OUTPUT_ORIGINAL_BOXES)

除此之外，我建议仅使用黑白图像。

关于python - 使用 pyocr(tesseract) 在网格上检测字母，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/43822471/

上一篇：python - Pandas CParseError，通过 FTP 下载的文件

下一篇：python - 从父表中选择所有记录，假设子表中存在某些内容

python - 如何将属性添加到 Django 表单小部件的媒体字段？

opencv - OCR:未获得理想的结果

Python 3从另一个函数更改函数中的变量

python - 将多个列表放入数据框中

c++ - Opencv 图像包装器 cpp

css - Drupal 不会预览操作 "Blue wheel spins with no action"

ios - 在 UITextView 长文本中添加多张图片

c++ - 删除 Tesseract 中的处理日志

python - 如何使用OCR提取指定位置的文本信息？