python - 使用 pyocr(tesseract) 在网格上检测字母

标签 python image ocr tesseract

我已成功使用 pyocr 和 tesseract 来检测此 image 上的文本

代码:

from PIL import Image
import sys

import pyocr
import pyocr.builders

# Tools
tools = pyocr.get_available_tools()
if len(tools) == 0:
    print("No OCR tool found")
    sys.exit(1)
tool = tools[0]
print("Will use tool '%s'" % (tool.get_name()))

# Language
langs = tool.get_available_languages()
lang = langs[0]
print("Will use lang '%s'" % (lang))

# Get text
txt = tool.image_to_string(
    Image.open('1.jpg'),
    builder=pyocr.builders.TextBuilder()
)

print(txt)

不幸的是,当我尝试这个时 image ,我根本没有得到任何结果。 我的计划是有一个数组,例如 (R, U, S, L)

最佳答案

您的jpeg背景太断断续续,试试
阅读:libpillowfight

img_out = pillowfight.unpaper_noisefilter(img_in)

img_out = pillowfight.swt(img_in, output_type=pillowfight.SWT_OUTPUT_ORIGINAL_BOXES)

除此之外,我建议仅使用黑白图像。

关于python - 使用 pyocr(tesseract) 在网格上检测字母,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43822471/

相关文章:

python - 类型错误:不可散列的类型:来自 pandas 的 pd.factorize() 的 'list'

python - 如何将属性添加到 Django 表单小部件的媒体字段?

opencv - OCR:未获得理想的结果

Python 3从另一个函数更改函数中的变量

python - 将多个列表放入数据框中

c++ - Opencv 图像包装器 cpp

css - Drupal 不会预览操作 "Blue wheel spins with no action"

ios - 在 UITextView 长文本中添加多张图片

c++ - 删除 Tesseract 中的处理日志

python - 如何使用OCR提取指定位置的文本信息?