我已成功使用 pyocr 和 tesseract 来检测此 image 上的文本
代码:
from PIL import Image
import sys
import pyocr
import pyocr.builders
# Tools
tools = pyocr.get_available_tools()
if len(tools) == 0:
print("No OCR tool found")
sys.exit(1)
tool = tools[0]
print("Will use tool '%s'" % (tool.get_name()))
# Language
langs = tool.get_available_languages()
lang = langs[0]
print("Will use lang '%s'" % (lang))
# Get text
txt = tool.image_to_string(
Image.open('1.jpg'),
builder=pyocr.builders.TextBuilder()
)
print(txt)
不幸的是,当我尝试这个时 image ,我根本没有得到任何结果。 我的计划是有一个数组,例如 (R, U, S, L)
最佳答案
您的jpeg
背景太断断续续,试试
阅读:libpillowfight
img_out = pillowfight.unpaper_noisefilter(img_in)
或
img_out = pillowfight.swt(img_in, output_type=pillowfight.SWT_OUTPUT_ORIGINAL_BOXES)
除此之外,我建议仅使用黑白图像。
关于python - 使用 pyocr(tesseract) 在网格上检测字母,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43822471/