python-2.7 - Tesseract 的路径错误

标签 python-2.7 windows-7 config tesseract

我以为 Tesseract 可以在我的 Win 7 机器上运行:

from PIL import Image
import pytesseract

pytesseract.pytesseract.tesseract_cmd = 'C:\\Program Files (x86)\\Tesseract-OCR\\tesseract.exe'

tessdata_dir_config = '--tessdata-dir "C:\\Program Files (x86)\\Tesseract-OCR\\tessdata"'

myFile = r"D:\temp\OCR\rightness_of_rendering.tif"

print(pytesseract.image_to_string(Image.open(myFile)))

tesseract.exe 位于 C:\Program Files (x86)\Tesseract-OCR\tesseract.exe

eng.traineddata 位于 C:\Program Files (x86)\Tesseract-OCR\tessdata

我得到的错误是

D:\LearnPython>D:\LearnPython\ocr_test.py
Traceback (most recent call last):
  File "D:\LearnPython\ocr_test.py", line 14, in <module>
    print(pytesseract.image_to_string(Image.open(myFile)))
  File "C:\Python27\lib\site-packages\pytesseract\pytesseract.py", line 125, in
image_to_string
    raise TesseractError(status, errors)
pytesseract.pytesseract.TesseractError: (1, u'Error opening data file \\Program
Files (x86)\\Tesseract-OCR\\eng.traineddata')

D:\LearnPython>

这是一个目录,所以我有点困惑如何设置它才能正常工作。

最佳答案

来自 pytesseract github page

tessdata_dir_config = '--tessdata-dir "<replace_with_your_tessdata_dir_path>"'
# Example config: '--tessdata-dir "C:\\Program Files (x86)\\Tesseract-OCR\\tessdata"'
# It's important to add double quotes around the dir path.

pytesseract.image_to_string(image, lang='chi_sim', config=tessdata_dir_config)

请注意,您需要在 image_to_string 调用中提供 config=tessdata_dir_config

所以,如果您使用的是工程数据,那就是

print(pytesseract.image_to_string(Image.open(myFile), lang='eng', config=tessdata_dir_config))

关于python-2.7 - Tesseract 的路径错误,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48076964/

相关文章:

python - python中字典的内存管理

c代码有小限制

android - config.xml格式问题

java - "Connection Reset"发生在 Solr 客户端

c# - 从 app.config 读取数据类型值

javascript - python selenium提交按钮在日期选择器后不起作用

Python打印对象设计

python - 什么时候删除 Tomcat 8/temp 目录是安全的?

java - 在 Windows 7 上控制 setLocation 偏移 4px

windows - 如何检查 Windows 7 中的文件夹中使用了哪些符号链接(symbolic link)