python - tesseract.exe 未安装或不在您的路径中

标签 python python-tesseract

我正在使用 Pytesseract 来读取 PDF 的特定部分。以下是将 tesseract 配置到我的代码中的代码。

pytesseract.pytesseract.tesseract_cmd = os.path.join(cwd, "Tesseract-OCR\\tesseract.exe")

cwd 与我的 文件和 Tesseract-OCR(包含 tesseract.exe)文件夹所在的目录相同。

当我执行 时,一切正常,并且我得到了所需的输出。 但是当我创建 SplitPDF.exe (使用 Pyinstaller)时出现问题,我收到一条错误消息,指出 tesseract.exe 未安装或不在您的路径中。


Traceback (most recent call last): File "site-packages\pytesseract\", line 223, in run_tesseract File "", line 775, in init File "", line 1178, in _execute_child FileNotFoundError: [WinError 2] The system cannot find the file specified

During handling of the above exception, another exception occurred:

Traceback (most recent call last): File "", line 1705, in call File "", line 241, in UploadAction1 pdfsplitbylca(entryString) File "", line 155, in pdfsplitbylca text = pytesseract.image_to_string(im, lang = 'eng') File "site-packages\pytesseract\", line 345, in image_to_string File "site-packages\pytesseract\", line 344, in File "site-packages\pytesseract\", line 253, in run_and_get_output File "site-packages\pytesseract\", line 225, in run_tesseract pytesseract.pytesseract.TesseractNotFoundError: C:\Users\VADIRA~1.KAT\AppData\Local\Temp_MEI370202\Tesseract-OCR\tesseract.exe is not installed or it's not in your path

我是否没有正确创建 .exe 或者是否有更好的方法来配置 Tesseract?


您应该考虑使用 Pytesseract 库(tesseract python 库)而不是可执行文件。我希望这有帮助。使用方法非常简单。您必须先安装它,然后才能使用

import pytesseract
from PIL import Image



关于python - tesseract.exe 未安装或不在您的路径中,我们在Stack Overflow上找到一个类似的问题:


