python - 如何在Python中检测和旋转图像

标签 python pdf ocr python-tesseract image-preprocessing

我有多个 pdf 发票,我正在尝试解析。我将它们转换为图像并使用 ocr 从图像中获取文本。其中一份 pdf 的 3 页中有 2 页旋转了 90 度。我如何检测这些旋转的页面并正确旋转它们以使 ocr 返回正确的信息?

最佳答案

要保持图像完整,可以将参数'expand'设置为True

image = image.rotate(270, expand=True)

关于python - 如何在Python中检测和旋转图像,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56664128/

相关文章:

.net - C# 或 .net 中是否有任何 API 可以编辑 pdf 文档?

pdf - Tika - 如何从 PDF 文本中提取文本 : underlined, 突出显示,划掉

python - 如何从包含表格数据的图像中提取数据?

java.lang.UnsatisfiedLinkError : The specified module could not be found 错误

python - 反转 'password_change_done',参数 '()' 和关键字参数 '{}' 未找到

python - 如何从 ONNX 模型获取输入数据?

用于名称标准化的 Python RegEx

python - 使用 Python 在 Maya 中调整图像大小

android - 使用 <object> html 标签在 android 上显示 pdf 的问题

c++ - 如何在 Windows 10 上使用 Visual Studio 2015 x64 配置和构建 Tesseract OCR C++