python - 如何在Python中检测和旋转图像

标签 python pdf ocr python-tesseract image-preprocessing

我有多个 pdf 发票，我正在尝试解析。我将它们转换为图像并使用 ocr 从图像中获取文本。其中一份 pdf 的 3 页中有 2 页旋转了 90 度。我如何检测这些旋转的页面并正确旋转它们以使 ocr 返回正确的信息？

最佳答案

要保持图像完整，可以将参数'expand'设置为True

image = image.rotate(270, expand=True)

关于python - 如何在Python中检测和旋转图像，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/56664128/

上一篇：php - Intellij 在调试时将项目文件作为非项目文件打开

下一篇：python - 如何集成 sympy 表达式和 Latex 格式

相关文章：

.net - C# 或 .net 中是否有任何 API 可以编辑 pdf 文档？

pdf - Tika - 如何从 PDF 文本中提取文本 : underlined, 突出显示，划掉

python - 如何从包含表格数据的图像中提取数据？

java.lang.UnsatisfiedLinkError : The specified module could not be found 错误

python - 反转 'password_change_done'，参数 '()' 和关键字参数 '{}' 未找到

python - 如何从 ONNX 模型获取输入数据？

用于名称标准化的 Python RegEx

python - 使用 Python 在 Maya 中调整图像大小

android - 使用 <object> html 标签在 android 上显示 pdf 的问题

c++ - 如何在 Windows 10 上使用 Visual Studio 2015 x64 配置和构建 Tesseract OCR C++

©2024 IT工具网联系我们