我目前正在尝试使用 PyPDF2
在 Python
中读取 PDF 文件。我想知道 PDF 文件的文本是否突出显示。
上下文:
我们用不同的颜色突出显示 PDF 文件中的文本。有什么方法可以知道在 Python 中使用任何库突出显示了哪些文本? 如果有,请告诉我正确的来源。
我查了很多地方来解决这个问题。我发现 PyPDF2
不能解决这个问题?
最佳答案
在 PyPdf2 中,您可以使用获取作为字典的 pageObject。然后您可以在其中搜索 key = '/Annots' 及其值。您至少可以知道页面是否有突出显示的文本。
关于python - 查找文本是否突出显示,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38847922/