java - 从 pdf 中提取单词坐标的库/工具

标签 java pdf coordinates highlighting

我正在寻找一个(最好是Java)库或命令行工具来从pdf中提取单词坐标。输入 pdf 包含文本或图像,后面带有 ocr 文本。

我的用例:
在 Java Web 应用程序中,我想使用它来突出显示并显示它,而无需其他软件(例如 Adob​​e Reader 等)。相反,我想将匹配的页面转换为图像并将其呈现在网页中。

最佳答案

您应该能够使用http://pdfbox.apache.org/进行突出显示并将其呈现为 pdf 本身。另请参阅http://itextpdf.com/ .

关于java - 从 pdf 中提取单词坐标的库/工具,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4366716/

相关文章:

java - 了解以毫秒为单位的 XMLGregorianCalendar/GregorianCalendar 时间

java - spring maven install or clean错误,为什么?

c# - 合并带有书签的 pdf 文件

java - 如果没有现有文件,如何创建一个全新的 PDF 文件?

java - 球围绕 3D 球体运动

google-maps - Google Maps API V3:如何获取区域边界坐标(折线)数据?

qt - 获取 QuickControl 的屏幕坐标

java - 如果文本不适合 JLabel,我想减小字体大小

java - 我应该如何在 Selenium 的一种方法中检查 5 次有效登录?

java - 在浏览器中对 pdf 进行数字签名