java - 从 PDf 到字符串

标签 java pdf text io

将 PDF 文件的文本(单词)作为一个长字符串或字符串数​​组获取的最简单方法是什么。

我已经尝试过 pdfbox,但这对我不起作用。

最佳答案

使用 iText。例如,以下代码段将提取文本。

PdfTextExtractor parser =new PdfTextExtractor(new PdfReader("C:/Text.pdf"));
parser.getTextFromPage(3);

关于java - 从 PDf 到字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1678435/

相关文章:

text - Cassandra WHERE - 比较不区分大小写

android - 在 Android 中使用默认字体样式

javascript - 可以更改部分字母的衬线吗?

java - 如何使用 Java Optional 转换复杂的 if 条件

java - 为什么PDFBox在转换为图像文件时会删除矩形线

javascript - 有没有办法打印 PDF 但手动设置值而不是从主 HTML 中获取它们?

php - 表单提交创建pdf并将数据保存到mysql数据库

Java GUI 输入对话框出现两次

java - Thread 构造函数如何直接接受 run 方法?

java - 如何将 ScrollView 添加到我的 xml 中?