java - Apache Commons IO 仅下载第一个 PDF 页面

标签 java pdf apache-commons-io

我正在使用 Java 和 Apache Commons-IO 下载 PDF,但我只想获取第一页,有什么方法可以做到吗?

这是获取整个文档的代码片段:

public void getPDF(String route) throws IOException {
    URL url = new URL(route);
    File file = new File("file.pdf");
    FileUtils.copyURLToFile(url, file);
}

最佳答案

继续您的代码,您可以使用一个新文档来仅保存给定 PDF 文件的第一页。

 URL url = new URL(route);
 File file = new File("file.pdf");
 FileUtils.copyURLToFile(url, file);

 PDDocument pdDoc = PDDocument.load(file);
 PDDocument document = null;

int pageNumberToRead=0;

try {   
    document = new PDDocument();   
    document.addPage((PDPage) pdDoc.getDocumentCatalog().getAllPages().get(pageNumberToRead));   
    document.save("basepath/first_page.pdf");  
    document.close();  
}catch(Exception e){}

关于java - Apache Commons IO 仅下载第一个 PDF 页面,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54703536/

相关文章:

java - 如何获取传递给 Java 启动的 -D 参数

pdf - 将 SVG 包含到 LaTeX 中

旋转 Markdown 的表格 pdf 输出

java - 如何使用Java查找远程Linux机器的磁盘空间

java - 如何迭代 TreeMap 并使用反射来获取子类名称?

java - 使用 javassist 修改在类构造函数中使用 getter 和 setter 的字段

java - 使用 Clip 方法设置文件路径。 java

r - 在苏门答腊 PDF 阅读器中打开编译的 .rnw 的自定义函数?

java - 使用 commons-fileupload 时出现 NoClassDefFoundError

java - 如何获取具有指定扩展名并排除少数目录的文件列表?