java - itext如何检查pdf页面上是否存在巨型字符串

标签 java pdf itext itextpdf

-我正在使用 IText 插件在我的 java 项目上创建/读取 pdf。 -我正在从任何扩展名(pdf、doc、word等)读取多个文本文件并将其内容写入新的pdf(所有文件的所有内容结合在一起) -为了分隔巨大的pdf上每个文件的每个内容,我总是开始一个新页面,在新页面的开头用红色写下文件的确切路径,然后写下文件的内容

问题:

  • 我想写下此 pdf 文件有多少页
  • 如何检查 pdf 页面上是否存在字符串?我有所有文件路径,所以我想检查页面上是否写有任何路径
  • 我按照本教程提取了我的任何页面的字符串:http://www.quicklyjava.com/read-pdf-file-in-java-using-itext/
  • 但是当我提取所有页面并检查页面上是否存在我的文件路径时(执行 string.contains(...)),系统在页面上找不到我的文件路径pdf页面!我检查了为什么会发生这种情况,当我输出一页的字符串时,它是这样的:

    1. 软件注册的 PdfGenerator/软件注册的 PdfGenerator/ src/br/ufrn/pairg/pdfgenerator/LeitorArquivoTexto.java 包 br.ufrn.pairg.pdfgenerator;

    导入java.io.BufferedReader; 导入java.io.File; 导入 java.io.FileReader; 导入java.io.IOException; 导入java.util.Scanner;

    公共(public)...

当我检查文件路径是否为“PdfGeneratorForSoftwareRegistration/PdfGeneratorForSoftwareRegistration/ src/br/ufrn/pairg/pdfgenerator/LeitorArquivoTexto.java”出现在这个巨大的字符串中,系统没有找到它。你能看到问题吗?我的路径太大了,占据了2行!这就是问题!

所以,我的问题是:有没有办法使用 itext 插件检查 pdf 文本中是否存在巨大字符串?

最佳答案

这不是最好的解决方案,但我通过在我的第一个 pdf 上的每个路径名之上编写一个神奇的 id(如“#%&#id_0#%&#”)来解决它。然后,我再次阅读pdf并检查是否有id。如果有,我会将其与我的文件路径相关联。

问题已解决:我使用 http://www.quicklyjava.com/read-pdf-file-in-java-using-itext/ 的解决方案获取页码

问题:如果项目中有任何文件上面写有#%&#id_0#%&#,#%&#id_1#%&#...,我的程序将无法运行。

关于java - itext如何检查pdf页面上是否存在巨型字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32527211/

相关文章:

javascript - 从javascript触发base64编码PDF的打印预览

java - 试图保护 PDF (iText) 试图禁止用户复制 pdf 的内容

java - 使用java创建复杂的pdf

java - iText 5.5.3 由于字体大小的测量方式,ColumnText 无法正确换行文本

java - Junit - 您应该在课前还是课前创建数据库连接?

java - 如何将maven项目的编译分为两部分?

java - Solaris 9 : memory leak detection

java - 如何使用用户密码以编程方式打开 PDF

java - 如何在iText签名印章中添加自定义字段?

java - 为什么我在代理后面对这些内容引擎的调用会失败?