java - itext如何检查pdf页面上是否存在巨型字符串

-我正在使用 IText 插件在我的 java 项目上创建/读取 pdf。 -我正在从任何扩展名(pdf、doc、word等)读取多个文本文件并将其内容写入新的pdf(所有文件的所有内容结合在一起) -为了分隔巨大的pdf上每个文件的每个内容，我总是开始一个新页面，在新页面的开头用红色写下文件的确切路径，然后写下文件的内容

问题:

我想写下此 pdf 文件有多少页
如何检查 pdf 页面上是否存在字符串？我有所有文件路径，所以我想检查页面上是否写有任何路径
我按照本教程提取了我的任何页面的字符串:http://www.quicklyjava.com/read-pdf-file-in-java-using-itext/
但是当我提取所有页面并检查页面上是否存在我的文件路径时(执行 string.contains(...))，系统在页面上找不到我的文件路径pdf页面!我检查了为什么会发生这种情况，当我输出一页的字符串时，它是这样的:

1. 软件注册的 PdfGenerator/软件注册的 PdfGenerator/ src/br/ufrn/pairg/pdfgenerator/LeitorArquivoTexto.java 包 br.ufrn.pairg.pdfgenerator;

导入java.io.BufferedReader; 导入java.io.File；导入 java.io.FileReader; 导入java.io.IOException；导入java.util.Scanner;

公共(public)...

当我检查文件路径是否为“PdfGeneratorForSoftwareRegistration/PdfGeneratorForSoftwareRegistration/ src/br/ufrn/pairg/pdfgenerator/LeitorArquivoTexto.java”出现在这个巨大的字符串中，系统没有找到它。你能看到问题吗？我的路径太大了，占据了2行!这就是问题!

所以，我的问题是:有没有办法使用 itext 插件检查 pdf 文本中是否存在巨大字符串？

最佳答案

这不是最好的解决方案，但我通过在我的第一个 pdf 上的每个路径名之上编写一个神奇的 id(如“#%&#id_0#%&#”)来解决它。然后，我再次阅读pdf并检查是否有id。如果有，我会将其与我的文件路径相关联。

问题已解决:我使用 http://www.quicklyjava.com/read-pdf-file-in-java-using-itext/ 的解决方案获取页码

问题:如果项目中有任何文件上面写有#%&#id_0#%&#,#%&#id_1#%&#...，我的程序将无法运行。

关于java - itext如何检查pdf页面上是否存在巨型字符串，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/32527211/

java - itext如何检查pdf页面上是否存在巨型字符串

上一篇：Android 上的 Java sardine webdav 客户端

下一篇：java - 使用 Jtable 预测 Java 中给定信息的类别的贝叶斯分类器程序