-我正在使用 IText 插件在我的 java 项目上创建/读取 pdf。 -我正在从任何扩展名(pdf、doc、word等)读取多个文本文件并将其内容写入新的pdf(所有文件的所有内容结合在一起) -为了分隔巨大的pdf上每个文件的每个内容,我总是开始一个新页面,在新页面的开头用红色写下文件的确切路径,然后写下文件的内容
问题:
- 我想写下此 pdf 文件有多少页
- 如何检查 pdf 页面上是否存在字符串?我有所有文件路径,所以我想检查页面上是否写有任何路径
- 我按照本教程提取了我的任何页面的字符串:http://www.quicklyjava.com/read-pdf-file-in-java-using-itext/
但是当我提取所有页面并检查页面上是否存在我的文件路径时(执行 string.contains(...)),系统在页面上找不到我的文件路径pdf页面!我检查了为什么会发生这种情况,当我输出一页的字符串时,它是这样的:
1. 软件注册的 PdfGenerator/软件注册的 PdfGenerator/ src/br/ufrn/pairg/pdfgenerator/LeitorArquivoTexto.java 包 br.ufrn.pairg.pdfgenerator;
导入java.io.BufferedReader; 导入java.io.File; 导入 java.io.FileReader; 导入java.io.IOException; 导入java.util.Scanner;
公共(public)...
当我检查文件路径是否为“PdfGeneratorForSoftwareRegistration/PdfGeneratorForSoftwareRegistration/ src/br/ufrn/pairg/pdfgenerator/LeitorArquivoTexto.java”出现在这个巨大的字符串中,系统没有找到它。你能看到问题吗?我的路径太大了,占据了2行!这就是问题!
所以,我的问题是:有没有办法使用 itext 插件检查 pdf 文本中是否存在巨大字符串?
最佳答案
这不是最好的解决方案,但我通过在我的第一个 pdf 上的每个路径名之上编写一个神奇的 id(如“#%id_0#%”)来解决它。然后,我再次阅读pdf并检查是否有id。如果有,我会将其与我的文件路径相关联。
问题已解决:我使用 http://www.quicklyjava.com/read-pdf-file-in-java-using-itext/ 的解决方案获取页码
问题:如果项目中有任何文件上面写有#%id_0#%,#%id_1#%...,我的程序将无法运行。
关于java - itext如何检查pdf页面上是否存在巨型字符串,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/32527211/