有谁知道获取 pdf 文档并替换与模式匹配的所有子字符串的最佳方法( [A-Z][A-Z][A-Z] ' ' [0-9][0-9][0- 9][0-9]|[A-Z] ),并将其替换为指向同一字符串的同一字符串的超链接。
我计划允许用户查看 pdf 文档(这是他们可以攻读学位的类(class)列表),并允许用户单击类(class),以便将其添加到列表中。
我知道我可以向 JEditorPane 添加一个超链接监听器,并且我假设它可以处理 pdf 中的超链接(我希望)
我正在研究 pdfbox 和 iText,但到目前为止我仍停留在如何替换文本上。
*我计划从 URL 中提取 pdf,并即时格式化超链接(也无需导出到文件)。
期待反馈。
最佳答案
我找到了这个例子 http://pdfbox.apache.org/apidocs/org/apache/pdfbox/examples/pdmodel/ReplaceString.html
通过在代码中合并模式匹配器,我能够更新文本并根据要替换的字符串将与模式匹配的字符串替换为字符串。
关于Java PDF 操作,基于模式匹配替换文本,带有超链接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5161347/