c# - 寻找 PDF 文件解析器

标签 c# regex delphi pdf unicode

<分区>

有人知道我可以用来从纯文本 pdf 文件中提取文本部分的 PDF 文件解析器吗?特别是我想要一种能够可靠地提取特定于注释的文本部分的方法?

Delphi、C# RegEx 我不介意。

最佳答案

PDF File Parser xactpro 上的文章似乎正是您所需要的。它解释了 PDF 的格式,并附带了解析器的完整源代码(以及另一个用于模型可视化的项目)。

解析器使用特定于格式的术语,但您可以轻松地使用可视化工具来了解要查找的内容。

关于c# - 寻找 PDF 文件解析器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/530052/

相关文章:

java - 如何转义java中的某些字符

javascript - 捕获 url 前缀但排除 www 的正则表达式

javascript - 在正则表达式javascript中仅排除0

windows - 为什么 TFontDialog 提供的字体比 Screen.Fonts 少?

c# - 关闭在 NamedPipeServer#WaitForConnection 上阻塞的线程的好方法是什么?

c# - Azure Functions 中的“即发即忘”调用

c# - 关于生成无法追踪的发票 ID 的想法

c# - 保存文件之前从 SaveFileDialog 获取文件夹路径

c# - 使用 Delphi 7 访问托管代码 (CLR) DLL

delphi - 动态 Delphi 表单创建 - 确保正确的鼠标消息处理