我需要验证 pdf 报告是基于文本的(而不是基于位图;但是它可能包含一些图像)。我不需要提取文本,只是为了验证它是基于文本的。
有没有办法使用 ITextSharp 库执行此类验证?
提前致谢
斯特凡
最佳答案
您可以很容易地查找文本绘图命令。您要做的最少工作就是尝试提取文本并查看是否有任何内容。理想情况下,您会知道它应该包含的一些文本并进行搜索。对于此类测试,一个句子或短语就足够了。
如今,使用 iText 提取文本非常简单。大量围绕 SO 和网络的示例。
关于c# - 如何使用 ITextSharp 验证 pdf 是否基于文本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6317601/