c# - 如何使用 ITextSharp 验证 pdf 是否基于文本?

标签 c# pdf itext

我需要验证 pdf 报告是基于文本的(而不是基于位图;但是它可能包含一些图像)。我不需要提取文本,只是为了验证它是基于文本的。

有没有办法使用 ITextSharp 库执行此类验证?

提前致谢

斯特凡

最佳答案

您可以很容易地查找文本绘图命令。您要做的最少工作就是尝试提取文本并查看是否有任何内容。理想情况下,您会知道它应该包含的一些文本并进行搜索。对于此类测试,一个句子或短语就足够了。

如今,使用 iText 提取文本非常简单。大量围绕 SO 和网络的示例。

关于c# - 如何使用 ITextSharp 验证 pdf 是否基于文本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6317601/

相关文章:

c# - 将凭据添加到 URL 字符串的正确方法?

ruby-on-rails-3 - 如何将 Prawn PDF 文件存储到 Amazon S3 中

android - 在应用程序中集成 MuPDF Reader

ios - 如何打开Acrobat Reader阅读pdf文件?

java - itext7 pdf 与书签合并

grails - iText无法在Grails Web应用程序中呈现图像

java - iText-在页面不同位置的 pdf 表格单元格短语中附加阿拉伯文本

c# - Nhibernate和MVC3书籍

在 Wix 安装期间,C# 自定义操作无法找到 appsettings.json 文件

c# - 在该类的构造函数中实例化类变量