c# - 使用 iTextSharp 获取包含在指定区域中的文本事件

标签 c# itextsharp

是否可以使用 iTextSharp 获取 pdf 文档指定区域中包含的所有文本?

enter image description here

谢谢。

最佳答案

首先,您需要用红色标记的矩形的实际坐标。乍一看,我会说 x 值 144(2 英寸)可能是正确的,但如果 y 值是 76,我会感到惊讶,所以你必须仔细检查。

获得矩形的精确坐标后,您可以使用 LocationTextExtractionStrategy 来使用 iText 的文本提取功能。正如在 ExtractPageContentArea 中所做的那样示例。

对于此示例的 iTextSharp 版本,请参阅 的 C# 端口 the examples of chapter 15

System.util.RectangleJ rect = new System.util.RectangleJ(70, 80, 420, 500);
RenderFilter[] filter = {new RegionTextRenderFilter(rect)};
ITextExtractionStrategy strategy = new FilteredTextRenderListener(
        new LocationTextExtractionStrategy(), filter);
text = PdfTextExtractor.GetTextFromPage(reader, 1, strategy);

关于c# - 使用 iTextSharp 获取包含在指定区域中的文本事件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20606467/

相关文章:

c# - 我应该如何在 EF 中定义一个可以采用各种数据类型的字段?

c# - 当颜色出现在屏幕上时检测颜色

c# - 使用 iTextSharp 将文件中的现有 PDF 添加到未写入的文档

c# - 使用 itextsharp(C#/asp.net) 在 pdf 中设置文本或图像的位置

c# - NULL 数组上的笛卡尔

c# - 每次 Controller 方法结束时调用方法

c# - DataGridView 事件

c# - 在 itextsharp 中旋转文本/垂直文本

pdf - 从带有 CID 字体的 PDF 中提取文本

itextsharp - iText 的 XmlWorker 无法识别表格单元格上的边框底部