是否可以使用 iTextSharp 获取 pdf 文档指定区域中包含的所有文本?
谢谢。
最佳答案
首先,您需要用红色标记的矩形的实际坐标。乍一看,我会说 x 值 144(2 英寸)可能是正确的,但如果 y 值是 76,我会感到惊讶,所以你必须仔细检查。
获得矩形的精确坐标后,您可以使用 LocationTextExtractionStrategy
来使用 iText 的文本提取功能。正如在 ExtractPageContentArea 中所做的那样示例。
对于此示例的 iTextSharp 版本,请参阅 的 C# 端口 the examples of chapter 15 罢工>。
System.util.RectangleJ rect = new System.util.RectangleJ(70, 80, 420, 500);
RenderFilter[] filter = {new RegionTextRenderFilter(rect)};
ITextExtractionStrategy strategy = new FilteredTextRenderListener(
new LocationTextExtractionStrategy(), filter);
text = PdfTextExtractor.GetTextFromPage(reader, 1, strategy);
关于c# - 使用 iTextSharp 获取包含在指定区域中的文本事件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20606467/