perl - 用于解析 PDF 文件的 CPAN Perl 模块

标签 perl cpan

我想解析一个 pdf 文件并从中提取一些内容。谁能列出任何特定的 perl 模块吗?

谢谢。

最佳答案

你可以尝试看看

CAM::PDF

PDF::API3

如果您尝试从文档中解析文本,那么它可能不切实际。来自 CAM::PDF::Text

This module attempts to extract sequential text from a PDF page. This is not a robust process, as PDF text is graphically laid out in arbitrary order. This module uses a few heuristics to try to guess what text goes next to what other text, but may be fooled easily by, say, subscripts, non-horizontal text, changes in font, form fields etc.

关于perl - 用于解析 PDF 文件的 CPAN Perl 模块,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9701155/

相关文章:

perl - 如何在 Perl 程序中的特定文件上设置断点?

perl 在 @INC 中找不到模块 Math::Pari 的可加载对象

perl - 所有 CPAN 镜像都不能在 CPAN 配置中工作?

perl - 如何阻止 CPAN 访问无响应的软件包存储库?

perl - 如何告诉 CPAN (Perl) 使用元编程创建的包?

perl - 在 mojolicious 中将参数传递给 redirect_to 并在目标 Controller 中使用它们

perl - Perl代码段上的问题

web-services - 如何使用 Perl 打印 SOAP Webservice 提供的 XML

windows - 需要在 Windows 中使用 perl 删除所有空子目录

perl - 如何开始为 CPAN 编写模块?