php - 在 PHP 中读取 PDF 元数据

标签 php pdf metadata

我正在尝试读取附加到任意 PDF 的元数据:标题、作者、主题和关键字。

是否有可以读取 PDF 元数据的 PHP 库,最好是开源的?如果是这样,或者如果没有,人们将如何使用该库(或缺少该库)来提取元数据?

明确地说,我对创建或修改 PDF 或其元数据不感兴趣,我也不关心 PDF 正文。我看过许多库,包括 FPDF(似乎每个人都推荐它),但它似乎只用于 PDF 创建,而不是元数据提取。

最佳答案

PDF Parser完全按照您的意愿行事,而且使用起来非常简单:

$parser = new \Smalot\PdfParser\Parser();
$pdf    = $parser->parseFile('document.pdf');
$text   = $pdf->getDetails();

您可以在 demo page 中尝试.

关于php - 在 PHP 中读取 PDF 元数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4493189/

相关文章:

c# - 如何使用 itextsharp 获取 html 内容并将其转换为 PDF?

javascript - MySql 绑定(bind)参数不起作用

PHP、in_array 和数组中的快速搜索(到最后)

javascript - 页面分割在 jsPDF 中不起作用

java - 使用 iText 在字符串下划线

java - 在 liferay 中搜索带有元数据的内容

metadata - 更改marklogic中的元数据模型

javascript - HTML5读取mp4的视频元数据

php - 从数据库中检索具有特定 ID 的所有帖子

php - 使用 PHP+MySQL 时出现问号而不是希伯来语