我正在尝试读取附加到任意 PDF 的元数据:标题、作者、主题和关键字。
是否有可以读取 PDF 元数据的 PHP 库,最好是开源的?如果是这样,或者如果没有,人们将如何使用该库(或缺少该库)来提取元数据?
明确地说,我对创建或修改 PDF 或其元数据不感兴趣,我也不关心 PDF 正文。我看过许多库,包括 FPDF(似乎每个人都推荐它),但它似乎只用于 PDF 创建,而不是元数据提取。
最佳答案
PDF Parser完全按照您的意愿行事,而且使用起来非常简单:
$parser = new \Smalot\PdfParser\Parser();
$pdf = $parser->parseFile('document.pdf');
$text = $pdf->getDetails();
您可以在 demo page 中尝试.
关于php - 在 PHP 中读取 PDF 元数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/4493189/