我想使用 PHP 提取 PDF 文件的文本和图像。所有的库似乎都是关于阅读的,而大多数其他解决方案要么只生成文本,要么只生成图像,要么是基于命令行的。我正在寻找 PHP 的完整解决方案。这可能吗?
目前,我也对其他建议持开放态度,例如是否有一个网站带有 API,您可以将文件提交到该网站?或者也许有人可以使用 OpenOffice 命令行工具提供有关现代解决方案的说明,这甚至是可能的?
最佳答案
Google 文档 API 怎么样?他们有一个 OCR,您或许可以使用。
关于php - 从 PHP 中的 pdf 文件获取文本和图像的最简单方法?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9756209/