node.js - 在 Node.js 中解析 PDF

标签 node.js pdf-parsing

我正在使用 meteor-react 将 PDF 文档上传到我的 Node.js 后端,我想在其中读取上传的 PDF 文档,作为 json 或其他内容。 是否可以?您会为此推荐什么库/工具? 谢谢!

最佳答案

有几个用于解析 PDF 的 Node 包:

  1. pdf2json:https://www.npmjs.com/package/pdf2json
  2. pdf阅读器:https://www.npmjs.com/package/pdfreader

查看他们的 Github 和文档页面。在我看来,pdf2json 是一个更完整的解决方案,而 pdfreader 可能更容易上手。您必须根据项目要求进行试验和选择。

关于node.js - 在 Node.js 中解析 PDF,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48073756/

相关文章:

java - 如何从 PDF 中提取书签?

database - 如何解析大量PDF

node.js - 如何从 Jenkins 运行 npm/grunt 命令

ruby-on-rails - Ruby:阅读 PDF 文件

javascript - 为什么 Jest 在没有标志 --runInBand 的情况下会失败?

javascript - 如何在 Slack channel 中发送私信?

python - 从 PDF python 中提取/识别表

pdf - iTextSharp 4.1.6和5.x版本之间的区别

node.js - 将node.js代码封装在函数中

javascript - 使用nodejs异步保存到dynamodb