javascript - node.js 如何使用 url 作为 pdf 路径来使用 pdf2json

标签 javascript node.js parsing pdf pdf-parsing

我正在使用 node.js 和 pdf2json 解析器来解析 pdf 文件。 目前它正在使用本地 pdf 文件。 但是我想通过 node.js 的 URL/HTTP 模块获取一个 pdf 文件,我想打开这个文件来解析它。

是否有可能解析/使用在线 pdf?

let query   = url.parse(req.url, true).query;
let pdfLink = query.pdf;
...
pdfParser.loadPDF(pdfLink + "");

所以url应该通过url给定:https://localhost:8080/?pdf=http://whale-cms.de/pdf.pdf

有没有办法在在线pdf/链接中解析它?

提前致谢。

最佳答案

我刚遇到同样的问题,并找到了解决方案:

        var request = require('request');
        var PDFParser = require("pdf2json");
        var pdfUrl = "http://localhost:3000/cdn/storage/PDFFiles/sk87bAfiXxPre428b/original/sk87bAfiXxPre428b"
        var pdfParser = new PDFParser();

        var pdfPipe = request({url: pdfUrl, encoding:null}).pipe(pdfParser);

        pdfPipe.on("pdfParser_dataError", err => console.error(err) );
        pdfPipe.on("pdfParser_dataReady", pdf => {
          let usedFieldsInTheDocument = pdfParser.getAllFieldsTypes();
            console.log(usedFieldsInTheDocument)
        });

来源: https://github.com/modesty/pdf2json/issues/65
干杯

关于javascript - node.js 如何使用 url 作为 pdf 路径来使用 pdf2json,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45055125/

相关文章:

javascript - Next.js 从 Docker 容器无限重新加载

Android DOMparser 无法获取子节点?

java - 如何将json中的字符串转换为json对象

javascript - 添加邮件到 : with jQuery?

javascript - 在 Javascript 服务器/客户端中共享对象定义

javascript - Node.js - Buffer 与 Uint8Array

node.js - 使用 npm 我如何将包下载为 zip,包中包含其所有依赖项

python - 通过元素树创建 xml 后解析时出现元素树错误

javascript - 使用 jQuery 过滤 div

javascript - 发生两个重叠元素的fadeIn()和fadeOut()时页面跳转