javascript - 如何使用 NodeJS 将 PDF 转换为 DOCX 或 URL 转换为 DOCX?

标签 javascript node.js docx

我正在尝试研究 NodeJS 中的 URL to DOCxPDF to DOCx 对话,但没有得到任何正确的解决方案。

我联系了PhantomJS,但它将URL 转换为PDF 这是任何想法,Phantom 可以转换为DOCX 吗?

请就 docx 对话提出您的建议。

注意: Docx 不需要 HTML 内容,因为我在 HTML 页面上有可用的 map 和其他图表,因此需要 URL。

最佳答案

能够将 HTML 转换为 DOCX 的免费开源实用程序非常少,能做到这一点的就更少了,因此专门询问 Node.js 是非常具体的。如果您习惯执行简单的命令,则可以使用 pandoc 将 URL 转换为 DOCX 。我建议首先在没有 Node 的情况下在本地测试此实用程序。

pandoc -f html https://stackoverflow.com/questions/48656219 -o 48656219.docx

免责声明: Pandoc 是一个标记转换器,而不是一个完整的 HTML 渲染器。这意味着您将没有完整的浏览器...例如您将丢失格式,并且许多常见的 HTML 和 CSS 技术通常会出现渲染问题。以下是使用 pandoc 呈现的此页面:/image/LfUhw.png

如果它有效,那么你很幸运,因为有一个用于 pandoc 的 npm 包可用。 https://www.npmjs.com/package/node-pandoc

var pandoc = require('node-pandoc');
var src, args, callback;

src = 'https://stackoverflow.com/questions/48656219';
args = ['-f','html', '-o','48656219.docx'];

// Set your callback function 
callback = function (err, result) {

  if (err) {
    console.error('Oh Nos: ',err);
  }

  // For output to files, the 'result' will be a boolean 'true'. 
  // Otherwise, the converted value will be returned. 
  console.log(result);
  return result;
};

// Call pandoc 
pandoc(src, args, callback);

关于javascript - 如何使用 NodeJS 将 PDF 转换为 DOCX 或 URL 转换为 DOCX?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48656219/

相关文章:

c# - 在 C# 中将 Html 转换为 Docx

title - Pandoc:更改 DOCX 输出中的标题样式

javascript - 如何返回对象方法参数

javascript - 如何在 Amazon S3 上托管的网站内绘制数据图表

javascript - typescript 数组与任何[]

node.js - 环回查找返回空

javascript - 声云波形

javascript - 如何在 NodeJs 中修改数组中的 JSON 键名称

javascript - 使用 req.body 的 Mongoose 查询未返回正确的数据

html - Xamarin 免费 HTML 或 DOC 到 PDF 转换