<分区>
我在谷歌上搜索(没有任何运气)可以将 doc、ppt 和 pdf 转换为 HTML5 的开源软件。
(正是 Scribd 所做的)是否有与Scribd 的转换类型?
如果有人知道付费服务,那也行。 Scribd 有一个 API ,但这是用于 Flash 查看器的。另外,我想托管我自己的内容,因为我需要进一步控制转换后的 html 文档。
<分区>
我在谷歌上搜索(没有任何运气)可以将 doc、ppt 和 pdf 转换为 HTML5 的开源软件。
(正是 Scribd 所做的)是否有与Scribd 的转换类型?
如果有人知道付费服务,那也行。 Scribd 有一个 API ,但这是用于 Flash 查看器的。另外,我想托管我自己的内容,因为我需要进一步控制转换后的 html 文档。
最佳答案
您不太可能找到一个单一的产品来完成所有这一切,尤其是在开源世界中。更有可能的是,您最终会依赖于一堆混杂的东西,甚至可能需要链接一些转换器才能获得 HTML。 (例如 PDF -> ps -> HTML)
OpenOffice 支持转换为 HTML,可以从命令行调用。
http://pdftohtml.sourceforge.net/看起来相当擅长将 pdf 转换为 html。
对于 Word ML 或 OpenXML 格式的文档,可以想象您可以使用 XSLT 转换,因为输入和输出格式都是 XML。我已经看到网上流传的一些样式表可以执行此操作,但 YMMV。
顺便说一句,为什么对开源有特定要求?例如,MS Powerpoint 已经支持另存为 HTML。
关于html - 将 pdf、doc、ppt 转换为 html5,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3199659/