html - 将 pdf、doc、ppt 转换为 html5

标签 html scribd document-conversion

<分区>

我在谷歌上搜索(没有任何运气)可以将 doc、ppt 和 pdf 转换为 HTML5 的开源软件。(正是 Scribd 所做的)是否有与Scribd 的转换类型?

如果有人知道付费服务,那也行。 Scribd 有一个 API ,但这是用于 Flash 查看器的。另外,我想托管我自己的内容,因为我需要进一步控制转换后的 html 文档

最佳答案

您不太可能找到一个单一的产品来完成所有这一切,尤其是在开源世界中。更有可能的是,您最终会依赖于一堆混杂的东西,甚至可能需要链接一些转换器才能获得 HTML。 (例如 PDF -> ps -> HTML)

OpenOffice 支持转换为 HTML,可以从命令行调用。

http://pdftohtml.sourceforge.net/看起来相当擅长将 pdf 转换为 html。

对于 Word ML 或 OpenXML 格式的文档,可以想象您可以使用 XSLT 转换,因为输入和输出格式都是 XML。我已经看到网上流传的一些样式表可以执行此操作,但 YMMV。

顺便说一句,为什么对开源有特定要求?例如,MS Powerpoint 已经支持另存为 HTML。

关于html - 将 pdf、doc、ppt 转换为 html5,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3199659/

相关文章:

php - 为什么不在这里使用 POST 方法?

php - 如何在没有 Flash/Adobe 的情况下在 PHP 网站上显示 PDF

drm - scribd 如何阻止下载

java - 如何使用 apache poi 将 .docx 转换为 .doc

document-conversion - 如何预览文件?

javascript - php表单提交与JS按钮的问题

javascript - 将焦点设置到 jQuery UI MultiSelect 小部件中的过滤器输入

php - 开源 Web PDF 查看器?

ibm-watson - 如何使用脚本 bash 中的文档转换服务转换多个文档?

javascript - 根据容器内的图像动态调整容器 DIV 的大小