pdf-conversion - PDF 到 HTML 或类似文件

标签 pdf-conversion pdf-viewer pdfview

我正在构建一个应用程序,可以通过浏览器查看 pdf,而无需在移动设备上安装插件。我尝试使用 ImageMagick 和 Ghostscript 将页面转换为图像,但它们太大,文本变得不清楚。我看到网站提供了将 pdf 转换为 html 的服务,并做了一项下降工作,但我找不到如何完成此操作的示例。任何帮助深表感谢。谢谢!

最佳答案

编辑:我似乎倒着读了这个问题。在这种情况下,最好解析 PDF,然后根据您找到的内容格式化一些 HTML。我相信 javapdf 选项能够做到这一点,但我没有使用过其中任何一个,所以我不确定。如果情况最糟,您找不到反汇编 PDF 的软件,您也许可以通过阅读 PDF 规范,用 Java 或 PHP 编写自己的反汇编程序。祝你好运!

http://www.adobe.com/devnet/pdf/pdf_reference.html - PDF 规范(Adobe 修改版本,因为它们最受欢迎,您可能希望支持它们的扩展)

--旧--这些网站可能会编写自己的专有软件来实现这一目的。如果您确实对这项工作感兴趣,我建议您解析 HTML 以获取数据和样式信息,并使用它来格式化某种 PDF 编写器 API。快速 Google 搜索会得到以下结果: -- END OLD --

http://www.cutepdf.com/Solutions/

http://ruby-pdf.rubyforge.org/pdf-writer/doc/index.html

http://asprise.com/product/javapdf/

关于pdf-conversion - PDF 到 HTML 或类似文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/6252541/

相关文章:

c# - 使用 PdfSharp 将 C# 中的 Windows 窗体转换为 PDF

asp.net - pdfclown 中的注释

pdf - ExpertPdf - 无法获取转换结果 header 。数据接收错误。无法接收数据。错误代码: 109

javascript - 无法绑定(bind)到 'pdfTitle',因为它不是 'app-pdf-viewer' 的已知属性

.net PDF 查看器控件

android - 使用 APV 实现 pdfViewer

ios - 如何在 PDFView 中 swift 适应来自 UIImage 的 PDF?

ios - 限制在 PDF 页面边界内移动/拖动 pdf 注释