我正在尝试从纸质文档转换为带有目录的可搜索 pdf。

有时您会下载 pdf 书籍或文档(例如下面可以看到的英特尔手册)该文档是可搜索的，它还有一个目录。现在，当您将同一份文档放在 Google Drive 上，然后在 iPad 上使用 PDF Expert 打开它时，它仍然可以通过目录进行搜索。这就是我想对所有扫描的 pdf 执行的操作。 enter image description here

现在是一个更具体的例子。下面显示的是我用 Fujitsu ScanSnap 扫描的文档。由于 ScanSnap 附带的一些软件，它也可以搜索。所以现在我有一个可搜索的 pdf，可以在本地或在我的 ipad 上打开，但它没有目录。所以我的主要问题是:如何将目录(如英特尔手册中的目录)添加到扫描的 pdf 中 enter image description here

似乎有很多人在使用“目录”做不同的事情。就像设计文档的人使用 InDesign 一样。我认为我正在尝试做的事情一定比这更简单。我在想必须有一种简单的方法可以使用 Adobe Acrobat Pro 来做到这一点吗？关于向现有目录添加“书签”或“链接”或“标签”的内容。您是否知道使用 Acrobat 或其他一些软件进行此操作的简洁明了的方法？

感谢帮助

最佳答案

Jpdfbookmark可以用于扫描的书籍

Watch tutorial video ≫

第 1 步:准备目录

以这种格式将 TOC 保存在 .txt 文件中:

Chapter 1. The Beginning/23
    Para 1.1 Child of The Beginning/25,FitWidth,96
        Para 1.1.1 Child of Child of The Beginning/26,FitHeight,43
Chapter 2. The Continue/30,TopLeft,120,42
    Para 2.1 Child of The Beginning/32,FitPage

您可以 ORC the TOC并使用正则表达式修复它。

第 2 步:加载目录

第 3 步:为第 4 步做准备

这听起来很蠢，但如果你错过了，你会很沮丧，不得不重做。展开所有书签 (Ctrl + E)，选择所有书签，然后转到工具 → 应用页面偏移

第 4 步:应用页面偏移

这一步应该是不言自明的。不要忘记保存。

就是这样。你完成了。有关更多信息，您可以阅读其 manual .该程序具有命令行模式，可以在Linux、Mac上运行。

如果有非罗马字符，转储和应用书签时一定要使用相同的编码。

我还有一个处理扫描书籍的完整指南，你可能想看看:The ultimate guide to process scanned books .

^{仅供引用:

• How to OCR tables of contents to proper outputs?

• How can I split in half a double-page scanned PDF in a single pass?}

关于pdf - 如何将交互式 "table of contents"添加到扫描的 pdf 中？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/22518248/

pdf - 如何将交互式 "table of contents"添加到扫描的 pdf 中？

Jpdfbookmark可以用于扫描的书籍

第 1 步:准备目录

第 2 步:加载目录

第 3 步:为第 4 步做准备

第 4 步:应用页面偏移

上一篇：Javascript:返回包含其他函数的对象的函数？这个叫什么？

下一篇：rabbitmq - 在每个 channel 上声明所有队列和交换是不是一种不好的形式？