我正在尝试重新排序我拥有的 pdf 页面。共有 716 页,每页都有编号。并非所有页面都在同一位置编号,但它们以三种“样式”编号。我想知道如何根据文档页面上的页码对页面重新排序? pdf 页码是可编辑的文本。
以下是三种样式的示例:
我看过一些关于创建书签的帖子。我找到了一个可以根据某种文本样式创建书签的插件,称为自动书签插件。我只是不确定该朝哪个方向发展。页面太多,无法手动执行此操作。
正在编辑的页码:
最佳答案
我在这里可以建议的是 PDFSharp 。该库将允许您打开 pdf 文件,按页面拆分,然后排序。
如果我理解正确,输入文档中的页面没有排序 - 所以首先将 pdf 页面转储到文本文件(对于所有三种情况)并看看提取页码有多难将是一个很好的任务 block (正则表达式或 pdf 语言标记)。
最后一步 - 创建新文档,其中页面按新编号排序
来自上面引用的 sourceforge 存储库:
Description
PDFsharp is a .NET library for creating and modifying Adobe PDF documents programmatically from any .NET language like C# or VB.NET. PDFsharp defines classes for the objects found in PDF files, so you never have to deal with IDs or references directly.
最后更新时间为 2015 年 12 月
关于javascript - 如何对PDF文档页面重新排序?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35612474/