javascript - 如何对PDF文档页面重新排序?

标签 javascript c# pdf

我正在尝试重新排序我拥有的 pdf 页面。共有 716 页,每页都有编号。并非所有页面都在同一位置编号,但它们以三种“样式”编号。我想知道如何根据文档页面上的页码对页面重新排序? pdf 页码是可编辑的文本。

以下是三种样式的示例:

Top Right Corner

Top Left Corner

Bot Left Corner

我看过一些关于创建书签的帖子。我找到了一个可以根据某种文本样式创建书签的插件,称为自动书签插件。我只是不确定该朝哪个方向发展。页面太多,无法手动执行此操作。

正在编辑的页码:

How it looks when editing the page number

最佳答案

我在这里可以建议的是 PDFSharp 。该库将允许您打开 pdf 文件,按页面拆分,然后排序。

如果我理解正确,输入文档中的页面没有排序 - 所以首先将 pdf 页面转储到文本文件(对于所有三种情况)并看看提取页码有多难将是一个很好的任务 block (正则表达式或 pdf 语言标记)。

最后一步 - 创建新文档,其中页面按新编号排序

来自上面引用的 sourceforge 存储库:

Description

PDFsharp is a .NET library for creating and modifying Adobe PDF documents programmatically from any .NET language like C# or VB.NET. PDFsharp defines classes for the objects found in PDF files, so you never have to deal with IDs or references directly.

最后更新时间为 2015 年 12 月

关于javascript - 如何对PDF文档页面重新排序?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35612474/

相关文章:

JavaScript 范围

c# - 共享 Outlook MailItem UserProperties

java - pdfbox生成多页

javascript - 我怎样才能返回 JavaScript 数组中所有以前的项目而不是当前值?

javascript - 对非拉丁字符串进行排序不起作用

C# 网站与 mySQL 数据库的连接

c# - 升级到 Azure Tools 2.0 后,Azure 辅助角色无法正常工作

html - xhtml2pdf 背景图像未缩放

php - 找不到类 'Mpdf\Mpdf'

javascript - 分页.js : How can I set up an additional page counter for only a few pages