parsing - 外部参照表 - 如果外部参照预告片之一具有/上一个 0 条目,如何恢复 PDF 文件

标签 parsing pdf

偏移量 666027 处的 XRef 表的/Prev 条目为 0,这似乎是错误的,如何处理此类 pdf,在这种情况下如何获取实际的/Prev? 请查看附件 pdf http://www.filedropper.com/hackermonthly-issue-11

最佳答案

Acrobat “照常”打开它,但随后想要在关闭时保存它。这表明它“修复”了该文件;可能是通过枚举文件中的对象并忽略外部参照表。

从技术上讲,文件已损坏,并且没有正确的方法来“处理”它。使用 Acrobat 打开然后保存可能对某些文件有效,但这不是完全安全的吗? Acrobat 仍然必须猜测哪些对象仍然有效,哪些对象无效。

该 PDF 最初是使用 Adob​​e InDesign CS5 创建的,据了解该 PDF 会生成错误的 PDF,并且可以假设用于添加注释的工具已损坏该文件。粗略地浏览一下文件末尾就可以确认这一点:startxref 偏移量偏离了几个字节,当使用十六进制编辑器修复此问题时,您将只能找到前一个 startxref(另一个注释)偏离了几个字节——此时我放弃了,没有进一步检查。因此,无论您使用什么工具来注释 PDF,都不要再使用它了。

关于parsing - 外部参照表 - 如果外部参照预告片之一具有/上一个 0 条目,如何恢复 PDF 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31247410/

相关文章:

vba - 将多张工作表保存为 PDF

vba - 将网页另存为 PDF 到某个目录

android - 在此行 : - The markup in the document following the root element must be well- formed 找到多个注释

java - 如何解析 JSDoc

java - 在 Java 中使用 Pattern 进行解析

C# PDF 生成(在 Azure 上使用 IronPDF)

java - 请帮我找到正则表达式来分割我的字符串

java - MaltParser 实际上提供了返回解析树概率的选项吗?

linux - ImageMagick 安全策略 'PDF' 阻止转换

html - R 开发工具 : create both html and pdf of vignettes