pdf - 如何将注释/突出显示从一个 PDF 复制到该 PDF 的更新版本?

标签 pdf

我最近几乎完全转向电子书。我更喜欢在阅读文档时使用突出显示或注释来标记文档。

但是,当我获得 PDF 的更新版本时 - 例如,O'Reilly 将允许访问您购买的书籍的更正版本 - 然后我会被标记的旧副本和新副本困住,而没有我的笔记。

我的首选语言是 C# 我意识到 iTextSharp如果我想以编程方式执行此操作,可能是我需要使用的(参见例如 Copy pdf annotations via C# ),但是有没有更简单的方法来处理这个问题?

我不敢相信我是唯一一个遇到这个问题的人,那么也许已经有一个解决方案可以为我处理这个问题?

最佳答案

您可以使用 iTextSharp 的此示例来解决您的问题:

var output = new MemoryStream();

using (var document = new Document(PageSize.A4, 70f, 70f, 20f, 20f))
{
    var readers = new List<PdfReader>();
    var writer = PdfWriter.GetInstance(document, output);

    writer.CloseStream = false;

    document.Open();

    const Int32 requiredWidth = 500;
    const Int32 zeroBottom = 647;
    const Int32 left = 50;

    Action<String, Action> inlcudePdfInDocument = (filename, e) =>
    {
         var reader = new PdfReader(filename);
         readers.Add(reader);

         var pageCount = reader.NumberOfPages;
         for (var i = 0; i < pageCount; i++)
         { 
             e?.Invoke();
             var imp = writer.GetImportedPage(reader, (i + 1));

             var scale = requiredWidth / imp.Width;
             var height = imp.Height * scale;

             writer.DirectContent.AddTemplate(imp, scale, 0, 0, scale, left, zeroBottom - height);

             var annots = reader.GetPageN(i + 1).GetAsArray(PdfName.ANNOTS);
             if (annots != null && annots.Size != 0)
             {
                 foreach (var a in annots)
                 {
                     var newannot = new PdfAnnotation(writer, new Rectangle(0, 0));
                     var annotObj = (PdfDictionary) PdfReader.GetPdfObject(a);
                     newannot.PutAll(annotObj);
                     var rect = newannot.GetAsArray(PdfName.RECT);
                     rect[0] = new PdfNumber(((PdfNumber)rect[0]).DoubleValue * scale + left); // Left
                     rect[1] = new PdfNumber(((PdfNumber)rect[1]).DoubleValue * scale); // top
                     rect[2] = new PdfNumber(((PdfNumber)rect[2]).DoubleValue * scale + left); // right
                     rect[3] = new PdfNumber(((PdfNumber)rect[3]).DoubleValue * scale); // bottom
                     writer.AddAnnotation(newannot);
                 }
             }

             document.NewPage();
         }

     }

    foreach (var apprPdf in pdfs)
    {
        document.NewPage();

        inlcudePdfInDocument(apprPdf.Pdf, null);
    }

    document.Close();
    readers.ForEach(x => x.Close());
}

output.Position = 0;
return output;

本示例将带有注释的 pdf 文件列表复制到一个新的 pdf 文件中。

同时从两个 PdfReaders 获取数据 - 一个用于复制新 pdf,另一个用于从旧 pdf 复制注释。

关于pdf - 如何将注释/突出显示从一个 PDF 复制到该 PDF 的更新版本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7294549/

相关文章:

pdf - 从 Windows 8 应用程序打印 PDF 文档

ios - PDF CMap : Single Glyph to Multiple-Characters Mapping

c# - 你如何使用C#从pdf文件中提取图像

javascript - 使用 JavaScript 滚动 PDF

image - Flutter pdf 多张图片

c++ - Direct2D 渲染到命令列表并打印 : Picture Compression

javascript - 如何在javascript中将PDF文件转换为base64字符串

ruby-on-rails - 将Google图表导出为PDF

python - 在 python 中加密 PDF

java - itext- 无法使用另一个 USB token 签署 pdf