java - 使用 Java 在 EPS 文件中添加元数据

标签 java file metadata read-write eps

我目前正在读写 .EPS 文件以在文件中操作/添加元数据(关键字和标签)。

PS:文件编码为Windows-1251或Cp1251 -Russian-

我正在像这样读取 EPS 文件:(String lines; 是一个全局变量)

try (BufferedReader br = new BufferedReader(new InputStreamReader(new FileInputStream(file), "Cp1251"))) {
    String line;
    while((line = br.readLine()) != null) {
        if(line.contains("</xmpTPg:SwatchGroups>")) {
            lines.add(line);
            lines.add(descriptionKwrds);
        }
        else
            lines.add(line);
        System.out.println(line);
    }
} catch (FileNotFoundException ex) {
    Logger.getLogger(script.class.getName()).log(Level.SEVERE, null, ex);
} catch (UnsupportedEncodingException ex) {
    Logger.getLogger(script.class.getName()).log(Level.SEVERE, null, ex);
} catch (IOException ex) {
    Logger.getLogger(script.class.getName()).log(Level.SEVERE, null, ex);
}

在上面的 descriptionKwrds 中是我想要操作 EPS 文件的元数据(标签),例如:

String descriptionKwrds = "<photoshop:AuthorsPosition>icon vector illustration symbol bubble sign</photoshop:AuthorsPosition>";

然后像这样写 EPS 文件:

try {
    try (BufferedWriter out = new BufferedWriter(new OutputStreamWriter(new FileOutputStream(file.getName()), "Cp1251"))) {
        for(String s : lines)
            out.write(s + "\n");
        out.flush();
    }
} catch (FileNotFoundException ex) {
    Logger.getLogger(script.class.getName()).log(Level.SEVERE, null, ex);
} catch (IOException ex) {
    Logger.getLogger(script.class.getName()).log(Level.SEVERE, null, ex);
}

文件读写正确,但是当我打开新生成的文件时。它说文件已损坏。

操作前后的文件是file1file2分别。并使用 ESP Converter在线打开 EPS 文件。

如何实现?

最佳答案

好的,您的问题是您的 EPS 文件是“带预览的 EPS”。除了实际的 PostScript 程序之外,还有一个位图,任何将 EPS 放在页面上的应用程序都可以使用它来向用户显示“预览”。

文件的开头是二进制文件,如下所示:

C5 D0 D3 C6 20 00 00 00 DC 49 05 00 00 00 00 00
00 00 00 00 FC 49 05 00 AE AC 4D 00 FF FF 00 00

如果您阅读 Adobe Technical Note 5002 "Encapsulated PostScript File Format Specification"看看第 23 页,您会看到它定义了 DOS EPS 二进制文件头,它以十六进制 C5D0D3C6 开头,就像您的文件一样。所以您可以看到您的文件有一个 DOS header ,它定义了一个预览。

现在字节 4-7 定义了 PostScript 的开始,字节 8-11 定义了 PostScript 部分的长度。 12-15 是图元文件的开始(对于您的情况为 0,因此不存在),16-19 是字节长度,再次为 0。然后在字节 20-23 处是 TIFF 表示的开始,字节 24- 27 是 TIFF 的长度。最后在剩下的两个字节中有 header 的校验和;这里我们有 0xFFFF,意思是“忽略校验和”。在这种情况下, header 已用两个字节 (0x00) 填充,使总共 32 个字节,这就是 PostScript 部分的偏移量为 0x20 的原因。

您的问题是,因为您已将内容添加到 PostScript 部分(因此增加了它的大小),但没有更新文件头以包含 PostScript 部分的新长度,或者预览的新位置,任何 EPS 用户都无法删除预览。实际上,您已经损坏了 PostScript 程序。

您要么需要更新文件头,要么通过删除文件头并从末尾修剪位图来去除预览位图以生成“纯”EPS 文件(即没有预览的文件)。

我差点忘了添加一些说明;您没有更新 EPS 文件中的“关键字”或“标签”。您正在添加执行 PostScript 运算符的 PostScript 语言程序代码。在这种情况下,当通过类似“Disitller”的 PostScript 解释器(即生成 PDF 作为输出的解释器)运行时,PDF 文件的元数据将被更改。您根本没有更改 EPS 的元数据(这是通过 header 中的注释完成的)。对于不是 Distiller 的 PostScript 消费者,您所做的更改将完全无效。

[更新]

像这样修改“file2”(即添加了 pdfmarks 的文件)的标题:

C5 D0 D3 C6 20 00 00 00 32 26 05 00 00 00 00 00
00 00 00 00 52 26 05 00 AE AC 4D 00 FF FF 00 00

生成一个工作文件。似乎这些修改实际上使文件更短了。 PostScript 部分的原始大小为 0x0549DC,TIFF 位图的偏移量为 0x0549FC。修改后PostScript段的大小为0x052632,TIFF位图的偏移量为0x052652。

我偷偷怀疑这是由于 CR/LF 转换造成的,如果是这样,这也会破坏存储在文件末尾的 TIFF 位图(我注意到末尾的二进制文件确实看起来不同).您需要将此文件作为二进制文件而不是文本来读写。

关于java - 使用 Java 在 EPS 文件中添加元数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56537491/

相关文章:

java - SWIG 不在包装文件中声明全局变量

文件仍在使用错误 32 如何释放它?

javascript - 获取 s3 中存储的文件的正确创建日期和修改日期

Java IO 异常捕获

java - 从 eclipse-update-site 升级到 eclipse-repository Maven 打包时出错

c - 使用 qsort 对结构数组进行排序

c - 将结构传递给 C 中的函数

package - nuget 检索包元数据

python - 如何在 Python 中获取视频文件的方向

java - JTextPane 的样式是否具有类似控制台的格式?