我目前正在读写 .EPS 文件以在文件中操作/添加元数据(关键字和标签)。
PS:文件编码为Windows-1251或Cp1251 -Russian-
我正在像这样读取 EPS 文件:(String lines;
是一个全局变量)
try (BufferedReader br = new BufferedReader(new InputStreamReader(new FileInputStream(file), "Cp1251"))) {
String line;
while((line = br.readLine()) != null) {
if(line.contains("</xmpTPg:SwatchGroups>")) {
lines.add(line);
lines.add(descriptionKwrds);
}
else
lines.add(line);
System.out.println(line);
}
} catch (FileNotFoundException ex) {
Logger.getLogger(script.class.getName()).log(Level.SEVERE, null, ex);
} catch (UnsupportedEncodingException ex) {
Logger.getLogger(script.class.getName()).log(Level.SEVERE, null, ex);
} catch (IOException ex) {
Logger.getLogger(script.class.getName()).log(Level.SEVERE, null, ex);
}
在上面的 descriptionKwrds
中是我想要操作 EPS 文件的元数据(标签),例如:
String descriptionKwrds = "<photoshop:AuthorsPosition>icon vector illustration symbol bubble sign</photoshop:AuthorsPosition>";
然后像这样写 EPS 文件:
try {
try (BufferedWriter out = new BufferedWriter(new OutputStreamWriter(new FileOutputStream(file.getName()), "Cp1251"))) {
for(String s : lines)
out.write(s + "\n");
out.flush();
}
} catch (FileNotFoundException ex) {
Logger.getLogger(script.class.getName()).log(Level.SEVERE, null, ex);
} catch (IOException ex) {
Logger.getLogger(script.class.getName()).log(Level.SEVERE, null, ex);
}
文件读写正确,但是当我打开新生成的文件时。它说文件已损坏。
操作前后的文件是file1和 file2分别。并使用 ESP Converter在线打开 EPS 文件。
如何实现?
最佳答案
好的,您的问题是您的 EPS 文件是“带预览的 EPS”。除了实际的 PostScript 程序之外,还有一个位图,任何将 EPS 放在页面上的应用程序都可以使用它来向用户显示“预览”。
文件的开头是二进制文件,如下所示:
C5 D0 D3 C6 20 00 00 00 DC 49 05 00 00 00 00 00
00 00 00 00 FC 49 05 00 AE AC 4D 00 FF FF 00 00
如果您阅读 Adobe Technical Note 5002 "Encapsulated PostScript File Format Specification"看看第 23 页,您会看到它定义了 DOS EPS 二进制文件头,它以十六进制 C5D0D3C6 开头,就像您的文件一样。所以您可以看到您的文件有一个 DOS header ,它定义了一个预览。
现在字节 4-7 定义了 PostScript 的开始,字节 8-11 定义了 PostScript 部分的长度。 12-15 是图元文件的开始(对于您的情况为 0,因此不存在),16-19 是字节长度,再次为 0。然后在字节 20-23 处是 TIFF 表示的开始,字节 24- 27 是 TIFF 的长度。最后在剩下的两个字节中有 header 的校验和;这里我们有 0xFFFF,意思是“忽略校验和”。在这种情况下, header 已用两个字节 (0x00) 填充,使总共 32 个字节,这就是 PostScript 部分的偏移量为 0x20 的原因。
您的问题是,因为您已将内容添加到 PostScript 部分(因此增加了它的大小),但没有更新文件头以包含 PostScript 部分的新长度,或者预览的新位置,任何 EPS 用户都无法删除预览。实际上,您已经损坏了 PostScript 程序。
您要么需要更新文件头,要么通过删除文件头并从末尾修剪位图来去除预览位图以生成“纯”EPS 文件(即没有预览的文件)。
我差点忘了添加一些说明;您没有更新 EPS 文件中的“关键字”或“标签”。您正在添加执行 PostScript 运算符的 PostScript 语言程序代码。在这种情况下,当通过类似“Disitller”的 PostScript 解释器(即生成 PDF 作为输出的解释器)运行时,PDF 文件的其元数据将被更改。您根本没有更改 EPS 的元数据(这是通过 header 中的注释完成的)。对于不是 Distiller 的 PostScript 消费者,您所做的更改将完全无效。
[更新]
像这样修改“file2”(即添加了 pdfmarks 的文件)的标题:
C5 D0 D3 C6 20 00 00 00 32 26 05 00 00 00 00 00
00 00 00 00 52 26 05 00 AE AC 4D 00 FF FF 00 00
生成一个工作文件。似乎这些修改实际上使文件更短了。 PostScript 部分的原始大小为 0x0549DC,TIFF 位图的偏移量为 0x0549FC。修改后PostScript段的大小为0x052632,TIFF位图的偏移量为0x052652。
我偷偷怀疑这是由于 CR/LF 转换造成的,如果是这样,这也会破坏存储在文件末尾的 TIFF 位图(我注意到末尾的二进制文件确实看起来不同).您需要将此文件作为二进制文件而不是文本来读写。
关于java - 使用 Java 在 EPS 文件中添加元数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56537491/