我正在编写一个程序,它接受 .epub 文件,将其解压缩,编辑 content.opt
文件以添加自定义元数据,然后压缩内容以创建新的 .epub 文件。我使用 calibre 作为我的电子阅读器和 .epub 编辑器,因为 calibre 使编辑 .epub 的元数据以及 .epub 文件的内容变得非常容易。
我能够成功创建新的 .epub 文件。我已经测试过这个新文件可以用 calibre 和我的 Kobo 电子阅读器读取。
但是,原始 .epub 文件中的任何元数据都不会传输到新的 .epub 文件。此外,我无法在 calibre 中编辑 .epub 文件。当我尝试时,收到错误“epub 中没有 META-INF/container.xml”。我尝试过使用多个 .epub 文件,但得到了相同的结果和错误。
解压后,原.epub文件内容如下:
META/INF
↳container.xml
content.opf
mimetype
pages_styles.css
[title]_split_000.xhtml
[title]_split_001.xhtml
.....
[title]_split_012.xhtml
[title]_split_013.xhtml
stylesheet.css
toc.ncx
新创建的 .epub 文件的解压目录与原始目录相同。运行 diff -r -q/[title]_original/[title]_recreated
不会产生任何输出,这表明它们实际上是相同的。所以我不确定 calibre 如何读取一个文件而不读取另一个文件。该错误似乎表明 calibre 无法找到 META-INF/container.xml 文件,该文件用于告诉电子阅读器元数据存储在目录中的位置。
注意:在解压或压缩过程中,我不会编辑原始 .epub 的任何内容,直到我能够弄清楚发生了什么。
我正在包含两个 go 文件和 .epub 文件的目录中运行命令 go run main.go zip.go
[标题]:
main.go
package main
import (
// "log"
// "strings"
)
type FileLocations struct {
src string
ext string
dest string
}
func main() {
fileName := "[title]"
temp := FileLocations{
src: fileName,
ext: ".epub",
dest: fileName,
}
// Unzip the zip/epub file
UnzipHelper(temp.src, temp.ext, temp.dest)
// Zip the modified directory
ZipHelper(temp.src, temp.ext)
}
func UnzipHelper(src string, ext string, dest string) error {
_, err := Unzip(src, ext, dest)
if err != nil {
return err
}
return nil
}
func ZipHelper(src string, ext string) error {
err := Zip(src, ext)
if err != nil {
return err
}
return nil
}
zip.go
package main
import (
"archive/zip"
"fmt"
"io"
"log"
"os"
"path/filepath"
"strings"
)
func Unzip(src string, ext string, dest string) ([]string, error) {
file := src + ext
var filenames []string
r, err := zip.OpenReader(file)
if err != nil {
return filenames, err
}
defer r.Close()
for _, f := range r.File {
// Store filename/path for returning and using later on
fpath := filepath.Join(dest, f.Name)
// Check for ZipSlip
if !strings.HasPrefix(fpath, filepath.Clean(dest)+string(os.PathSeparator)) {
return filenames, fmt.Errorf("%s: illegal file path", fpath)
}
filenames = append(filenames, fpath)
if f.FileInfo().IsDir() {
// Make Folder
os.MkdirAll(fpath, os.ModePerm)
continue
}
// Make File
if err = os.MkdirAll(filepath.Dir(fpath), os.ModePerm); err != nil {
return filenames, err
}
outFile, err := os.OpenFile(fpath, os.O_WRONLY|os.O_CREATE|os.O_TRUNC, f.Mode())
if err != nil {
return filenames, err
}
rc, err := f.Open()
if err != nil {
return filenames, err
}
_, err = io.Copy(outFile, rc)
// Close the file without defer to close before next iteration of loop
outFile.Close()
rc.Close()
if err != nil {
return filenames, err
}
}
// Remove zip file so it can be recreated later
os.Remove(file)
return filenames, nil
}
func Zip(filename string, ext string) error {
// Creates .epub file
file, err := os.Create(filename + ext)
if err != nil {
log.Fatal("os.Create(filename) error: ", err)
}
defer file.Close()
w := zip.NewWriter(file)
defer w.Close()
walker := func(path string, info os.FileInfo, err error) error {
fmt.Println("Crawling: " + path)
if err != nil {
return err
}
if info.IsDir() {
return nil
}
file, err := os.Open(path)
if err != nil {
return err
}
defer file.Close()
f, err := w.Create(path)
if err != nil {
return err
}
_, err = io.Copy(f, file)
if err != nil {
return err
}
return nil
}
err = filepath.Walk(filename, walker)
if err != nil {
log.Fatal("filepath.Walk error: ", err)
}
return err
}
最佳答案
我迟到了一个月,但我遇到了同样的问题,并意识到我正在压缩包含 epub 内容的文件夹,而不是文件夹内的内容。
当您压缩文件夹时,生成的 .zip 文件将遵循相同的目录结构,因此您将有一个子文件夹来保存实际的电子书内容。您收到此错误的原因是 META-INF 位于此子文件夹内而不是根目录中。
示例:如果您的 epub 内容位于名为 temp_files 的文件夹中,则当您压缩该文件夹时,文件结构将如下所示:
+ your_zipped_file.zip
+ temp_files
- META-INF
- OEBPS
- mimetype
什么时候应该是:
+ your_zipped_file.zip
-META-INF
-OEBPS
-mimetype
(英语不是我的母语,所以请原谅任何错误)
关于go - 为什么 calibre 无法读取重新创建的 .epub 文件上的元数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65799618/