go - 为什么 calibre 无法读取重新创建的 .epub 文件上的元数据?

标签 go zip unzip epub calibre

我正在编写一个程序,它接受 .epub 文件,将其解压缩,编辑 content.opt 文件以添加自定义元数据,然后压缩内容以创建新的 .epub 文件。我使用 calibre 作为我的电子阅读器和 .epub 编辑器,因为 calibre 使编辑 .epub 的元数据以及 .epub 文件的内容变得非常容易。

我能够成功创建新的 .epub 文件。我已经测试过这个新文件可以用 calibre 和我的 Kobo 电子阅读器读取。

但是,原始 .epub 文件中的任何元数据都不会传输到新的 .epub 文件。此外,我无法在 calibre 中编辑 .epub 文件。当我尝试时,收到错误“epub 中没有 META-INF/container.xml”。我尝试过使用多个 .epub 文件,但得到了相同的结果和错误。

解压后,原.epub文件内容如下:

META/INF
  ↳container.xml
content.opf
mimetype
pages_styles.css
[title]_split_000.xhtml
[title]_split_001.xhtml
.....
[title]_split_012.xhtml
[title]_split_013.xhtml
stylesheet.css
toc.ncx

新创建的 .epub 文件的解压目录与原始目录相同。运行 diff -r -q/[title]_original/[title]_recreated 不会产生任何输出,这表明它们实际上是相同的。所以我不确定 calibre 如何读取一个文件而不读取另一个文件。该错误似乎表明 calibre 无法找到 META-INF/container.xml 文件,该文件用于告诉电子阅读器元数据存储在目录中的位置。

注意:在解压或压缩过程中,我不会编辑原始 .epub 的任何内容,直到我能够弄清楚发生了什么。

我正在包含两个 go 文件和 .epub 文件的目录中运行命令 go run main.go zip.go [标题]:

ma​​in.go

package main

import (
// "log"
// "strings"
)

type FileLocations struct {
    src  string
    ext  string
    dest string
}

func main() {

    fileName := "[title]"
    temp := FileLocations{
        src:  fileName,
        ext:  ".epub",
        dest: fileName,
    }

    // Unzip the zip/epub file
    UnzipHelper(temp.src, temp.ext, temp.dest)

    // Zip the modified directory
    ZipHelper(temp.src, temp.ext)
}

func UnzipHelper(src string, ext string, dest string) error {
    _, err := Unzip(src, ext, dest)
    if err != nil {
        return err
    }
    return nil
}

func ZipHelper(src string, ext string) error {
    err := Zip(src, ext)
    if err != nil {
        return err
    }
    return nil
}

zip.go

package main

import (
    "archive/zip"
    "fmt"
    "io"
    "log"
    "os"
    "path/filepath"
    "strings"
)

func Unzip(src string, ext string, dest string) ([]string, error) {

    file := src + ext

    var filenames []string

    r, err := zip.OpenReader(file)
    if err != nil {
        return filenames, err
    }
    defer r.Close()

    for _, f := range r.File {

        // Store filename/path for returning and using later on
        fpath := filepath.Join(dest, f.Name)

        // Check for ZipSlip
        if !strings.HasPrefix(fpath, filepath.Clean(dest)+string(os.PathSeparator)) {
            return filenames, fmt.Errorf("%s: illegal file path", fpath)
        }

        filenames = append(filenames, fpath)

        if f.FileInfo().IsDir() {
            // Make Folder
            os.MkdirAll(fpath, os.ModePerm)
            continue
        }

        // Make File
        if err = os.MkdirAll(filepath.Dir(fpath), os.ModePerm); err != nil {
            return filenames, err
        }

        outFile, err := os.OpenFile(fpath, os.O_WRONLY|os.O_CREATE|os.O_TRUNC, f.Mode())
        if err != nil {
            return filenames, err
        }

        rc, err := f.Open()
        if err != nil {
            return filenames, err
        }

        _, err = io.Copy(outFile, rc)

        // Close the file without defer to close before next iteration of loop
        outFile.Close()
        rc.Close()

        if err != nil {
            return filenames, err
        }
    }

    // Remove zip file so it can be recreated later
    os.Remove(file)

    return filenames, nil
}

func Zip(filename string, ext string) error {
    // Creates .epub file
    file, err := os.Create(filename + ext)
    if err != nil {
        log.Fatal("os.Create(filename) error: ", err)
    }
    defer file.Close()

    w := zip.NewWriter(file)
    defer w.Close()

    walker := func(path string, info os.FileInfo, err error) error {
        fmt.Println("Crawling: " + path)
        if err != nil {
            return err
        }
        if info.IsDir() {
            return nil
        }
        file, err := os.Open(path)
        if err != nil {
            return err
        }
        defer file.Close()

        f, err := w.Create(path)
        if err != nil {
            return err
        }

        _, err = io.Copy(f, file)
        if err != nil {
            return err
        }

        return nil
    }

    err = filepath.Walk(filename, walker)
    if err != nil {
        log.Fatal("filepath.Walk error: ", err)
    }
    return err
}

最佳答案

我迟到了一个月,但我遇到了同样的问题,并意识到我正在压缩包含 epub 内容的文件夹,而不是文件夹内的内容。

当您压缩文件夹时,生成的 .zip 文件将遵循相同的目录结构,因此您将有一个子文件夹来保存实际的电子书内容。您收到此错误的原因是 META-INF 位于此子文件夹内而不是根目录中。

示例:如果您的 epub 内容位于名为 temp_files 的文件夹中,则当您压缩该文件夹时,文件结构将如下所示:

+ your_zipped_file.zip
    + temp_files
        - META-INF
        - OEBPS
        - mimetype

什么时候应该是:

+ your_zipped_file.zip
    -META-INF
    -OEBPS
    -mimetype

(英语不是我的母语,所以请原谅任何错误)

关于go - 为什么 calibre 无法读取重新创建的 .epub 文件上的元数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/65799618/

相关文章:

sockets - io.复制: How to know if a socket is closed or disconnected

python - 如何从 Python 中的 zip 文件中读取 zip 文件?

ant - 使用 Ant 提取嵌套的 zip 存档

java - ZipInputStream.getNextEntry 在某些 zip 文件上返回 null

android - retrofit 是否会自动解压缩 GZIP 文件?

linux - 如何使用 Golang 安装 Gin

json - Unmarshal() 正在返回空结构

sockets - 如果没有 EOF,从 Golang 中的服务器读取 Unix Socket 响应的最佳方法是什么

java - 下载的 zip 文件无效

python - 从列表中的元组压缩字符串子集