python - 如何在 Python 中复制二进制文件的一部分？

标签 python file buffer binaryfiles

我有一个大的二进制文件(60GB)，我想将其分成几个较小的文件。我迭代了该文件，并使用 fileObject.tell() 方法找到了要分割文件的点，所以现在我有一个包含 1000 个分割点的数组，称为 file_pointers >。我正在寻找一种从这些分割点创建文件的方法，因此该函数如下所示:

def split_file(file_object, file_pointers):
     # Do something here

它会为每个 block 创建文件。我看到了这个question ，但我担心Python的循环可能太慢了，而且我也觉得必须有某种内置函数应该类似。

最佳答案

这比我想象的要简单得多，但我会在这里发布我的答案，以防有人想要快速解决方案。以下是从 file_pointer[1] 复制到 file_pointer[2]

的示例

with open('train_example.bson', 'rb') as fbson:
    fbson.seek(file_pointers[1])
    bytes_chunk = fbson.read(file_pointers[2] - file_pointers[1])
    with open('tmp.bson', 'wb') as output_file:
        output_file.write(bytes_chunk)

关于python - 如何在 Python 中复制二进制文件的一部分？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/46755002/

上一篇：Java抽象类常量

下一篇：csv - 当字符串以\结尾时 readtable()

相关文章：

c - 返回c中的缓冲区

python - 为什么循环在计算时会产生 NaN 值？

Java nio2 目录没有关闭。导致 "too many open files"错误

c# - C# 中除法的第二次计算时间差为零

arrays - 无法将文件放入 redux 数组

php - 如何使用javascript检查是否选择了文件？

java - Android ByteArrayOutputStream.write - "int off"参数，什么是

python - 在 Python 中使用绿色测试运行程序跳过测试

c# - 用于运行 C# 代码的 Python 包装器

python - 尝试在 ubuntu 上安装 matplotlib 时出现编码错误