我正在尝试提取一个 14.6 GB 的 7z 文件 ( https://archive.org/download/stackexchange/stackoverflow.com-Posts.7z )。
我已将其下载并保存在我的 Google 云端硬盘中。我将驱动器安装到 Google Colab,然后将当前目录更改为文件所在的位置:os.chdir('/content/drive/My Drive/.../')
当我尝试解压缩文件 !p7zip -k -d stackoverflow.com-Posts.7z
时,它使用了当前实例的 HDD 空间,在此过程中,它用完了所有可用空间分配的硬盘空间,因此解压缩突然终止。
有没有办法在不使用实例的硬盘空间的情况下提取文件,或者以 block 的形式提取文件,以便提取成功。
PS:我相信,解压缩后的文件大小约为 100 GB
最佳答案
您可以尝试使用 libarchive 按 block 读取数据,而无需先解压缩。
https://github.com/dsoprea/PyEasyArchive
这是一个 example notebook
关于google-drive-api - 如何在 Google Colab 中提取一个非常大的文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60708805/