通过 to_csv 写入 zip 文件时,我遇到了一个特殊问题。
使用 GZIP:
df.to_csv(path_or_buf = 'sample.csv.gz', compression="gzip", index = None, sep = ",", header=True, encoding='utf-8-sig')
给出了一个名为“sample.csv.gz”的整洁的gzip文件,在其中我得到了我的csv“sample.csv”
但是,使用 ZIP 时情况会发生变化
df.to_csv(path_or_buf = 'sample.csv.zip', compression="zip", index = None, sep = ",", header=True, encoding='utf-8-sig')
提供一个名为“sample.csv.zip”的 zip 文件,但其中的 csv 也已重命名为“sample.csv.zip”。 从文件中删除多余的“.zip”即可恢复 csv。
如何实现邮政编码扩展而不出现此问题? 我需要有 zip 文件作为我无法绕过的要求。 我在 Windows 10 机器上使用 python 2.7。
提前感谢您的帮助。
最佳答案
自 1.0.0 版本以来,pandas 中使用 dict 作为压缩选项非常简单:
filename = 'sample'
compression_options = dict(method='zip', archive_name=f'{filename}.csv')
df.to_csv(f'{filename}.zip', compression=compression_options, ...)
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.to_csv.html
关于Python pandas to_csv zip 格式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55134716/