Python pandas to_csv zip 格式

标签 python pandas python-2.7

通过 to_csv 写入 zip 文件时,我遇到了一个特殊问题。

使用 GZIP:

df.to_csv(path_or_buf = 'sample.csv.gz', compression="gzip", index = None, sep = ",", header=True, encoding='utf-8-sig')

给出了一个名为“sample.csv.gz”的整洁的gzip文件,在其中我得到了我的csv“sample.csv

但是,使用 ZIP 时情况会发生变化

df.to_csv(path_or_buf = 'sample.csv.zip', compression="zip", index = None, sep = ",", header=True, encoding='utf-8-sig')

提供一个名为“sample.csv.zip”的 zip 文件,但其中的 csv 也已重命名为“sample.csv.zip”。 从文件中删除多余的“.zip”即可恢复 csv。

如何实现邮政编码扩展而不出现此问题? 我需要有 zip 文件作为我无法绕过的要求。 我在 Windows 10 机器上使用 python 2.7。

提前感谢您的帮助。

最佳答案

自 1.0.0 版本以来,pandas 中使用 dict 作为压缩选项非常简单:

filename = 'sample'
compression_options = dict(method='zip', archive_name=f'{filename}.csv')
df.to_csv(f'{filename}.zip', compression=compression_options, ...)

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.to_csv.html

关于Python pandas to_csv zip 格式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/55134716/

相关文章:

python - Pandas DataFrame - 所需索引具有重复值

python - 将多个 CSV 文件导入 pandas 并连接到一个 DataFrame

python - 如何从时间序列重采样中获取列内的类别计数

python-2.7 - 无法将数据插入本地 Google App Engine 数据存储区

python - 编译 Mozilla Firefox 时创建 ./config.data 失败

python - 如何使用python从只读mysql数据库中获取数据?

python - 同时使用 pytest 和 tf.test.TestCase 的问题

python - 从句子列表中删除某个单词

python - 禁用 "\"字符 Python 2.7 的自动加倍 - re2 错误

python - 执行 Lambda python 函数时模块导入错误