python - HDF5 文件在覆盖 pandas 数据帧后变大

标签 python pandas hdf5 pytables

我正在尝试覆盖 hdf5 文件中的 pandas 数据框。每次我这样做时,文件大小都会增加,而存储的帧内容是相同的。如果我使用 mode='w' 我会丢失所有其他记录。 这是错误还是我遗漏了什么?

import pandas
df = pandas.read_csv('1.csv')
for i in range(100):
  store = pandas.HDFStore('tmp.h5')
  store.put('TMP', df)
  store.close()

tmp.h5 变大了。

最佳答案

阅读此 section 底部的重要警告

这就是 HDF5 的工作原理。

关于python - HDF5 文件在覆盖 pandas 数据帧后变大,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33101797/

相关文章:

python - 当小数>=1时,pandas/numpy round()如何工作?

Pandas :同一 HDF 中的大型数据帧?

python - Pandas:在字符串匹配后获取列中的下一个值

python - 临时更改 pandas 的 set_option 以显示数据框

python - 从损坏的文件中恢复数据

r - 从 netCDF 更快地读取时间序列?

python - 为什么这个已弃用的 Factory.set_creation_function 的替代方法不能与 nosetests 一起使用?

python - PowerShell 上的彩色文本输出

python - 需要帮助设计基于 NEAT 算法的神经网络的适应度评估

pandas - 合并数据框的前两个并创建新的标题