Python Pandas - 在不读取/重写整个文件的情况下编写新的 CSV 标题行

标签 python csv pandas

我有一个 27GB 的 CSV 文件,我想简单地重命名标题行。 我可以在不将整个文件读入数据帧然后再次写入整个文件的情况下执行此操作吗?

这基本上是我想要做的,但不需要重写整个 27GB 的文件。

data = pd.read_csv(filename,sep="|",nrows=2)
data.head()

LOC_ID  UPC FW  BOP_U   BOP_$
0   17  438531560821    201712  1   40.0
1   239 438550152328    201719  2   28.8


data.columns = ['WHSE','SKU','PERIOD','QUANTITYONHAND','DOLLARSONHAND']
data.head()


   WHSE           SKU  PERIOD  QUANTITYONHAND  DOLLARSONHAND
0    17  438531560821  201712               1           40.0
1   239  438550152328  201719               2           28.8

最佳答案

只需用nrows 指定只有一行。

header_df = pd.read_csv('my_file.csv', index_col=0, nrows=1)

至于重写 文件,我认为您不必处理整个文件来重写。

关于Python Pandas - 在不读取/重写整个文件的情况下编写新的 CSV 标题行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42301380/

相关文章:

python - 将日期时间转换为小时数?

python - Jupyter notebook 中的 !ls (Python 3)

python - KIVY:按钮中的图像被拉伸(stretch)

python - 使用 lambda 函数嵌套 for 循环

python - 使用时间序列时在 Pandas 滚动中使用中心

python - 删除 NaN 行在 pandas 中不起作用

python - 将 C 字符串公开给 NumPy 的最快方法?

MySQL : Break string by delimiters (^A)

Powershell:查找 CSV 列中的任何值并将其替换为单个值

python - 如何防止 csv.DictWriter() 或 writerow() 舍入我的 float ?