python - 如何使用 for 循环将列标题列表添加到多个文件

我想创建一个 for 循环来命名多个文件中的列。所有文件均为 .csv。命名文件后，我想附加它们。我想我已经从下面开始了。

import csv
import pandas as pd


df0 = pd.read_csv('/home/jayaramdas/anaconda3/df/s110_s_b') 
df1 = pd.read_csv('/home/jayaramdas/anaconda3/df/s111_s_b') 
df2 = pd.read_csv('/home/jayaramdas/anaconda3/df/s112_s_b') 
df3 = pd.read_csv('/home/jayaramdas/anaconda3/df/s113_s_b') 
file_list = ['df0', 'df1', 'df2', 'df3']

for file in file_list:

    file.columns = ['date', 'bill_id', 'sponsor_id']

    df0 = df0.append(df1)
    df0 = df0.append(df2)
    df0 = df0.append(df3)


print (df0)

但我收到以下错误:

`enter code here`AttributeError                            Traceback (most recent call last)
<ipython-input-86-5d50a0488b24> in <module>()
      9 file_list = ['df0', 'df1', 'df2', 'df3']
     10 for file in file_list:
---> 11     file.columns = ['date', 'bill_id', 'sponsor_id']
     12 df0.columns = ['date', 'bill_id', 'sponsor_id']
     13 df0 = df0.append(df1)

AttributeError: 'str' object has no attribute 'columns'

最佳答案

你可以尝试这个:

import pandas as pd
import glob

df = pd.concat((pd.read_csv(f, names=['date','bill_id','sponsor_id']) for f in glob.glob('/home/jayaramdas/anaconda3/df/s11?_s_b')))

PS，如果您的 CSV 文件相对较小，那么您可能需要将它们读入一个字符串，然后从该字符串创建数据框。

关于python - 如何使用 for 循环将列标题列表添加到多个文件，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/35855131/

python - 如何使用 for 循环将列标题列表添加到多个文件

上一篇：python - Jinja2/Python 将图像插入 html

下一篇：python - 用不同的随机数替换二维数组中的值