我想从几个 .csv 文件中提取数据,并将它们组合成 pandas 中的一个大数据框。为此,我创建了一个数据框,该数据框应填充传入数据框的数据。
final_df = DataFrame(columns=['Column1','Column2','Column3'])
for file in glob.glob("file.csv"):
name_csv = str(file)
logfile = pd.read_csv(name_csv, skip_blank_lines = False)
df = DataFrame(logFile, columns=['Column1','Column2','Column3']
concat = pd.concat([final_df,df])
但是,随着循环的每次迭代,先前提取的数据都会被覆盖。我该如何解决这个问题?
最佳答案
您根本没有使用 pd.concat
的结果。变量 concat
只是在每次迭代中被丢弃,但它将是部分数据框。
关于Python:Pandas 数据框 - 数据被覆盖而不是连接,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/42533735/