python - 对 pandas 中的多个 .csv 文件应用相同的操作

标签 python pandas csv data-analysis read.csv

我有六个 .csv 文件。它们的整体大小约为 4gigs。我需要清理每一个，并对每一个做一些数据分析任务。这些操作对于所有帧都是相同的。这是我阅读它们的代码。

#df = pd.read_csv(r"yellow_tripdata_2018-01.csv")
#df = pd.read_csv(r"yellow_tripdata_2018-02.csv")
#df = pd.read_csv(r"yellow_tripdata_2018-03.csv")
#df = pd.read_csv(r"yellow_tripdata_2018-04.csv")
#df = pd.read_csv(r"yellow_tripdata_2018-05.csv")
df = pd.read_csv(r"yellow_tripdata_2018-06.csv")

每次运行内核时，我都会激活要读取的文件之一。我正在寻找一种更优雅的方式来做到这一点。我想过做一个for循环。制作一个文件名列表，然后一个接一个地读取它们，但我不想将它们合并在一起，所以我认为必须存在另一种方法。我一直在寻找它，但似乎所有问题都导致连接最后读取的文件。

最佳答案

像这样使用 `for` 和 `format`。我每天都用这个:

number_of_files = 6

for i in range(1, number_of_files+1):
    df = pd.read_csv("yellow_tripdata_2018-0{}.csv".format(i)))

    #your code here, do analysis and then the loop will return and read the next dataframe

关于python - 对 pandas 中的多个 .csv 文件应用相同的操作，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/53100599/