我有六个 .csv 文件。它们的整体大小约为 4gigs。我需要清理每一个,并对每一个做一些数据分析任务。这些操作对于所有帧都是相同的。 这是我阅读它们的代码。
#df = pd.read_csv(r"yellow_tripdata_2018-01.csv")
#df = pd.read_csv(r"yellow_tripdata_2018-02.csv")
#df = pd.read_csv(r"yellow_tripdata_2018-03.csv")
#df = pd.read_csv(r"yellow_tripdata_2018-04.csv")
#df = pd.read_csv(r"yellow_tripdata_2018-05.csv")
df = pd.read_csv(r"yellow_tripdata_2018-06.csv")
每次运行内核时,我都会激活要读取的文件之一。 我正在寻找一种更优雅的方式来做到这一点。我想过做一个for循环。制作一个文件名列表,然后一个接一个地读取它们,但我不想将它们合并在一起,所以我认为必须存在另一种方法。我一直在寻找它,但似乎所有问题都导致连接最后读取的文件。
最佳答案
像这样使用 for
和 format
。我每天都用这个:
number_of_files = 6
for i in range(1, number_of_files+1):
df = pd.read_csv("yellow_tripdata_2018-0{}.csv".format(i)))
#your code here, do analysis and then the loop will return and read the next dataframe
关于python - 对 pandas 中的多个 .csv 文件应用相同的操作,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53100599/