python - 对 pandas 中的多个 .csv 文件应用相同的操作

标签 python pandas csv data-analysis read.csv

我有六个 .csv 文件。它们的整体大小约为 4gigs。我需要清理每一个,并对每一个做一些数据分析任务。这些操作对于所有帧都是相同的。 这是我阅读它们的代码。

#df = pd.read_csv(r"yellow_tripdata_2018-01.csv")
#df = pd.read_csv(r"yellow_tripdata_2018-02.csv")
#df = pd.read_csv(r"yellow_tripdata_2018-03.csv")
#df = pd.read_csv(r"yellow_tripdata_2018-04.csv")
#df = pd.read_csv(r"yellow_tripdata_2018-05.csv")
df = pd.read_csv(r"yellow_tripdata_2018-06.csv")

每次运行内核时,我都会激活要读取的文件之一。 我正在寻找一种更优雅的方式来做到这一点。我想过做一个for循环。制作一个文件名列表,然后一个接一个地读取它们,但我不想将它们合并在一起,所以我认为必须存在另一种方法。我一直在寻找它,但似乎所有问题都导致连接最后读取的文件。

最佳答案

像这样使用 forformat。我每天都用这个:

number_of_files = 6

for i in range(1, number_of_files+1):
    df = pd.read_csv("yellow_tripdata_2018-0{}.csv".format(i)))

    #your code here, do analysis and then the loop will return and read the next dataframe

关于python - 对 pandas 中的多个 .csv 文件应用相同的操作,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53100599/

相关文章:

python - Matplotlib:绘制离散值

python - 使用 Dash,有没有办法在页面的两个部分中重复相同的 id 组件?

pandas - 在 Azure 函数上使用 Pandas 库

Java API 从 CSV 文件创建对象

bash - 使用 bash 脚本修改 CSV 中的值

python - 使用 easy_install 或 setup.py install 在 OSX 上安装 Python 模块

python - 使用 gensim 将 LDA 应用于语料库进行训练

python - 查找与完整集具有相似均值的子集

python - python 中的数据库与平面文件(需要速度但不能放入内存)与生成器一起用于 NN 训练

c# - 在 C# 中将 unicode 字符串写入 csv