python - 快速切片数据集并存储在新的数据框中?

标签 python pandas

我是 python 新手,非常感谢您的帮助。

我将 4 个具有相同标题的数据集导入到 python 中。现在我想创建 4 个数据框,其中仅包含 4 个数据集中选定的列。我知道如何以丑陋的方式完成此任务,但是执行此任务最有效的方法是什么?

我尝试了 for 循环,但无法使其工作:D

数据集导入为 df1,df2,df3,df4

dataset_list = (df1,df2,df3,df4)
new_dataframes= (df_1,df_2,df_3,df_4)
for i in dataset_list:
    for e in new_dataframes:
        e = i.loc[0:,['column1','column2','column3','column4']]

最佳答案

您可以使用字典理解:

cols = ['column1','column2','column3','column4']
dfs = {k: df[cols] for k, df in enumerate([df1, df2, df3, df4], 1)}

此方法的好处是它可以满足任意数量的项目,而无需手动增加变量名称。

关于python - 快速切片数据集并存储在新的数据框中?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/49495585/

相关文章:

python - matplotlib 中的多进程绘图

numpy - 如何将 pandas 系列的 Numpy 对象转换为 Numpy 矩阵?

python - Pandas 日期格式化具有不同的多种日期格式问题

python - np.unique 中更快的 return_inverse

python - 如何将 torch 张量转换为 Pandas 数据帧?

python - Pandas - 行之间的比率

python - 为什么 Pandas read_excel 函数在 Pyinstaller .exe 中返回错误,但在 Python 解释器下却没有?

python - 如何创建一个包含列表中小于现有列中单元格值的最大值的新列?

python - 使用传统的 TCP 向 ZeroMQ 服务器发送消息,可能吗?

python - 如何在 macOS 上安装 dbus-python?