python - 从 Pandas 数据框中按文件名提取列

我是 python 和 pandas 的新手。

我为我的数据制作了一个 Pandas DataFrame，如下图所示。我想提取按文件名分组的 x_c 和 y_c 列。例如，我想制作新的数据帧，假设为 df1，其中包含 x_c 和 y_c 的值，“文件名”为“recon_image_0000.tif” 然后我想以相同的方式制作另一个数据帧 df2，但文件名为“recon_image_0001.tif”。像这样，我想提取所有数据并单独保存，直到最后一个文件名“recon_image_0036.tif”。

有人可以给我一些提取和制作新的 pandas 数据框的提示吗？

最佳答案

>>> df
  file_name  x_c  y_c
0     a.tif    7   37
1     a.tif   23   41
2     a.tif   98   21
3     b.tif   74  100
4     b.tif   84   78
5     b.tif   50   10
6     b.tif    1   10
7     c.tif   10   57
8     c.tif   49   15


>>> g = df.groupby("file_name")
>>> variables_names = [f"df_{e}" for e,i in enumerate(g, start=1)]
>>> for name, group in zip(variables_names, g):
        globals()[name] = group[1].reset_index(drop=True)
>>> df_1
  file_name  x_c  y_c
0     a.tif    7   37
1     a.tif   23   41
2     a.tif   98   21

>>> df_2
  file_name  x_c  y_c
0     b.tif   74  100
1     b.tif   84   78
2     b.tif   50   10
3     b.tif    1   10

>>> df_3
  file_name  x_c  y_c
0     c.tif   10   57
1     c.tif   49   15

关于python - 从 Pandas 数据框中按文件名提取列，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/69969373/

上一篇：r - 有没有一种有效的方法来计算 R 中 sf 中多边形的所有成对交集(不使用 for 循环)？

下一篇：swift - 如何在SwiftUI中使用.refreshable调用API并刷新列表

相关文章：

python - 多索引 Seaborn 线图

python - 有没有一种方法可以在 python 中连接两个对象，使得其中一个对象中的所有值都为另一个对象中的每个值重复

python - pandas:类型转换返回错误的值

python - 在按其他列和相对位置加权的同时对列进行滚动求和

Python，加拿大地址正则表达式验证

python - 计算 36 nCr 10 的所有可能性并将其放入 Python 列表中

python - Django 查询/迭代问题

python - 不需要枚举

python - 将一个数据框中的零值列替换为另一个数据框中同名列的平均值

python - Python中将Json Dict对象转换为DataFrame