python - Pandas 融化了 n 列和顺序控制(计数器)

标签 python pandas melt

我有一个宽格式的数据集,其中一行的 x 和 y 坐标位于不同的列中。下面的示例只有 4 个坐标对,但实际数据集有几十个。有一列包含纵坐标的数量(下例中的 n)。

如何用这么多 xn、yn 列来融合这个数据框?我可以在不明确调用的情况下执行此操作吗 ('x1', 'y1', 'x2', 'y2', 'x3', 'y3', 'x4', 'y4' ... 'xn', 'yn') ?我需要跟踪订单,以便 (x1,y1) 对是计数器 1; (x2,y2) 是计数器 2;等等

idx = [1, 2, 3]
colA = [10, 5, 12]
n = [3, 2, 4]
x1 = [0, 1, 7]
y1 = [4, 0, 4]
x2 = [3, 2, 8]
y2 = [5, 1, 5]
x3 = [4, np.nan, 10]
y3 = [3,np.nan, 3]
x4 = [np.nan, np.nan, 11]
y4 = [np.nan, np.nan, 3]

df = pd.DataFrame(list(zip(idx, colA, n, 
                           x1, y1, x2, y2, x3, y3, x4, y4
                          )), 
                  columns =['idx', 'colA', 'n', 
                            'x1', 'y1', 'x2', 'y2', 
                            'x3', 'y3', 'x4', 'y4'
                           ])
display(df)
<表类="s-表"> <头> idx colA <日>n x1 y1 x2 y2 x3 y3 x4 y4 <正文> 1 10 3 0 4 3 5 4.0 3.0 NaN NaN 2 5 2 1 0 2 1 NaN NaN NaN NaN 3 12 4 7 4 8 5 10.0 3.0 11.0 3.0

期望的输出

<表类="s-表"> <头> idx colA 计数器 x <日>是 <正文> 1 10 1 0 4 1 10 2 3 5 1 10 3 4 3 2 5 1 1 0 2 5 2 2 1 3 12 1 7 4 3 12 2 8 5 3 12 3 10 3 3 12 4 11 3

最佳答案

让我们试试 wide_to_long

out = pd.wide_to_long(df,['x','y'],i=['idx','colA','n'],j='cnt').dropna().reset_index()
Out[8]: 
   idx  colA  n  cnt     x    y
0   1    10  3     1   0.0  4.0
1   1    10  3     2   3.0  5.0
2   1    10  3     3   4.0  3.0
3   2     5  2     1   1.0  0.0
4   2     5  2     2   2.0  1.0
5   3    12  4     1   7.0  4.0
6   3    12  4     2   8.0  5.0
7   3    12  4     3  10.0  3.0
8   3    12  4     4  11.0  3.0

关于python - Pandas 融化了 n 列和顺序控制(计数器),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/67829948/

相关文章:

python - 帮助进行 John Zelle 的 Python 编程练习 (8-13)

python - 一定次数的迭代后打开一个新的 CSV 文件

r - 将melt 与data.table 结合使用仅适用于多个测量变量

python - pandas - 使用 'melt' 函数 reshape 表格

python - Python 服务器的实时分析

python - 如何在 python 3.0 中使用授权通过 http 下载文件,解决错误?

python - Pandas groupby 键然后根据组和返回键进行过滤

python - 读取包含特定列的 CSV 并保留到最后一列

reshape 名字的字母顺序 R bug?

python - 我可以在不同的计算机上使用相同的虚拟环境吗