python - Pandas 将列集 reshape 为行

标签 python pandas

我有一个大致如下所示的数据框:

A1 B1 C1 A4 B4 C4 A7 B7 C7
A2 B2 C2 A5 B5 C5 A8 B8 C8
A3 B3 C3 A6 B6 C6 A9 B9 C9

我希望看起来像这样:

A1 B1 C1
A2 B2 C2
A3 B3 C3
A4 B4 C4
A5 B5 C5
A6 B6 C6
A7 B7 C7
A8 B8 C8
A9 B9 C9

pandas 或其他数据处理库中是否内置了任何东西,可以轻松地做到这一点,而无需为每个“列集”手动遍历行 3(在本例中)次?这实际上是一个 3 列的主元。

最佳答案

reshape + 交换轴 + reshape


df.values.reshape(-1, 3, 3).swapaxes(1, 0).reshape(-1, 3)

array([['A1', 'B1', 'C1'],
       ['A2', 'B2', 'C2'],
       ['A3', 'B3', 'C3'],
       ['A4', 'B4', 'C4'],
       ['A5', 'B5', 'C5'],
       ['A6', 'B6', 'C6'],
       ['A7', 'B7', 'C7'],
       ['A8', 'B8', 'C8'],
       ['A9', 'B9', 'C9']], dtype=object)

为了扩展它并使其更通用,您可以根据分组计算偏移量,例如,假设在以下框架中每 4 列分组:

A1 B1 C1 D1 A4 B4 C4 D4 A7 B7 C7 D7
A2 B2 C2 D2 A5 B5 C5 D5 A8 B8 C8 D8
A3 B3 C3 D3 A6 B6 C6 D6 A9 B9 C9 D9

n = 4
f = df.shape[1] // n

df.values.reshape(-1, f, n).swapaxes(1, 0).reshape(-1, n)

array([['A1', 'B1', 'C1', 'D1'],
       ['A2', 'B2', 'C2', 'D2'],
       ['A3', 'B3', 'C3', 'D3'],
       ['A4', 'B4', 'C4', 'D4'],
       ['A5', 'B5', 'C5', 'D5'],
       ['A6', 'B6', 'C6', 'D6'],
       ['A7', 'B7', 'C7', 'D7'],
       ['A8', 'B8', 'C8', 'D8'],
       ['A9', 'B9', 'C9', 'D9']], dtype=object)

使用底层数组将是一种非常快速的方法。

df = pd.concat([df]*500)

In [128]: %%timeit
     ...: n = 3
     ...: f = df.shape[1] // n
     ...: df.values.reshape(-1, f, n).swapaxes(1, 0).reshape(-1, n)
     ...:
77.4 µs ± 417 ns per loop (mean ± std. dev. of 7 runs, 10000 loops each)

In [129]: %%timeit
     ...: c = np.arange(len(df.columns))
     ...: df.columns = [c // 3, c % 3]
     ...: df1 = df.stack(0).sort_index(level=1).reset_index(drop=True)
     ...:
     ...:
12.2 ms ± 326 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)

关于python - Pandas 将列集 reshape 为行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57658565/

相关文章:

python - 带有分组条形图的 Pandas 堆叠条形图

python - 来自 Pandas 数据框的共现矩阵

python - pandas.read_fwf 忽略提供的数据类型

python - gitpython 相当于 git-apply

python - 用python求解联立多元多项式方程

python - 你应该用 wsgi 部署 django 吗?

python - 将日期从 int64 转换为日期时间

python - 为什么我的 Django URL 调度程序不工作?

python - 在 python 中使用 paramiko 库通过 SOCKS 进行动态应用程序级端口转发

python - 如何使用 Panda 中的第一列保存结果