python - 如何将每一行中的数据重命名为pandas中的唯一编号？

如何重命名或标记具有与唯一编号相同值的 2 列的数据。例如

这是我的示例数据:

col1   col2
A1     B1
A1     C1
A1     B2
B1     C2
C2     D1

预期:

col1   col2  new_col1  new_col2
    A1     B1      1         2
    A1     C1      1         3
    A1     B2      1         4
    B1     C2      2         5
    C2     D1      5         6

对于这种情况有什么指导方针吗？我正在考虑 np.random 但它只能定义一列

最佳答案

使用factorize将 DataFrame reshape 为 MultiIndex Series by DataFrame.stack :

s = df.stack()
df = df.join(pd.Series(pd.factorize(s)[0] + 1, index=s.index).unstack().add_prefix('new_'))
print (df)
  col1 col2  new_col1  new_col2
0   A1   B1         1         2
1   A1   C1         1         3
2   A1   B2         1         4
3   B1   C2         2         5
4   C2   D1         5         6

关于python - 如何将每一行中的数据重命名为pandas中的唯一编号？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/59728705/

上一篇：git - 如何限制远程 git 存储库中的交互？

下一篇：julia - 为什么命名的 splats 在 Julia 中不起作用？

相关文章：

python - 计算最高分 - Pandas 中每个供应商的最低分

python - 使用小时作为中点将 Pandas DataFrame 重新采样为每小时

R:第n行第(m+1)列与第(n+1)行第m列之间的日期差

pandas - 如何将字典文本文件读取到数据框？

python - 选择名称遵循 pandas 中给定模式的 DataFrame 列

python - 使用 Xception CNN 训练自定义图像时出现奇怪的错误

python - 我如何用 Python 读出 Blender 中的自定义属性？

python - 如何从多个列表制作字典？

python - Pandas:多索引列标题

python - 将元组列表转换为 Pandas 数据框的单列？