给定数据

df = pd.DataFrame(
    {
        'c': ['p1', 'p2', 'p3'],
        'v': [ 2  ,  8  ,  3],
    }
)

这输出

我想知道如何使用 pandas 创建以下内容

    c  v  p1  p2  p3
0  p1  2   2   0   0
1  p2  8   0   8   0
2  p3  3   0   0   3

通过这种方式，我可以将其扩展到 1000 行而不是 3 行(因此无需硬编码)

编辑

我目前的做法如下:

df = pd.DataFrame(
    {
        'c': ['p1', 'p2', 'p3'],
        'v': [ 2  ,  8  ,  3],
    }
)

# create columns with zero 
for p in df['c']:
    df[p] = 0
# iterate over columns, set values 
for p in df['c']:
    # get value
    value = df.loc[ df.loc[:,'c']==p, 'v']
    # get the location of the element to set
    idx=df.loc[:,'c']==p
    df.loc[idx,p]=value

虽然输出了正确的结果，但我觉得这是一种非常笨拙的方法。

编辑二

解决方案必须适用于以下数据:

df = pd.DataFrame(
    {
        'c': ['p1', 'p2', 'p3', 'p1'],
        'v': [ 2  ,  8  ,  3, 4],
    }
)

回归

    c  v  p1  p2  p3
0  p1  2   2   0   0
1  p2  8   0   8   0
2  p3  3   0   0   3
3  p1  9   9   0   0

意味着使用数据透视表作为

piv = df.pivot_table(index='c', columns='c', values='v', fill_value=0)
df = df.join(piv.reset_index(drop=True))

不会起作用，尽管对于原始数据集来说它很好。

最佳答案

由 get_dummies 创建的多个指标 DataFrame列 v 和 DataFrame.join转为原文:

df1 = df.join(pd.get_dummies(df["c"]).mul(df['v'], axis=0))
print (df1)
    c  v  p1  p2  p3
0  p1  2   2   0   0
1  p2  8   0   8   0
2  p3  3   0   0   3

编辑:

df1 = df.join(pd.get_dummies(df["c"]).mul(df['v'], axis=0))
print (df1)
    c  v  p1  p2  p3
0  p1  2   2   0   0
1  p2  8   0   8   0
2  p3  3   0   0   3
3  p1  4   4   0   0

详细信息:

#indicator column
print (pd.get_dummies(df["c"]))
   p1  p2  p3
0   1   0   0
1   0   1   0
2   0   0   1
3   1   0   0

#all values are multiple by c column
print (pd.get_dummies(df["c"]).mul(df['v'], axis=0))
   p1  p2  p3
0   2   0   0
1   0   8   0
2   0   0   3
3   4   0   0

关于python - 使用 Pandas 操作数据框，创建新列并根据在数据框中查找现有数据来填充它们的值，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/57935194/

python - 使用 Pandas 操作数据框，创建新列并根据在数据框中查找现有数据来填充它们的值

编辑

编辑二

上一篇：python - Pandas - 用特定组的平均值替换列中的 NaN

下一篇：python - 从字符串末尾分割字符串中的 3 个空格分隔的值？