输入数据集:
Var1 Var2 Var3 Var4
101 XXX yyyy 12/10/2014
101 XYZ YTRT 13/10/2014
102 TTY UUUU 9/9/2014
102 YTY IUYY 10/10/2014
预期数据集:
Var1 Var2 Var3 Var4 New_Variable
101 XXX yyyy 12/10/2014 XXX, yyyy
101 XYZ YTRT 13/10/2014 XYZ, YTRT
102 TTY UUUU 9/9/2014 TTY, UUUU
102 YTY IUYY 10/10/2014 YTY, IUYY
如何连接两个或多个字符串变量并创建一个新变量来捕获同一数据集中的连接值?
最佳答案
您可以使用cat
方法。
这是一个例子:
>>> df = pd.DataFrame({'a':['x','y','z'], 'b': ['x','y','z'], 'c': ['x','y','z']})
>>> df
a b c
0 x x x
1 y y y
2 z z z
现在,您可以在所选列之一上使用 cat
方法创建新列。指定您想要与 others
参数连接的其他列,并使用 sep
参数指定分隔符:
>>> df["new"] = df.a.str.cat(others=[df.b, df.c], sep=', ')
>>> df
a b c new
0 x x x x, x, x
1 y y y y, y, y
2 z z z z, z, z
关于python - 使用 Pandas 连接两个或多个变量以创建新变量,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26324192/