python - pandas dataframe如何进行 "elementwise"串联？

我有两个具有相同形状、索引和列的 pandas 数据框 A,B。 A 的每个元素都是形状为 (n,1) 的 np.ndarray，B 的每个元素是一个浮点值。现在我想高效将B元素逐个附加到A。一个最小的例子:

index = ['fst', 'scd']

column = ['a','b']

A
Out[23]: 
          a       b
fst  [1, 2]  [1, 4]
scd  [3, 4]  [3, 2]

B
Out[24]: 
            a         b
fst  0.392414  0.641136
scd  0.264117  1.644251

resulting_df = pd.DataFrame([[np.append(A.loc[i,j], B.loc[i,j]) for i in index] for j in column], columns=column, index=index)

resulting_df
Out[27]: 
                              a                           b
fst  [1.0, 2.0, 0.392414377685]  [3.0, 4.0, 0.264117463613]
scd  [1.0, 4.0, 0.641136433253]   [3.0, 2.0, 1.64425062851]

有类似pd.DataFrame.applymap的东西吗？可以在两个而不是一个 pandas 数据帧之间按元素进行操作？

最佳答案

您可以使用 applymap 将 df2 中的元素转换为列表，然后只需普通加法即可组合列表，即

index = ['fst', 'scd']

column = ['a','b']


A = pd.DataFrame([[[1, 2],[1, 4]],[[3, 4],[3, 2]]],index,column)
B = pd.DataFrame([[0.392414,0.264117],[ 0.641136 , 1.644251]],index,column)

选项 1:

n =  B.applymap(lambda y: [y])
ndf = A.apply(lambda x : x+n[x.name])

选项 2: 使用 pd.concat 了解其工作原理检查 here即

pd.concat([A,B]).groupby(level=0).apply(lambda g: pd.Series({i: np.hstack(g[i].values) for i in A.columns}))

为了使当前方法给出正确的输出，请移动循环，即

pd.DataFrame([[np.append(A.loc[i,j], B.loc[i,j]) for j in A.columns] for i in A.index], columns=A.columns, index=A.index)

输出:

                       a                     b
fst  [1.0, 2.0, 0.392414]  [1.0, 4.0, 0.264117]
scd  [3.0, 4.0, 0.641136]  [3.0, 2.0, 1.644251]

关于python - pandas dataframe如何进行 "elementwise"串联？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/46580327/

上一篇：python - 在 Scikit 学习支持向量回归中查找混合次数多项式

下一篇：python - 如何在引用前一行的同时迭代 pandas 数据框？

相关文章：

根据组(按行)data.frame 根据条件替换每列中的值

python - 进入子目录、运行命令然后返回的最优雅的方式是什么？

python - 打包数据以进行相关性确定的最佳格式？

python - 使用 MySQLdb 执行 "SELECT ... WHERE ... IN ..."

R:快速乘以data.frame(或其他数据结构)中的选定行

python - 第一列数据框中每两个元素的共同元素

python - 使用可迭代设置时必须具有相等的 len 键和值

python - 在pandas中使用read_excel和index_col时，如果工作表包含一些0数字，我如何设置正确的索引列？

python - 如何修复 Python Numpy/Pandas 安装？

python - 如何根据现有列过滤 pandas 数据框中的行？