Python - 使用 Pandas 进行行计算

我正在使用 python(使用 pandas 库)处理大型表。

我想执行各种向量运算，例如与表中每一行的相关性。

这可能是一个简单的问题，但对我来说处理 DataFrame 结构很困难。我不太清楚如何将每一行(或列)转换为列表(或 numpy 数组)。

即使计算行数似乎也不是一个简单的问题，因为像 df.count() 这样的函数似乎会忽略空数据。

简单数据表和预期结果表如下。在这种情况下，我想计算每行对的总和。

真实表的大小要大得多(超过 1000 行和列)并且包含一些空值。

数据.csv:

Label Col1 Col2
Row1 1 2
Row2 3 4
Row3 5 6

输出.csv:

Label Col3
Row1,Row2 4,6
Row1,Row3 6,8
Row2,Row3 8,10

最佳答案

使用列时，Pandas 更快、更自然。因此，我建议先转置 DF，然后再对列求和

关于Python - 使用 Pandas 进行行计算，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/33912075/

相关文章：

python - 添加零时奇怪的 numpy.sum 行为