我正在使用 python(使用 pandas 库)处理大型表。
我想执行各种向量运算,例如与表中每一行的相关性。
这可能是一个简单的问题,但对我来说处理 DataFrame 结构很困难。我不太清楚如何将每一行(或列)转换为列表(或 numpy 数组)。
即使计算行数似乎也不是一个简单的问题,因为像 df.count() 这样的函数似乎会忽略空数据。
简单数据表和预期结果表如下。在这种情况下,我想计算每行对的总和。
真实表的大小要大得多(超过 1000 行和列)并且包含一些空值。
数据.csv:
Label Col1 Col2
Row1 1 2
Row2 3 4
Row3 5 6
输出.csv:
Label Col3
Row1,Row2 4,6
Row1,Row3 6,8
Row2,Row3 8,10
最佳答案
使用列时,Pandas 更快、更自然。因此,我建议先转置 DF,然后再对列求和
关于Python - 使用 Pandas 进行行计算,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33912075/