Python - 使用 Pandas 进行行计算

标签 python pandas

我正在使用 python(使用 pandas 库)处理大型表。

我想执行各种向量运算,例如与表中每一行的相关性。

这可能是一个简单的问题,但对我来说处理 DataFrame 结构很困难。我不太清楚如何将每一行(或列)转换为列表(或 numpy 数组)。

即使计算行数似乎也不是一个简单的问题,因为像 df.count() 这样的函数似乎会忽略空数据。

简单数据表和预期结果表如下。在这种情况下,我想计算每行对的总和。

真实表的大小要大得多(超过 1000 行和列)并且包含一些空值。


数据.csv:

Label Col1 Col2
Row1 1 2
Row2 3 4
Row3 5 6

输出.csv:

Label Col3
Row1,Row2 4,6
Row1,Row3 6,8
Row2,Row3 8,10

最佳答案

使用列时,Pandas 更快、更自然。因此,我建议先转置 DF,然后再对列求和

链接:Invert index and columns in a pandas DataFrame

关于Python - 使用 Pandas 进行行计算,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33912075/

相关文章:

python - 添加零时奇怪的 numpy.sum 行为

python - Django GenericIPAddress 字段不验证输入

python - 如何从操纵延迟加载方法的网页中获取所有数据?

python - 根据条件,使用数据框 2 中的相应值填充数据框 1 的 A 列中的 NaN 值

python - 如何读取包含 "pandas.core.frame, numpy.core.multiarray"的数据文件

python - 在 Python 中解析命令行参数 : getting a KeyError

python - 将列表转换为 Numpy ndarray

Python Pandas 计算日期之间的平均天数

python - 我想根据条件将 Pandas Dataframe 分成 2 个数据帧

python - 在 Pandas 的条件下删除重复行