我使用下面的方法来查找具有 55k 行的 pandas 数据帧的计数。这包含在站点列表(4000 个站点)的 for 循环中。当包含以下线路时,完成 4000 个站点的循环需要花费很多分钟。
for i in g_sitelist:
x = len(dfreglist[(dfreglist['site'] == i) & (dfreglist['isactive'] == 1)])
是否还有其他更好的方法可以在一秒钟内完成循环。
最佳答案
您可以使用value_counts()
:
site_counts = dfreglist[dfreglist['isactive'].eq(1)]['site'].value_counts()
这将给出一系列 site
值和事件计数,然后您可以对其进行迭代。
关于python-3.x - 根据条件查找 pandas 数据框中的列数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54651361/