我对 pandas 和 python 都很陌生。我确实找到了这个
Pandas Count Unique Occurances by Month
在 stackoverflow 上,这与我的问题类似,但我似乎无法操纵答案来解决我的问题,所以这里是:
我有一个服务器列表,每个服务器都有许多适用于该服务器的补丁。 Excel 看起来有点像这样:
Server Name - Missing Patch
Server 1 ---- file
Server 1 ---- reg
Server 1 ---- file
Server 2 ---- reg
Server 2 ---- file
Server 2 ---- file
Server 2 ---- file
Server 3 ---- reg
Server 3 ---- reg
Server 3 ---- file
Server 3 ---- reg
Server 3 ---- unicorns
我想制作一个数据框,其中有一列唯一的服务器和一列计算每个服务器有多少个丢失的补丁。它应该看起来像这样:
Server Name - Missing Patch Count
Server 1 ---- 3
Server 2 ---- 4
Server 3 ---- 5
我似乎无法使 nunique 工作,并且 value_counts 返回一个系列,这不完全是我想要的。我设法得到df.drop_duplicates('Server Name')
只显示服务器名称的唯一实例,但我无法让它按该数据对列进行排序。
我意识到这里有很多类似的问题,但我是 pandas 的新手,似乎无法使用文档应用正确的语法来解决我的问题 - 有人可以帮忙吗?
最佳答案
您可以groupby
‘服务器名称’,调用count
然后reset_index
恢复服务器名称列:
In [330]:
df.groupby('Server Name').count().reset_index()
Out[330]:
Server Name Missing Patch
0 Server 1 3
1 Server 2 4
2 Server 3 5
关于python - Pandas 对每个唯一服务器的结果进行计数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31077140/