python - Pandas 对每个唯一服务器的结果进行计数

标签 python pandas group-by dataframe

我对 pandas 和 python 都很陌生。我确实找到了这个

Pandas Count Unique Occurances by Month

在 stackoverflow 上,这与我的问题类似,但我似乎无法操纵答案来解决我的问题,所以这里是:

我有一个服务器列表,每个服务器都有许多适用于该服务器的补丁。 Excel 看起来有点像这样:

Server Name - Missing Patch
Server 1 ---- file
Server 1 ---- reg
Server 1 ---- file
Server 2 ---- reg
Server 2 ---- file
Server 2 ---- file
Server 2 ---- file
Server 3 ---- reg
Server 3 ---- reg
Server 3 ---- file
Server 3 ---- reg
Server 3 ---- unicorns

我想制作一个数据框,其中有一列唯一的服务器和一列计算每个服务器有多少个丢失的补丁。它应该看起来像这样:

Server Name - Missing Patch Count
Server 1 ---- 3
Server 2 ---- 4
Server 3 ---- 5

我似乎无法使 nunique 工作,并且 value_counts 返回一个系列,这不完全是我想要的。我设法得到df.drop_duplicates('Server Name')只显示服务器名称的唯一实例,但我无法让它按该数据对列进行排序。

我意识到这里有很多类似的问题,但我是 pandas 的新手,似乎无法使用文档应用正确的语法来解决我的问题 - 有人可以帮忙吗?

最佳答案

您可以groupby ‘服务器名称’,调用count然后reset_index恢复服务器名称列:

In [330]:

df.groupby('Server Name').count().reset_index()
Out[330]:
  Server Name  Missing Patch
0    Server 1              3
1    Server 2              4
2    Server 3              5

关于python - Pandas 对每个唯一服务器的结果进行计数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31077140/

相关文章:

python - 你如何为 Windows 部署 Django 应用程序?

python - 为什么 SQLAlchemy 不更新 Flask WSGI 服务器中的行值?

Pandas:使用 SimpleImputer 将数据帧转换为一系列?

mySQL:如何进行多个子查询和分组以用于数据表?

mysql - 适用于 where group-by plus 和 order-by 的索引

c# - 为什么 Entity Framework linq 查询的内部 SQL 中没有 GroupBy 子句?

python - 感染效率 - Pygame

python - 如何访问 Pandas 数据框中左上角数据的值?

python - Pandas - 连接数据框

python - 重构数据框架