我从library(nycflights13)
查看“航类”表包裹。我尝试从中创建一个表,其中包含每个始发机场每个承运商的航类数量。我最初的想法是统计每个始发机场的每个航空公司的数量。
所以表格可能如下所示:
number of flights / carrier / origin
200-AA-JFK
147-AA-ALM (because airlines could have flown off from different airports)
etc...
坦白说,我不知道如何在编码方面解决这个问题。我从这个简单的两行代码开始:
flights %>%
count(carrier)
它显示了每家航空公司的数量。是否可以添加另一个计数标准(例如出发地),以便该函数可以计算每个出发地的航空公司数量?
最佳答案
一个选项是group_by
,然后对“航类”进行总和
library(nycflights13)
library(dplyr)
flights %>%
group_by(origin, carrier) %>%
summarise(nflights = sum(flight), count = n())
如果我们不需要“flight”的sum
,则使用具有多列的count
flights %>%
count(origin, carrier)
关于r - 如何根据2个条件进行计数,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59095486/