r - 在 R 中查找 Flights 数据集中的比例

标签 r dplyr

我正在尝试学习 dplyr 并且我正在使用 nywflights13 包。我试图找出从出发地(NYC(EWR,JFK))飞往目的地(西雅图)的航类比例

我期望的输出是,

Origin   n     Prop
JFK     2092     53
EWR     1831     47

我可以通过其他方式做到这一点。但我试图找到使用 dplyr 包。我尝试了以下方法但没有成功,

 library("nycflights13")

   flights %>% filter(dest=="SEA") %>% group_by(origin) %>% 
summarise(n=n(origin)) %>% mutate(Prop= n / sum(n))

但是我收到错误 Error in n(origin) : unused argument (origin)

有人可以帮我解决这个问题吗?

最佳答案

如果 plyrdplyr 都被加载,我们可以屏蔽 summarisemutate 等。更好用

  dplyr::summarise(n=n())

使用完整代码,

  flights %>% 
    filter(dest=="SEA") %>%
    group_by(origin) %>% 
    dplyr::summarise (n = n()) %>%
    dplyr::mutate(freq = n / sum(n))
 # Source: local data frame [2 x 3]

 #  origin     n      freq
 #  (chr) (int)     (dbl)
 #1    EWR  1831 0.4667346
 #2    JFK  2092 0.5332654

关于r - 在 R 中查找 Flights 数据集中的比例,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/33207263/

相关文章:

r - 如果按特定顺序包含多个变量,则进行子集化

r - 如何将区间随机划分为不重叠、间隔相等长度的区间

通过 dplyr group_by 运行列表并每次进行总结和变异

在分组数据上使用 slide_dbl() 滚​​动窗口

r - 在 R 中排序和保持不同的重复行

r - 如何从字符串中查找特定单词并按这些单词合并变量

r - 全部加载和构建并重新加载之间的区别

r - "Social Network Analysis Labs in R"(斯坦福教程): Confusion over graph object/network class

r - 查找组内超出阈值的点数

R,dplyr : cumulative version of n_distinct