r - 计算平均发动机预期生命周期之间的比率

标签 r dataframe dplyr data-wrangling

我在下面有一个小型 R 数据框,其中包含 2006 年至 2008 年在日本和墨西哥制造的汽车。我需要计算每年日本和墨西哥制造的汽车的平均发动机生命周期之间的比率。我正在使用 dplyr,到目前为止,我已经能够按年份和 build 地点进行分组。

但是我卡在了这部分。知道如何计算每年在日本和墨西哥制造的汽车的平均发动机生命周期之间的比率吗?

这是我使用的代码:

cars_df %>%
    group_by(year_built, place_built) %>%
    summarise(car,year_built,place_built, 
               avg_life_exp = mean(engine_life_expectancy))

example dataframe

最佳答案

在我们创建“engine_life_expectancy”之后,执行一个mutatesummarise 默认删除最后一个分组列。所以,现在,它按 'year_built' 分组,因此我们可以将 'avg_life_exp' 的 first 元素除以 last 或第二个

library(dplyr)
cars_df %>%
     group_by(car, year_built, place_built) %>%  
     summarise(avg_life_exp = mean(engine_life_expectancy)) %>%
     mutate(ratio = first(avg_life_exp)/last(avg_life_exp)) 

注意:不是在 summarise 中指定 'car'(因为新版本的 summarise 可以为每个组返回多行),我们可以包括 'car ' 也作为分组列

关于r - 计算平均发动机预期生命周期之间的比率,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/64453966/

相关文章:

R - describe() 输出到数据框

r - 使用transform和plyr在R中添加计数列

python - 从数据框中的字符串中提取第一个日期

r - 使用重复标识符传播(使用 tidyverse 和 %>%)

在 dplyr 中重复 data.frame 的行

r - facet_wrap 并为 ggplot2 中的分类变量分配颜色

r - 如何从一个 data.table 中删除另一个 data.table 中指定的组组合 [R]

r - 将命名向量转换为列表但保留向量名称

python - 如何迭代 pandas-datareader 并为每个股票代码创建多个数据帧?

python-2.7 - 如何识别从今天(包括今天)到过去和 future (不包括周末)的三个工作日并将它们放入 Pandas 数据框中?