dataframe - 将多个函数应用于 Julia DataFrames.jl 中的单个列

标签 dataframe julia

我想轻松地将多个函数应用于 Julia 数据框中的单个列。这是 Julia Academy 上 DataFrames.jl 类(class)笔记本 5 中的一个简单示例。
Bogumil 向我们展示了如何轻松计算 jumps 的平均值列通过执行以下操作:

combine(df, :jumps => mean)



jumps_mean



Float64

1
2.7186


但是如果我想对 jumps 应用多个函数怎么办?获取多个汇总统计信息?到目前为止,我可以使以下内容起作用:
combine(df, :jumps => (x -> [(mean(x), std(x), minimum(x), maximum(x))]) => [:mean, :std, :min, :max])



意思
标准
最大限度
分钟



Float64
Float64
64位
64位

1
2.7186
0.875671
2
11


是否有更简洁的语法来执行此操作,而无需将函数返回包装在 [ ] 中?还是专门使用匿名函数?
例如,我想做:
combine(df, :jumps => (mean, std, minimum, maximum))

最佳答案

做:

combine(df, :jumps .=> [mean, std, minimum, maximum])
另见 Multiple summary statistics on grouped column in Julia一些更高级的例子。

关于dataframe - 将多个函数应用于 Julia DataFrames.jl 中的单个列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/66353988/

相关文章:

constructor - 在 Julia 中为数学常数供电很慢

julia - 创建具有参数返回类型的函数

python - 左合并 dask 数据帧结果到空数据帧

python - 如何根据一列值和其他条件更改DataFrame列值

python - 尝试在一个数据框中创建一个 Pandas 系列,其值基于键是否在另一个数据框中

python - 如何使用Python将Excel文件的所有行和列合并到另一个Excel文件的单个单元格中?

julia - 如何获得Julia中索引列表的补充?

Python,数据帧 : duplicating elements in a column of lists and attributing to them rows in another column

julia - Julia 中最小值的位置

julia - Julia 主对角线下的总和