date - Julia @子集日期

标签 date filter julia subset

这应该很简单,但我找不到任何文档或之前的问答。使用 Julia 进行子集化很容易,尤其是使用 @Chain 命令时。但是我这辈子都没有想出一种在日期上进行子集化的方法:

maindf = @chain rawdf begin
    @subset(Dates.year(:travel_date) .== 2019)
end

在所有文档中 Dates.year(today()) 应该生成 (2021) 但这最终会给我一个错误:

ERROR: MethodError: no method matching +(::Vector{Date}, ::Int64)
Closest candidates are:
  +(::Any, ::Any, ::Any, ::Any...) at operators.jl:560
  +(::T, ::T) where T<:Union{Int128, Int16, Int32, Int64, Int8, UInt128, UInt16, UInt32, UInt64, UInt8} at int.jl:87
  +(::T, ::Integer) where T<:AbstractChar at char.jl:223

不确定为什么会出现方法错误..

在使用 DPLYR 的 R 中,这将是:

maindf = rawdf %>% 
filter(., year(travel_date) == 2019)

有什么想法吗?

最佳答案

使用:

julia> using DataFramesMeta, Dates

julia> df = DataFrame(travel_date=repeat([Date(2019,1,1), Date(2020,1,1)],3), id=1:6)
6×2 DataFrame
 Row │ travel_date  id
     │ Date         Int64
─────┼────────────────────
   1 │ 2019-01-01       1
   2 │ 2020-01-01       2
   3 │ 2019-01-01       3
   4 │ 2020-01-01       4
   5 │ 2019-01-01       5
   6 │ 2020-01-01       6

julia> @rsubset(df, year(:travel_date) == 2019)
3×2 DataFrame
 Row │ travel_date  id
     │ Date         Int64
─────┼────────────────────
   1 │ 2019-01-01       1
   2 │ 2019-01-01       3
   3 │ 2019-01-01       5

julia> @subset(df, year.(:travel_date) .== 2019)
3×2 DataFrame
 Row │ travel_date  id
     │ Date         Int64
─────┼────────────────────
   1 │ 2019-01-01       1
   2 │ 2019-01-01       3
   3 │ 2019-01-01       5

区别在于 @rsubset 按行工作,而 @subset 按整列工作。

您的问题是,在 Dates.year(:travel_date) .== 2019) 中,您混合了 year 函数的非广播调用和广播比较 .== 2019.您始终需要确保您是按行工作(在这种情况下使用 @rsubset)还是在整列上工作(使用 @subset)。

不同的场景可能需要不同的方法。以下是整列方法有用的示例:

julia> using Statistics

julia> @subset(df, :id .> mean(:id))
3×2 DataFrame
 Row │ travel_date  id
     │ Date         Int64
─────┼────────────────────
   1 │ 2020-01-01       4
   2 │ 2019-01-01       5
   3 │ 2020-01-01       6

您希望 mean 对整列进行运算的位置。

编辑

这里与 @chain 相同:

julia> @chain df begin
           @subset year.(:travel_date) .== 2019
       end
3×2 DataFrame
 Row │ travel_date  id
     │ Date         Int64
─────┼────────────────────
   1 │ 2019-01-01       1
   2 │ 2019-01-01       3
   3 │ 2019-01-01       5

关于date - Julia @子集日期,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/69083523/

相关文章:

php - 使用 PHP 和 MYSQL 进行过滤

ubuntu - 在 Ubuntu 16.10 上安装 Julia 语言时出现问题

julia - Julia 中缺少、无、未定义和 NaN 之间的用法和约定差异

java - 在两个不同时区之间传递日期对象而不在java中应用时区转换

shell - 如何在 shell 脚本中列出每个星期一和星期四的日期?

php - 如何使用 php 将从下拉列表中选择的日期插入到 mySQL 表中?

python - Julia 中的任意精度算术

java - Google DateTime 类 - Java 中的日期格式

javascript - Angular 过滤器去除字符串中直到并包括第一个空格的所有字符

R 过滤行 : where clause : from dataframe