dataframe - julia dataframe - 按值列表对列进行子集化

标签 dataframe subset julia data-manipulation

using DataFrames

df = DataFrame(A = 1:10, B = 2:2:20)

10x2 DataFrame
| Row | A  | B  |
|-----|----|----|
| 1   | 1  | 2  |
| 2   | 2  | 4  |
| 3   | 3  | 6  |
| 4   | 4  | 8  |
| 5   | 5  | 10 |
...
...

是否可以使用值列表来对数据帧进行子集化,例如

df[df[:A] .in [3,4], :]

如果列表很小,这可以通过

来完成
df[(df[:A] .== 3) |  (df[:A] .== 4), :]

但我想知道是否有办法对大量值执行此操作

最佳答案

上面接受的答案不再有效。 以下是 2019 年的一些工作:

# by column name

julia> df[ [x in [3,4] for x in df[:A]] ,:]
2×2 DataFrame
│ Row │ A     │ B     │
│     │ Int64 │ Int64 │
├─────┼───────┼───────┤
│ 1   │ 3     │ 6     │
│ 2   │ 4     │ 8     │

# or by column number

julia> df[ [x in [3,4] for x in df[:1]] ,:]
2×2 DataFrame
│ Row │ A     │ B     │
│     │ Int64 │ Int64 │
├─────┼───────┼───────┤
│ 1   │ 3     │ 6     │
│ 2   │ 4     │ 8     │

关于dataframe - julia dataframe - 按值列表对列进行子集化,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34271850/

相关文章:

julia - 测试一个字符是否为有效的 Julia 单字符变量名?

python - 在数据框中每行创建多个新行

python - 从使用 apply() 方法的数据框中,如何返回包含数据框中元素列表的新列?

r - 从 data.frame 中提取列比从矩阵中提取列更快 - 为什么?

r - 如何对存储在列表中的 data.frames 进行子集化?

r - 从 Stata 到 R : creating a scatterplot with vertical date lines on a subset

python - 如何从 for 循环返回多个具有唯一名称的 pandas 数据帧?

python - 计算 pandas DataFrame 中特定组的平均值(使用 axis=1) - 如何获取特定组?

julia - 如何从 Julia 中拟合的 GLM 模型对象中提取数据分布类型(例如泊松、二项式)?

macros - 宏观卫生是否只在不同的模块中保护您?