r - 如何在 R data.table 中检索按行最大值的列?

标签 r dataframe data.table max

我有以下 R data.table:

library(data.table)
iris = as.data.table(iris)
> iris
    Sepal.Length Sepal.Width Petal.Length Petal.Width    Species
1            5.1         3.5          1.4         0.2     setosa
2            4.9         3.0          1.4         0.2     setosa
3            4.7         3.2          1.3         0.2     setosa
4            4.6         3.1          1.5         0.2     setosa
5            5.0         3.6          1.4         0.2     setosa
6            5.4         3.9          1.7         0.4     setosa
7            4.6         3.4          1.4         0.3     setosa
8            5.0         3.4          1.5         0.2     setosa
...

假设我想找到每行的行最大值,仅适用于 data.table 列的子集:Sepal.Length , Sepal.Width , Petal.Length , Petal.Width
我会使用以下代码:
iris[, maximum_element :=max(Sepal.Length, Sepal.Width, Petal.Length, Petal.Width), by=1:nrow(iris)]

哪些输出
     Sepal.Length Sepal.Width Petal.Length Petal.Width   Species     maximum_element
  1:          5.1         3.5          1.4         0.2    setosa               5.1
  2:          4.9         3.0          1.4         0.2    setosa               4.9
  3:          4.7         3.2          1.3         0.2    setosa               4.7
  4:          4.6         3.1          1.5         0.2    setosa               4.6
  5:          5.0         3.6          1.4         0.2    setosa               5.0

对于我的问题,我实际上对值不感兴趣,但值来自哪一列,即我想要以下输出:
     Sepal.Length Sepal.Width Petal.Length Petal.Width   Species maximum_column
      1:          5.1         3.5          1.4         0.2    setosa  Sepal.Length
      2:          4.9         3.0          1.4         0.2    setosa  Sepal.Length
      3:          4.7         3.2          1.3         0.2    setosa  Sepal.Length
      4:          4.6         3.1          1.5         0.2    setosa  Sepal.Length
      5:          5.0         3.6          1.4         0.2    setosa  Sepal.Length

(在这种情况下,最大值来自 Sepal.Length )。

如何“检索”具有最大值的列名?

最佳答案

这是 pmax 的选项

iris[, maximum_element := do.call(pmax, .SD), .SDcols = 1:4]

要查找列名,请使用 max.col.SD指定 .SDcols 后作为数字列,即列 1 到 4
iris[,maximum_column :=  names(.SD)[max.col(.SD)], .SDcols = 1:4]
head(iris, 4)
#   Sepal.Length Sepal.Width Petal.Length Petal.Width Species maximum_column
#1:          5.1         3.5          1.4         0.2  setosa   Sepal.Length
#2:          4.9         3.0          1.4         0.2  setosa   Sepal.Length
#3:          4.7         3.2          1.3         0.2  setosa   Sepal.Length
#4:          4.6         3.1          1.5         0.2  setosa   Sepal.Length

关于r - 如何在 R data.table 中检索按行最大值的列?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/45149124/

相关文章:

r - 如何通过将条件与向量匹配来选择 data.table 中的行

根据时差删除重复项并折叠附近的重复项

python - numpy/scipy 等效于 R ecdf(x)(x) 函数?

c++ - 在模板化 Rcpp 函数中调用另一个 cpp 函数

r - shinydashboard:通过textInput过滤DT

python - 在同一 Pandas 数据框中交换行

r - 在 R 中我需要什么样的加入?

r - CI 累积值

python - Pandas 选择多个日期时间之间的数据框行

r - 如果一列的值出现在另一列中,则对行进行分组