r - 添加一列,其中包含具有最大频率的对象的值

标签 r matrix max subset frequency

我有这个矩阵:

mat=matrix(c(1,1,1,2,2,2,3,4,
             4,4,4,4,4,3,5,6,
             3,3,5,5,6,8,0,9,
             1,1,1,1,1,4,5,6),nrow=4,byrow=TRUE)
print(mat)
     [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8]
[1,]    1    1    1    2    2    2    3    4
[2,]    4    4    4    4    4    3    5    6
[3,]    3    3    5    5    6    8    0    9
[4,]    1    1    1    1    1    4    5    6

和一个子集,其中包含我要应用我的函数的行的索引:

subset=c(2,4)

我想在矩阵“mat”中添加一个新列,其中仅包含我指定的子集,该行中具有最大频率的对象的值。

在这种情况下:

  • 对于第 1 行,我希望在新列中有一个空单元格,
  • 对于第 2 行,我想在新列中使用值“4”,
  • 对于第 3 行,我希望在新列中有一个空单元格,
  • 对于第 4 行,我想在新列中使用值“1”。

编辑: 感谢答案中的代码! 现在我应该用其他值替换 NA 值: 我有另一个矩阵:

mat2=matrix(c(24,1,3,2, 4,4,4,4, 3,2,2,5, 1,3,5,1),nrow=4,byrow =TRUE)

     [,1] [,2] [,3] [,4]
[1,]   24    1    3    2
[2,]    4    4    4    4
[3,]    3    2    2    5
[4,]    1    3    5    1

和子集:

subset=c(1,3)

我想用具有最大值的行的值的列名替换矩阵的 NA(第一个子集的剩余行)。

在这种情况下,第一行为“1”,第三行为“4”。

最佳答案

您正在寻找模式。不幸的是,R 不提供内置模式功能。但是自己写一个并不难:

## create mode function
modeValue <- function(x) {
  ux <- unique(x)
  ux[which.max(tabulate(match(x, ux)))]
}

## add new column with NA
smat <- cbind(mat, NA)

## calculate mode for subset
smat[subset, ncol(smat)] <- apply(smat[subset, , drop=FALSE], 1, modeValue)
smat
#      [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9]
# [1,]    1    1    1    2    2    2    3    4   NA
# [2,]    4    4    4    4    4    3    5    6    4
# [3,]    3    3    5    5    6    8    0    9   NA
# [4,]    1    1    1    1    1    4    5    6    1

关于r - 添加一列,其中包含具有最大频率的对象的值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38461584/

相关文章:

go - 如何在 go-lang 中获取矩阵的维数?

excel - 在 Excel 中输入最大数字标题

sql - 如何在Oracle中找到负最大值和正最小值?

mysql - 为什么在 INNER JOIN 中使用 MAX() 时只能选择两列?

r - bquote轴标签ggplot2中的换行符和上标

matrix - tensorflow逐元素矩阵乘法

r - 如何获取每个唯一 ID 的摘要

java - 着色器/矩阵问题 - 看不到对象

r - 如何在 ggplot 中制作循环的、类似 donut 的颜色图例?

r - 使用 lapply 更改列表中数据框的列名