我有一个data.frame,我正在尝试创建一个频率表,该表显示每一行的值的频率。所以我从这样的事情开始:
d <- data.frame(a=c(1,2,3), b=c(3,4,5), c=c(1,2,5))
看起来像这样:
a b c
1 3 1
2 4 2
3 5 5
我真正想要创建的是一个意外的data.frame或矩阵,如下所示:
1, 2, 3, 4, 5, 6, 7, 8, 9
2, 0, 1, 0, 0, 0, 0, 0, 0
0, 2, 0, 1, 0, 0, 0, 0, 0
0, 0, 1, 0, 2, 0, 0, 0, 0
最上面的行只是一个标签行,不必在最终结果中。但我将其添加在那里进行说明。每行显示数字1:9,并且在起始数据的每行中显示每个数字的次数。
我无法用一种简单的方法来创建它。尽管
table()
函数似乎应该有所帮助,但我无法获得它给我任何爱。任何帮助或想法表示赞赏。
最佳答案
干得好:
t(apply(d, 1, tabulate, nbin=9))
[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9]
[1,] 2 0 1 0 0 0 0 0 0
[2,] 0 2 0 1 0 0 0 0 0
[3,] 0 0 1 0 2 0 0 0 0
(尽管在此应用程序中可能无关紧要,但
tabulate()
(在table()
的代码内部使用)对于执行计算的惊人速度也很不错。)编辑:
tabulate()
未设置为处理0或负整数。如果您想要另一个衬纸来做,则可以使用table()
,例如:d <- data.frame(a=c(0,-1,-2), b=c(3,4,5), c=c(1,2,5))
t(apply(d, 1, function(X) table(c(X, -9:9)) - 1))
-9 -8 -7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7 8 9
[1,] 0 0 0 0 0 0 0 0 0 1 1 0 1 0 0 0 0 0 0
[2,] 0 0 0 0 0 0 0 0 1 0 0 1 0 1 0 0 0 0 0
[3,] 0 0 0 0 0 0 0 1 0 0 0 0 0 0 2 0 0 0 0
关于r - 将数据帧转换为特定格式的频率表,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/9728038/