我是 R 的新手。我有一个数据框(使用 read.csv 导入),其中包含 >200 列和 >100 行,这是一项调查的结果。因此,一列或一组列代表问题的答案。我有两个问题。
a) 名称为“Q1”、“Q2”、...“Q9”的列包含 bool 值(是/否)。创建如下所示的频率表的命令是什么(即:所有行中每列的真/假频率)。
q1 q2 q3 ...
true 5 99 11
false 95 1 89
b) 名称为“P1”、“P2”、...“P9”的列包含来自 1..5 的等级(“同意”...“不同意”)的值。创建如下所示的频率表的命令是什么(即计算每列所有行中 1、2、...5 的出现次数)
p1 p2 p3 ....
1 1 4 5
2 4 45 7
3 78 34 6
4 5 55 8
5 4 22 67 ....
最佳答案
数据:
df = data.frame(q1=c(F,T,T),q2=c(T,F,F),q3=rep(T,3), p1=c(1,2,1), p2=c(3,4,5), p3=c(4,4,2))
你可以试试:
library(qdapTools)
t(mtabulate(df[grep('q',names(df), value=T)]))
# q1 q2 q3
#FALSE 1 2 0
#TRUE 2 1 3
t(mtabulate(df[grep('p',names(df), value=T)]))
# p1 p2 p3
#1 2 0 0
#2 1 0 1
#3 0 1 0
#4 0 1 2
#5 0 1 0
关于r - R中多个 bool 或非 bool 列的频率,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31723243/