我有一个因素,希望将其设为数据框中的一列。但我惊讶地发现它会自动转换为字符,即使我指定了 stringsAsFactors。
这是 MWE:
a <- data.frame(dummy=1:5, stringsAsFactors = TRUE)
b <- as.factor(c("Monday", "Tuesday", "Monday", "Thursday", "Tuesday"))
a["d"] <- b
> levels(a["d"])
NULL
如何完成作业才能获得实际因素,同时保持原始水平?
重要的是,我不能使用事后转换因子的解决方案,因为在示例中,当我准备了一个具有所有适当级别且按所需顺序的因子时,它将获得“星期一星期四星期二”级别(在此示例中,它将是一周中的所有天)。
最佳答案
这是因为提取列的差异。 a['d']
仍然是一个以 'd' 作为列的 data.frame
,而 a[, 'd']
或a[['d']]
或 a$d
均将 'd' 列提取为具有 class
的 向量
code> 作为因素
。要查看差异,我们检查 str()
str(a['d'])
#'data.frame': 5 obs. of 1 variable:
#$ d: Factor w/ 3 levels "Monday","Thursday",..: 1 3 1 2 3
str(a[['d']])
#Factor w/ 3 levels "Monday","Thursday",..: 1 3 1 2 3
levels(a["d"])
#NULL
levels(a[["d"]])
#[1] "Monday" "Thursday" "Tuesday"
关于r - 当分配给数据框时,因子变成字符,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41333131/