r - 如何在 read.spss 后访问 R data.frame 列描述

标签 r dataframe

我已经使用库外部 read.spss 函数导入了一个 SPSS .sav 文件。

dataset = read.spss("data.sav", to.data.frame=TRUE)

我想访问列描述,但不知道如何以编程方式访问它们。我可以在 RStudio 的数据查看器中看到这些,位于粗体列名称下方的标题中。

这里的图片:http://i.stack.imgur.com/PgIO5.png

最佳答案

您最好使用 read_sav 导入数据。来自 haven 的函数包(来自 Hadley Wickham 的另一个很棒的包)。

读取“保存”文件:

dd <- read_sav("SomeFile.sav")

head(dd)[,1:10]

methods(as_factor)
table(dd$District)
class(dd$District)
class(dd$Date)
lapply(dd, class)   # some variables have labels and others don't
lapply(dd, class) %>% head

'labelled' 变量具有显示它们的变量标签('label')和它们的值标签('labels')的属性
dd$Region
attributes(dd$Region)

您可以读取变量标签:
attr(dd$Region, 'label')

您可以更改变量标签:
attr(dd$Region, 'label') <- 'a new label for Region'
attr(dd$Region, 'label')

值标签相同
attr(dd$Region, 'labels')

要更改名称,您需要更改属性的“名称”
names(attr(dd$Region, 'labels')) <- c("NE","Nyanza","West")
attr(dd$Region, 'labels')

关于r - 如何在 read.spss 后访问 R data.frame 列描述,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/31461640/

相关文章:

pandas - pandas 中数据的条件合并和转换

performance - R中更快的比例表

r - 使用 stringdist 对变量上的数据进行分区以加速 "fuzzy match"

r - ggplot2 图,从某个点开始的刻度轴

r - 在 R 的生存分析中违反比例假设时,如何对协变量与时间的相互作用进行建模

python - 具有字符串列到整数列表列的数据框

r - 了解 R 中的 Biclust 类

python - 将对角线上方的元素移动到行的开头

python - 如何复制行但在 Pandas 中交换值

python - 从python pandas中的列名获取列索引