r - 如何在 read.spss 后访问 R data.frame 列描述

我已经使用库外部 read.spss 函数导入了一个 SPSS .sav 文件。

dataset = read.spss("data.sav", to.data.frame=TRUE)

我想访问列描述，但不知道如何以编程方式访问它们。我可以在 RStudio 的数据查看器中看到这些，位于粗体列名称下方的标题中。

这里的图片:http://i.stack.imgur.com/PgIO5.png

最佳答案

您最好使用 read_sav 导入数据。来自 haven 的函数包(来自 Hadley Wickham 的另一个很棒的包)。

读取“保存”文件:

dd <- read_sav("SomeFile.sav")

head(dd)[,1:10]

methods(as_factor)
table(dd$District)
class(dd$District)
class(dd$Date)
lapply(dd, class)   # some variables have labels and others don't
lapply(dd, class) %>% head

'labelled' 变量具有显示它们的变量标签('label')和它们的值标签('labels')的属性

dd$Region
attributes(dd$Region)

您可以读取变量标签:

attr(dd$Region, 'label')

您可以更改变量标签:

attr(dd$Region, 'label') <- 'a new label for Region'
attr(dd$Region, 'label')

值标签相同

attr(dd$Region, 'labels')

要更改名称，您需要更改属性的“名称”

names(attr(dd$Region, 'labels')) <- c("NE","Nyanza","West")
attr(dd$Region, 'labels')

关于r - 如何在 read.spss 后访问 R data.frame 列描述，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/31461640/

上一篇：performance - 请解释这个 Symfony 与 Zend Framework 2 的性能结果

下一篇：compilation - 为什么我无法在 Ubuntu 12.04 中编译 Drwright

相关文章：

pandas - pandas 中数据的条件合并和转换

performance - R中更快的比例表

r - 使用 stringdist 对变量上的数据进行分区以加速 "fuzzy match"

r - ggplot2 图，从某个点开始的刻度轴

r - 在 R 的生存分析中违反比例假设时，如何对协变量与时间的相互作用进行建模

python - 具有字符串列到整数列表列的数据框

r - 了解 R 中的 Biclust 类

python - 将对角线上方的元素移动到行的开头

python - 如何复制行但在 Pandas 中交换值

python - 从python pandas中的列名获取列索引