我有许多名为“abcd001.txt,abcd002.txt”的制表符分隔的 .txt 文件....存储在一个目录中。 我可以使用以下代码导入它们(默认目录与数据文件目录相同)。它的三列,都是数字类型的数据
filenames <- list.files(path=".",pattern="abcd+.*txt")
#list of data in R
names <-substr(filenames,1,6)
for(i in names){
filepath <- file.path(".",paste(i,".txt",sep=","))
assign(i, read.table(filepath,
colClasses=c("numeric"),
sep = "\t"))
}
代码本身没有返回任何错误。我的疑问是如何访问正在加载的数据?如何访问说文件 abcd011.txt 的数据应该是三列数据
commands:names[3] 只返回文件号 000002 但没有数据。
这里的代码和这里的代码类似:Read multiple CSV files into separate data frames .
最佳答案
我建议将 read.table
的结果放在一个列表或一位 data.frame 中。此外,我建议在此处使用 apply
样式循环,标准 R (lapply
) 或 plyr
。我更喜欢使用 plyr
,所以我的示例将使用该包。一个例子:
## Read into a list of files:
filenames <- list.files(path=".",pattern="abcd+.*txt")
list_of_data = llply(filenames, read.table,
colClasses = c("numeric"), sep = "\t")
现在可以使用以下方法访问数据:
list_of_data[[1]]
list_of_data[["abcd1.txt"]]
或者你可以将文件的内容读入一个大的data.frame
:
big_data = ldply(filenames, read.table,
colClasses = c("numeric"), sep = "\t"))
现在可以使用以下方法访问文件的内容:
big_data[big_data$variable == "abcd1.txt",]
关于r - 导入和读取多个文件 R,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/13121393/