我有一个文件看起来像:
a 1,2,3,5
b 4,5,6,7
c 5,6,7,8
...
第一个和第二个之间的分隔符是'\t',其他分隔符是逗号。如何将这种数据集读取为具有 5 个字段的数据帧。
最佳答案
我可能会这样做。
read.table(text = gsub(",", "\t", readLines("file.txt")))
V1 V2 V3 V4 V5
1 a 1 2 3 5
2 b 4 5 6 7
3 c 5 6 7 8
稍微拆开一下:
readLines()
将文件作为字符向量读入 R 中,每行一个元素。 gsub(",", "\t", ...)
用制表符替换每个逗号,因此现在我们只有一种分隔字符的行。 text =
论据 read.table()
让它知道您正在传递一个字符向量以直接读取(而不是包含文本数据的文件名)。 关于r - 如何读取不同分隔符的数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23568981/