r - 如何读取不同分隔符的数据?

标签 r read.table

我有一个文件看起来像:

a 1,2,3,5
b 4,5,6,7
c 5,6,7,8
...

第一个和第二个之间的分隔符是'\t',其他分隔符是逗号。如何将这种数据集读取为具有 5 个字段的数据帧。

最佳答案

我可能会这样做。

read.table(text = gsub(",", "\t", readLines("file.txt")))
  V1 V2 V3 V4 V5
1  a  1  2  3  5
2  b  4  5  6  7
3  c  5  6  7  8

稍微拆开一下:
  • readLines()将文件作为字符向量读入 R 中,每行一个元素。
  • gsub(",", "\t", ...)用制表符替换每个逗号,因此现在我们只有一种分隔字符的行。
  • text =论据 read.table()让它知道您正在传递一个字符向量以直接读取(而不是包含文本数据的文件名)。
  • 关于r - 如何读取不同分隔符的数据?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23568981/

    相关文章:

    r - `boot`包中自定义分层样本策略

    r - read.table : ! header 中的错误:无效的参数类型

    阅读 R 中的表格?

    r - R中的时间序列分析

    r - R语言中的清除屏幕命令

    linux - 如何确定R中当前工作区中所有对象的大小? (不在 Windows 中)

    Read.table()无效多字节字符串错误: Find the strings causing the error

    在 R 中读取带有制表符和分号的文本文件

    读取 .txt 文件,其中列用引号分隔,行在 R 中多行

    r - 在 R 中加载/读取数据占用太多内存