我有这个示例数据集:
sub_id,age,country,score
{subID},{Age},{CountryOfOrigin},{Qscore}
1,23,UK,15
2,28,uk,19
3,40,United Kingdom,33
4,19,france,21
5,36,Italy,16
6,24,UK,18
7,26,greece,16
8,22,italy,15
我想阅读本文并执行一些计算/分析。我想要标题行,但该行会引起问题。我尝试读入它并删除第一行({with those}...这是一个无意义的行),但是由于读入时列中的混合数据类型,R 不会让我对任何内容执行计算因为数据不再是数字。
这是一个更大的数据框的示例,因此我无法执行此操作并手动指定要更改为数字的列。
似乎最好的解决方案是读取带有标题的 csv 文件,但跳过第一行。
df <- read.csv('scores.csv',
header=TRUE,
skip=1)
这可行,但它会转换我所有的列名称!例如df$Qscore
变成df$X.Qscore.
,这显然并不理想。我至少可以对此进行计算,但我不知道我做错了什么。
我还尝试只读取标题,然后读取没有标题的数据,并将它们粘在一起,但这也存在很多问题。这一定是一个常见的问题......
注意:我是 R 新手,我有一个看起来很常见的问题,但我无法在这里找到答案(可能是因为我不知道)知道要搜索什么吗?),所以如果这是一个大量的重复,我们深表歉意......
最佳答案
我们可以滥用comment.char
选项:
read.table(text = "sub_id,age,country,score
{subID},{Age},{CountryOfOrigin},{Qscore}
1,23,UK,15
2,28,uk,19
3,40,United Kingdom,33
4,19,france,21
5,36,Italy,16
6,24,UK,18
7,26,greece,16
8,22,italy,15", sep = ",", comment.char = "{", header = TRUE)
关于read.csv 带标题但忽略第二行,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/51782423/